안녕하세요.
몇년 전 교수님 책으로 R에 입문하여 현재까지 열심히 사용 중입니다.
의료보건분야 R 관련 책은 (지금은 안 찾아보아 모르겠지만) 당시에는 이 책밖에 없었던 것 같고,
입문자에게도 쉽게 잘 읽혀서 R을 사용하게 된 확실한 계기가 되었습니다.
책을 쓰시는 것 외에도 다른 많은 활동을 하고 계신 걸 근래에 알게되었네요. 질문을 드리기에 앞서 늦었지만 매우 감사드립니다.^^
논문 작성시 및 변수들을 스크리닝 목적으로 살펴볼 때에도 moonBook 패키지가 매우 유용한 것 같은데요, mytable 함수와 관련하여 궁금한 점이 있습니다.
mytable 함수를 사용하면, 변수 특징에 따라서, 자동으로 적절한 통계법을 사용하여 p값을 구해주는데요,
어떤 변수에 구체적으로 어떤 통계법을 사용하여 나온 p값인지 궁금한데, 그에 대해서는 매뉴얼을 읽어봐도 제가 잘 못 찾은 것인지 설명을 찾지 못했습니다.
제가 이번에 하고자 하는 것은 '그룹별 연속형 변수의 차이 비교' 입니다.
제가 가지고 있는 기본 통계책을 보면 그룹별 연속형 변수 비교시에 아래와 같은 순서로 판단하여 통계방법을 선택하고 적용하는 것 같습니다.
(1) 정규성 검정[만족] -> 등분산 가정 [만족] -> Student t-test
(2) 정규성 검정[만족] -> 등분산 가정 [불만족] -> Welch t-test
(3) 정규성 검정[불만족] -> Mann Whitney U test
mytable 함수를 통해 제가 가지고 있는 데이터를 돌려서 나온 p값이, 어떤 통계방법을 통해 나온 것인지 궁금해서,
제가 별도로 계산한 p값과 비교해보았습니다. 그랬더니,
(1) bartlett.test 등분산 가정 [만족] -> Student t-test
(2) bartlett.test 등분산 가정 [불만족] -> Welch t-test
를 적용하는 것 같았습니다. 다만, 매뉴얼에서 설명하고 있는 것처럼 정규성을 만족하지 않는 변수에 대하여 비모수적 검정방법(Mann Whitney U test)을 사용하고 있는 것 같지는 않았습니다.
mytable에서 show.all=TRUE로 설정하면 ptest라는 항목으로 변수마다 'non-normal', 'normal'을 구분해주고 있는데,
여기에서 'non-normal'이라고 표시된 변수도 Mann Whitney U test가 아니라 Student t-test에서 나온 p값과 일치하였습니다.
제가 사용해본 정규성 검정 방법과 달라서 제가 잘못 판단한 것일 수 있습니다.
그렇다면 mytable함수에서 정규성 검정은 어떤 방법으로 하는지(Lilliefors? Shapiro-Wilk? 혹은 다른 방법?)도 궁금하고,
정규성 검정 결과에 따라 Student (or Welch) t-test 혹은 Mann Whitney U test를 구분해서 하고 있는지도 궁금합니다.
평상시에는 특별히 관계가 없더라도, 특히 논문에서 결과 제시할 때에 어떤 통계법을 사용했는지에 대한 설명이 필요하기 때문에 이렇게 문의를 드립니다.
더불어, 그룹별 연속형변수 차이 분석 뿐만 아니라, 범주형 등의 경우에도 어떤 경우에 통계법을 사용하고 있는지 등도 알려주시면 더욱더 잘 활용 할 수 있을 것 같습니다^^
감사합니다.!!
Comment 1
-
cardiomoon
2019.07.11 23:54
No. | Subject | Author | Date |
---|---|---|---|
674 | 안녕하세요 mytable 함수 관련하여 질문드립니다. [1] | 지옥소년 | 2019.07.26 |
673 | 교수님, sphagetti plot으로 문의드립니다. [3] | cardio_H | 2019.07.22 |
672 | 교차분석 결과로 로지스틱 회귀분석 가능한지 질문드립니다 [1] | 김도 | 2019.07.22 |
671 | 그래프 출력 오류 [2] | 김날 | 2019.07.17 |
670 | mytable 함수 추가 질문 드립니다 [3] | 수수 | 2019.07.17 |
669 | 틀리지 않는법 | cardiomoon | 2019.07.13 |
» | mytable에서 하는 통계법 질문 [1] | 수수 | 2019.07.11 |
667 | 여러 군의 평균 값 비교에 대해 질문드립니다. [2] | jera0131 | 2019.07.10 |
666 | mytable에서의 P value [2] | RR | 2019.07.08 |
665 | 정회원신청합니다. [1] | 박소이 | 2019.07.08 |
664 | mytable 및 ztable 관련 질문드립니다 [1] | jera0131 | 2019.07.05 |
663 | 정회원 서버접속이 안됩니다. [1] | 세희맘 | 2019.07.05 |
662 | 정회원 로그인이 안됩니다 [1] | jaljary | 2019.07.05 |
661 | 정회원 서버와 web r studio 접속이 안됩니다. [1] | jera0131 | 2019.07.05 |
660 | 정회원서버 접속 실패 [1] | cellory | 2019.07.05 |
659 | 정회원서버 [1] | 박소이 | 2019.07.02 |
658 | 정회원 신청드립니다. [3] | cellory | 2019.07.02 |
657 | survival analysis | diddbwls9 | 2019.07.01 |
656 | 정회원 서버 접속 실패 | Sally | 2019.06.28 |
655 | 후원금 입금 관련? [2] | duehdaud | 2019.06.25 |
안녕하세요? 문건웅입니다.
mytable()함수를 실행하실때 method=3으로 지정하시면 정규성 검정을 합니다. default가 method=1이므로 정규분포하는 것으로 간주합니다. 따라서 선생님께서 method=3으로 지정하지 않으셨다면 위의질문 내용이 맞습니다.
정규성 검정은 n<5000일때는 shapiro.test를 하고 n>5000일때는 Anderson-Darling test를 합니다.
method=3으로 하셨다면
그룹이 2개일때는 위의 질문대로
(1) 정규성 검정[만족] -> 등분산 가정 [만족] -> Student t-test
(2) 정규성 검정[만족] -> 등분산 가정 [불만족] -> Welch t-test
(3) 정규성 검정[불만족] -> Mann Whitney U test
그룹이 3개일때는
(1) 정규성 검정[만족] -> ANOVA
(2) 정규성 검정[불만족] -> Kruskal-Wallis test
categorical variable일 경우 catMethod에 따라 달라집니다.
R에서 mytable_sub의 도움말을 보시면 다음 항목을 보실 수 있습니다. 감사합니다.
method
An integer indicating methods for continuous variables. Possible values in methods are
forces analysis as normal-distributed
forces analysis as continuous non-normal
performs a Shapiro-Wilk test to decide between normal or non-normal
Default value is 1.
catMethod
An integer indicating methods for categorical variables. Possible values in methods are
Perform chisq.test first. If warning present, perform fisher test
Perform chisq.test without continuity correction
Perform chisq.test with continuity correction
perform fisher.test
perform prop.trend test