안녕하세요.
mytable 함수를 만들어 주셔서 덕분에 아주 유용하게 잘 쓰고 있습니다.
제가 R 공부하는 스터디 모임을 하고 있는데 발표 준비 중 갑자기 궁금증이 생겨
mytable 함수로 시행한 결과와 수작업으로 한 결과를 비교해 보았는데요.
데이터가 정규분포를 할경우에
그룹이 2개인경우는 mytable 함수에서 등분산성을 검정한 후 Student's t-test 혹은 Welch's t-test를 시행하는것을 보았으나
그룹이 3개 이상인 경우에는 정규분포할경우 등분산성을 검정 결과와 상관없이 one-way ANOVA로만 결과값이 나오는것을 보았습니다.
그룹간 n 수가 비슷하지 않고 서로 차이가 많이 날 때에는 one-way ANOVA 결과가 부정확할 가능성 때문에 Welch's ANOVA를 시행해야 할것 같은데
one-way ANOVA를 시행하게 만드신 특별한 이유가 있으신가요?
초보라 허접한 질문일수도 있겠지만 미리 답변 감사드립니다.
Comment 3
-
cardiomoon
2017.11.20 08:10
-
천감기
2017.11.20 17:05
정규분포를 하고, 등분산성이 가정된다면 ANOVA를 하면 됩니다. 두 집단일 때는 t-test이겠지요.
정규분포를 가정하지만, 등분산성이 가정 되지 않는다면, Welch ANOVA와 Welch t-test를 하면 되겠지요.
그냥 쉽게 생각하면 그렇습니다.
SPSS에서도 그값을 제공해 주지요.
그런데,
등분산성을 가정하지 못하는 경우에는 비모수 검정을 하도록 권하기도 합니다.
즉 옵션으로 Welch ANOVA 또는 Kruskal-Wallis test를 할 수 있습니다.
제가 적확한 책은 기억나지 않지만,
의학 통계에서 교과서적이라고 할 수 있는 어떤 책에 Kruskal-Wallis test를 하도록 권하는 내용이 있습니다.
그래서, 어떤 통계 프로그램은 (web-R이 아닌 다른, 초보자를 위한 프로그램...)
등분산성을 가정할 수 없다고 생각되는 경우는 강제로 Kruskal-Wallis test를 시행하도록 하고 있습니다.
web-R도 비슷한 맥락이라고 이해하시면 됩니다.
----------------------------------
사실 N 수가 많이 차이나는 경우에 등분산성 검정에서 어쩌구 저꺼구 하는 이야기는
data driven statistic이라고 할 수 있는데 사실 그런 것에는 큰 위험이 있습니다.
그 이야기는 아주 큰 주제이기 때문에 다른 기회에....
-
브리디온
2017.11.22 01:45
네 감사합니다.
n수가 비슷하더라도 등분산 가정 만족하지 않으면 one way ANOVA 시행하는것에 위험이 있다는 말씀이시지요?^^
지금 현재 mytable 함수는 정규분포 가정 만족하면 ANOVA 로 결과를 내게 되어 있어서 정규분포할경우는 확인을 해봐야 하겠네요.
혹시 함수 수정 가능하시면 업데이트 해주시면 감사하겠습니다. 문교수님
제가 능력이 안되서 도와드리진 못하고 부탁만 드리네요. 죄송합니다..
지금은 one-way ANOVA 또는 Kruskal-Wallis test를 시행하도록 되어 있습니다. Welch's ANOVA를 시행하지 않는 이유가 있는 것은 아닙니다. 제가 Welch's ANOVA를 몰라서 못 넣었습니다.^^