선생님 안녕하세요 r-통계를 잘 활용하고 있는 사람중에 한명입니다.
선생님 덕분에 많은 혜택을 받고 있는 것 같아 먼저 감사 말씀을 드립니다.
web- r통계에서 Pearson-moment correlation으로 correlation plot을 만들었는데,
이 plot이 유효한 것인지 궁금해서 여쭤보게 되었습니다.
문제는 제가 correlation 통계를 돌린 것이 이분형-이분형 / 이분형-연속형 / 연속형-연속형 변수가 같이 혼재되어 있다는 것입니다.
변수별로 따로 나눠서 통계를 돌려야 할가 고민하였지만, 연속형변수와 이분형 변수의 관계를 correlation plot으로 한눈으로 볼 수 있다는 것이, 시각적으로 유용한 것 같습니다.
그래서 해결책을 찾다가,
0,1 ( 없음, 있음)으로 코딩된 이분형변수와 연속형 변수 간 관계를 point-biserial correlation으로 볼 수 있다고 알게되었는데, 이는 spss 이변량 분석법 중 pearson을 이요해서 할 수 있다고 합니다.
다만 연속형변수가 정규형분포고 outlier가 없는 조건을 만족해야한다고 합니다.
그런데, 제 자료의 연속형 변수는 outlier가 3개가 있고, 연속형 변수가 Shapiro-Wilk test에서 p<0.05로 정규분포를 만족하지 않습니다.
bisersial test가 spss에서는 이변량을 통해서 할 수는 있으나
correlation analyasis는 보통 연속형 변수간의 상관성을 보는 경우가 대부분인 것 같습니다.
질문 드리고 싶은 것은
1. 제 자료중 이분형변수와 비정규분포 연속형 변수간의 관계를 보려면, biserial test (이변량 분석)를 사용해도 될까요?
2. 이변량 상관분석에서 pearson을 그대로 써도 될지요? (정규성 분포를 하지 않아 spearman이나 kendall tau-b를 쓰면 안될까요?)
3. Mann-Whitney를 사용하여 비교통계를 결국엔 해야할지요?
4. web-r에서 correlation test 결과를 이분법-비정규분포 연속형 변수간 써도 딜지요?
5. web-r에서 자료를 도표화해주는 Pearson-moment correlation plot을 연속형-범주형 사이에 사용해도 될지
6. 만약 위의 correlation plot을 사용하지 못한다면 전체적으로 상관성을 볼 수 있는 시각화자료는 없을지
여쭤보고 싶습니다.
바쁘신 와중에 일면식정도인 사람의 질문을 받아주셔서 감사합니다.
Comment 1
-
아빠가들려주는통계김지형
2018.05.31 02:48
No. | Subject | Author | Date |
---|---|---|---|
474 | 정회원 서버 접속이 안되네요 [1] | iamswchoi | 2018.06.09 |
473 | shiny 한글 문제 문의드립니다. [3] | suny | 2018.06.07 |
472 | 단독망에서 패키지 실행 질문있습니다. [1] | 김지은22 | 2018.06.05 |
471 | Hodges-Lehman estimator [1] | 김밥친구 | 2018.06.04 |
470 | 교수님 안녕하세요 질문이 있습니다 [1] | 세발낙지 | 2018.06.03 |
» | 범주형변수와 비정규분포 연속형 변수 간 관계를 볼때 이변량 상관관계 분석이 가능한지요? [1] | 아라리 | 2018.05.30 |
468 | 안녕하세요 공부하던 중 질문드립니다. [1] | Ikarus86 | 2018.05.27 |
467 | 선생님 책으로 공부중인데..질문있습니다. [1] | jsus | 2018.05.26 |
466 | 인류 역사상 최고의 천재였다는 남자.jpg | 소꿈노리 | 2018.05.25 |
465 | 설명 변수 고르기에 대해서.. [2] | 짱이야 | 2018.05.25 |
464 | WebR관련 문의드립니다. [1] | neurojang | 2018.05.17 |
463 | nomogram [5] | 횽횽 | 2018.05.16 |
462 | 불충분한 데이터의 생존분석에 관하여 질문드립니다. [2] | fermion503 | 2018.05.14 |
461 | 교수님 안녕하세요 서버 구축관련하여 질문드립니다. [2] | 우루루루 | 2018.05.11 |
460 | 다중회귀 관련 여러가지 질문들이 있습니다. [2] | 짱이야 | 2018.05.04 |
459 | 다중회귀 관련 질문이 있습니다~~ [2] | 짱이야 | 2018.05.03 |
458 | 생존분석 결과가 다운되지 않습니다. [2] | 아라리 | 2018.05.02 |
457 | cox 와 kaplan 분석 시 결과해석 문의드립니다. [2] | 또니 | 2018.04.30 |
456 | 생존분석 p 값 [2] | alse | 2018.04.26 |
455 | 문의드립니다 [2] | 알로하 | 2018.04.26 |
이해하고 알고 있는 범위에서 답해 보겠습니다.
아마도 matrix correlation plot을 말씀하시는 듯합니다.
이는 연구의 초기에 여러 변수들 간의 성격을 탐색해 보기에 좋은 plot이면서
연구를 정리하면서 특정 변수들 관계를 한꺼번에 보여주는 plot이기도 합니다.
일단 초기 단계에서 변수들간의 관계를 보면서 정규성이 있어 보이는지, 이상값은 없는지 등등을 알아 보고,
(대충 알아보는 거죠)
그에 맞는 적절한 방법을 사용합니다.
어떤 통계 방법을 사용하는지는 변수의 성격에 따라 결정되는 것이 아니라,
연구 디자인에 의해서 결정됩니다.
위에서, Mann-Whitney test를 언급한 것은 어떤 두 집단에서 결과가 다르기 때문임을 보려 한 것같기도 한데,
만일 이분변수라고 한 것이 어떤 두 가지 치료법을 두고 그 치료법에 의한 차이인 연속변수를 보려한 것이라면,
Mann-Whitney test를 주로 하면서,
나머지 분석들은 보조적, 탐색적으로 생각하시면 됩니다.
이런 경우라면, web-r의 table 탭을 이용하시는 것이 더 맞습니다.
즉 분석의 관점이 모든 변수끼리 한꺼번에 비교하려는 것이 아니라,
두 집단(치료법에 따른 두 집단)을 관찰하려고 한 것이니까요.
내가 보고자 한 가설이 무엇인가...에 맞추어 한번 생각해 보시면 답이 더 분명해 지지 않을까
하는 생각도 들고, 다른 사람들이 답변할 때도 쉽게 답변할 수 있으리라는 생각이 듭니다..