불유합을 일으키는 위험인자에 대해서 조사하고자 한다.
1)
| 뷸유합 n=40 | 유합 n=200 |
경부단축 30% 이상 | 30 | 10 |
경부 단축 30% 미만 | 10 | 190 |
2)
| 불유합 n=40 | 유합 n=200 |
남자 | 23 | 90 |
여자 | 17 | 110 |
3)
| 불유합 n=40 | 유합 n=200 |
BMI : 연속변수 |
|
|
첫번쨰 통계방법 : "각각의 변수를 따로따로 검정한다"
1),2)는 카이 제곱 검정 (유의한 차이가 있는지와 odd ratio 를 알수 있다)
3)은 t 검정 (유의하게 차이가 있는지만 알 수 있다)
-> 결과에 따라 유의한 차이가 있는 변수를 위험인자로 해석한다.
두 번째 통계방법: "모두를 한번에 검정한다."
logistic regression test 로 모든 변수를 돌려 각각변수의 odd ratio를 확인한다.
-> 통계적으로 유의한 수준의 차이가 있는 변수를 확인하여 위험인자로 해석하고
이들의 odd ratio를 위험도 정도로 해석한다.
첫번쨰와 두번쨰중 어떤 것이 맞는 통계 방법인지 모르겠습니다. 고수님들 많은 조언 부탁드립니다.
Comment 1
-
cardiomoon
2017.07.28 08:58
어느 방법이 맞고 틀리고의 문제가 아닙니다.
첫번째 방법 즉 단변량 검정은 두 변수의 관계에 대해 알수 있습니다. 하지만 이 경우 confounding variable이 있는 경우 해석이 문제가 될 수 있습니다.
과거에 커피와 폐암의 관계에 대한 관찰연구가 많았는데 그 결과는 일관되게 커피를 많이 마시는 사람에서 폐암이 많이 발생하는 것으로 나왔습니다.
하지만 그 이유는 흡연이라는 인자가 작용했기 떄문이었습니다. 즉 커피를 많이 마시는 사람이 담배를 많이 파웠는데 담배 때문에 폐암의 위험이 증가한 것입니다.
이러한 confounding variable의 영향을 배제하기 위해 시도하는 방법이 randomized trial 이고 randomized trial 이 불가능할 경우 선택하는 방법이 다중회귀방법입니다.
두번째 방법이 다중로지스틱회귀로 다중로지스틱 회귀의 설명변수로 A,B,C등을 넣은 후 그 결과 A의 odd ratio가 1.2가 나왔다면 1.2의 해석은 B,C가 일정할때 A의 값에 따라 결과가 1.2배 달라진다로 해석할 수 있습니다.