안녕하세요?
통계 초보 또 인사드립니다.....
retrospective chart review를 했는데... 300여명의 환자를 수술했는데, 10명의 환자에서 합병증이 발생했습니다.
그래서 합병증 발생군(10명) vs. 비발생군 (290명)으로 나눠서 위험인자를 분석하는 로지스틱회귀분석을 하려고 합니다.
나이, BMI, DM, 수술 방법 등 여러가지 변수로 분석을 했더니...
예를 들어) DM, HTN, aspirin 복용력이 의미있는 변수로 나왔는데...
DM이 합병증 발생군에 1명(10%), 비발생군에 4명 (1.4%) 이라면 이걸 어떻게 해석해야 될까요?
또, 합병증 발생군에서 aspirin 복용하는 사람이 딱 1명(10%)이고, 비발생군에서 2명(0.6%) 라면
이것을 의미있는 변수로 볼 수 있을까요?
딱 한명 때문에 통계적 의미가 달라지는데... 이것을 결과에 그대로 기술해도 되는지 궁금합니다.
그리고 한두명 때문에 통계적 의미가 달라질 수도 있는데 이걸 그냥 로지스틱으로 분석하면 되는건지... 다른 방법이 있는지도 궁금하구요.
----결론적으로 이런 경우에 로지스틱을 적용하는게 틀린 건 아닌지... 틀렸다면 다른 방법은 뭐가 있는지 궁금하구요~
95% CI가 (2~195) 이렇게 넓은 범위로 나왔지만... 결과에 그대로 기록하고 discussion 에 관련 내용을 적어도 될까요???
고수님들의 가르침 부탁드립니다. 감사합니다.
Comment 2
-
cardiomoon
2016.09.26 08:08
-
김현정
2016.09.27 08:53
네~ 교수님... 감사합니다.
logistic regression을 하면, 의미있는 변수 두 개가 각각
OR 27.454 (95% CI 2.12-355.64) p=0.011
OR 17.95 (1.33-242.64) p=0.03
으로 나오는데
이 위험인자를 가진 사람이 2명, 3명라서
한 두명의 차이로 통계학적 의미가 달라질 수 있는데... 이것도 의미가 있는가 싶어서요...^^;;
매번 감사합니다~
로지스틱 회귀분석을 하시면 되는데 합병증 발생군(10명) vs. 비발생군 (290명)으로 나눠서 하시는 것이 아니라 event를 합병증 발생으로 넣으시고 분석을 하시고 비율이 아니라 odd ratio와 OR 의 95% 신뢰구간 및 p값으로 보고하시면 될 것 같습니다.^^