안녕하십니까, 교수님. 항상 도움주셔서 감사드립니다.
Cox proportional hazard model에서 다중공선성을 확인하고자 하는데요,
교수님 책에 쓰신 것처럼, glm함수에서 vif, sqrt(vif)>2를 이용하여 회귀분석에서 확인해봐도 될지요?
아니면 Cox model에서 따로 다중공선성을 확인하는 방법이 있는지요?
제가 찾다보니, rms package를 이용한 cvif라는 값도 있던데, 이건 coxph 함수에서도 구할 수 있는것 같습니다. 이 수치를 이용하여도 될지요?
두서없이 질문을 드려 죄송합니다.
박영석 올림.
Comment 2
-
cardiomoon
2017.11.20 08:11
-
천감기
2017.11.20 16:50
우선 다중 공선선을 검정하는데 많이 사용되는 VIF 등을 어떻게 구하는지를 알면 조금 쉽게 생각하실 수도 있습니다.
로지스틱 회귀분석으로 할 때, VIF를 구하려고 하면, SPSS 설명한 글들을 보면, 로지스틱 회귀분석 메뉴를 사용하지 말고,
다중 회귀분석 메뉴에서 VIF를 계산하라고 되어 있지요.
왜냐하면, VIF 계산에서는 Y값은 무시하고, 많은 독립변수들인 X1, X2, X3 등등만 계산하기 때문에, Y가 연속변수이든, 0/1인 이분변수이든 상관이 없기 때문입니다.
즉, X1과 기타 다른 X들과 계산하고, 다시 X2와 다른 X들과 계산하고.. 이런식의 계산을 반복합니다.
마찬가지 이유로, COX regression에서 다중 공선성을 계산하는 많은 X 변수들도 그냥 다중 회귀분석을 이용한 VIF를 사용해서 계산할 수 있습니다.
어짜피 Cox에서는 Y에 해당하는 것이 time과 event 인데, 나머지 X들은 결국 로지스틱회귀분석과 같은 서로 관계가 있는지 보는 셈이 될테니까요...
그래서 그냥 다중회귀분석에 있는 다중공선성 보는 메뉴를 사용하면 된다. 이렇게 요약할 수 있겠습니다.
그건 SPSS에서의 이야기입니다.
web-R에서도 그렇게 하는 것이 좋을지, 혹은 따로 cox에서도 그 메뉴를 넣어야 하는지는
조금 토의해 보아야 겠습니다. 사실 SPSS에서도 그걸 몰라서, 어려워서 안한 것이 아닐테니까요..
질문하신 내용은 저로서도 잘 모르겠습니다.^^ 통계 전공하신 분들의 답변이 필요할 것 같습니다.