안녕하세요.
다변량분석을 할때 예후에 대한 인자로 여러가지를 예측변수를 넣게 되는데요.
이것들이 보통은 상관관계가 있는 경우가 많은 것 같습니다.
예를 들어 나이와 co-morbidity 같은 경우 상관관계가 있을 건데요...
1.
다변량분석을 하게 되면 서로 보정을 하게된 후 좀 더 강한 유의한 인자만 살아남게 되는데...
이런 경우 살아남은 인자가 유의하지 않은 인자보다 예후를 예측하는데 좋은 인자라고 해석할 수 있는지요?
예를 들어 나이는 유의하게 나왔는데, co-morbidity는 유의하게 나오지 않은 경우
나이는 co-morbidity보다 생존을 예측하는데 유의한 인자였다. 이런식으로요.
2.
그리고 다중회귀분석에서는 다중공선성(VIF)가 높은 경우는 독립변수간에 완전한 선형관계가 있다고 봐서
좀 더 유의하다고 생각하는 인자만 남기게 되는데,
생존분석에서도 그러한 방법이 있는지요? (변수선택시 넣지 말아야할 조건이 있는건지요?)
Comment 2
-
alse
2018.08.28 23:49
검색하다보니 천감기선생님께서 다른 글에 이렇게 답변을 달아주셨는데요.---------------------------------------------------------------------------------우선 다중 공선선을 검정하는데 많이 사용되는 VIF 등을 어떻게 구하는지를 알면 조금 쉽게 생각하실 수도 있습니다.로지스틱 회귀분석으로 할 때, VIF를 구하려고 하면, SPSS 설명한 글들을 보면, 로지스틱 회귀분석 메뉴를 사용하지 말고,다중 회귀분석 메뉴에서 VIF를 계산하라고 되어 있지요.왜냐하면, VIF 계산에서는 Y값은 무시하고, 많은 독립변수들인 X1, X2, X3 등등만 계산하기 때문에, Y가 연속변수이든, 0/1인 이분변수이든 상관이 없기 때문입니다.즉, X1과 기타 다른 X들과 계산하고, 다시 X2와 다른 X들과 계산하고.. 이런식의 계산을 반복합니다.마찬가지 이유로, COX regression에서 다중 공선성을 계산하는 많은 X 변수들도 그냥 다중 회귀분석을 이용한 VIF를 사용해서 계산할 수 있습니다.어짜피 Cox에서는 Y에 해당하는 것이 time과 event 인데, 나머지 X들은 결국 로지스틱회귀분석과 같은 서로 관계가 있는지 보는 셈이 될테니까요...그래서 그냥 다중회귀분석에 있는 다중공선성 보는 메뉴를 사용하면 된다. 이렇게 요약할 수 있겠습니다.그건 SPSS에서의 이야기입니다.web-R에서도 그렇게 하는 것이 좋을지, 혹은 따로 cox에서도 그 메뉴를 넣어야 하는지는조금 토의해 보아야 겠습니다. 사실 SPSS에서도 그걸 몰라서, 어려워서 안한 것이 아닐테니까요..------------------------------------------------------------------------------------------------------반대로 다중공선성이 다중회귀분석에서 낮게 측정됐다면 Cox의 변수로 사용해도 된다는 말씀일까요? ^^ -
alse
2018.08.31 12:04
통계학과 선생님께 여쭤볼기회가 되어 여쭤보았는데요...
1.
"주어진 데이터에 기반해서 통계적으로 봤을 때"라는 단서를 달고 그렇다고 할 수 있습니다. 그러나 일반적으로 '어떤 변수가 생존 예측에 유의한 인자이다'라는 판단에는 임상적인 판단도 함께 들어가야 합니다. 예를 들어 나이의 p-value가 co-morbidity의 p-value보다 훨씬 작게 나왔다 할지라도, 만약 나이의 HR가 1.01이 나왔다면, 임상적으로는 나이가 생존에 미치는 영향이 미미한 것일 수도 있습니다. 그리고 co-morbidity의 p-value가 충분히 작게 나오지 않았다 할지라도, 그것이 co-morbidity가 생존에 영향을 미치지 않는다는 근거가 되지는 않습니다. 사실은 영향을 미치는데, 샘플 사이즈가 작았거나 데이터의 노이즈 때문에 우리가 detect 하지 못한 것일 수도 있기 때문입니다. 그래서 설명변수를 선택할 때 p-value로만 선택하는 것보다는 임상적인 지식과 통계 결과를 같이 이용하는 것이 일반적으로 추천되는 방법입니다.
2.
VIF는 종속변수와 관계가 없는 개념이라, 생존분석에서도 선형회귀분석에서와 같은 방법으로 이용하시면 됩니다.
이렇게 답변 받았습니다. 다른분들도 도움되시면 좋겠네요 ^^