교수님 안녕하세요?
생존분석을 하던 중 궁금증이 있어서 글을 올리게 되었습니다.
저는 일반적으로 생존분석을 할 때 Kaplan-meier curve를 그리고 log-rank test로 두군간의 생존율의 차이가 있는지 확인하고 다변량 분석을 위해서 cox-regression test를 시행하여서 논문에 제시할때는 단변량 분석결과는 Kaplan-meier curve 에서의 중앙생존기간과 95% interval, log-rank P-value를 제시하고 다변량 분석결과는 cox-regression model에서의 Hazard-ratio와 95% confidence interval, P-value를 제시하였었습니다.
그런데 다른 논문들을 보던 중 단변량 분석에서도 Hazard-ratio와 95% confidence interval, P-value를 제시한 논문들이 있었고 method에 자세히 기술이 되어 있지 않아서 확실하지는 않지만 단변량 분석도 cox-regression을 이용한 것 같아보였습니다. Cox-regression test를 시행할때 변수를 하나만 넣어서 단변량 분석을 시행한 것 같고 주변에 물어보니 그런식으로도 많이 분석을 시행한다고 하더군요. 그래서 질문드리고자 하는것은 아래와 같습니다.
1. 생존분석시 단변량 분석으로 log-rank test를 시행하는것과 cox-regression test를 시행하는 것 중 어느 것이 더 적절한 것인지 궁금합니다.
2. Log-rank test에서는 P-value 0.036으로 양군간에 유의한 차이를 보였는데, cox-regression test에서는 P-value가 0.053으로 나왔다면 결과 해석을 어떻게 해야할까요?
3. Log-rank test는 Hazard ratio와 95% confidence interval을 구할 수 없는 방법인지 궁금합니다.
(관찰 기간 동안 양군 모두에서 event가 50% 이상의 환자에서 일어나지 않아서 median 값과 95% confidence interval을 제시할 수 없을때는 대표값을 어떻게 기술해주어야 할까요?)
부디 도움을 부탁드리고 또 미리 감사드립니다.. ^^;;;
1. 우선은 약간 비유적으로 설명하겠습니다.
단변량 분석으로, 카이제곱 검정을 하고, 다변량 분석으로 로지스틱 회귀분석을 하기도 하지만,
한변 단변량 분석으로 바로 하나의 변수만 넣은 로지스틱 회귀분석을 사용할 수도 있습니다.
사실 두 경우의 값이 거의 비슷하다는 것을 경험적으로도 알 수 있습니다.
비슷한 방식으로, log-rank test 한 것과 Cox 에 하나의 변수만 넣은 것도 거의 비슷한 양상을 보입니다.
그러므로 어떤 것이 더 좋으냐 라기 보다는 연구 계획서에 어떤 통계법을 사용하기로 하였느냐,
미리 계획된 그 방법을 쓰는 것이 정답입니다.
결과적으로 다변수 분석을 할 예정이라면, 단변수 Cox 시행한 후에 다변수 Cox 하는 것이 더 자연스럽고 편리한 점은 있습니다.
또 만일 RCT를 계획하고 있다면 Log rank test 한 후에 Cox를 하는 것이 조금 더 자연스러운 점이 있습니다.
Log-renk test의 경우에 샘플 수 계산 등이 조금 더 용이하고 직접적이기도 합니다.
한편 비열등성 검정의 경우 HR의 95%신뢰구간으로 판단하는 경우가 일반적인데
Cox 의 경우에 HR의 95% 신뢰구간을 구하기가 더 용이합니다.
그렇지만, 무엇보다 중요한 것은 연구 시작 적에 세운 계획에서 정한 방법이 우선됩니다.
================================
2. 위의 이유로 가장 중요한 것은 연구 계획서에 기록된 방법의 결과입니다.
이런 경우는 왕왕 있습니다. 모수 검정과 비모수 검정이 결과가 0.05 걸쳐 있는 경우,
ANOVA와 ANCOVA가 그런 경우 등이죠. 이런 경우에는 항상 연구 전에 protocol이 가장 중요합니다.
그리고, 이렇게 애매하게 나온 경우라면 신뢰성이 떨어집니다. 그리고 계산한 p값에 대해서는 모두 제시해야 합니다.
적저히 내 마음에 맞는 것만 제시하는 것은 마땅하지 않습니다.
3. 보통 흔히 구하는 경우는 Cox에서 HR과 95%신뢰구간을 구하지만,
logrank test에서 구하는 방법은 Klein & Moeschberger, 2003.의 것이 있습니다.
MedCalc에서 이 방법으로 구해 주는데, 아직 web-r에서는 구하지 못하지만, 개선될 것 같습니다.
그래서, 앞서 말씀드린 것처럼 굳이 구해야 하는 경우라면 (비열등성 검정에서 처럼) Cox를 사용하는 것이 좋을 수도 있습니다.
첨언하자면, 카이제곱 검정의 OR과 로지스틱 회기분석의 OR을 약간 다르지만 거의 비슷합니다.
4. event의 숫자가 작아서, 중앙생존기간이 구해지지 않은 경우도 있습니다. 평균생존시간은 구해지나요? 그렇다면 그것으로 대신할 수 있고요.
속해있는 분야에 따라서 차라리 5년 생존율과 그것의 95%신뢰구간을 더 자주 표현하는 경우도 있습니다.
학문의 분야에 따른 관습이라고 할 수도 있습니다.
김지형 드림