교수님 안녕하세요.
항상 교수님의 가르침에 감사함을 느끼는 학생입니다.
이번에는 생존분석 관련 질문을 드리려고 합니다.
우선 저는 다음과 같은 컨셉의 "환자-대조군 연구"를 하고 있습니다.
" 알츠하이머성 치매에 걸린 사람(환자군)과 건강한 사람 (대조군)을 선정하여 질환을 일으키는 유전적인 요인 (부모로부터 물려받은 risk allele)을 찾기. "
가장 기본적으로 Logistic regression등을 통해
특정 유전인자의 유무 (독립변수)에 따라 알츠하이머성 치매 (종속변수)에 걸릴 위험도가 얼마나 높아지는 지 등은 검정해보았습니다.
다음과 같이 나이를 활용한 생존분석이 가능할지 여쭤보고자 합니다.
1. 데이터 설명
1) EVENT
알츠하이머 (AD), 정상인 (Healthy control, HC)
2) TIME (중단된 데이터, 첨부의 도표와 같이 검진 시점이 모두 다름.)
알츠하이머 환자군 : 알츠하이머 진단 후 Onset 시점을 추적하여 onset 나이데이터 추출
대조군 : 진단 시점의 나이 (진단 시점까지는 알츠하이머에 걸리지 않았음)
2. 검증하고자 하는 것과 검증을 위해 생각한 분석방법
검증하고자 하는 것 : 어떤 유전적인 요인에 따라 알츠하이머성 치매의 발생이 더 빠르게 나타난다.
1) Log-rank test 를 수행한다면 아래의 생존 곡선 두개를 비교
생존곡선 1. 전체 코호트 중 특정 유전 요인을 갖는 subset 에서의 알츠하이머성 치매의 발병 여부에 따른 생존 곡선
생존곡선 2. 전체 코호트 중 특정 유전 요인을 갖지 않는 subset에서의 알츠하이머성 치매의 발병 여부에 따른 생존 곡선
2) Cox의 비례위험 모형을 사용하여 Hazard ratio를 구함.
독립변수= 부모로 부터 받은 유전인자 (단변수)
TIME = 알츠하이머성 치매의 경우 ONSET age, 건강인의 경우 진단시 나이 (절단된 데이터)
EVENT = 알츠하이머성 치매
이런 상황에서, 질문은 총 네개 입니다.
Q1. 이 연구의 경우 위와 같이 나이를 활용한 생존 분석이 가능할지.
만약 가능하다면,
Q2. TIME을 알츠하이머성 치매의 경우 ONSET age로 건강인의 경우 진단시 나이 (절단된 데이터)로 보는 것이 맞는지?
Q3. [Log-rank test] 위와 같이 유전인자의 유/무에 따라 두개의 곡선을 각각 그리고 비교하는 것이 맞는지?
Q4. [Cox 비례위험 모형 ] 위와 같이 분석하는 것이 적절한지.
이상입니다.
교수님! 다시한번 감사드리며, 저도 좋은 분석가가 되어 꼭 도움이 되는 사람이 되겠습니다. 감사합니다!!
Comment 4
-
cardiomoon
2021.03.30 18:47
-
짱이야
2021.03.30 23:00
네 선생님 답변 정말 감사드립니다.!!!
정말 죄송하지만 다시한번 여쭤보겠습니다.
1. 출생당시에 유전적인 요인을 randomize했다?
연구에 필요한 대상(알츠하이머군 + 건강인)을 모집할때, "유전요인"을 고려하지 않았었습니다.
즉, 이것으로 유전적인 요인으로 인한 selection bias는 없다. = 유전적인 요인을 randomize했다 라고 이야기할 수 있을까요?
2. 만약 유전적 요인을 randomize하였다면,
위와 같이 time을 설정하는 것 (onset age와 diagnosis age 설정), log-rank test를 하는 것, cox-regression을 하는 것이 적절할 수 있다는 것으로 이해해도 괜찮을까요??
정말 감사합니다 선생님!
-
cardiomoon
2021.03.31 21:51
이 경우 생존분석을 진행하는 것은 무리인 것 같습니다. 전형적인 생존분석은 예를 들어 대장암인 경우 대장암을 진단받은 후 randomize하여 치료군과 대조군으로 나누고 randomization 이후 생존기간을 log rank test나 Cox regression 으로 비교하는 것이 되겠습니다. 이 경우는 생존분석을 진행하는 것은 무리일 것 같습니다.
-
짱이야
2021.04.01 08:50
네 교수님 답변주셔서 감사합니다~!
출생당시에 유전적 요인을 randomize 했다면 가능하겠죠.