운동량에 따른 사망률이 u shape을 가진다는 가정으로 분석.
변수 "운동량" 은 연속형 변수
이럴경우 사망률이 가장 낮을때의 운동량을 다른 성별, 나이, risk factor 들을 보정해서 찾고자 한다면 어떤 분석 방법을 적용해야 할까요?
감사드립니다.
운동량에 따른 사망률이 u shape을 가진다는 가정으로 분석.
변수 "운동량" 은 연속형 변수
이럴경우 사망률이 가장 낮을때의 운동량을 다른 성별, 나이, risk factor 들을 보정해서 찾고자 한다면 어떤 분석 방법을 적용해야 할까요?
감사드립니다.
일반적인 접근법은 로지스틱 회귀분석이나, Cox 회귀분석입니다.
운동량을 구간별로 나누어서, 만약 1000명이라면 1000명씩 10개로 나룰 수 있겠지요.
500명 정도라면, 한군이 너무 너무 작아 질 수 있으므로, 4 등분 또는 5등분 정도로 할 수도 있고요,
이렇게 해서 1군을 혹은 가장 낮은 군을 reference로 잡고,
나머지 변수들도 모두 공변량으로 넣어서 분석 할 수 있겠지요.
이런 분석으로 BMI를 10개인가... 정도의 구간으로 나누어서 사망을 분석한 것이 NEJM이 실려 있습니다.
U 자 곡선으로 되어 있죠.
어떻게 구간으로 나눌 것인가? 또 구간으로 나눈 것을 더미변수로 처리하기 위해 이름을 잘 정해야.
reference로 처리하는데 혼란스럽지 않습니다.
SPSS나 web-R이나, reference 처리하는 것이 조금 까다롭습니다.
보통은 first 혹은 last 밖에 되지 않기 때문에,
아예 코딩할 때 이름을 달리하는 방법이 가장 무난합니다.
알고 나면 아무것도 아니지만... 모를 때는 조금 까다롭죠.