교수님 매우 많은 도움이 되는 수업을 잘들었습니다. 그런데 질문이 있어 글 남깁니다.
마지막 시간에 로지스틱 회귀분석에서
BMI, 키, 몸무게의 경우 교차되는 설명변수에 넣고 돌려야 한다고 들었습니다만
이 부분이 잘 이해가 안가서 질문드립니다.
세가지 변수를 모두 "교차되는 설명변수"에 넣어야 하는 것인지 아니면 BMI 는 설명변수로, 키, 몸무게는 교차변수로 넣는 것인지, 아니면 그 반대인지,,
문의드립니다.
이렇게 해서 나온 final model 에 BMI 만 있다면 odds ratio 해석은 어떻게 해야 하는 것인지요?
또 다른 예로는 밀도 같은 것이 있겠는데요, 밀도는 부피 분의 질량인데 세가지 변수를 각각 어디로 넣어야 하는 것인지요,,
그리고 이렇게 통계를 돌려 의미있는 결과가 나온 경우, 제한점으로 교란변수일 가능성을 배제 못한다고 설명할 수 있는 것인지요?
아니면 다중공선성에 문제가 있다고 해야 하는 것인지요? 다중공선성에 문제가 있는 것이라면, web R에서 이부분에 대한 검증이 가능한지요?
또 통계돌리는 방법을 기술할 때, 따로 기술해주어야 하는 부분이 있는것인지요?
질문이 많아서 죄송합니다.
기본적인 질문이지만, 답을 구하기 어려워서 질문드립니다.
감사합니다.
Comment 1
-
cardiomoon
2017.09.06 22:52
이해를 잘 못하신 것 같습니다. 상호 교차되는 설명변수는 설명변수간에 interaction을 보는 방법입니다. 예를 들어 mtcars데이터에서 연비(mpg)를 반응변수(종속변수)로 하고 공차중량(wt)와 마력(hp)를 설명변수로 하여 회귀모형을 만들면 lm(mpg~wt*hp,data=mtcars) 로 할 수 있습니다. 이때 wt*hp는 wt+hp+wt:hp와 같습니다. 이때 wt:hp는 wt와 hp의 interaction입니다. 제 책 의학논문 작성을 위한 R통계와 그래프를 참고하시기 바랍니다.