교수님께.
매번 큰 도움을 받고 있어서 항상 감사히 생각하고 있습니다.
논문 작성 중에 궁금한 부분이 생겨서 질문 드립니다.
예를 들어, 다변량 분석을 시행할 때, 임상적 혹은 통계적으로 유의한 변수 (age, sex, albumin, cr 등등) 를 추려서 다변량 분석에 variable 로 입력을 시키고,
이를 backward elimination 으로 분석을 시켰을 때 최종적으로 포함되는 변수들이 있습니다.
이때 최종 모델에서 만일에 age, sex 가 제외가 되었다면,
논문 기술을 할때, age 와 sex 로는 adjust 가 되었다고 할 수가 없는 것인가요?
아니면 backward elimination 을 시행하면서 age, sex adjustment 가 되었다고 볼 수가 있는 것인가요?
이 부분을 찾아봐도 정확히 나온 곳이 없어서 교수님께 여쭤봅니다.
좋은 하루 되십시오.
안녕하세요
잘 모르지만 답변이 없으시길래 한글자 달아봅니다
위계적 회귀분석의 방법에 따른 국문논문이 하나 있으니 읽어보시기 바랍니다
류나현, 김형석, 강필성 (2016). 다중선형회귀모형에서의 변수선택기법 평가. 대한산업공학회지, 42(5), 314-326.
말씀하신 문제에 대한 방법론적 해결방법은 후진제거의 옵션에는 진입값 설정과 제거값설정이 있습니다
이 부분을 조정해 보셔서 age와 sex를 제거되지 않게 하는 방법이 있습니다
하지만 근본적으로 투입하신 변수들 간에 다중공선성이 있어서 동시투입시 age와 sex가 누락되는 것이라면 다중공선성 해결이 우선일 것이며 입력방식이나 단계입력방식으로 변인들간의 공선성여부를 확인하시고 다중공선성 변인을 제거하고 후진제거 방식으로 다시 돌려 보시는게 좋으실 것 같습니다
추가적으로 경로분석을 실시하시고 그 결과를 확인해 보실것을 권장드립니다 일단 추정방법이 틀리고 오차의 유무가 결과에 영향을 미치기에...
또한 궁극적으로 age와 sex는 정규분포를 가정하지 못하는 범주형 변수로 봐야 하고 특히 sex는 이분형 변수이기에 그에 맞는 조취(변수타입 지정, 추정방식지정, SE 옵션지정)를 추가적으로 하시면 더욱 좋은 결과를 가져오지 않을까 생각해 봅니다