교수님께,
로지스틱 회귀분석과정중 질문 있어 문의드립니다.
회귀분석후 stepwise (backward elimination) 분석을 시행하며
다음과 같은 에러가 발생합니다.
> backwardlogi=step(logi_SCI, direction = "backward")
Start: AIC=90.76
mortality ~ noso + hepabiliary + appro + invasive + Charlson.s.Score +
Pitt.bacteremia.score
Df Deviance AIC
- appro 1 76.840 88.840
- invasive 1 77.928 89.928
<none> 76.760 90.760
- hepabiliary 1 79.347 91.347
- noso 1 81.333 93.333
- Charlson.s.Score 1 94.757 106.757
- Pitt.bacteremia.score 1 97.144 109.144
Error in step(logi_SCI, direction = "backward") :
행의 개수가 변경되었습니다: 결측치들을 제거했나요?
기본회귀 일때는 디폴트로 listwise deletion 했서 문제 없었던 것 같은데..n 수가 많지 않아 결측치 있는 데이터도 최대한
포함해서 분석하고 합니다.
이러한 에러의 원인은 무엇이며, 어떻게 해결하면 좋을지 이리저리 찾아봐도 명확한 답을 찾을 수 없어 이렇게 질문드립니다.
항상 책과 강의를 통해 많은 도움 받고 있습니다. 감사드립니다!
Comment 2
-
아빠가들려주는통계김지형
2019.02.21 10:41
-
매직하마
2019.02.23 13:37
답변 정말 감사합니다!!^^
No. | Subject | Author | Date |
---|---|---|---|
594 | diagnostic accuracy [1] | 쑤니 | 2019.03.07 |
593 | 생존분석 질문입니다. [2] | 박소이 | 2019.03.06 |
592 | 표만들기 오류 [1] | 김밥친구 | 2019.03.03 |
591 | 변수선택 관련 질문 드립니다. [1] | chamchi | 2019.02.28 |
590 | forest plot 그리는 법 문의 드립니다. [1] | 강민정 | 2019.02.24 |
589 | matchIt 함수 사용시 질문 있습니다. [1] | YJK | 2019.02.23 |
588 | ORplot 관련하여 질문드립니다. | 매직하마 | 2019.02.23 |
587 | mytable 함수 에러 [3] | iddrlee | 2019.02.21 |
586 | 범주형 변수 생존 분석시 log rank와 cox univariate 결과 해석에 대해 질문 드립니다. [1] | 소외 | 2019.02.20 |
585 | 회귀분석에서의 범주형변수 [4] | 에곤쉴레 | 2019.02.20 |
584 | Survdiff로 log-rank test 시 P-value 소수점 [3] | begabung | 2019.02.15 |
583 | 정회원 서버 신청 문의입니다. [2] | chl065512 | 2019.02.13 |
582 | mytable 관련 질문드립니다 [3] | 낡은찻잔 | 2019.02.12 |
581 | web-R 기반 분석 후 다운로드 관련 문의점 | kato7 | 2019.02.11 |
» | stepwise logistic 회귀에서 결측치 문제 질문드립니다. [2] | 매직하마 | 2019.02.10 |
579 | 데이터 업로드에 오류가 반복되어 생깁니다. | kato7 | 2019.02.07 |
578 | table 작성시 오류 | 김날 | 2019.02.07 |
577 | 문의 드립니다. [1] | 김날 | 2019.01.31 |
576 | 표 만들기에서 계속 error 가 납니다. [3] | 세희맘 | 2019.01.30 |
575 | Risk scoring??? [1] | 홍성엽 | 2019.01.28 |
기본적으로 listwise deletion이 아닌 상태로 실행할 수가 없습니다.
regression에서 말이죠.
대신에 비어있는 값을 적절한 방법으로 impution 시켜야 하고,
그렇게 해서 실행하는 방법이 R에도 이미 나와있습니다.
대표적인 방법이 multiple impution이고요,
web-R에서도 곧 실행될 것입니다.
잠시만 기다리시면,
그런데 무엇보다 중요한 것은
다변수 분석을 시행하는데, n수가 적다면 사실 분석에 의미가 적어집니다.
충분히 많은 수가 있어야. 다양한 변수에 따른 영향을 판단할 수 있겠지요.