질문이 있습니다.
최근 결측치를 다루는 공부를 하며 multiple imputation 에 대해 알게되고 mice package 를 알게되었습니다.
예를 들어 airquality 의 데이터에서
imp <- mice(airquality, seed=123) 으로 5개의 대체값을 만든 후의 과정이 궁금합니다.
comple <- complete(imp, action =3) 으로 하면 3번째의 대체값을 넣고 분석을 하면되는 건가요?
만약 분석을 하고 난 후 결측치가 있었던 데이터와의 비교는 불가능한건가요??
Comment 2
-
cardiomoon
2022.01.08 16:05
-
이등수학
2022.01.17 19:56
5개 대체값을 모두 분석한 후(with 함수) 합칩니다(pool 함수). 그 후 원래 분석결과와 비교하시면 됩니다.
문건웅 교수님 강의록 R강의7. 누락된 자료의 처리 (rstudio-pubs-static.s3.amazonaws.com) 참고해주십시오.
제가 지금 만들고 있는 autoReg 패키지를 보시면 그 해답이 있습니다. 지금 CRAN에 submission 중인데 CRAN에 등록되면 홍보할 예정입니다.
https://cardiomoon.github.io/autoReg/articles/Automatic_Regression_Modeling.html