안녕하십니까?
열심히 웹에서 하는 R통계 공부하고 있습니다.
질문드립니다.
연속형 자료를 범주화해서 통계를 돌리고 싶은데 어떻게 해야 되나요?
예를 들어 modified Rankin scale 0,1,2,3,4,5 중 0,1,2는 good prognosis, 3,4,5는 poor prognosis로 하여 두군이나 세군을 비교하고 싶습니다.
또는 환자들을 연령군(20대, 30대, 40대, 50대, 60대, 70대, 80대)간의 outcome 비교를 하고 싶습니다.
제가 자료를 다시 정리해서 업로드해서 해야 되나요? 아님 프로그램에서 가능한가요?
그냥 R에서는 명령어 입력으로 범주화가 가능한 것 같던데요...
답변부탁드립니다.
감사합니다.
Comment 2
-
cardiomoon
2016.10.11 08:42
-
Even
2016.10.12 16:05
답변 감사드립니다.
R명령어를 preprocessing부분에 넣으면 됩니다. 예를 들어 내가 올린 자료는 uploaded로 접근 가능합니다.
1) modified Rankin scale 0,1,2,3,4,5 중 0,1,2는 good prognosis, 3,4,5는 poor prognosis로 하여 두군이나 세군을 비교하고 싶습니다.
이 경우 modeified Rankin scale이 scale이라는 열 이름으로 저장 되어 있고 새로 pxgroup이라는 범주형 범주로 만들려면
uploaded$pxgroup<-ifelse(uploaded$scale<3,"good","poor")
2) 연령군별로 비교시 age라는 열에서 새로 decade라는 열을 만들려면
uploaded$decade<-uploaded$age%/%10
라고 입력하시고 do preprocesing체크박스를 체크하시면 됩니다. a/%/b는 a를 b로 나눈 몫을 뜻하는 연산자입니다.