처음 사용하는데 데이터 전처리가 어렵습니다.
홈페이지에 혹시 공지가 있는지 수시간째 헤매도 있는데 못 찼겠습니다.
혹시 있다면 어래와 같은 질문은 하지 않아도 될 것 같습니다만.....
1. 웹에서하는 R2.0에서는 변수 하나씩 지정하여 숫자를 factor로 바꿀수 있게 되어있지만 이렇게 코딩한 변수가 많아 너무 시간이 많이 걸립니다.
여러변수를 한꺼번에 바꿀 수 없는지요?
2. 데이터전처리에 대한 예문이나 예제를 구할 수 있을지요?
3. 문자는 자동으로 factor로 인식하는지요? 그렇다면 excel에서 T,F로 바꿔서 바꾸는 것이 좋을 것 같습니다.
4. CSV로 올릴때, 숫자가 3개 또는 5개 미만이면 자동으로 factor로 인식하게 하는 것은 어떨지요?
5. NA를 .으로 표시해놨습니다. 결측치 전처리는 어떻게 해야하는지요?
감사합니다.
Comment 1
-
cardiomoon
2016.04.02 23:40
No. | Subject | Author | Date |
---|---|---|---|
134 | table 만들기에서, 나이 순으로 정렬시에 median 값과 범위를 지정할 수는 없는지요? [2] | 혈액 | 2016.04.06 |
133 | 자료 업뎃해서 다시 올립니다. [3] | 소오름 | 2016.04.03 |
132 | 표만들기가 안되네요 ㅠㅠ [3] | 피터팬79 | 2016.04.03 |
131 | 밑에서 질문 했던 자료입니다. [1] | 소오름 | 2016.04.03 |
» | 처음사용하는데 데이터 전처리가 어렵습니다. [1] | namuhanayeyo | 2016.04.02 |
129 | 메타분석에 대해 질문이 있습니다 [2] | 카우보이 | 2016.04.01 |
128 | 이 데이터의 비교를 하고 싶습니다. [3] | 소오름 | 2016.04.01 |
127 | 자료전처리 문의드립니다 (두 명목변수를 조합해서 새 변수 생성) [2] | 화모기 | 2016.03.31 |
126 | ANOVA, Kruskal-Wallis 검정 및 다중비교 [3] | 소오름 | 2016.03.31 |
125 | PSM와 c-statisticcs (AUC)에 관련해서 질문드립니다. | 김정환 | 2016.03.22 |
124 | 그래프 그리기에 대한 질문입니다. [2] | 난둥 | 2016.03.18 |
123 | 생존분석에서 설명변수 없이 생존곡선을 그리고 싶습니다. [4] | sabqueen | 2016.03.16 |
122 | Table 1 만들기 질문 [2] | jaychoi | 2016.03.13 |
121 | 산점도로 표현하고 싶은데요.. [2] | 난둥 | 2016.03.11 |
120 | 머신러닝 레볼루션 행사안내 [1] | mike | 2016.03.10 |
119 | 표만들기 관련 질문입니다. [1] | tympa | 2016.03.10 |
118 | 그래프 작성 문의드립니다. [4] | 도치맘 | 2016.03.10 |
117 | descriptive 표만들기 질문입니다. [4] | 난둥 | 2016.03.10 |
116 | [RStudio Server] 사용 연장 문의 [2] | KB | 2016.03.09 |
115 | 인공지능, 인지 컴퓨팅, 머신 러닝, 딥 러닝 관련 IBM 자료 [1] | Ben | 2016.03.09 |
1) 제가 쓴 "의학논문작성을 위한 R통계와 그래프" 책 155페이지에 보시면 문자열/숫자로 입력된 변수를 범주형변수로 바꾸기 라는 내용이 있고 158페이지에는 범주형변수를 문자열/숫자형 변수로 바꾸기 라는 내용이 있습니다. 참조하십시요.
2) 178페이지에 보시면 NA값을 평균값으로 입력하기 라는 내용이 있고 161-177에 걸쳐 누락된 자료를 처리하는 최신기법인 multiple imputation에 대해 다루고 있습니다.
3) 문자는 문자로 character로 인식이되며 통계처리시 factor처럼 처리됩니다.
4) 기본적으로 고유값이 6개 미만인 값은 표만들기 할때 범주형변수로 처리됩니다. 이 값은 조정 가능합니다.
5) .로 표시된것을 일괄하여 바꾸셔야 하겠는데요...결측치는 비워 놓으시길 바랍니다.^^