교수님 안녕하십니까.
web-R사이트를 아주 유용하게 이용하다가, 제가 직접 코드로 r을 다뤄보고 싶어 이제 공부를 막 시작했습니다.;
부끄럽지만 data frame을 편집하는 과정에서부터 벌써 막히네요;;
첨부한 파일에서 예를 들어 'aqp4_ab'라는 변수에서 'neg' 혹은 'pos'값을 가지는 환자들과 이와 더불어 'dx_final'변수항목에서 'ms' 값을 가지는 환자를 리스트에서 제거한 버전의 새로운 데이터 프레임을 만드려고 할 때, 명령문을 어떻게 사용해야 할지요?
이것저것 해봐도 계속 오류가 납니다.
도움 부탁드립니다.
감사합니다.
Comment 5
-
cardiomoon
2018.01.23 13:31
> data=read.csv("./Downloads/KJS_data.csv",stringsAsFactors = FALSE)> nrow(data)[1] 133> table(data$dx_final)mono_TM ms nmosd_sn nmosd_sp rec_TM86 10 2 20 15>> #dx_final이 "ms"가 아닌 자료만 고르려면> data1=subset(data,dx_final!="ms")> nrow(data1)[1] 123>>> #aqp4_ab가 neg, pos인 환자들만 고르려면> table(data$aqp4_ab)nc neg pos uk13 93 20 7> data2=subset(data,aqp4_ab %in% c("pos","neg"))> nrow(data2)[1] 113 -
neurokim
2018.01.23 23:39
교수님, 감사합니다.~!!
큰 도움이 되었습니다. ~
-
neurokim
2018.01.24 00:13
교수님 그런데 한 가지 궁금한 것이 위의 예에서 final_dx가 ms인 경우를 위의 코드를 이용해 제거한 이후 다시 table(data$dx_final)을 적용하면 ms 0이라고 표기되어 나오는데, 이 말은 ms라는 항목 자체는 data frame구조상에 남아 있으면서 거기에 해당되는 수가 0이라는 의미인 것 같습니다만, 만약 ms라는 변수옵션 자체를 아예 dataset에서 없애고 싶다면 다른 방법을 취해야 하는 건지요?? (즉 제거 이후에 table(data$dx_final)을 취하면 테이블 상에 mono_TM nmosd_sn nmosd_sp rec_TM만 나오게 하는 방법)
-
cardiomoon
2018.01.24 23:30
> data=read.csv("./Downloads/KJS_data.csv",stringsAsFactors = FALSE)> table(data$dx_final)mono_TM ms nmosd_sn nmosd_sp rec_TM86 10 2 20 15> data1=subset(data,dx_final!="ms")> table(data1$dx_final)mono_TM nmosd_sn nmosd_sp rec_TM86 2 20 15 -
neurokim
2018.01.25 01:24
교수님 감사합니다.;;
저는 csv파일을 읽어올때, stringsAsFactors=FALSE대신 header=T를 넣었었는데, 그것 때문에 일어난 문제 같습니다. 교수님이 알려주신 그대로 하니, 잘 나옵니다 ;
감사합니다.