교수님 안녕하세요.
질문이 있어 글을 남기게 되었습니다.
저는 각 그룹에 3개체씩 연령별 그룹 4개로 나누어 총 12개체의 처리전(base)과 처리후(12h)의 expression 데이터를 가지고 하려고합니다.
연령별 그룹의 variance를 나타내는 boxplot을 그리려고 하는데 어떻게해봐도 자꾸 오류가 생깁니다.
제가 원하는 이미지는 첨부된 파일과 같습니다.
각 연령별로 그룹의 3개체씩의 데이터를 먼저 통계처리하고 진행하는게 맞는거 같은데
group1 (c1~3) group2 (c4~6) group3 (c7~c9) group4 (c10~12)
유전자개수가 너무 많은 걸까요...?
Comment 5
-
cardiomoon
2020.04.16 22:08
-
zkbi
2020.04.16 22:37
RNA-sequencing expression data로 받은거에서 FPKM값이라고 되어있습니다. missing data 인지는 모르겠습니다. 업체에 확인해보도록 하겠습니다.
유전자에 따라 0도 많고 30000이 넘어가는 데이터도 있어서 log를 씌워서도 해보고 있는데 맞는지 모르겠습니다.
-
cardiomoon
2020.04.16 22:55
-
zkbi
2020.04.20 14:47
교수님. 정말 감사합니다.
첫번째 사진이 individual 값으로 나타내신 그래프인가요?
-
cardiomoon
2020.04.20 22:17
두 그림은 같은 그림인데 밑의 그림은 로그스케일로 바꾼 그림입니다. vlaue값이 0이 너무 많아 boxplot이 한일자(-)로 보입니다.
자료가 0이 너무 많은데요? 0이 맞는 건가요? 혹시 0은 missing data인건가요?