R에서 그룹별 사분위수 계산을 하려고 합니다.
그런데
aggregate(Y~X,df, summary)
aggregate(Y~X,df, fivenum)
summary, fivenum 모두 1st , 3rd quartile 값을 보여주는 것으로 되어 있는데
같은 데이터도 summary를 이용한 결과와 fivenum을 이용한 결과가 median 값은 같은데 quartile 값이 다릅니다.
spss로 데이터 탐색해서 나온값과 비교해도 quartile 값이 모두 다 다르네요.
사분위수 계산 방법이 통계학적으로 여러가지가 있다고 하긴 했는데
함수별 사분위수 계산방법이 차이가 나서 그런지요?
논문 작성시 normal distribution 되지 않아 그룹별 median, IQR 보여주기 위해 사분위수 계산하려고 하는데
R에서는 그룹별 사분위수 계산을 주로 어느 함수를 이용하여 구하는지 문의드립니다.
감사합니다.
Comment 2
-
cardiomoon
2021.05.04 22:40
-
버블
2021.05.15 19:52
감사합니다.~
quantile 함수의 도움말을 보시면 도움이 될 겁니다. quantile() 함수에서 quantile을 구하는 방법(type)이 모두 9가지가 있습니다 이중 R과 S에서는 type=7이 default로 되어있고
SAS에서는 2010까지는 type=3, 그 이후에는 type=2가 default이고 Minitab과 SPSS는 type=6을 사용합니다.
?quantile 을 입력하시면 도움말이 나옵니다.