데이터셋이 사용자별(ID) 물건카타고리별 구입여부(0, 1)가 포함된 binary 데이터입니다.
ex)
ID 전자제품류 가구류
1 1 1
2 0 1
3 1 1
.
.
.
총 8개의 제품 카타고리가 있고 이걸 ID별(약 5,000명) 군집분석 시 알 함수가 알고 싶습니다.
1. binary data의 상관분석
2. 군집의 수를 정하기 위한 binary 데이터의 계층적군집분석 방법
3. K값을 가지고 binary data 비계층적군집화방법
Comment 2
-
마술샘
2016.06.13 02:07
-
마술샘
2016.06.13 02:33
2,3번에 대한 답변은 아래 링크로 대신 하겠습니다
http://statdb1.uos.ac.kr/teaching/multi/chapter06-01.html
http://statdb1.uos.ac.kr/teaching/multi/chapter06-02.html
혹은 R 다변량통계분석의 제 11장 군집분석 부분을 참고하시면 되실겁니다
특히 343-353부분만 보셔도 되실겁니다
가까운 도서관에서 그 부분만 발취해서 보시면 좋으실겁니다
옛날에 군집분석 관련해서 논문 낸게 있는데 지금보니 많이 부족하지만 첨부합니다
안녕하세요 마술샘입니다
1. binary data의 상관분석
일단 두 변수 모두 이분형 변수 이거나 순서형 변수이어야 합니다
spearman 검증을 사용하시면 됩니다
방법은 먼저 상관계수 검증을 위해 cor(데이터명, method="spearman", use="pairwise.complete.obs")
혹은 with(데이터명, cor(변인1,변인2, method="spearman"))으로 해주시면 되십니다
그리고 p값을 구하시기 위해서는 with(데이터명, cor.test(변인1,변인2, method="spearman"))으로 해주시면 됩니다
그러나 web-r에서는 회귀분석안에 상관분석을 들어가셔서 변수 넣으시고 spearman을 체크하시고 r 값과 p값을 체크해서 확인하시면 됩니다.
편하게 하세요~~~~~~