교수님 안녕하세요, 늘 많은 도움 얻어갑니다 ^^
그룹 별로 1씩 증가하는 변수(Seq)를 기존 데이터에서 누락된 값을 고려하여 생성하고 싶습니다.
예를 들어
Group | Seq | Value |
A | 1 | 10 |
A | 2 | 20 |
A | 4 | 30 |
A | 5 | 40 |
B | 1 | 100 |
B | 3 | 150 |
B | 4 | 200 |
B | 5 | 250 |
이런식으로 데이터가 형성되어 있다고 하면 A그룹에서는 Seq 3, B그룹에서는 Seq 2가 누락된 상태입니다.
이러한 누락값을 1씩 증가되도록 Seq를 재 생성하여 아래와 같은 데이터로 만드려면 어떻게 하면 좋을까요?
Value의 누락은 상관없습니다.
Group | Seq | Value |
A | 1 | 10 |
A | 2 | 20 |
A | 3 | NA |
A | 4 | 30 |
A | 5 | 40 |
B | 1 | 100 |
B | 2 | NA |
B | 3 | 150 |
B | 4 | 200 |
B | 5 | 250 |
Comment 3
-
cardiomoon
2018.09.01 07:56
-
cardiomoon
2018.09.01 13:27
Group=rep(c("A","B"),each=4)Seq=c(1,2,4,5,1,3,4,5)Value=c(10,20,30,40,100,150,200,250)df=data.frame(Group,Seq,Value)if(!require(tidyverse)) install.packages("tidyverse")df %>% complete(Seq,Group) %>% arrange(Group) -
kenny
2018.09.03 08:36
교수님 감사합니다. tidyverse의 패키지에 대해 공부를 더 해보도록 하겠습니다!
tidyr 패키지의 의 complete() 함수를 쓰시면 됩니다^^