안녕하세요!
웹 문서에서 read_html을 사용해 https://en.wikipedia.org/wiki/Seoul 페이지의
위 표를 R에서 읽어오고자 하여 다음과 같이 입력하였는데 encoding을 첨부하여도 계속 해서 멀티바이트 문자열 에러가 발생합니다.
어떻게 하면 정상적으로 읽어올 수 있을지 해결법을 가르쳐주시면 감사하겠습니다.
Comment 2
-
cardiomoon
2020.09.15 16:46
encoding이 UTF=8이 아니라 UTF-8입니다.> library(rvest)> hwurl="https://en.wikipedia.org/wiki/Seoul"> html_ex=read_html(hwurl,encoding="UTF-8")> html_ex %>% html_nodes(".toccolours")%>%html_table()[[1]]Year Pop. ±% p.a.1 1950 1,021,000 —2 1960 2,361,000 +8.74%3 1970 5,312,000 +8.45%4 1980 8,244,000 +4.49%5 1990 10,518,000 +2.47%6 2000 9,879,000 −0.62%7 2010 9,796,000 −0.08%8 2020 9,963,000 +0.17%9 source:[68] source:[68] source:[68] -
콘이맘
2020.10.02 20:50
답변 감사합니다 ^^...