Skip to menu

IT Daily의  좋은 글이 있어 올립니다.

원문 보기  :  http://www.itdaily.kr/news/articleView.html?idxno=53338

 

[데이터사이언티스를 찾아서] 코딩을 모르는 것은 21세기 문맹이다보바스기념병원 고석범 병원장

  
 

[컴퓨터월드] 노인요양재활 서비스를 주로 제공하는 요양 병원인 보바스기념병원에서 병원장을 맡고 있는 고석범 원장은 주변 사람들에게 코딩의 중요성을 설파하곤 한다. 
그는 전산학과 출신도 아니다. 가톨릭 대학교 의과대학을 졸업하고 같은 대학 병원에서 신경과 전문의가 된 그가, ‘프로그래밍 언어’에 대해 이야기하고 “생산성을 망치는 MS 오피스에 종속되선 안 된다”는 주장을 펼치곤 한다.
신경과 전문의가 코딩의 중요성을 강조하기까지 필시 무슨 이유가 있을 터. 고석범 병원장의 생각을 직접 듣기 위해 경기도 성남시 분당에 위치한 보바스기념병원을 찾았다.

데스크톱PC 전원을 켜면 윈도우 시작음이 들리고 인터넷 검색을 하기 위해 인터넷 익스플로러를 실행시킨다. 그리고 문서 작업을 위해 마이크로소프트 오피스를 사용한다. 

우리 주변 사람들 이야기다. 인터넷 검색을 위해서는 인터넷 익스플로러를, 각종 업무를 위해서는 MS 워드나 엑셀을 사용하듯 흔한 일이다. 보바스기념병원 고석범 병원장 역시 불과 몇 년 전 이와 같은 흔한 사람들과 다를 바 없는 유형의 삶을 살았다고 했다. 

“R을 접할 수 있었던 것은 정말 행운이었다” 
고석범 병원장은 R을 접한 후 그의 사고방식에 변화가 일어났다고 말했다.

2009년 성남시 노인보건센터장으로 재직했을 당시 R을 처음 접했다. 성남시 노인보건센터는 시립요양원으로 공공 관련 사업을 진행했는데 이에 대한 보고서를 제출해야 했다. 이 같은 보고서 작성을 위해 무료 프로그램을 찾다 발견한 것이 R이었다. 

고 병원장은 “처음 R 콘솔을 실행하고 간단한 소개가 나온 후 프롬프트만으로 구성된 화면을 보았을 때 그 황당함은 아직까지 잊을 수 없다”고 그 당시를 회상했다. 도대체 무엇을 어떻게 하라는 것인지 정말 당황했다고 한다. 이런 프로그램에 외국 사용자들이 왜 열광하는지 이해할 수도 없었다.

그래도 괜찮은 통계 프로그램이라는 추천에 군말 없이 CRAN 사이트에 올라와 있는 여러 매뉴얼을 들춰보면서 R을 공부하기 시작했다. R 사용설명서와 R 사용자들의 블로그를 모아놓은 R-blonggers.com 사이트에서 R로 구현한 여러 사례들을 접하면서 오픈소스의 정신과 코딩의 세계에 빠져들게 됐다.

고석범 병원장은 “의료계에서 많이 사용하는 SPSS의 경우 통계를 위한 분석을 한다고 했을 때 수많은 결과를 쏟아낸다. 이 결과물을 해석하는 것이 통계학을 공부하는 것처럼 이해할 수 있지만 이는 주종이 바뀐 것이다. SPSS가 통계학을 위해 이 프로그램을 사용해야 한다는 개념이 된다. 반대로 R의 경우는 원하는 대로 분석하고 결과를 낼 수 있다. R을 사용할 때 내가 통계를 하고 있다는 생각이 들면서 R이 통계학자들이 만든 언어라는 것을 피부로 느끼게 됐다”고 말했다. 

고 병원장은 그 당시 애플 맥(Mac)을 구입하면서 컴퓨터의 기본 원리와 개념에 대해 더욱 파고들고 있는 자신을 발견하게 됐다. 

통계학적 지식뿐만 아니라 컴퓨터에 대한 이해의 틀 가져야 
“R을 사용하는 많은 사람이 학계에 있어서인지 그들의 글을 읽어보면 통계학적인 지식뿐만 아니라 컴퓨터 세계에 대한 이해의 틀을 가져야 한다고 조언하는 내용이 많았다” 

고석범 병원장은 컴퓨터에 대해 전혀 몰랐던 상태에서 R을 매개로 명령어를 익히면서 코딩을 맛봤다. 이에 그치지 않고 문서 조판에 사용되는 프로그램은 레이텍(LaTeX)은 물론 C언어, 웹 등 R과 연계 된 것들로 공부 범위를 점차 넓혀나갔다. 

“보통 R의 학습곡선(learning curve)이 가파르다고 이야기들 한다. 그만큼 쉽게 접근 하지 못하고 그저 어려운 언어, 생소한 언어라고 치부하고 가까이 두려하지 않는다. 그러나 프로그래밍 접근만이 아닌 통계학적 지식을 겸한다면 이처럼 쉬운 언어도 없다고 생각한다”는 생각을 가진 고석범 병원장은 이 같은 생각을 통해 컴퓨터에 대한 개념을 알게 된 후 컴퓨터를 소비적으로 사용하기 보다 자신의 생각을 자유롭게 발휘할 수 있는 방법에 대해 고민하게 됐다. 

“개인적으로 업무에 마이크로소프트 오피스를 사용하는 것을 반대한다. 업무의 생산성을 높이기는 커녕 오피스 틀에 맞춘 생각에 머물러 있어 그저 종속 관계로 남게 된다. 단순히 오피스를 쓰기 위해 컴퓨터를 사는 것이 아니라 컴퓨터를 잘 활용할 수 있는 방법을 찾아야 한다”는 생각도 피력했다.

고석범 병원장의 이런 자신의 생각을 좀 더 강조하기 위해 “R과 Shiny 패키지를 활용한 웹 애플리케이션 개발”이라는 책을 번역했다. 이 책을 통해 초보자들이 R과 RStudio를 설치하는 방법과 RStudio에서 샤이니 앱 개발을 손쉽게 시작할 수 있는 한국어판 특별 부록도 수록해 보다 쉽게 R을 생각할 수 있도록 했다.

고 병원장은 이에 그치지 않고 “R과 Knitr를 활용한 데이터 연동형 문서 만들기(빅데이터 시대의 효율적인 자료 작성 가이드)”란 제목으로 서적도 출간했다. 이 책은 R 언어와 니터(Knitr) 패키지를 사용하여, ‘재현 가능한 연구(reproducible research)’ 방법으로 인쇄물, 웹 페이지, 웹 프리젠테이션, 웹 애플리케이션 등의 다양한 데이터 문서와 자료를 만드는 방법을 소개했다.  

  
 

데이터 분석의 주도적 역할을 하기 위해서는 프로그래밍 언어를 알아야
“빅데이터가 화두가 되면서 데이터를 가지고 연구를 수행하는 방향으로 의약연구도 흐름을 바꾸기 시작했다. 회계 다음으로 중요한 데이터가 인간의 생명, 질병, 그리고 건강을 다루는 의료 데이터라고 생각한다. 이를 잘 활용할 수 있으려면 R이 보다 적극적으로 활용해야 한다” 
고석범 병원장은 최근 빅데이터가 화두가 되면서 의료계에서 빅데이터 연구를 해보겠다고 하지만 잘못된 방향으로 가고 있다고 꼬집어 말했다. 빅데이터 연구를 위해 IT 전문가와 협업을 하고 가치를 찾겠다고 하지만 연구자가 주도권을 잡지 못하고 있다. 

결국 주도권을 가지고 있는 연구자가 직접 분석에 도달할 수 있어야 하며, 이를 위해 R 같은 통계 프로그램 언어를 다를 수 있는 능력이 필요하다는 것이다. 

특히 “대형 병원의 경우 적극적인 투자를 통해서 IT 시스템을 갖추고 있지만 대부분 병원은 영세해 OCS(Order Communication System) 운영하기도 벅차다”며, “간단한 분석의 경우 스스로 해봄으로 새로운 가치를 창출할 수 있다”고 강조했다. 

“코드 한 줄 쓰기”가 첫 걸음마 
고석범 병원장은 컴퓨터에 대한 이해가 없었던 자신의 상황을 비유하며 “R은 한 줄 쓰기가 어렵지 한 줄을 쓰고 나면 이미 절반은 성공한 것”이라고 조언했다. 

내가 프로그램을 거창하게 만들겠다는 것보다 계산기를 사용하듯 낯선 두려움을 떨쳐내고 연습을 지속적으로 하다보면 실력이 늘어날 수 있다는 것이다. 

게다가 R에 관련한 자료가 많아 쉽게 접근이 가능하며 관련 커뮤니티도 활성화되어 있어 많은 도움을 받을 수 있다고 덧붙여 말했다. 

“처음 R 관련 패키지를 이해할 때는 2주 걸렸다. 개발자들이야 소소코드를 들여다보며 분석을 하지만 사용자들은 잘만 활용하면 된다. 게다가 R 개발 프로그램인 RStudio는 코드를 입력하는 순간 시각적으로 표현해줘 초보자들도 쉽게 사용할 수 있다”며 두려움을 떨치라고 조언했다.