Coursera Developing Data Products 리뷰
동영상 강의 편의성 증가 한 챕터 강의 동영상이 끝나면 다음 챕터로 자동으로 넘어가는 기능이 생겼고, 자막을 킨 상태이면 다음 챕터로 넘어가도 자막이 켜진 세팅이 유지가 됩니다.
Classmate라는 새로운 메뉴 Classmate라고 새로 생긴 메뉴가 있는데 수강생들을 지도에 표시해주는 기능입니다. 한국에도 몇 명이 수강중인지 보입니다. 해당 숫자를 눌러도 누가 강의를 듣는지는 자세히 표시해 주지 않네요. -0-;; 기능이 아직 완전하게 구현된 것은 아닌 것 같습니다. 나중에는 해당 지역을 클릭하면 수강한 학생들이 표시되고 쪽지보내기 등 커뮤니케이션 기능이 추가될 것으로 보입니다. MOOC의 단점 내지 취약한 부분으로 알려진 것이 수강생은 많아도 수료생은 극히 적다는 점인데, 혼자(그것도 무료로) 공부하면서 동기부여가 약해지고 외롭(?)게 공부해야 한다는 것이 수료를 막는 장애라고 인지하는 것 같습니다. 토론게시판의 기능을 보완하고 영어로 의사소통이 힘든 학생들에게는 Classmate 메뉴는 강의를 수료까지 이끄는 유용한 기능이 될 것으로 보입니다.
‘shiny’에 대해서 이전까지 뭐하는 것인지 자세히 알지 못했는데 이번 강의를 들으면서 R의 가능성에 눈이 한 번 더 띄였다고 느껴질 정도로 인상깊었고 재밌었습니다. R이 통계와 데이터를 다루는 언어로 특화되어 출발했을진 몰라도 프로그래밍에서 독자적인 영역을 구축해가고 있다는 생각이 들었습니다. 그리고 이러한 R의 발전에 Rstudio라는 회사의 기여도와 영향력을 새삼 느끼게 되었습니다(Hadly Whickam 교수님도.. -0-;;).
R에는 여러가지 Visualization Package들이 있습니다. ggplot2는 base package라 불러도 될 수준이구요. ggplot2는 정적인 plot, 완성된 이미지를 만드는 그래프 툴이라면 Interactive Visualization 툴은 유저의 Input에 따라 그래프가 변하는 동적인 이미지를 만드는 Package들입니다. ‘googlevis’, ‘rChart’ 등 여러가지 Package들을 배우게 되고 html과 결합시키는 방법들을 배우게 됩니다. 또, 웹에서 프리젠테이션 사이트를 보여주는 Package도 2종류 배우게 됩니다.
R Package 제작법은 Rstudio에 마련된 환경을 활용합니다. R에서 Package 제작이 코딩에 엄청난 실력을 가진 굇수들만이 할 수 있는 것은 아니란 것을 알게 되었고, 나도 한 번 만들어 봐야겠다는 생각이 들었습니다. R Package 제작이 Reproducible Research의 수단으로 활용되어 R의 Package가 기하급수적으로 늘어나는 것들에는 Rstudio를 이용한 쉬운 개발환경들도 한 몫한다고 생각되어 집니다. 이래저래 Rstudio에는 여러 번 감사한 마음을 갖게 되네요(어디에 팔리지 않았으면..).
Data Science Specializaton 마지막 강의입니다. Capstone Project라는 마지막 코스가 남아 있지만, 전체 과정을 마무리하는 프로젝트이고 따로 특별한 강의는 없는 것이기 때문에 Developing Data Products가 마지막 코스라고 봐도 무방할 것 같습니다.
2016년 1월에 수강했는데 플랫폼이 바뀌었습니다. 디자인이 심플하고 깔끔하게 바뀐 것과 함께 기존에 불편했던 부분들이 개선되었습니다. 간단하게 몇가지 변경된 부분들을 살펴보면.,.
추가된 기능과 더불어 UI는 eDX와 비슷하게 변했습니다. 주별로 있는 퀴즈가 강의 동영상 중간에 끼어 넣으면서(물론 별도로 퀴즈를 풀 수 있는 메뉴는 있습니다), 강의와 퀴즈의 연속성을 주는 UI는 eDX에서 경험한 스타일이였습니다.
UI와 기능들 모두 사용자가 학습에 집중하고 강의 수료를 완료할 수 있도록 변경되었다고 느껴집니다. MOOC 사이트들에서 공개한 데이터는 아직 본 적이 없지만, MOOC에서 강의를 한 번이라도 수료한 사람은 추가로 다른 강의를 신청할(수료증을 받는 유료 강의를 신청할) 가능성이 높을 것이라 생각됩니다. 개인적인 생각입니다만, 강의의 퀄리티와 무관하게 일종의 프로젝트를 완료했다는 성취감이 MOOC 강의에 대한 만족감으로 전이될 수 있다고 생각됩니다. 저도 사실 Johnes Hopkins의 Data Science 강의 시리즈 자체에 대해서는 남들에게 추천할 정도로 좋은 강의라고 생각되지는 않지만, Coursera의 다른 강의와 다른 MOOC 사이트 들의 다른 강의들은 계속해서 수강할 계획이 있습니다. MOOC에 대한 만족의 절반은 강의 수료에 대한 자기만족과 성취감이라고 생각되어 집니다. Coursera도 이에 대한 근거 data가 있기에 강의 수료자를 많이 만들어 내기 위해 노력하는 것이 아닐까 생각됩니다.
Intro가 길었는데 강의 자체에 대한 후기는 짧게 남깁니다. 강의 내용은 3파트입니다. ‘shiny’, Interactive Visualization 툴, R Package 제작법 입니다. JHU의 Data Science 강의 전반적인 특징은 R에 굉장히 Oriented 되어있다는 것입니다. 모든 강의가 R을 사용하고 프로젝트에 R을 이용해야 합니다(이름을 ‘Data Science with R’이라고 바꿨으면 싶을 정도;). 3가지 모두 R과 관련된 것이고 특히 shiny와 Interactive Visualization 툴은 프로젝트 과제를 위해서 반드시 알아둬야 하는 항목입니다.
프로젝트 과제는 shinyapp.io라는 사이트(또, Rstudio가 제공하는 사이트;)에 shiny와 interactive plot 툴을 활용한 web app을 올리는 것과 제출한 web app을 설명하는 프리젠테이션 파일을 R Package를 통해 만드는 것입니다. 저는 R에 내장된 iris 데이터로 Machine Learning 알고리즘들을 테스트해보는 아주 형식적인 웹앱을 만들었습니다. 제출 기한에 쫓겨 만들고 너무 단순하고 성의없다고 자괴감을 가졌는데, 다른 Peer들의 과제들을 채점하면서 ‘난 정말 성의있었구나’ 혹은 ‘이 강의 듣는 사람들이 많이 바빴구나’ 하고 느꼈습니다. 웹앱 자체의 복잠함이나 완성도는 크게 신경쓰실 필요는 없을 거 같습니다. 과제 채점기준에 부합되게 만드는 것이 중요할 것 같습니다. (참고하실 분은 제 작업물 링크로..)
위에서도 잠깐 언급했지만 JHU의 Data Science 강의를 추천하기 힘든 이유는 강의만으로 해당 주제를 반도 알 수 없다는 것입니다. 무슨 말이냐면, Data Web App을 만드는 데에 여러가지 Package들과 도구들이 있는데 이 모든 것을 모두 언급하지만 그 깊이는 수박 겉핥기라는 것입니다. 저도 강의를 들으면서 부족한 부분이 많아서 datacamp.com 등 다른 사이트에서 공부를 병행했습니다. 한달안에 끝내는 스케줄에 깊이를 요구하는 것이 무리라고 생각되겠지만 그렇다면 강의 스케줄을 늘리던지, 한두 object들에 집중하는 것이 맞다고 봅니다. 동영상 강의 말미에 자세한 내용은 어디를 참고하라면서 링크를 던져두고 끝내는 것은 성의가 없다고 보아야 할 것입니다. 그럴듯한 강의 제목과 수료증으로 사람들을 현혹시키는 부분이 분명히 있어 보입니다. 이 강의 시리즈를 들으면서 가장 만족한 부분은 프로젝트를 하고 Peer 평가를 하면서 다른 수강생들의 작업물을 보면서 배우는 것이였습니다. 다른 이들의 작업물과 어드바이스를 통해 배우는 점이 많아서 저도 feedback을 굉장히 충실하게 하려고 노력했습니다(그래서 그런지 Cousera에서 ‘좋은 평가자’라면서 좀 더 Peer feedback을 해달라고 메일이 오기도 했습니다. 물론 Cousera의 알고리즘이 detect한 것이겠지만요..;;). 하지만 Peer 평가는 Cousera 사이트의 공통적인 정책이지 이 과목만이 주는 장점은 아니죠. 이 강의 시리즈에서 R Programming 과목이 많이 알려져서 많은 사람들이 수강(낚인)하지만 더 좋은 학습 사이트들도 있다고 생각합니다. 저도 이미 유료로 시작한 강의여서 끝까지 진행했지, 무료로 시험삼아 듣기 시작했다면 실망한 순간 다른 곳에서 시작했을 것 같습니다(datacamp.com 추천!).
3월에 시작하는 Capstone 프로젝트만 남아 있는데 1년 가까이 진행된 강의가 끝나간다고 생각하니 속이 후련하네요. 마지막 후기에는 어떤 글을 남기게 될지 기대됩니다.