2016년 3월 29일 화요일

인간을 위한 데이터 분석, 인간중심컴퓨팅 연구실 (Human-Centered Computing Lab, HCC Lab)


서울대 융합과학기술대학원의 인간중심 컴퓨팅 연구실(지도교수 서봉원)은 연구실의 이름에서도 알 수 있듯이 무엇보다도인간(Human)”을 중요한 가치로 둔 연구를 진행하고 있다. 소셜 미디어, 스마트 디바이스 등에서 사용자가 남긴 빅데이터를 수집, 관리, 분석하는 것에서 그치지 않고 사용자의 의미있는 패턴을 추출하고 인간과 사회에 어떤 중요한 의미적 가치를 창출할 수 있는 인사이트를 도출하고자 하는 것이다.

이를 통해 사용자 개개인에게는 최적화된 맞춤형 정보를 제공하고, 사회적으로는 사회문제를 정확하게 이해하고 예측할 수 있는 프레임을 제공하고자 한다. 학문적으로는 연구영역은 크게 인간 컴퓨터 상호작용(Human Computer Interaction), 빅데이터 분석(Big Data Analysis), 소셜 컴퓨팅(Social Computing), 정보시각화(Information Visualization), 인터랙션 디자인(Interaction Design) 등의 다양한 분야에 걸쳐 있으며, 컴퓨터 공학, 전자 공학, 기계 공학, 산업 공학 전공 학생들과 언어학, 심리학, 경제학, 언론 정보학 등의 인문사회 전공 학생들이 모여 융합적인 시각에서 공동연구를 진행하고 있다.

데이터 수집과 분석 방법으로는 텍스트 마이닝(Text Mining), 기계학습(Machine Learning), 자연어처리(Natural Language Processing), 감정분석(Sentiment Analysis), 소셜 네트워크 분석(Network Analysis), 군집 분석(Clustering) 등의 기술을 이용하고 있으며, 주된 분석 언어로는 Python, R 등을 사용하고 있다. 또한 대규모 데이터를 효과적으로 처리하기 위해 하둡(Hadoop), 스파크(Spark) 등의 최신 분산 컴퓨팅 기술을 활용하고 있다.
다음으로 최근 인간중심컴퓨팅연구실에서 진행중인 연구들을 소개하고자 한다.


HCC연구실 학회 단체 사진


- 자동 기사 작성 소프트웨어 개발, Robot Journalism

인간중심컴퓨팅연구실에서는 알고리즘을 이용해 자동으로 주식관련 기사를 작성해주는  일명 로봇 저널리즘연구를 진행하여 언론의 큰 주목을 받았다. 기사를 작성하는 것은 본래 기자의 본업으로, 사회 현상을 관찰하고 하나의 짜임새 있는 글로 정리해내는 인간의 지적인 행위로 여겨져 왔다. 하지만 프로그래밍을 통해 기사 작성 알고리즘을 구현함으로써, 연구진은 로봇이 인간 기자를 대체할 수 있는 가능성에 대해서 탐구해 보았다.
현재 연구진이 구현한 알고리즘에 따라 파이낸셜 뉴스를 통해 로봇저널리즘이라는 제목의 경제증권뉴스가 매일 오후 세시에 게재되고 있다. 기존 증권 뉴스의 경우 주식 시장 거래에서 생성되는 데이터를 바탕으로 언론사별로 수많은 기자들이 매일 거의 똑같은 형식의 기사를 작성해온것과 달리 본 알고리즘은 주식시장의 수많은 정보를 수집하여 분석하고 하나의 정확한 기사를 정해진 시간에 생성해 낸다는 특징이 있다. 비록 전문가들이 줄 수 있는 전망이나 주식시장의 전반적인 분위기에 대한 평가 등의 주관적인 내용을 다룰 수는 없지만, 보다 객관적이고 정확하며 신속한 보도가 가능하다는 장점이 있다. 실제로 기사는 주식 시장이 마감된 이후 수 초 내로 작성되어 포스팅까지 완료된다. 본 연구는 서울대학교 사회대 이준환 교수와 공동 연구로 진행 중이며, 포털 사이트에서 로봇 저널리즘이라는 키워드 검색을 통해 기사를 열람해 볼 수 있다.

포털 사이트서 검색한 로봇 저널리즘 결과(2016.4.8)




- 소셜 미디어를 통한 Data 분석

최근 트위터나 페이스북 등의 소셜미디어를 통해 다양한 정보가 폭발적으로 생산되고 있다. 사용자는 소셜 미디어를 통해 정보를 생산하기도 하고, 또 이러한 정보를 습득하여 지식으로 활용하기도 한다. 하지만 소셜 미디어를 통해 유통되는 정보들이 과연 믿을 수 있는 것인지에 대한 논의 역시 계속되어 왔다. 특히 고도의 전문성을 요구하면서도 잘못 사용되었을 경우 사용자에게 큰 영향을 미칠 수 있는 의료 건강 정보의 경우 정보의 신뢰도에 대한 논의가 필수적이라고 할 수 있다.

이러한 배경하에 인간중심컴퓨팅 연구실은 트위터에서 공유되는 대장암과 관련된 트윗들에 대한 정보 가치로서의 신뢰성을 검증해 보았다. 트위터에서 대장암과 관련된 키워드를 포함하고 있는 트윗들을 3개월 동안 수집하였으며, 해당 트윗들에 대한 컨텐츠 분석을 진행하였다. 분석 결과 대부분의 트윗이 개별 사용자를 통해 생산되었으며 뉴스 기사나 연구에 결과, 혹은 예방법에 관련된 내용이 주를 이루고 있었다. 반면 전문적인 의사나 의료 기관에 의해 생성된 트윗의 비율은 소수에 불과했다. 정보 신뢰도의 경우, 대부분의 의학적으로는 옳은 내용을 포함하고 있는것으로 나타났다.

연구 내용은 Medicine: February 2016 – Volume 95 – Issue 7 – p e2275 에서 확인할 수 있다.
한편, 소셜 미디어 비디오 컨텐츠를 딥러닝(Deep Learning)으로 분석하여 마케팅에 활용할 수 있는지에 대한 연구가 진행되었다. 또한, 트위터와 인스타그램, 페이스북 등에서 비디오의 비중과 중요성이 급증하고 있다. 이러한 컨텐츠로 마케팅 등에 활용하려는 움직임이 일고 있다. 연구진은 인스타그램에서 공유되는 비디오 컨텐츠 36,000개에 대한 감성분석(Sentiment Analysis)을 진행하였으며 컨텐츠 요소들에 대한 사용자의 감성요소들을 추출할 수 있었다. 방법론으로 딥러닝을 활용하였으며, 76%의 정확도로 감정을 예측할 수 있었다. 이러한 결과는 비디오 컨텐츠를 통해 고객 서비스를 관리, 대중의 의견을 예측, 수렴하는데 사용될 수 있을 것으로 보인다.



- Smart InteractionSmart Device 연구

가상현실(Virtual Reality)과 관련된 각종 기기들이 보급되면서 VR이 새로운 스크린으로서 급부상하고 있다. 하지만 VR 환경을 고려한 인터랙션에 대한 연구는 아직 미미한 편이다. 대부분의 VR 기기가 Head Mounted Display 형식이며 오로지 Mount 측면의 버튼을 이용하여 조작하는 인터랙션이 대부분이다. 연구진은 기존의 제한적인 인터랙션 방식을 벗어나 자연스럽고 다양한 인터랙션을 디자인하기 위해 VR HMD 전면에 터치 인터페이스를 만들어 디자인 스페이스를 확장하고자 하였다. 아래 그림에서 보듯이 사용자는 VR 전면부를 통해 인터랙션을 할 수 있으며 더욱 많은 인터랙션이 가능하리라 예상된다.

Front Touch Interface의 구현 모식도
웨어러블 디바이스의 보급 역시 새로운 인터랙션에 대한 논의를 불러일으키고 있다. 스마트폰 이외에 웨어러블 디바이스가 추가적으로 주어진 경우 사용자에게 두 기기 사이의 적절한 인터랙션 방법을 제공하는 것은 매우 중요한 연구이다. 인간중심컴퓨팅연구실에서도 스마트폰과 스마트워치를 서로 연결하여 효율적으로 인터랙션 하는 방식에 대해 연구하였고, 또 다양한 사용자 시나리오 환경에서 어떻게 각각의 인터랙션이 사용될 수 있는지에 대해 연구하였다. 또한 양손의 위치에 따라 웨어러블 디바이스 및 스마트폰 인터랙션이 어떻게 변화하는지, 효과적인 인터페이스 디자인은 어떤지에 대한 연구가 진행되었다. 이러한 연구는 사용자에게 새로운 인터렉션 경험을 제공해 준다는 데에서 큰 의의가 있다.
- Smart Classroom 연구
Smart Classroom 실험 사진
데이터를 활용한 연구는 교육 부분에도 적용할 수 있다. 최근 시도되고 있는 Flipped Learning이란 학교에서 수업을 진행하고 집에서 과제를 진행하는 기존의 수업 방식과는 반대의 접근법으로 수강자는 교실 수업 전에 교사가 제공하는 수업 영상을 미리 시청하고, 이후 수업시간에는 교사가 수업 진행이 아닌 학생들과 상호작용하거나 심화된 학습활동을 하는데 시간을 더 많이 할애할 수 있는 수업의 형태이다. 기존 방식이 학생들의 반응을 면대면 학습을 통해 파악할 수 있던 반면, Flipped Learning은 집에서 동영상으로 수업을 진행하기 때문에 학생들의 Feedback을 알 수 없다는 문제점이 있다. 이 문제점을 극복하기 위해 HCC에서는 온라인 수업으로 얻을 수 있는 Data를 분석하고 의미를 파악하여 학습자 혹은 교수자에게 의미 있는 정보를 주는 연구를 진행하고 있다.
HCC 연구실 로고

서봉원 교수님
위와 같이 인간중심컴퓨팅 연구실에서는 사람을 위해 의미 있고 유용한 정보를 만들어 내는 것에 목적이 있다. 자세한 연구 소개는 hcc.snu.ac.kr 에서 확인할 수 있다.
(글/그림: 인간중심컴퓨팅 연구실 정정민 연구원)

0 개의 댓글:

댓글 쓰기

차세대융합기술연구원 │ 서울대학교 융합과학기술대학원. Powered by Blogger.