2017년 6월 26일 월요일

[4차 산업혁명 시리즈] ① 인공지능이 내 동료가 될 수 있을까?

IBM Watson을 활용하여 사용자 인터뷰 데이터 분석하기


아마존 에코, 구글의 구글홈, 삼성의 빅스비, 애플의 시리까지, 최근 인공지능에 대한 세간의 관심이 연일 뜨거운 상황이다 [그림 1]. 이러한 논의들 사이에서, 우리는 사용자 조사 방법의 개선이라는 조금 다른 관점에서 접근해보기로 했다. 인공지능 자체에 대한 개발과 디자인 못지 않게 “인공지능이 우리를 어떻게 도울 수 있을 것인가”에 대한 물음 역시 중요하기 때문이다.


[그림 1] 다양한 인공지능 에이전트/서비스의 등장


우리는 사용자 조사 방법이라는 차원에서, “인공지능이 우리의 일을 덜어줄 수 있지 않을까?”에 대한 물음에 답을 찾고자, 범용적인 인공지능인 IBM Watson을 활용해 사용자 조사 방법의 개선을 시도해보고자 했다 [그림 2]. 그리고 그 중에서도 IBM Watson의 Language 내에 있는 Conversation을 활용하여, 인터뷰 분석을 개선하는 방향에 대해 고민하기 시작했다. 전통적으로 인터뷰 분석은 사람들이 한 발화(dialogue) 데이터를 늘어놓고 인간의 예리한 눈으로 하나씩 골라내는 작업으로 생각되었다. 여기에는 오랜 시간이 걸리고, 많은 노고가 필요하다.


[그림 2] IBM Watson을 통한 사용자 조사 방법의 개선 방향


사용자 조사 과정에서 많은 경우 인터뷰가 진행되는데, 이를 통해 얻어진 인터뷰 데이터는 우리의 일상적인 말과 닮아 있어 자동 분석이 어렵다. 결국 우리는 이처럼 질적인(qualitative) 특성을 가지고 있는 인터뷰 데이터를 하나하나 손으로 골라내서 분석하기 위해 엄청난 시간과 노력을 들이게 된다. 보통 인터뷰 분석은 사용자가 했던 말에서 어떤 의도(intent)를 읽어내는 방식으로 진행된다. 예를 들어, “저는 운전할 때 심심해서 스마트폰을 써요”라는 말에서 단순히 심심함을 표현하는 목적보다는 그 기저에 깔린 니즈(needs), 즉 ‘운전할 때 컨텐츠 추천이 필요하다’라는 의도를 읽어내는 과정이 필요하다. 문제는 이러한 인터뷰 데이터를 한 개씩 보며 어떤 의미인지 해석하는 과정을 거쳐야 한다는 점인데, 인터뷰 데이터는 적어도 몇 백 개, 많으면 몇 만 개까지 있다는 점이다. 그래서 질적 데이터 분석은 ‘사금을 골라내는 일’에 비유되기도 한다. 우리는 많은 양에 압도당하고, 반복적인 분류 작업에 지치고, 심지어 결과에 대해서는 의심당하기도 한다.

인공지능을 통한 분석을 통해 우리는 기존 방법에서 몇 가지 문제를 극복할 수가 있다. 인터뷰 분석에서 가장 중요한 것은 의도(intent) 분석이다. 우리는 말 속에 자연스럽게 ‘의도(intent)’를 숨겨놓는다. 때로는 사람-사람 사이에서도 의도를 알아내기 어려울 때가 있는데, AI가 이제는 훈련을 통해 우리의 의도를 읽어낼 수 있다. 왓슨 컨버세이션(Watson Conversation)은 발화에 대해 숨겨진 의도를 훈련하면, 비슷한 의도를 가진 다른 말을 골라낼 수 있도록 만들어졌다. 위 [그림3]에서 볼 수 있듯이, “나 심심해”, “뭐 할 거 없나?”라는 말이 “할 것 좀 추천해줘”라는 의도라고 학습시키면, 다음 번에 비슷한 의도를 가진 “이제 뭐하지?”를 같은 의도로 분류할 수 있게 되는 것이다.


[그림 3] 발화 속에 숨겨진 의도(intent)와 IBM Watson의 분석 가능성


왓슨으로 인터뷰를 분석하는 것은 어려운 일이 아니다. 왓슨을 잘 가르치면 일은 굉장히 쉽다. 예를 들면, 전체 인터뷰 데이터가 2,000개라고 할 때 10% 정도인 200개 대해서 어떻게 의도가 분류되는지를 가르쳐주면, 왓슨은 나머지 1,800개에 대해서 배운대로 의도를 분류한다. 좀 더 구체적인 상황을 예로 들어 설명하기 위해서, ‘새로운 TV를 디자인하기 위한 니즈를 발굴하기 위한 사용자 조사’를 했다고 가정해보자. 우리는 10% 정도의 인터뷰 데이터를 들여다보면서 사람들이 대여섯 가지의 의도를 가진 니즈에 대해서 이야기한다는 것을 쉽게 알아낼 수 있다 [그림 4].


[그림 4] IBM Watson으로 인터뷰 분석하기


흥미롭게도 위의 [그림 4]와 같이 훈련된 왓슨에, 새로운 인터뷰 데이터를 넣으면 자동적으로 분류가 이뤄진다. 예를 들어, “TV 볼 때 옆에서 엄마가 언니랑 얘기해서 시끄러워요. 뭔가 이런 상황에서 나한테만 잘 들리게 하면 좋겠다는 생각이 들어요.”라는 인터뷰 데이터를 왓슨에 넣으면, 왓슨은 이 데이터를 ‘맞춤형(tailored)’라는 의도로 분류해준다. 맞춤형이라는 의도로 분류된 다른 인터뷰 데이터인 “내가 누워있는 시선 위치에 맞게 티비가 저절로 높이 조절됐으면”과 비교해보면 아주 적절한 분류가 이뤄진다는 점을 알 수 있다. 인공지능이 연구자가 적어도 몇 분에 걸쳐서 해야할 일을 단 1초만에 해준다는 점에서 놀라운 일이 아닐 수 없다.

결국 인공지능이 이제 연구까지 돕는 셈인데, 우리는 과연 인공지능을 동료라고 생각해야 할까? 여기에 대해서 몇 가지 짚고 넘어가야 할 점이 있다. 인공지능이 우리의 노고를 줄여준다고 할 때, 인간이 할 일이 없어지는 것은 아니다. 오히려 인간에게는 해석이라는 굉장히 중요한 문제를 해결해야 한다. 왓슨은 반복적인 대량의 인터뷰 데이터 코딩은 도울 수 있지만 만능 툴도 아니고, 어떤 상황에서나 쓸 수 있는 것도 아니다. 인공지능이 모든 걸 다 해결해 줄 수는 없다. 인공지능을 쓴다는 건 기존의 도구들을 쓰는 것과 크게 다르다. 과정과 단계를 조절할 수 없는 대신, 좋은 재료 넣기와 기계를 얼마나 돌릴지만 정의할 수 있다. 인공지능은 과정을 은닉(hidden) 한다. 과정에서 소외되면 사람은 결과에 대해 판단하기 어렵다. 사람들은 짧은 의심 후 근거 없는 맹신의 상태에 들어가게 된다. UX/HCI 연구자로서 우리가 가져야할 고민은 바로 여기에 있다. 의심과 맹신, 그 모멘트를 어떻게 디자인 할 것인가에 대한 부분이 바로 그것이다.

글쓴이: 김유정 박사과정
소속: 디지털 융합전공
관심분야: 인공지능, UX, Human Computer Interaction










0 개의 댓글:

댓글 쓰기

차세대융합기술연구원 │ 서울대학교 융합과학기술대학원. Powered by Blogger.