왓슨 (컴퓨터)
왓슨은 인간의 자연어 형식의 질문들에 답할 수 있는 인공지능 컴퓨터이다. 시험 책임자 데이비드 페루치(David Ferrucci)가 주도한 아이비엠(IBM)의 딥큐에이(DeepQA) 프로젝트를 통해 개발되었다.
목차
개요
왓슨은 사람의 목소리를 인지하고 인간이 묻는 질문의 답을 찾아 음성으로 답한다. 인간을 닮은 컴퓨터 튜링의 기계인 인공지능은 아이비엠 연구소가 개발한 왓슨에 의해 현실화되었다. 인간의 언어로 묻는 질문을 알아듣고 빠른 시간 안에 답을 찾아내어 음성으로 답하는 왓슨 컴퓨터는 인간의 지능과 닮았을 뿐만 아니라 속도와 정확성에서는 인간의 능력을 앞섰다. 아이비엠의 초대 회장 토머스 왓슨(Thomas John Watson)에서 이름을 따온 왓슨은 "고도의 자연 언어처리, 정보수집, 지식재현, 사고, 기계학습을 질문-응답 영역에 적용한 것"이라고 한다. 왓슨은 파워 세븐(power 7) 프로세서와 아이비엠의 딥큐에이 소프트웨어를 결합했다. 90개의 아이비엠 파워 750(Power 750) 서버로 구성되고, 총 2880개의 파워세븐 코어 프로세서가 작동하며 18테라바이트의 램을 이용한다.
역사
2004년 아이비엠 연구책임자가 동료들과 식사를 하는 도중에 미국의 텔레비전 퀴즈쇼인 제퍼디 게임을 시청하느라 모두 침묵에 빠진 것에 주목했다. 식사 중이던 레스토랑 손님들이 다들 텔레비전 앞으로 모여들었다.[1] 2005년 아이비엠 연구팀 이사 폴 혼은 찰스 리켈에게 개발자들을 배정해 주면서, 제퍼디에서 인간을 이기는 왓슨 개발을 해보라고 지시했다. 1년 뒤인 2006년 아이비엠 개발부서의 수석 매니저 데이비드 페루치가 최초의 테스트를 하였다. 테스트에서 경쟁자인 사람 중에서 최고 득점자는 왓슨보다 절반의 시간 만에 95%를 맞추었는데, 왓슨은 15%만 맞추었다. 2007년 왓슨 개발팀은 이 문제를 해결하기 위해 3년에서 5년의 개발 기간과 15명의 연구자를 배정받았다. 2008년 개발팀은 제퍼디 챔피언과 겨룰 수 있는 수준으로 왓슨을 개발했다. 그리고 2010년, 마침내 왓슨은 인간 경쟁자를 이겼다. 왓슨은 4테라바이트의 디스크 공간의 구조화/비구조화된 콘텐츠에 접근하였는데 경기가 치러지는 동안에는 인터넷에 연결되지 않았다. 각 단서마다 왓슨의 가장 가능성 있는 세 개의 응답이 텔레비전 화면에 띄워졌고, 게임 신호 장치에서 자신과 경쟁하는 사람들을 지속해서 앞질렀다. 하지만 몇 개의 낱말로 된 몇 개의 단서만 가지고 있는 일부 분류에 응하는 데에는 문제가 있었다.[2]
작동 방식
질문이 왓슨에게 주어졌을 때, 질문의 주요 특성을 추출하기 위해 질문을 분석한다. 답변을 포함할 가능성이 있는 구문의 자료나 정보의 모음을 찾아서 일련의 가설을 생성한다. 다양한 추론 알고리즘을 사용하여 질문의 언어와 각 가능성 있는 응답 언어 간의 비교를 수행한다. 이 단계는 서로 다른 비교를 수행하는 수 백개의 추론 알고리즘이 사용되기 때문에 매우 어려운 작업이다. 어떤 것은 시간과 공간의 특징을, 어떤 것은 맥락 정보와 관련된 정보 소스를 찾는다. 각 추론 알고리즘은 각각 집중하는 영역에 기반하여 질문에 의해 가능 답변이 추론되는 정도를 점수로 만들어 낸다. 각 결과 점수는 왓슨이 훈련 기간동안 해당 도메인에서 두 개의 유사한 구문간의 추론을 생성할 때, 얼마나 잘 수행된 알고리즘인지를 알게되는 통계 모델에 의해 가중치가 부여된다. 이 통계 모델은 왓슨이 질문에 대한 답변후보들에 대한 신뢰도를 요약할 때 사용된다. 왓슨은 다른 답변들보다 강력한 후보라고 생각하는 답변을 찾을 때까지 각 답변 후보에 대해 이 과정을 반복한다.[3]
서비스
2014년 1월 클라우드 기반의 왓슨 코그니티브 컴퓨팅의 개발과 상용화를 전담하는 사업 조직인 아이비엠 왓슨이 신설되었다. 현재 왓슨은 개발자들이 쉽게 코그니티브 어플리케이션을 작성할 수 있도록 왓슨 디벨로퍼 클라우드를 통해 응용 프로그램 인터페이스(API) 형태로 제공하고 있으며, 깃허브(GitHub)를 통해서 샘플코드(sample code)도 제공하고 있다.
- 언어(language) : 알케미 언어(alchemy language)는 텍스트, URL을 통해 키워드과 감정, 정보를 파악한다. 컨버세이션(conversation)은 사용자와 자연어로 상호작용할 수 있도록 지원하며 다큐먼트 컨버세이션은(document conversation) 기존의 문서를 사용자가 필요한 형식으로 변환한다. 7개의 언어로 도메인별 전문 번역을 제공하며, 자연어 분류(natrual language classifier)를 통하여 문장을 파악하고 어느 주제에 속하는지를 분류할 수 있다. 성격 분석 기능(personality insights)은 소셜미디어나 텍스트를 분석하여 개인 성향을 분석하고, 리트리브 앤드 랭크(retrieve and rank)는 사용자의 질문에 가장 연관성이 높은 결과를 보여준다. 톤 애널라이저(tone analyze)는 언어학적 분석을 통해 커뮤니케이션 안의 텍스트에서 감정, 사회적 경향, 글의 스타일을 추출한다.
- 말하기(speech) : 스피치 투 텍스트(speech to text)는 음성을 텍스트로 변환하고, 텍스트 투 스피치는(text to speech) 텍스트를 음성으로 변환한다.
- 이미지(visoin) : 비주얼인식(visual recognition)을 통하여 50개 이상의 이미지를 트레이닝하면 왓슨이 스스로 학습하고 학습한 결과를 토대로 사진의 대상이 학습한 대상과 유사한지 확인한다.
- 데이터 분석(data insights) : 알케미데이터 뉴스(alchemydata news)는 매일 생산되는 25만에서 30만개의 뉴스와 블로그 기사를 통해 60일 분량을 분석하여 주제, 키워드, 감정 정보 등을 파악한다. 디스커버리(discovery)는 어플리케이션에 연계하여 보다 나은 의사결정을 위해 패턴, 추세 및 통찰력을 식별할 수 있도록 지원하는 인지적인 검색과 컨텐츠 분석 엔진이다. 트레이드오프 애널리틱스(tradeoff analytics)는 사용자의 고려요소를 분석하여 최선의 선택을 하도록 돕는다.
- 체화된 인지(embodied cognition) : 프로젝트 인투(project intu)는 다양한 인지서비스를 다양한 장비, 공간 및 물건과 통합할 수 있도록 지원한다.[3]
적용 분야
의료·헬스케어
임상 의사 결정 지원시스템(CDSS)는 환자 특이적인 사정과 권고안을 주기 위한 목적으로 정보화된 지식 데이터베이스 기반에, 환자 개개인의 특징을 접목시킨 임상적 의사결정을 직접적으로 돕기 위해 고안된 임의의 소프트웨어 또는 환자의 돌봄 과정에서 진단이나 치료와 관련된 임상적 의사결정을 개선하기 위해 고안된 임의의 시스템을 뜻한다. 임상 의사 결정 지원시스템이 사용되는 분야는 크게 두 가지로 나눈다. 첫째, 의학적 관리 분야로 헬스케어를 위한 정보를 검색하거나 의료인에 의해 요구된 정보를 제공하기 위한 분야이다. 둘째, 임상적 분야로서 환자를 진단하고 치료하기 위한 약물 제조에 대한 경고 및 조언 기능에 초점을 맞춘 분야이다. 임상 의사 결정 지원시스템은 특정 환자와 관련된 주의, 경고, 추적조사, 임상예측규칙, 계산, 알고리즘 및 리마인더를 발생시킨다. 이러한 시스템은 급성 또는 2차적 진료, 예방, 진단 시 질병관리, 영상의 인식 및 해석 등에서 사용된다. 미국의 경우 전자식건강기록(EHR)을 의무화 하고 있으며, 모든 헬스케어 시설에 전자식건강기록을 의무화 했을 때의 목표는 수집된 환자 데이터를 임상 의사 결정 지원시스템을 통해 분석하여 더 우수하고 저렴한 헬스케어를 추진하는 것이다. 우리나라의 경우 대부분의 상급종합병원에서 전자의무기록을 도입하고 있으므로 왓슨과 같은 컴퓨터를 이용한다면 한국인의 질병을 체계적으로 분석하고 치료경과 등을 파악할 수 있을 것으로 예상된다.
데이터마이닝이란 대량의 데이터로부터 쉽게 드러나지 않는 유용한 정보들을 추출하는 과정을 뜻한다. 데이터마이닝을 효과적으로 수행하기 위해서는 시계열분석 등 각종 통계기법과 데이터베이스 기술뿐만 아니라 산업공학, 신경망, 인공지능, 전문가 시스템, 퍼지이론, 패턴인식, 기계학습, 불확실성 추론, 정보검색에 이르기까지 각종 정보기술들을 사용하게 된다. 데이터마이닝을 흔히 데이터베이스에서 지식발견, 혹은 지식 추출, 정보수확, 정보 고고학, 데이터 패턴 처리 등으로도 통용된다. 의료산업에서 데이터마이닝은 병원에서 진료진에 의해 작성된 각종 기록, 각종 장비에서 측정된 환자의 생체정보, 환자에게 투약된 약, 각종 시술을 바탕으로 하여 환자의 질병에 대한 치료경과, 약품의 효과 등을 데이터마이닝을 통해 추출해 낼 수 있다.[4]
- 가천대 길병원 : 2012년 한국 가천대학교 길병원은 국내 최초로 메모리얼슨론케터링(MSK)암센터에서 아이비엠 왓슨을 도입하였다. 유방암, 폐암, 대장암, 직장암, 위암 치료에 활용하고 있다. 레지던트 생활을 하며 암 환자의 진료를 터득하여 현재도 교육을 받고 있다. 선진 의료기관의 자체 제작 문헌과 290종의 의학 저널, 200종의 교과서의 전문자료를 습득하였다. 왓슨은 의료진의 소견서와 진단서에 나타난 정형 및 비정형 자료의 의미와 맥락을 분석하고 이를 이용하여 환자의 특성에 맞는 맞춤치료 옵션을 제안한다.[5][6]
- 언더아머 : 미국 스포츠웨어 브랜드인 언더아머는 자사 헬스케어 앱 유에이레코드(UA Record)에 왓슨 기술을 적용했다. 수면, 운동, 활동, 영양 정보를 추적하여 개인의 건강관리사, 운동 트레이너 역할을 수행한다. 향후에는 아이비엠이 보유하고 있는 빅데이터를 언더아머 사용자들이나 전문 선수들의 코칭에 사용할 수 있는 앱이 제작될 계획이다. 또한 날씨가 운동 성과나 코칭 활동에 미치는 영향 등 부가적인 데이터 분석 기능도 포함될 예정이다.[7]
유통
- 노스페이스 : 아웃도어 브랜드 노스페이스는 2015년 온라인 쇼핑몰 도우미 플루이드리테일(Fluid Retail)을 선보였다. 방문자가 쇼핑 중 던진 질문을 분석하여 구매 결정을 도는 서비스이다. 소비자들의 온라인 쇼핑 패턴을 분석하고 유통기업과 연계하여 소비자가 필요로하는 정보를 제공한다. 또한 방대한 분량의 상품 정보, 리뷰, 전문가 코멘트 등을 분석하여 고객의 니즈에 최적으로 부합하는 상품을 매칭한다.[8]
- 미국 : 백화점 체인 메이시스는 오프라인 매장 탐색용 웹서비스 메이시스온콜(macy's on call)을 출시했다. 방문객은 매장별 제품 위치, 서비스, 시설 관련 질문을 하여 답을 들을 수 있다. 이 서비스는 아이비엠의 왓슨이 제공하는 자연어 처리 응용 프로그램 인터페이스를 이용한다. 왓슨은 기계 학습을 통해 대화를 많이 할수록 맞춤형 대답을 더 잘하게 된다. 왓슨이 학습한 내용은 소비자 참여 플랫폼인 세티스피(satisfy)의 솔루션을 통해 정리된다. 이로 인해 백화점 측면에서는 상담 인원 확보, 고객 안내를 위한 사이니지 배치 등의 부담에서 벗어날 수 있다.[9]
- 롯데 : 롯데그룹은 2016년 12월 한국 아이비엠과 제품과 서비스를 제공하는 백화점, 마트, 편의점, 면세점 등 계열사 온오프라인 채널의 고객 데이터를 활용
금융
법률·행정
로봇·SW업계
문화
- 영화 : 왓슨은 영화 예고편을 제작하였다. 예고편을 제작하기 위해 100개의 공포 영화 예고편을 분석하고, 학습된 정보를 바탕으로 예고편에 사용할 장면 10개를 추출했다. 시스템이 영화를 보기 시작해서, 90분 영상에서 6분 영상을 추출하고, 추출된 영상을 편집자가 수정하여 최종 예고편 영상으로 완성되는데 약 24시간이 걸렸다. 일반적으로 10~30일 걸리는 것을 감안할 때, 단순한 수작업 시간을 줄이는데 인공지능이 활용될 수 있는 가능성을 보여주었다.
- 음악 : 왓슨 비트(beat)를 통해 음악가가 노래를 작곡하는 데에도 협력했다. 왓슨은 5년간의 문화 데이터를 수집하고 분석하여 각 연도의 감성 레벨(emotional temperature)을 파악하였고, 뉴욕 타임스 기사, 영화 대본, 노래 가사, 트위터나 블로그 등 소셜 미디어에 게시된 코멘터리를 살펴본 뒤, 왓슨 비트 기술을 통해 빌보드 차트 상위에 기록되었던 음악을 분석하여 5년간의 음악 트렌드를 알렉스 다 키드(Alex da kid)에게 알려주어 작곡하는 것을 지원했다.[3]
각주
- ↑ 왓슨 나무위키 - https://namu.wiki/w/%EC%99%93%EC%8A%A8(%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5)
- ↑ 왓슨 위키백과 - https://ko.wikipedia.org/wiki/%EC%99%93%EC%8A%A8_(%EC%BB%B4%ED%93%A8%ED%84%B0)
- ↑ 3.0 3.1 3.2 김천순, 〈[https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201714669705069&dbt=NART IBM Watson 작동방식에 대한 이해 및 사례 소개]〉, 《한국IBM》, 2017-01-31
- ↑ 이창현, 〈[의료산업과 왓슨(watson)]〉, 《정보통신산업진흥원》
- ↑ 임민철 기자, 〈IBM AI 왓슨의 비즈니스 활용사례 대방출〉, 《지디넷코리아》, 2017-11-14
- ↑ 가천대 길병원, 〈(가천대 길병원) 암 치료의 동반자, 인공지능 왓슨〉, 《네이버 블로그》, 2017-02-03
- ↑ 더보안, 〈IT이슈 :: IBM의 인공지능 플랫폼 왓슨〉, 《네이버블로그》, 2016-01-28
- ↑ 김소연, 〈Retail과 인지컴퓨팅의 결합, Virtual Shopping Assistants의 시대가 오는가?〉, 《버티컬플랫폼》, 2014-04-29
- ↑ 박창선 IT칼럼니스트, 〈빅데이터부터 AI...메이시 백화점의 데이터 사랑〉, 《디지털투데이》, 2016-07-25
참고자료
같이 보기