"어니"의 두 판 사이의 차이
잔글 |
잔글 |
||
27번째 줄: | 27번째 줄: | ||
==== 비드프레스의 원리 ==== | ==== 비드프레스의 원리 ==== | ||
− | [[파일:비드프레스의 개념도.png|썸네일| | + | [[파일:비드프레스의 개념도.png|썸네일|500픽셀|오른쪽|비드프레스의 개념도]] |
가령 올 초 헬리콥터 사고로 사망한 미 프로농구 스타 '코비 브라이언트'에 관한 동영상을 제작한다고 가정한다. | 가령 올 초 헬리콥터 사고로 사망한 미 프로농구 스타 '코비 브라이언트'에 관한 동영상을 제작한다고 가정한다. | ||
2020년 7월 13일 (월) 14:45 판
어니(ERNIE, 百度文心)는 2019년 3월, 중국 최대 포털회사 바이두(百度)가 정식으로 발표한 AI기반 지식강화 자연어처리(NLP) 모델 및 플랫폼이다. 중국어로는 바이두원신(百度文心, bǎi dù wén xīn)이라고 한다. 어니는 바이두의 딥러닝 프레임 워크인 패들패들(PaddlePaddle,飞桨)에 기반한 프로젝트이다. 2019년 12월, 대표적인 자연어 이해 지표인 GLUE(General Language Understanding Evaluation·자연어 이해 평가)대회에서 90.1점을 기록, MS(89.9점), 구글(89.7점)을 앞질러 경쟁사들을 놀라게 했다.
ERNIE는 2018년 구글이 선보였던 Bert(Bidirectional Encoder Representations from Transformers)와 유사한 자연어 이해 모델을 구현했다. ERNIE와 Bert는 모두 미국의 인기 어린이 TV프로그램 '세서미 스트리트'에 등장하는 캐릭터명이다. 문맥을 파악하기 위해 문장의 단어 앞뒤로 등장하는 단어들을 조사하면서 의미를 이해한다. 바이두는 이미 자사 검색엔진과 AI 비서 '샤오두'(小度)에 알고리즘(자연어 이해 모델)을 적용 중이다.
자연언어처리 기법(NLP)
자연어 처리는 컴퓨터가 사람처럼 언어를 이해하고, 처리하며, 구사할 수 있도록 만드는 인공지능 기술이다. 이 기술은 포털 내 번역 기능과 챗봇에 쓰이고 있다.
바이두의 NLP 기술은 '자연언어처리 기법(NLP) 평가'에서 유례 없는 90.1점을 차지하며 신기록을 세웠다. 구글과 MS는 각각 89.9점과 89.7점으로 2,3위에 이름을 올렸다.
바이두가 개발한 NLP 기술 이름은 '어니(ERNIE)2.0'이다. 2019년 7월, 기존 1.0 버전을 업그레이드 해 새로 출시한 이래 바이두 이용자는 물론 AI 전문가들 사이에서도 혁신적 기술이라 평가 받아 왔다. 바이두 측은 어니2.0이 중국어와 영어를 번역하는 데 있어 구글보다 더 뛰어난 성능을 지녔다며 자신있게 내놓았다. 바이두는 구글의 NLP 기술인 버트(BERT)를 염두해 기술명을 어니로 지었다. 어니와 버트 모두 미국 어린이 텔레비전 교육프로그램 '세서미 스트리트(Sesame Street)' 캐릭터에서 착안했다.
어니2.0과 버트의 가장 큰 차이는 '중국어 해석 능력'이다. 어니2.0은 중국 내 주요 지방의 9개 사투리를 모두 이해해 완벽에 가깝게 영어로 번역해낸다. 이뿐 아니라 중국에서만 쓰는 간체와 대만·홍콩 등지에서 쓰는 번체를 섞어 문장을 입력해도 문제 없이 영어로 정확하게 해석할 수 있다.
문장의 구성 또한 풍성하다. 구글의 버트가 '간단한 접근법'이 강점이라면 바이두의 어니2.0은 사람이 쓴 다채로운 표현의 소설 속 긴 문장도 자연스러운 어감으로 번역한다. 어니2.0 개발팀은 이 과정을 성공시키기 위해 일반 도서 대신 해리포터 시리즈를 참고했다.[1]
활용
비트프레스
바이두가 자사 인공지능 어니(ERNIE)를 활용해 특정 주제에 맞게 웹페이지, 비디오 클립, 미디어를 편집해 2분 가량의 짧은 동영상을 만들어주는 인공지능 비드프레스(VidPress)의 프로토타입을 개발했다. 비드프레스는 URL에서 텍스트를 분석한 후 간결한 형태의 내러티브(서술문)를 합성하고, 인공지능이 선택한 미디어 및 비디오 클립을 활용해 2분 가량의 동영상을 만들어낸다. 음성도 자동을 삽입해준다. 이는 사람이 동영상을 편집하는 데 들어가는 시간을 절약할 수 있으며 동영상의 품질도 사람을 능가한다는 게 바이두의 설명이다.
연구팀은 바이두의 동영상 플랫폼인 '하오칸'(好看)에서 비드프레스를 이용해 테스트한 결과 2분 가량의 동영상을 만드는데 9분 정도가 걸렸으며 시청자들의 관심도도 비교적 높은 것으로 나타났다. 사람이 편집한 동영상을 끝까지 시청한 비율이 50%에 그친데 반해 비드프레스가 편집한 동영상을 끝까지 시청한 비율은 65%에 달했다.
비드프레스의 원리
가령 올 초 헬리콥터 사고로 사망한 미 프로농구 스타 '코비 브라이언트'에 관한 동영상을 제작한다고 가정한다.
비드프레스는 코비 브라이언트의 사망을 다룬 웹페이지를 분석한 후 짧은 스토리를 만들어낸다. 인공지능 알고리즘은 웹페이지에서 브라이언트의 사망에 관한 중요한 문장을 뽑아내 동영상 스크립트의 전면에 배치한다.이 스크립트에는 헬리콥터, 코비 등 핵심 키워드가 들어간다. 인공지능은 요약문의 논리적인 구조를 명확히 하고, 사람이 문장 작성시 범하기 쉬운 나쁜 버릇도 교정해준다. 예를 들어 사람이 흔히 범하는 '모호한' 대명사를 보다 명확하게 해준다.
비드프레스는 문자 음성 변환 기술을 통해 스크립트를 음성으로 변환할 수 있다. 여기에 사람이 관심을 가질만한 음성 트랙에 '앵커(anchors)'를 배치한다. 연구팀은 의사결정 모델을 이용해 스토리 주제와 앵커를 연관짓는 작업을 진행한다. 또 사람들이 관심을 갖는 브랜드나 위치 등을 효과적으로 처리하도록 만들었다.
비드프레스는 웹페이지나 바이두의 뉴스피드 네트워크인 '바이쟈하오(Baijiahao)'에서 캡처한 미디어에 대해 점수를 매긴다. 비드프레스 알고리즘은 높은 점수를 받은 동영상 클립과 이미지를 타임라인상의 앵커와 연결짓는 작업을 한다. 이를 효율적으로 할수 있도록 일반적인 웹페이지 접근 능력뿐 아니라 저작권을 갖고 있는 상업적인 데이터베이스에도 접속할 수 있도록 시스템을 개발했다.
동영상 제작에는 컴퓨터 비전 기술도 활용된다. 브라이언트의 헬리콥터 사고 당시 현장 사진에 생전에 촬영한 그의 인터뷰 화면을 추가할수 있다. 이같은 일련의 작업을 통해 비드프레스는 사람이 편집한 동영상 보다 시청자들의 관심도가 더 높은 2분 가량의 동영상을 만들 수 있다는 설명이다.[2]
수상
바이두 어니 지식강화 자연어처리 기술 및 플랫폼은 2020년 7월 9일, 개막된 2020세계인공지능대회(WAIC)에서 최고상인 SAIL상(Super AI Leader, 탁월한 인공지능 리더)을 수상, 바이두기술위원회 우화(吴华, wú huá) 위원장이 대표로 수상했다.[3]
각주
- ↑ 박혜섭 기자, 〈중국 바이두 자연어처리(NLP) 기술, 구글·MS 눌렀다〉, 《AI타임스》, 2019-12-30
- ↑ 장길수 기자, 〈바이두, 주제에 맞게 동영상 제작해주는 인공지능 개발〉, 《로봇신문사》, 2020-05-21
- ↑ 重庆晚报, 〈百度文心(ERNIE)知识增强语义理解技术与平台参考资料〉, 《百度》, 2020-07-09
참고자료
- 어니 공식 홈페이지 - https://wenxin.baidu.com/
- 〈百度文心(ERNIE)知识增强语义理解技术与平台〉, 《百度百科》
- 박혜섭 기자, 〈중국 바이두 자연어처리(NLP) 기술, 구글·MS 눌렀다〉, 《AI타임스》, 2019-12-30
- 장길수 기자, 〈바이두, 주제에 맞게 동영상 제작해주는 인공지능 개발〉, 《로봇신문사》, 2020-05-21
- 重庆晚报, 〈百度文心(ERNIE)知识增强语义理解技术与平台参考资料〉, 《百度》, 2020-07-09
같이 보기