어니(ERNIE, 百度文心)는 2019년 3월, 중국 최대 포털회사 바이두(百度)가 정식으로 발표한 AI기반 지식강화 자연어처리(NLP) 모델 및 플랫폼이다. 중국어로는 바이두원신(百度文心, bǎi dù wén xīn)이라고 한다. 어니는 바이두의 딥러닝 프레임 워크인 패들패들(PaddlePaddle,飞桨)에 기반한 프로젝트이다. 2019년 12월, 대표적인 자연어 이해 지표인 GLUE(General Language Understanding Evaluation·자연어 이해 평가)대회에서 90.1점을 기록, MS(89.9점), 구글(89.7점)을 앞질러 경쟁사들을 놀라게 했다.
ERNIE는 2018년 구글이 선보였던 Bert(Bidirectional Encoder Representations from Transformers)와 유사한 자연어 이해 모델을 구현했다. ERNIE와 Bert는 모두 미국의 인기 어린이 TV프로그램 '세서미 스트리트'에 등장하는 캐릭터명이다. 문맥을 파악하기 위해 문장의 단어 앞뒤로 등장하는 단어들을 조사하면서 의미를 이해한다. 바이두는 이미 자사 검색엔진과 AI 비서 '샤오두'(小度)에 알고리즘(자연어 이해 모델)을 적용 중이다.
자연언어처리 기법(NLP)[편집]
자연어 처리는 컴퓨터가 사람처럼 언어를 이해하고, 처리하며, 구사할 수 있도록 만드는 인공지능 기술이다. 이 기술은 포털 내 번역 기능과 챗봇에 쓰이고 있다.
바이두의 NLP 기술은 '자연언어처리 기법(NLP) 평가'에서 유례 없는 90.1점을 차지하며 신기록을 세웠다. 구글과 MS는 각각 89.9점과 89.7점으로 2,3위에 이름을 올렸다.
바이두가 개발한 NLP 기술 이름은 '어니(ERNIE)2.0'이다. 2019년 7월, 기존 1.0 버전을 업그레이드 해 새로 출시한 이래 바이두 이용자는 물론 AI 전문가들 사이에서도 혁신적 기술이라 평가 받아 왔다. 바이두 측은 어니2.0이 중국어와 영어를 번역하는 데 있어 구글보다 더 뛰어난 성능을 지녔다며 자신있게 내놓았다. 바이두는 구글의 NLP 기술인 버트(BERT)를 염두해 기술명을 어니로 지었다. 어니와 버트 모두 미국 어린이 텔레비전 교육프로그램 '세서미 스트리트(Sesame Street)' 캐릭터에서 착안했다.
어니2.0과 버트의 가장 큰 차이는 '중국어 해석 능력'이다. 어니2.0은 중국 내 주요 지방의 9개 사투리를 모두 이해해 완벽에 가깝게 영어로 번역해낸다. 이뿐 아니라 중국에서만 쓰는 간체와 대만·홍콩 등지에서 쓰는 번체를 섞어 문장을 입력해도 문제 없이 영어로 정확하게 해석할 수 있다.
문장의 구성 또한 풍성하다. 구글의 버트가 '간단한 접근법'이 강점이라면 바이두의 어니2.0은 사람이 쓴 다채로운 표현의 소설 속 긴 문장도 자연스러운 어감으로 번역한다. 어니2.0 개발팀은 이 과정을 성공시키기 위해 일반 도서 대신 해리포터 시리즈를 참고했다.[1]
비트프레스[편집]
바이두가 자사 인공지능 어니(ERNIE)를 활용해 특정 주제에 맞게 웹페이지, 비디오 클립, 미디어를 편집해 2분 가량의 짧은 동영상을 만들어주는 인공지능 비드프레스(VidPress)의 프로토타입을 개발했다. 비드프레스는 URL에서 텍스트를 분석한 후 간결한 형태의 내러티브(서술문)를 합성하고, 인공지능이 선택한 미디어 및 비디오 클립을 활용해 2분 가량의 동영상을 만들어낸다. 음성도 자동을 삽입해준다. 이는 사람이 동영상을 편집하는 데 들어가는 시간을 절약할 수 있으며 동영상의 품질도 사람을 능가한다는 게 바이두의 설명이다.
연구팀은 바이두의 동영상 플랫폼인 '하오칸'(好看)에서 비드프레스를 이용해 테스트한 결과 2분 가량의 동영상을 만드는데 9분 정도가 걸렸으며 시청자들의 관심도도 비교적 높은 것으로 나타났다. 사람이 편집한 동영상을 끝까지 시청한 비율이 50%에 그친데 반해 비드프레스가 편집한 동영상을 끝까지 시청한 비율은 65%에 달했다.
비드프레스의 원리[편집]
가령 올 초 헬리콥터 사고로 사망한 미 프로농구 스타 '코비 브라이언트'에 관한 동영상을 제작한다고 가정한다.
비드프레스는 코비 브라이언트의 사망을 다룬 웹페이지를 분석한 후 짧은 스토리를 만들어낸다. 인공지능 알고리즘은 웹페이지에서 브라이언트의 사망에 관한 중요한 문장을 뽑아내 동영상 스크립트의 전면에 배치한다.이 스크립트에는 헬리콥터, 코비 등 핵심 키워드가 들어간다. 인공지능은 요약문의 논리적인 구조를 명확히 하고, 사람이 문장 작성시 범하기 쉬운 나쁜 버릇도 교정해준다. 예를 들어 사람이 흔히 범하는 '모호한' 대명사를 보다 명확하게 해준다.
비드프레스는 문자 음성 변환 기술을 통해 스크립트를 음성으로 변환할 수 있다. 여기에 사람이 관심을 가질만한 음성 트랙에 '앵커(anchors)'를 배치한다. 연구팀은 의사결정 모델을 이용해 스토리 주제와 앵커를 연관짓는 작업을 진행한다. 또 사람들이 관심을 갖는 브랜드나 위치 등을 효과적으로 처리하도록 만들었다.
비드프레스는 웹페이지나 바이두의 뉴스피드 네트워크인 '바이쟈하오(Baijiahao)'에서 캡처한 미디어에 대해 점수를 매긴다. 비드프레스 알고리즘은 높은 점수를 받은 동영상 클립과 이미지를 타임라인상의 앵커와 연결짓는 작업을 한다. 이를 효율적으로 할수 있도록 일반적인 웹페이지 접근 능력뿐 아니라 저작권을 갖고 있는 상업적인 데이터베이스에도 접속할 수 있도록 시스템을 개발했다.
동영상 제작에는 컴퓨터 비전 기술도 활용된다. 브라이언트의 헬리콥터 사고 당시 현장 사진에 생전에 촬영한 그의 인터뷰 화면을 추가할수 있다. 이같은 일련의 작업을 통해 비드프레스는 사람이 편집한 동영상 보다 시청자들의 관심도가 더 높은 2분 가량의 동영상을 만들 수 있다는 설명이다.[2]
바이두 어니 지식강화 자연어처리 기술 및 플랫폼은 2020년 7월 9일, 개막된 2020세계인공지능대회(WAIC)에서 최고상인 SAIL상(Super AI Leader, 탁월한 인공지능 리더)을 수상, 바이두기술위원회 우화(吴华, wú huá) 위원장이 대표로 수상했다.[3]
- ↑ 박혜섭 기자, 〈중국 바이두 자연어처리(NLP) 기술, 구글·MS 눌렀다〉, 《AI타임스》, 2019-12-30
- ↑ 장길수 기자, 〈바이두, 주제에 맞게 동영상 제작해주는 인공지능 개발〉, 《로봇신문사》, 2020-05-21
- ↑ 重庆晚报, 〈百度文心(ERNIE)知识增强语义理解技术与平台参考资料〉, 《百度》, 2020-07-09
참고자료[편집]
- 어니 공식 홈페이지 - https://wenxin.baidu.com/
- 〈百度文心(ERNIE)知识增强语义理解技术与平台〉, 《百度百科》
- 박혜섭 기자, 〈중국 바이두 자연어처리(NLP) 기술, 구글·MS 눌렀다〉, 《AI타임스》, 2019-12-30
- 장길수 기자, 〈바이두, 주제에 맞게 동영상 제작해주는 인공지능 개발〉, 《로봇신문사》, 2020-05-21
- 重庆晚报, 〈百度文心(ERNIE)知识增强语义理解技术与平台参考资料〉, 《百度》, 2020-07-09
같이 보기[편집]
![검수요청.png](/images/b/bf/%EA%B2%80%EC%88%98%EC%9A%94%EC%B2%AD.png) 이 어니 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
인공지능 : 인공지능 서비스, 인공지능 기술 □■⊕, 인공지능 로봇, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 킬 스위치 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • URL • 감정 • 글자 • 단어 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문단 • 문서 • 문자 • 문자인식 • 문자채팅 • 문장 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 음성합성(TTS) • 의미 • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 출처 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
노드 • 데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 레이블 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 시뮬레이션 • 엣지 • 임베딩 • 청크(Chunk) • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 기억 • 단기기억 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 자기지도학습 • 장기기억 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 훈련
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • FFN • MHSA • RAG • ReLU 함수 • Seq2Seq • XAI • Word2Vec • 가중치 • 경사하강법 • 관계형 네트워크(RN) • 기울기 소실 • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 디코더 • 로지스틱 함수 • 리키 ReLU 함수 • 매개변수 • 미시 함수 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 비선형 함수 • 생성대립신경망(GAN) • 생성형 AI • 선형 함수 • 소프트맥스 함수 • 손실함수 • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 스위시 함수 • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 어탠션 • 에이전트체인(CoA) • 역전파 • 역치 • 온도 • 원핫 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 인코더 • 입력층 • 잔차신경망(레즈넷) • 제한 볼츠만 머신(RBM) • 전방전달신경망(FFNN) • 정렬위장 • 주의 메커니즘 • 초매개변수(하이퍼 파라미터) • 출력층 • 코헨 자기조직 신경망 • 탄젠트 함수 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 하이퍼볼릭 탄젠트 함수(tanh) • 학습률 • 합성곱 신경망(CNN) • 확률분포 • 확률적 경사하강법 • 활성화 함수
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 장비
|
GPU • 그래픽카드 • 레니게이드 • 반도체 • 엔비디아 • 엔비디아 A100 • 엔비디아 H100 • 엔비디아 H200 • 집적회로(칩)
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 인공지능, 개발, 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인물, 행사, 일반
|
|
인공지능 : 인공지능 서비스, 인공지능 기술 □■⊕, 인공지능 로봇, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 킬 스위치 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • URL • 감정 • 글자 • 단어 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문단 • 문서 • 문자 • 문자인식 • 문자채팅 • 문장 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 음성합성(TTS) • 의미 • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 출처 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
노드 • 데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 레이블 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 시뮬레이션 • 엣지 • 임베딩 • 청크(Chunk) • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 기억 • 단기기억 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 자기지도학습 • 장기기억 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 훈련
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • FFN • MHSA • RAG • ReLU 함수 • Seq2Seq • XAI • Word2Vec • 가중치 • 경사하강법 • 관계형 네트워크(RN) • 기울기 소실 • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 디코더 • 로지스틱 함수 • 리키 ReLU 함수 • 매개변수 • 미시 함수 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 비선형 함수 • 생성대립신경망(GAN) • 생성형 AI • 선형 함수 • 소프트맥스 함수 • 손실함수 • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 스위시 함수 • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 어탠션 • 에이전트체인(CoA) • 역전파 • 역치 • 온도 • 원핫 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 인코더 • 입력층 • 잔차신경망(레즈넷) • 제한 볼츠만 머신(RBM) • 전방전달신경망(FFNN) • 정렬위장 • 주의 메커니즘 • 초매개변수(하이퍼 파라미터) • 출력층 • 코헨 자기조직 신경망 • 탄젠트 함수 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 하이퍼볼릭 탄젠트 함수(tanh) • 학습률 • 합성곱 신경망(CNN) • 확률분포 • 확률적 경사하강법 • 활성화 함수
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 장비
|
GPU • 그래픽카드 • 레니게이드 • 반도체 • 엔비디아 • 엔비디아 A100 • 엔비디아 H100 • 엔비디아 H200 • 집적회로(칩)
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 인공지능, 개발, 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인물, 행사, 일반
|
|