엑사원
엑사원(EXAONE)은 엘지그룹(LG Group)의 인공지능 연구원이 2021년 12월에 선보인 한국어·영어 기반 멀티모달 거대언어모델(LLM)이다. '인간을 위한 전문가 AI'라는 뜻으로, 약 3,000억 개의 파라미터를 가졌다.
[아사달] 스마트 호스팅 |
목차
개요
엑사원은 초거대 AI 모델로, 이름은 'EXpert AI for everyONE'의 축약어에서 유래했다. 이 이름은 "모두를 위한 전문가 AI"라는 의미를 담고 있으며, 동시에 접두어 'EXA'는 10의 18승을 나타내는 '엑사'를 의미하여, 초거대 AI의 방대한 규모를 상징적으로 표현한다. 엑사원의 개발은 LG AI 연구원이 AI 기술의 최전선에 서겠다는 의지를 반영한 결과물이다. 초거대 AI란 대용량의 데이터를 처리하고 학습하여, 인간처럼 사고, 학습, 판단할 수 있는 AI를 의미한다. 이러한 AI는 특정 용도에 제한되지 않고, 다양한 분야에서 활용될 수 있는 잠재력을 지니고 있다. 엑사원은 이러한 특성을 바탕으로, 다양한 산업과 연구 분야에서 혁신적인 변화를 이끌어낼 수 있는 가능성을 가지고 있다.[1]
발전
엑사원 2.0
엑사원 2.0은 약 1년 반의 개발 기간을 거쳐 2023년 7월 19일에 공개된 차세대 초거대 인공지능 모델이다. 이 모델은 이전 버전인 엑사원 1.0에 비해 성능, 효율성, 그리고 데이터 처리 능력에서 획기적인 향상을 이루었다. 엑사원 2.0은 약 4,500만 건의 특허와 논문, 그리고 3억 5천만 장에 이르는 이미지를 학습한 결과, 한층 더 깊고 폭넓은 지식 기반을 구축했다. 이러한 방대한 데이터를 통해 엑사원 2.0은 한국어와 영어를 동시에 이해하고 처리할 수 있는 이중 언어 모델로 설계되었다. 이는 특히 영어로 된 전문 지식 데이터가 대부분인 현실을 고려한 것이다.
엑사원 2.0의 성능 향상은 단순히 데이터의 양만이 아니라, 고도의 최적화 기술을 통해 이뤄졌다. LG AI 연구원은 모델의 경량화와 최적화를 통해 기존 모델 대비 추론 처리 시간을 25% 단축하고, 메모리 사용량을 70% 줄였다. 이를 통해 운영 비용은 약 78%나 절감되었다. 멀티모달 모델 역시 이미지 생성 품질을 향상시키기 위해 메모리 사용량을 기존 대비 2배로 늘렸지만, 추론 처리 시간은 83% 단축하고, 비용을 66% 절감하는 성과를 거뒀다.
또한, 엑사원 2.0은 사용자 맞춤형 설계가 가능하도록 다양한 옵션을 제공한다. 사용자는 언어, 비전, 멀티모달 등 다양한 유형의 모델을 선택할 수 있으며, 고객의 데이터 보안을 위해 파인 튜닝(Fine-Tuning)과 온프레미스(On-Premise) 및 사설 클라우드(Private Cloud) 방식을 지원한다. LG 전자의 AICC(AI 컨택 센터)는 엑사원 2.0의 대표적인 활용 사례로, 고객 상담 내용을 실시간으로 분석하고 적절한 답변이나 콘텐츠를 제안하는 데 사용된다.[2]
엑사원 3.0
엑사원 3.0은 2024년 8월 공개한 인공지능 모델로, 경량화된 형태로 오픈소스로 공개된 것이 특징이다. 이 모델은 한국어와 영어 기반의 거대언어모델(LLM)로, 기존 모델보다 효율성과 성능 면에서 크게 개선되었다. 엑사원 3.0 경량 모델은 전작 대비 매개변수 수를 대폭 줄여 전력 소모와 비용을 절감하면서도, 성능 면에서는 엑사원 1.0을 능가한다. 특히 추론 처리 시간이 56% 단축되고, 메모리 사용량이 35% 감소하면서 구동 비용이 72% 절감되는 등, 학계와 연구기관에서 활용하기에 적합한 모델이다. 성능 평가에서도 25개 부문 중 13개 부문에서 1위를 차지하며, 메타와 구글의 최신 모델들과 비교해도 경쟁력을 갖추고 있다. 엑사원 3.0 기술 보고서에 따르면 AI 모델 성능평가 지표 25개 부문 중 한국어 실제 사용성, 영어 실제 사용성, 수학, 코딩 등 13개 부문에서 1위를 차지했다.
엘지는 이번 오픈소스 공개를 통해 엑사원 생태계가 더욱 확장되기를 기대하고 있다. 연구기관과 스타트업들이 엑사원을 적극 활용함으로써 인공지능 연구가 활성화되고, 이를 통해 엘지의 인공지능 산업에서의 입지도 강화될 전망이다. 엑사원 3.0을 기반으로 한 다양한 서비스와 제품들도 2024년 하반기부터 출시될 예정으로, AI 기술의 실질적 활용이 더욱 확대될 것으로 보인다. 2024년 하반기부터는 엘지 계열사를 시작으로 엑사원 3.0이 적용된 제품과 서비스가 출시된다. 또 엑사원 3.0을 기반으로 만든 생성형 AI 서비스인 '챗엑사원'(ChatEXAONE)의 베타 서비스를 시작했다. 엑사원 3.0 기반 서비스로 질의응답, 검색·요약·번역·분석, 데이터베이스 관리, 코딩 업무 등을 지원한다. 자연어 입력만으로도 파이썬·자바 등 프로그래밍 언어 22개를 활용할 수도 있다.[3][4][5]
특징
멀티모달
엑사원의 가장 큰 특징 중 하나는 멀티모달 기능이다. 멀티모달 AI란 텍스트와 이미지와 같은 다양한 유형의 데이터를 동시에 이해하고 처리할 수 있는 AI를 말한다. 엑사원은 텍스트와 이미지를 동시에 학습할 수 있는 능력을 가지고 있으며, 텍스트를 입력하면 이에 맞는 이미지를 생성하거나, 반대로 이미지를 보고 그에 대한 텍스트 설명을 생성하는 것이 가능하다. 이 기능은 특히 시각적 자료와 텍스트 정보를 동시에 다루어야 하는 응용 분야에서 매우 유용하게 활용될 수 있다.
이 기능은 다른 초거대 AI 모델들과 차별화되는 엑사원의 강력한 장점 중 하나이다. 예를 들어, 비슷한 시기에 출시된 카카오의 초거대 AI 모델인 '민달리'는 텍스트를 보고 이미지를 생성할 수는 있지만, 이미지를 분석해 텍스트를 생성하는 기능은 지원하지 않는다. 반면, 엑사원은 양방향 소통이 가능하여, 이미지와 텍스트 간의 상호작용이 더욱 원활하다.[6]
방대한 학습 데이터
엑사원이 가진 또 다른 중요한 특징은 방대한 학습 데이터와 이중 언어 처리 능력이다. LG AI 연구원은 엑사원을 개발하기 위해 세계 최대 규모의 학습 데이터를 활용하였다. 6천억 개의 말뭉치와 2억 5천만 장 이상의 고해상도 이미지 데이터를 학습시켰다. 이러한 막대한 데이터 양은 엑사원이 다양한 상황에서 유연하게 대응할 수 있는 기반을 제공한다.
특히, 엑사원은 개발 초기부터 한국어와 영어 데이터를 동시에 학습한 이중 언어(bilingual) 모델이다. 이는 한국어 특화 모델로 출발한 네이버의 '하이퍼클로바'나 카카오의 '민달리'와 차별화되는 점이다. 또한, 엑사원은 주로 영어에 특화된 오픈AI의 GPT-3와도 다르게, 한국어와 영어 모두에서 높은 성능을 발휘할 수 있도록 설계되었다. 이중 언어 모델은 글로벌 비즈니스 환경에서 매우 중요한 역할을 할 수 있다. 한국어와 영어를 동시에 이해하고 처리할 수 있는 능력은, 엑사원이 국내외 다양한 분야에서 활용될 수 있는 가능성을 열어준다. 특히, 한국 시장을 타겟으로 하는 기업이나 기관에서는 엑사원의 이러한 특성이 큰 이점으로 작용할 것이다.[6] [1]
산업적 응용 가능성
엑사원은 다양한 산업 분야에서 활용될 수 있는 잠재력을 지니고 있다. 그 중 하나가 고객 지원 시스템이다. 엑사원의 멀티모달 기능을 활용하면, 고객의 문의 사항에 대해 텍스트나 이미지를 기반으로 정확하고 신속한 답변을 제공할 수 있다. 예를 들어, 고객이 제품 이미지를 보내면, 엑사원은 그 이미지에 대한 설명과 함께 관련된 추가 정보를 제공할 수 있다. 또한, 디지털 콘텐츠 제작 분야에서도 엑사원은 중요한 역할을 할 수 있다. 이미지를 기반으로 마케팅 문구를 생성하거나, 새로운 광고 캠페인을 위한 시각적 자료를 생성하는 등 다양한 응용이 가능하다. 엑사원의 이중 언어 처리 능력은 이러한 작업을 글로벌 시장에서도 유연하게 수행할 수 있도록 도와준다.[6] [1]
활용
유니버스
엑사원 유니버스는 LG AI 연구원이 개발한 전문가용 대화형 인공지능(AI) 플랫폼으로, 기존의 대화형 AI와 차별화된 고도화된 기능을 제공하는 것이 특징이다. 이 플랫폼은 단순히 질의응답이나 텍스트 분류, 요약, 번역 같은 일반적인 AI 기능을 넘어서, 각 분야의 전문가들이 신뢰할 수 있는 정보를 탐색하고, 인사이트를 도출할 수 있도록 설계되었다.
엑사원 유니버스의 가장 큰 특징은 전문성과 신뢰성이다. 이 플랫폼은 사전 학습한 방대한 데이터를 기반으로, 각 도메인별 최신 전문 데이터를 통합하여 질문에 대한 정확한 답변을 제공한다. 예를 들어, 특정 질문에 대해 AI가 제공하는 답변에는 그 답변을 도출하는 데 사용된 관련 전문 문헌과 AI가 참고한 데이터가 함께 제시된다. 이 과정은 사용자가 AI의 추론 과정을 보다 투명하게 이해하고 검토할 수 있게 해준다.
또한, 엑사원 유니버스는 도메인 특화 서비스를 통해 다양한 전문 분야에 맞춤형 솔루션을 제공한다. LG AI 연구원은 AI/머신러닝, 화학, 바이오, 제약, 의료, 금융, 특허 등 여러 분야에 특화된 서비스를 준비하고 있다. 이를 통해 연구자들은 자신이 속한 분야에서 최신 정보를 신속하게 탐색하고, 필요한 인사이트를 얻을 수 있다. 엑사원 유니버스는 LG 그룹 내 AI 연구자들과 협력 대학을 대상으로 먼저 도입되었으며, 이후 LG 임직원 및 외부 전문가들로 대상이 확대될 예정이다. 이러한 플랫폼은 각 분야의 전문가들이 신뢰할 수 있는 정보 기반을 제공함으로써, AI 활용의 새로운 기준을 제시하고 있다.[7]
디스커버리
엑사원 디스커버리는 LG AI 연구원이 개발한 플랫폼으로, 신소재, 신물질, 신약과 같은 새로운 지식을 발견하는 데 중점을 두고 있다. 이 플랫폼은 특히 화학 및 바이오 분야에서 혁신적인 연구 개발을 가속화하는 도구로 자리 잡고 있다. 엑사원 디스커버리는 심층 문서 이해(DDU, Deep Document Understanding) 기술을 적용하여, 단순한 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 다양한 형식의 데이터를 분석하고 이해할 수 있다. 이는 AI가 다양한 형식의 데이터를 종합적으로 분석해, 연구자가 새로운 지식을 발견하는 과정을 크게 단축시킬 수 있도록 돕는다.
이 플랫폼은 특히 신소재와 신약 개발에 있어 획기적인 성과를 기대할 수 있다. 예를 들어, 신소재 개발 과정에서 엑사원 디스커버리를 활용하면, 기존에 수만 회에 걸쳐야 했던 합성 실험을 수십 회로 줄이고, 연구개발 기간도 기존의 수 년에서 몇 개월로 단축시킬 수 있다. 이를 통해 연구자들은 보다 효율적으로 새로운 소재와 물질을 발견하고, 산업적 응용 가능성을 높일 수 있다. 엑사원 디스커버리는 2023년 4분기부터 LG 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 서비스를 제공할 예정이며, 이를 통해 신소재·신물질·신약 관련 연구개발에 혁신적인 변화를 가져올 것으로 예상된다.[8]
아틀리에
엑사원 아틀리에는 창의적 발상을 돕기 위해 개발된 멀티모달 AI 플랫폼이다. 이 플랫폼은 이미지와 텍스트 데이터를 모두 이해하고 생성할 수 있는 기능을 제공하며, 특히 디자인과 창작 과정에서 혁신적인 도구로 활용된다. 엑사원 아틀리에는 3억 5천만 장의 이미지-텍스트 페어 데이터를 학습하여, AI가 이미지 생성 및 이해 능력을 극대화할 수 있도록 했다. 이 플랫폼은 예술, 디자인, 마케팅 등 다양한 창의적 분야에서 사용될 수 있으며, 특히 디자인 싱킹 프로세스를 지원하여 사용자가 AI와 상호작용을 통해 창의적인 결과물을 도출할 수 있도록 돕는다.
또한, 엑사원 아틀리에는 캡셔닝 AI 기능을 탑재하고 있다. 이 기능은 셔터스톡과의 협력을 통해 상용화된 것으로, 새로운 이미지에 대한 자연어 설명을 생성하고, 이를 통해 이미지 검색에 활용할 수 있는 메타 데이터를 제공한다. 이와 함께, 마케팅 문구 생성, 제품 설명, 시각 자료의 텍스트화 등 다양한 응용 분야에서 활용될 수 있다. 엑사원 아틀리에는 2023년 3분기부터 전문 디자이너를 대상으로 서비스가 제공되며, 이를 통해 AI 기반의 창의적 작업이 한층 더 혁신적으로 변화할 것으로 기대된다. 이 플랫폼은 창의적인 작업 과정에서 AI의 역할을 확장하고, 인간의 상상력을 증폭시키는 도구로서 중요한 위치를 차지할 전망이다.[9]
각주
- ↑ 1.0 1.1 1.2 김영신 기자, 〈LG, 사람 말 이해하고 그림-영상 만드는 초거대AI '엑사원' 공개〉, 《연합뉴스》, 2021-12-14
- ↑ 이주영 기자, 〈LG, 초거대 멀티모달 AI ‘엑사원 2.0’ 공개〉, 《AI타임스》, 2023-07-19
- ↑ 박해린 기자, 〈AI로 돈 벌 수 있다...구광모 신무기 '엑사원 3.0'〉, 《한국경제》, 2024-08-16
- ↑ 이재연 기자, 〈LG AI ‘엑사원’ 오픈소스로 공개…“학계서 활용 기대”〉, 《한겨레》, 2024-08-07
- ↑ 안민구 기자, 〈LG, 구광모가 점찍은 AI 모델 상용화 '박차'〉, 《일간스포츠》, 2024-08-22
- ↑ 6.0 6.1 6.2 김동원 기자, 〈LG가 출시한 초거대 AI '엑사원', "넌 무엇을 할 수 있니?"〉, 《AI타임스》, 2022-02-22
- ↑ 정두용 기자, 〈네이버·카카오보다 빨랐다…LG, 차세대 AI '엑사원 2.0' 공개〉, 《이코노미스트》, 2023-07-19
- ↑ 윤상호 기자, 〈LG, 초거대AI '엑사원2.0' 공개…하반기, 생성형AI 공략 본격화〉, 《디일렉》, 2023-07-19
- ↑ 〈초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’ 공개〉, 《엘지》, 2023-07-19
참고자료
- 김영신 기자, 〈LG, 사람 말 이해하고 그림-영상 만드는 초거대AI '엑사원' 공개〉, 《연합뉴스》, 2021-12-14
- 김동원 기자, 〈LG가 출시한 초거대 AI '엑사원', "넌 무엇을 할 수 있니?"〉, 《AI타임스》, 2022-02-22
- 이주영 기자, 〈LG, 초거대 멀티모달 AI ‘엑사원 2.0’ 공개〉, 《AI타임스》, 2023-07-19
- 〈초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’ 공개〉, 《엘지》, 2023-07-19
- 정두용 기자, 〈네이버·카카오보다 빨랐다…LG, 차세대 AI '엑사원 2.0' 공개〉, 《이코노미스트》, 2023-07-19
- 윤상호 기자, 〈LG, 초거대AI '엑사원2.0' 공개…하반기, 생성형AI 공략 본격화〉, 《디일렉》, 2023-07-19
- 이재연 기자, 〈LG AI ‘엑사원’ 오픈소스로 공개…“학계서 활용 기대”〉, 《한겨레》, 2024-08-07
- 박해린 기자, 〈AI로 돈 벌 수 있다...구광모 신무기 '엑사원 3.0'〉, 《한국경제》, 2024-08-16
- 안민구 기자, 〈LG, 구광모가 점찍은 AI 모델 상용화 '박차'〉, 《일간스포츠》, 2024-08-22
같이 보기