"아야23"의 두 판 사이의 차이

2024년 9월 24일 (화) 23:14 기준 최신판

아야23(Aya 23)은 캐나다 스타트업 코히어(Cohere)가 2024년 출시한 23개 언어를 지원하고 오픈소스로 제공되는 최신 거대언어모델(LLM)이다.

[아사달] 스마트 호스팅

개요[편집]

아야 23은 코히어의 비영리 연구 기관인 C4AI에서 출시한 거대언어모델로, 2024년 2월에 출시된 '아야 101'의 고도화 버전이다. 아야 23은 총 23개 언어를 지원하며, 전 세계 인구의 절반 이상이 사용하는 언어를 포괄하는 것이 특징이다. 한국어를 비롯해 중국어, 일본어, 아랍어, 힌디어 등 다양한 아시아 언어와, 영어, 독일어, 프랑스어, 스페인어, 러시아어 등 여러 유럽 및 중동 언어가 포함되어 있다. 이를 통해 다양한 문화와 지역에서 사용할 수 있는 다국어 모델로 자리매김하고 있다. 아야 23의 가장 큰 개선점 중 하나는 성능 향상이다. 이전 버전인 '아야 101'은 전 세계 119개국에서 3,000명 이상의 연구자가 자발적으로 참여한 '아야 프로젝트'를 기반으로, 101개의 언어를 지원하는 거대한 모델로 탄생했다. 그러나 너무 많은 언어를 지원하면서, 특정 언어에서의 성능이 떨어지는 문제가 있었다. 이를 보완하기 위해 아야 23은 언어 범위를 좁히고, 그 대신 각 언어별 성능을 강화했다.^[1]

기술적 특징[편집]

아야 23은 두 가지 매개변수 옵션인 8B와 35B로 개발되었다. 매개변수의 크기가 클수록 모델의 세부적인 학습과 정보 처리 능력이 향상된다. 아야 23은 이전 모델에 비해 식별 작업 성능이 최대 14%, 생성 작업 성능이 20%, 다국어 MMLU(수학적 언어 이해력)는 41.6%까지 향상되었으며, 특히 다국어 수학적 추론은 6.6배나 증가했다. 이러한 성능 향상은 아야 23이 다국어 지원뿐만 아니라 언어 간의 복잡한 작업을 훨씬 더 효과적으로 처리할 수 있음을 보여준다.

아야 23의 성능은 구글의 젬마(GEMMA)나 미스트랄 AI(Mistral AI)의 믹스트랄(MIXTRAL)과 비교했을 때도 일부 영역에서 더 우수하다는 평가를 받고 있다. 특히 다국어 모델에서 흔히 어려운 작업인 자연스러운 생성 작업과 수학적 추론 능력에서 강점을 보인다.^[1]

오픈소스 접근성[편집]

코히어는 아야 23의 매개변수인 가중치(Weights)를 허깅페이스(Hugging Face) 플랫폼을 통해 오픈소스로 공개했다. 이는 연구자와 개발자가 자유롭게 이 모델을 활용하고, 다양한 응용 프로그램을 개발할 수 있도록 돕기 위한 것이다. 가중치는 AI 모델의 학습된 정보가 응축된 부분으로, 이를 공개하는 것은 외부 연구자들이 모델을 더 발전시키고 커스터마이징할 수 있는 큰 기회를 제공한다. 일반적으로 AI 모델의 가중치는 비공개로 유지되는 경우가 많지만, 코히어는 이를 개방함으로써 인공지능 기술의 발전을 촉진하는 선도적인 역할을 하고 있다.^[2]

성능[편집]

아야 23은 전반적으로 아야 101에 비해 생성 작업에서 20%, 다국어 MMLU에서 41.6% 향상된 성능을 자랑하며, 특히 수학적 추론 작업에서 6.6배나 성능이 증가했다. 이는 복잡한 논리적 문제 해결이 필요한 환경에서 아야 23이 매우 유용할 수 있음을 의미한다. 또한, 아야 23은 특정 언어에서의 성능 저하 문제를 해결하고, 지원하는 각 언어에서 높은 품질의 결과를 제공할 수 있도록 개선되었다. 이는 단순히 여러 언어를 지원하는 것을 넘어서, 사용자가 사용하는 언어의 구체적인 요구 사항에 더 잘 맞춘 응답을 제공한다.^[1]

활용 가능성[편집]

아야 23은 다양한 언어 지원을 통해 글로벌 비즈니스, 연구, 번역, 콘텐츠 생성 등 다양한 분야에서 유용하게 사용될 수 있다. 특히 다국어 기반의 서비스와 애플리케이션 개발에 적합하며, 고도화된 언어 모델을 필요로 하는 복잡한 작업에서도 뛰어난 성능을 발휘할 수 있다. 또한, AI 연구자들은 아야 23의 오픈소스 가중치를 활용하여 맞춤형 모델을 개발하거나, 기존 애플리케이션에 통합할 수 있는 가능성을 열어 두었다.

각주[편집]

↑ ^1.0 ^1.1 ^1.2 임대준 기자, 〈코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력한 성능"〉, 《AI타임스》, 2024-05-24
↑ NewsClien, 〈Cohere AI, 23개 언어 지원하는 다국어 모델 'Aya 23' 공개〉, 《클리앙》, 2024-05-24

참고자료[편집]

임대준 기자, 〈코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력한 성능"〉, 《AI타임스》, 2024-05-24
NewsClien, 〈Cohere AI, 23개 언어 지원하는 다국어 모델 'Aya 23' 공개〉, 《클리앙》, 2024-05-24

같이 보기[편집]

아야 101

이 아야23 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

인공지능 : 인공지능 서비스^□^■^⊕, 인공지능 로봇, 인공지능 기술, 인공지능 기업, 인공지능 인물

거대언어모델(LLM)	그록 • 네모 • 라마 • 몰모 • 믹스트랄 • 믿음 • 바드 • 사하바트-AI • 솔라 미니 • 솔라 프로 • 아야23 • 엑사원 • 인플렉션 2.5 • 제미나이 • 제미나이 나노 • 챗GPT • 클로드 • 파이-3.5 • 팔미라-X-004 • 하이퍼클로바X

챗봇	라온 • 브리티 코파일럿 • 샵봇 • 시리 • 심심이 • 아숙업(AskUp) • 알로 • 알리GPT • 애플 인텔리전스 • 오토GPT • 이루다 • 채티 • 챗뤼튼 • 챗베이스 • 클로바X • 키미챗 • 테이 • 패브릭스 • 픽스트랄 • 허깅챗

인공지능 검색	구버 • 라이너 • 빙 • 서치GPT • 옴니서치 • 퍼플렉시티

인공지능 문서	감마 • 구글 번역 • 노션AI • 다글로 • 딥엘(DeepL) • 뤼튼 • 비토 • 스위치미팅 • 에버노트 • 캔바 • 클로바노트 • 클로바더빙 • 파파고

인공지능 코딩	깃허브 코파일럿 • 데빈 • 커서AI • 코덱스 • 코디움메이트 • 탭나인

인공지능 이미지	AI 모션 • AI 프로필 • NUI 스튜디오 • 달리(DALL·E) • 드림스튜디오 • 레오나르도 AI • 미드저니 • 비디스커버 • 스테이블 디퓨전 • 에픽 • 카카오브레인 • 칼로 • 캐럿 • 코파일럿 • 파이어플라이 • 플레이그라운드

인공지능 웹툰	딥툰 • 로어머신

인공지능 음악 및 음성	AI 보이스 스튜디오 • 뮤직LM • 복스박스 • 사운드풀 • 수노 • 에이바 • 유디오 • 이봄 • 일레븐랩스 • 타입캐스트

인공지능 동영상	더 프로스트 • 드림머신 • 디-아이디 • 런웨이 젠 • 런웨이 젠3 • 무비 젠 • 브루 • 브이 • 소라 • 스테이블 비디오 디퓨전 • 인비디오 AI • 카이버 AI • 크레아 AI • 클링 AI • 피카아트 • 피포 디퓨전 • 픽스버스 • 픽토리

인공지능 서비스	슈퍼로이어

인공지능 무기	가스펠 • 라벤더

인공지능 스피커(한국)	갤럭시홈미니 • 기가지니 • 기가지니2 • 누구 • 누구네모 • 엑스붐AI씽큐 • 카카오아이 • 카카오미니 • 큐보이스 • 클로바 • 클로바웨이브

인공지능 스피커(글로벌)	구글홈 • 구글홈미니 • 구글홈허브 • 두어 • 빅스비 • 샤오두 • 스마트스피커 • 알렉사 • 어시스턴트 • 에코 • 에코닷 • 에코쇼 • 코타나 • 티몰지니 • 홈팟

인공지능 행사	2024년 제2차 AX 컨퍼런스

위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

[.ED.83.80.EC.9E.84.EC.8A.A4-1] 1.0 ^1.1 ^1.2 임대준 기자, 〈코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력한 성능"〉, 《AI타임스》, 2024-05-24

[2] NewsClien, 〈Cohere AI, 23개 언어 지원하는 다국어 모델 'Aya 23' 공개〉, 《클리앙》, 2024-05-24

[1]

[2]

@@ 1번째 줄: / 1번째 줄: @@
-아야23
+'''아야23'''(Aya 23)은 [[캐나다]] [[스타트업]] [[코히어]](Cohere)가 2024년 출시한 23개 언어를 지원하고 [[오픈소스]]로 제공되는 최신 [[거대언어모델]](LLM)이다.
+{{:인터넷 배너|호스팅}}
+== 개요 ==
+아야 23은 [[코히어]]의 비영리 연구 기관인 C4AI에서 출시한 [[거대언어모델]]로, 2024년 2월에 출시된 '아야 101'의 고도화 버전이다. 아야 23은 총 23개 언어를 지원하며, 전 세계 인구의 절반 이상이 사용하는 언어를 포괄하는 것이 특징이다. 한국어를 비롯해 중국어, 일본어, 아랍어, 힌디어 등 다양한 [[아시아]] 언어와, 영어, 독일어, 프랑스어, 스페인어, 러시아어 등 여러 [[유럽]] 및 [[중동]] 언어가 포함되어 있다. 이를 통해 다양한 문화와 지역에서 사용할 수 있는 다국어 모델로 자리매김하고 있다. 아야 23의 가장 큰 개선점 중 하나는 성능 향상이다. 이전 버전인 '아야 101'은 전 세계 119개국에서 3,000명 이상의 연구자가 자발적으로 참여한 '아야 프로젝트'를 기반으로, 101개의 언어를 지원하는 거대한 모델로 탄생했다. 그러나 너무 많은 언어를 지원하면서, 특정 언어에서의 성능이 떨어지는 문제가 있었다. 이를 보완하기 위해 아야 23은 언어 범위를 좁히고, 그 대신 각 언어별 성능을 강화했다.<ref name="타임스"> 임대준 기자, 〈[https://www.aitimes.com/news/articleView.html?idxno=159977 코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력한 성능"]〉, 《AI타임스》, 2024-05-24 </ref>
+== 기술적 특징 ==
+아야 23은 두 가지 [[매개변수]] 옵션인 8B와 35B로 개발되었다. 매개변수의 크기가 클수록 모델의 세부적인 학습과 정보 처리 능력이 향상된다. 아야 23은 이전 모델에 비해 식별 작업 성능이 최대 14%, 생성 작업 성능이 20%, 다국어 MMLU(수학적 언어 이해력)는 41.6%까지 향상되었으며, 특히 다국어 수학적 추론은 6.6배나 증가했다. 이러한 성능 향상은 아야 23이 다국어 지원뿐만 아니라 언어 간의 복잡한 작업을 훨씬 더 효과적으로 처리할 수 있음을 보여준다.
+아야 23의 성능은 [[구글]]의 [[젬마]](GEMMA)나 [[미스트랄 AI]](Mistral AI)의 [[믹스트랄]](MIXTRAL)과 비교했을 때도 일부 영역에서 더 우수하다는 평가를 받고 있다. 특히 다국어 모델에서 흔히 어려운 작업인 자연스러운 생성 작업과 수학적 추론 능력에서 강점을 보인다.<ref name="타임스"></ref>
+===오픈소스 접근성===
+코히어는 아야 23의 [[매개변수]]인 가중치(Weights)를 [[허깅페이스]](Hugging Face) 플랫폼을 통해 오픈소스로 공개했다. 이는 연구자와 개발자가 자유롭게 이 모델을 활용하고, 다양한 응용 프로그램을 개발할 수 있도록 돕기 위한 것이다. 가중치는 AI 모델의 학습된 정보가 응축된 부분으로, 이를 공개하는 것은 외부 연구자들이 모델을 더 발전시키고 커스터마이징할 수 있는 큰 기회를 제공한다. 일반적으로 AI 모델의 가중치는 비공개로 유지되는 경우가 많지만, 코히어는 이를 개방함으로써 [[인공지능 기술]]의 발전을 촉진하는 선도적인 역할을 하고 있다.<ref> NewsClien, 〈[https://www.clien.net/service/board/news/18732032 Cohere AI, 23개 언어 지원하는 다국어 모델 'Aya 23' 공개]〉, 《클리앙》, 2024-05-24 </ref>
+===성능===
+아야 23은 전반적으로 아야 101에 비해 생성 작업에서 20%, 다국어 MMLU에서 41.6% 향상된 성능을 자랑하며, 특히 수학적 추론 작업에서 6.6배나 성능이 증가했다. 이는 복잡한 논리적 문제 해결이 필요한 환경에서 아야 23이 매우 유용할 수 있음을 의미한다. 또한, 아야 23은 특정 언어에서의 성능 저하 문제를 해결하고, 지원하는 각 언어에서 높은 품질의 결과를 제공할 수 있도록 개선되었다. 이는 단순히 여러 언어를 지원하는 것을 넘어서, 사용자가 사용하는 언어의 구체적인 요구 사항에 더 잘 맞춘 응답을 제공한다.<ref name="타임스"></ref>
+== 활용 가능성 ==
+아야 23은 다양한 언어 지원을 통해 글로벌 비즈니스, 연구, 번역, 콘텐츠 생성 등 다양한 분야에서 유용하게 사용될 수 있다. 특히 다국어 기반의 서비스와 애플리케이션 개발에 적합하며, 고도화된 언어 모델을 필요로 하는 복잡한 작업에서도 뛰어난 성능을 발휘할 수 있다. 또한, AI 연구자들은 아야 23의 [[오픈소스]] 가중치를 활용하여 맞춤형 모델을 개발하거나, 기존 [[애플리케이션]]에 통합할 수 있는 가능성을 열어 두었다.
+{{각주}}
+== 참고자료 ==
+* 임대준 기자, 〈[https://www.aitimes.com/news/articleView.html?idxno=159977 코히어, 한국어 포함 23개 언어 지원 LLM 출시..."전작보다 강력한 성능"]〉, 《AI타임스》, 2024-05-24
+* NewsClien, 〈[https://www.clien.net/service/board/news/18732032 Cohere AI, 23개 언어 지원하는 다국어 모델 'Aya 23' 공개]〉, 《클리앙》, 2024-05-24
+== 같이 보기 ==
+* [[아야 101]]
+{{인공지능 서비스|검토 필요}}

위키원

이름공간

변수

보기

더 보기

검색