검수요청.png검수요청.png

미니맥스 (기업)

위키원
이동: 둘러보기, 검색
미니맥스(MiniMax, 稀宇科技)
미니맥스(MiniMax, 稀宇科技)
얀준지에(闫俊杰) 미니맥스(MiniMax, 稀宇科技) 창업자

미니맥스(MiniMax, 稀宇科技)는 중국의 인공지능 스타트업이다. 인공지능플랫폼 기업 센스타임(SenseTime)의 전 부사장이었던 얀준지에(闫俊杰)가 2021년 12월에 설립한 미니맥스는 설립 2년만에 기업가치 25억달러(약 33조3500억원)의 유니콘이다.  텍스트 대 시각, 텍스트 대 음성, 텍스트 대 텍스트 등 세 가지 모드의 기본 모델 아키텍처를 구축했다.

미니맥스는 현재 대형 AI 모델 스타트업 중 가장 높은 기업 가치를 자랑한다. 2023년 6월 펀딩라운드에서 IDG 캐피탈 등으로부터 2억 5000만 달러가 넘는 투자를 받았다. 2024년 2월에는 알리바바, 세퀘이아 차이나 등으로부터 6억달러가 넘는 자금을 조달했다.[1][2]

개요[편집]

미니맥스는 2021년 중국 빅테크 센스타임의 부사장 출신 얀 준지에를 중심으로 20명의 센스타임 출신 직원들이 모여 설립한 선도적인 범용 인공지능 기술 기업으로, 사용자와 함께 지능을 창조하는 데 전념하고 있다.

미니맥스는 소셜 AI 경험과 자신만의 대화형 성격을 지닌 비디오 게임 및 만화 캐릭터 등 캐릭터 챗봇 개발에 중점을 두고 있다. 현재 해외 시장용 '토키(Talkie)'와 중국 내수용 '싱 예(Xing Ye)'라는 두가지 AI 캐릭터 챗봇 앱을 제공하고 있다.

2024년 1월에는 최신 대형언어모델(LLM) '아밥6(abab6)'를 출시했다. 이는 중국 최초의 '전문가 혼합(MoE)' 아키텍처를 기반으로 한 LLM으로, 대규모 매개변수로 복잡한 작업을 처리할 능력을 갖추고 있다.

2024년 8월 31일 미니맥스는 첫 번째 동영상 생성 모델 abab-video-1을 출시하고 이를 산하 AI 챗봇 하이뤄AI(海螺AI)에 응용하면서 세간의 관심이 집중됐다. 이로써 미니맥스는 콰이서우(快手), 바이트댄스(字節跳動), 즈푸AI에 이어 동영상 생성 모델을 가진 중국 AI 회사가 됐다. 현재, 이 모델이 생성하는 동영상의 길이는 6초에 달하며, 향후 10초까지 지원 가능할 예정이다.

또한 미니맥스는 기업과 개발자를 위해 안전하고 유연하며 신뢰할 수 있는 API 서비스를 제공하는 오픈 플랫폼을 운영하여 AI 애플리케이션을 빠르게 구축할 수 있도록 지원한다.[1][2]

주요 인물[편집]

얀준지에(闫俊杰) 미니맥스 창업자

전 센스타임(SenseTime, 商汤科技) 부사장 및 범용 인공지능 기술 책임자였으며, 센스타임 연구원 부원장을 역임한 바 있다. 그는 2015년 중국과학원 자동화연구소에서 박사 학위를 취득했다. 센스타임에서는 딥러닝 도구 체인 및 기초 알고리즘 구축과 범용 인공지능 기술 개발을 담당했으며, 얼굴 인식 및 스마트 시티 관련 기술 체계도 구축했다. 딥러닝 및 컴퓨터 비전 분야에서 그는 세계적인 학술회의 및 저널에 100편 이상의 논문을 발표했으며, Google Scholar 인용 횟수는 10,000회 이상에 달한다.[3]

역사[편집]

미니맥스는 2021년 12월에 설립되어 초기부터 대규모 AI 모델 개발에 매진해 왔다. 첨단 연구와 실용적 응용에 중점을 둔 미니맥스는 해당 분야에서 선도적인 위치를 확립했다.

2023년 4월, 미니맥스는 API 플랫폼을 출시하여 기업들이 대규모 언어 모델 기능에 접근할 수 있도록 했다. 같은 해 6월에는 국제 시장을 겨냥한 AI 네이티브 캐릭터 커뮤니티 애플리케이션인 토키(Talkie)를 선보였다. 2023년 11월에는 음성 대규모 모델을 출시하며 멀티모달 역량을 더욱 확장했다.

2024년 4월, 미니맥스는 조 단위 파라미터를 가진 MoE 아키텍처의 abab6.5 시리즈를 공개하며, Hailuo AI 앱을 출시했다. 2024년 9월에는 AI 기반 영상 제작 도구를 제공하는 Hailuo AI Video를 출시했다. 11월에는 텍스트, 수학, 멀티미디어 처리에서 새로운 가능성을 열어가는 abab7-preview 모델을 공개했다.

현재 미니맥스의 모델은 매일 30억 건의 상호작용을 처리하고, 3조 개 이상의 토큰을 분석하며, 2천만 개의 이미지를 생성하고, 7만 시간 분량의 음성을 생성하며 글로벌 AI 혁신에 큰 영향을 미치고 있다.[4]

기술 및 제품[편집]

대규모언어모델[편집]

abab6.5[편집]

미니맥스는 2024년 4월 17일, MoE(혼합 전문가 모델) 아키텍처를 기반으로 한 아밥(abab) 6.5 시리즈 모델을 공식 출시했다. 해당 모델은 GPT-4, Claude-3, Gemini-1.5에 근접한 핵심 능력을 갖추고 있다.

아밥(abab) 6.5 시리즈 주요 모델
  • abab 6.5 : 조 단위 파라미터를 보유하며, 20만 tokens의 컨텍스트 길이를 지원한다.
  • abab 6.5s : abab 6.5와 동일한 훈련 기술 및 데이터를 사용하면서도 더욱 효율적으로 작동하며, 20만 tokens의 컨텍스트 길이를 지원한다. 1초 내에 약 3만 자의 텍스트를 처리할 수 있는 고속 성능을 제공한다.
abab 6.5 개발 배경 및 성과

2024년 1월, MiniMax는 중국 내 최초로 MoE 아키텍처 기반의 abab 6 모델을 출시했다. 이후 모델 아키텍처 개선, 데이터 파이프라인 재구성, 훈련 알고리즘 및 병렬 훈련 전략 최적화를 통해 스케일링 법칙(Scaling Laws) 가속화 과정에서 중요한 성과를 달성했다.

모델 테스트 결과

공식 테스트에서는 20만 tokens 내에서 "대해라침(바다에서 바늘 건지기)" 방식으로 업계 표준을 사용했다. 긴 텍스트 내에 해당 텍스트와 무관한 문장(needle)을 삽입하고, 자연어 질문을 통해 모델이 이를 정확히 답변할 수 있는지를 평가했다.

설명

abab 6.5는 총 891번의 테스트에서 모두 정답을 도출하며 우수한 성능을 입증했다. MiniMax의 abab 6.5 시리즈는 대규모언어모델 분야에서 중요한 이정표를 제시하며, AI 기술의 정밀성과 처리 속도를 대폭 향상시켰다.[5]

abab7-preview[편집]

2024년 11월 초에 공개한 대규모 언어모델이다. 이 모델은 245K tokens의 컨텍스트를 지원하며, abab6.5 시리즈에 비해 장문 처리, 수학적 연산, 글쓰기 능력에서 큰 향상을 보였다. 현재 abab7-preview는 오픈 플랫폼에 정식으로 배포되어 있어 개발자 및 사용자 체험이 가능하다.

abab7 정식 버전[편집]

abab7 정식 버전은 현재 긴급히 준비 중이며, 곧 선보일 예정이다.

챗봇[편집]

Hailuo AI(海螺AI)[편집]

하이뤄AI는 미니맥스의 자체 다중 모달 대형 언어 모델을 기반으로, 사용자에게 다양한 지능형 서비스를 제공하여 작업 효율성과 생활 품질을 높이는 것을 목표로 한다. 주요 기능으로는 지능형 검색과 질문 답변, 정확한 이미지 분석, 몰입형 음성 대화, 전문적/창의적 글쓰기, 문서 요약, 그리고 독창적인 플로팅 볼 기능 등이 포함된다. 이를 통해 사용자들은 정보를 빠르게 얻고 문제를 효율적으로 해결할 수 있다.[6]

토키(Talkie)[편집]

토키는 미니맥스가 개발한 AI 기반 대화 소프트웨어로, 특히 해외 시장, 특히 미국의 엔터테인먼트 애플리케이션 시장에서 뛰어난 성과를 보이고 있다.

Talkie는 AI 채팅봇과 카드 게임 요소를 결합하여 사용자에게 독특하고 새로운 소셜 경험을 제공한다. 이를 통해 단순한 대화 이상의 재미와 몰입감을 제공하며, 기존의 소셜 네트워킹 애플리케이션과 차별화된 가치를 제안한다.

Talkie는 글로벌 사용자들에게 혁신적인 엔터테인먼트 경험을 제공하며, AI 기술의 새로운 활용 가능성을 제시하고 있다.[7]

싱예(星野)App[편집]

싱예(星野)App는 미니맥스가 출시한 AI 기반의 역할 대화 및 상호작용 플랫폼으로, 2023년 9월에 공식 출시되었다.

싱예(星野)는 몰입형 AI 콘텐츠 커뮤니티로, 사용자가 원하는 이상적인 대화 상대를 현실로 구현하는 것을 목표로 한다.

오리지널 캐릭터아바타 파트너를 통해 사용자의 상상을 현실화할 수 있는 플랫폼을 제공한다. 싱예(星野)의 AI 에이전트는 단순한 대화형 봇이 아니라, 사용자의 진심을 듣고 정서적 연결을 형성하며 소중한 추억을 함께 만들어가는 진정한 친구로 설계되었다.

星野 App의 특징
  • 캐릭터 맞춤화 : 星野의 주요 강점 중 하나는 캐릭터 맞춤화 기능이다. 사용자는 천사, 여성, 아이, 냉정한 목소리 등 다양한 역할과 음성 옵션 중에서 선택할 수 있다. 각 캐릭터는 고유의 성격과 음성을 가지고 있어, 사용자에게 더 많은 개인화된 경험과 재미를 제공한다.
  • 지능형 대화 시스템 : 첨단 자연어 처리 기술을 통해 사용자의 언어를 이해하고 적절히 응답한다. 이는 마치 실제 사람과 대화하는 듯한 자연스럽고 유연한 소통을 가능하게 한다.
  • 정서적 연결 및 추억 형성 : 星野는 단순한 대화 도구를 넘어, 사용자가 정서적 유대감을 형성하고 기억을 만들어갈 수 있도록 돕는다. 장기적인 상호작용을 통해 AI 에이전트는 사용자의 습관과 선호를 학습하며, 더욱 세심한 서비스를 제공한다.
  • 안전성과 프라이버시 보호 : 디지털 시대의 요구에 부응하여, 사용자 대화 내용이 노출되지 않도록 강력한 보안 및 프라이버시 보호를 제공한다. 이를 통해 사용자가 안심하고 자신의 감정과 생각을 자유롭게 표현할 수 있다.
  • 커뮤니티 상호작용 : 星野는 사용자 간의 상호작용과 경험 공유를 위한 커뮤니티 플랫폼도 제공한다. 이를 통해 사용자는 자신의 경험을 공유하고, 다른 사람의 피드백을 받을 수 있다.[8]

video-01[편집]

비디오-01 생성 비디오 (사진=미니맥스) 출처 : AI타임스(https://www.aitimes.com)

비디오-01은 텍스트 프롬프트를 통해 최대 6초 길이 1280x720 해상도의 고품질 비디오를 초당 25프레임으로 2분 내에 생성한다. 미니맥스의 '하이뤄' AI 플랫폼에서 제공된다.

미니맥스의 비디오-01은 루마 AI의 '드림머신'과 비슷한 수준이지만, 런웨이의 '젠-3 알파'나 다른 중국 모델인 콰이쇼우의 '클링'만큼 좋지는 않다는 평가다.[9]

Music-01[편집]

Music-01은 텍스트-음악 AI 모델이며, 주요 기능은 다음과 같다.

  • 고도로 의인화된 음악 생성: 이 모델은 복잡하고 감성적인 음악 작곡을 제작할 수 있어 다양한 창작 시나리오에 이상적이며 음악 제작에 상당한 유연성과 혁신을 제공한다.
  • 다양한 스타일 지원: 이 모델은 전통 악기부터 현대 전자 음악, 중국 클래식부터 서양 팝에 이르기까지 다양한 음악 스타일을 능숙하게 처리한다.

speech-01[편집]

미니맥스가 개발한 생성형 음성 대모델로, 음성 생성 기술에서 상당한 장점을 지니고 있다. 기존 TTS(음성 합성) 모델에 비해 데이터량, 자연스러움, 감정 표현 및 합성 효율 등에서 획기적인 발전을 이뤄, 사용자에게 더 높은 인간화된 자연스럽고 유려한 음성 합성 경험을 제공한다.

데이터 기반의 딥 러닝

MiniMax는 수백만 시간 분량의 고품질 음성 데이터를 수집하고 처리하여, 이를 GPT 대모델로 학습한다. 기존의 TTS 모델처럼 발음 사전(lexicon)에 의존하지 않고, 데이터를 통해 입술, 발음, 연음, 발음 생략, 음조 변화 등의 미세한 차이를 자동으로 포착한다.

문맥 이해와 감정 표현

Speech-01은 콘텐츠의 문맥을 이해하고, 그에 따라 말하는 감정과 표현 방식을 자동으로 조정한다. 기존의 "반복 기계"처럼 단순히 소리내어 읽는 것이 아니라, 실제 말하는 환경에서 자라난 전문가처럼 언어 습관과 문맥을 유연하게 모사할 수 있다.

세밀한 맞춤형 제어
  • 단어 수준: 사용자는 음성의 억양, 일시적 정지 등을 정밀하게 제어할 수 있으며, 혀꼬임이나 동음이의어 처리도 정확히 맞출 수 있다.
  • 문장 수준: 속도 조정 기능을 제공하여 빠르거나 느린 발화 속도를 개인화할 수 있다.
  • 다양한 음색: 100개 이상의 시스템 음색을 제공하며, 사용자는 원하는 음색을 선택하거나 조합하여 자신만의 음성을 만들 수 있다. SSML(음성 합성 마크업 언어) 수준의 유연성을 제공하여 음성의 세부 사항을 엄격하게 조정할 수 있다.

'초장문 텍스트 지원 기존 음성 모델이 지원하는 텍스트 길이를 뛰어넘어, 단 한 번에 1000만 자까지 출력할 수 있다. 장편 소설, 웹 연재물, 역사적 대작 등도 Speech-01을 통해 유려하게 음성으로 변환할 수 있다.

실시간 상호작용과 낮은 지연 시간

엔지니어링 최적화를 통해 음성 생성 지연을 30% 줄이고 안정성을 대폭 향상시켰다. 실시간 라이브 해설이나 음성 채팅 등에서 지연 없는 자연스러운 음성 경험을 제공한다.

동영상[편집]

각주[편집]

  1. 1.0 1.1 박찬 기자, 〈한달 새 중국 AI 유니콘 2개 탄생...투자 붐 절정〉, 《AI타임스》, 2024-03-06
  2. 2.0 2.1 홍성현 차이나랩 객원기자, 〈미니맥스 챗봇 인기, 중국 AI 기업의 글로벌 현주소는?〉, 《중앙일보》, 2024-11-05
  3.  〈闫俊杰,Minimax稀宇科技,联合创始人,星野,创始人〉, 《IT桔子》, 
  4. "MiniMax", Crunchbase
  5. IT之家, 〈MiniMax 稀宇科技发布万亿MoE模型 abab 6.5,核心能力接近 GPT-4〉, 《腾讯新闻》, 2024-04-17
  6.  〈海螺AI官网 - 大模型MiniMax推出的智能AI伙伴〉, 《AIGC工具导航》, 
  7.  〈Talkie AI 陪聊 | AI工具箱〉, 《玉米小站》, 
  8.  〈星野app: MiniMax旗下AI角色扮演互动对话聊天应用平台〉, 《通塔师AI导航》, 
  9. 박찬 기자, 〈중국 '4마리 호랑이' 미니맥스도 비디오 생성 모델 출시〉, 《AI타임스》, 2024-09-03

참고자료[편집]

같이 보기[편집]


  질문.png 이 문서는 로고 수정이 필요합니다.  

  검수요청.png검수요청.png 이 미니맥스 (기업) 문서는 인공지능 기업에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.