검수요청.png검수요청.png

문샷AI

위키원
이동: 둘러보기, 검색
문샷AI(Moonshot AI, 月之暗面)
문샷AI(Moonshot AI, 月之暗面)
양즈린(楊植麟) 문샷AI(Moonshot AI, 月之暗面) 창업자

문샷AI(Moonshot AI, 月之暗面)는 2023년에 4월에 설립된 알리바바텐센트 등이 투자한 중국 인공지능(AI) 스타트업이다. 문샷 AI는 중국어 기반의 범용인공지능(AGI·사람과 유사한 수준 또는 그 이상의 지능을 갖춘 AI)에 주력하고 있다. 문샷AI는 중국 칭화대학교 컴퓨터공학과를 졸업한 양즈린(楊植麟), 같은 학교 출신 저우신위(周昕宇), 우위신(吳育昕)이 함께 공동창업했다.[1]

개요[편집]

문샷AI는 지난 2023년 3월 창립된 스타트업으로, 중국 인공지능 대규모언어모델 분야 핵심 회사 중 하나다. 창업팀은 구글 바드(Bard), 제미나이(Gemini) 등 다양한 AI 모델 개발에 참여한 인재들로 구성된 것으로 알려져 있다.

2023년 10월, 문샷AI는 세계 최초로 20만자(중국어) 처리를 지원하는 '중국판 챗 GPT'인 '키미 챗(Kimi Chat)'을 세상에 선보였다.

문샷AI는 역사상 처음으로 창업 1년 만에 기업가치 30억달러(약 4조1500억원)를 인정받은 유니콘(기업 가치 10억달러 이상 스타트업)으로 성장, 알리바바와 텐센트 등의 투자를 이끌어냈다.

사명[편집]

기업명인 웨즈안몐(月之暗面)은 달의 뒷면 이라는 뜻이다. 양즈린 창업자가 미국 록밴드 '핑크플로이드'의 음반 '달의 뒷면(The Dark Side of the Moon·1973)'에서 기업명을 따왔다. 문샷AI는 2023년 이 음반 발매 50주년을 기념해 설립됐다.

주요 인물[편집]

양즈린(楊植麟) 문샷AI 창업자

창업자이자 CEO인 양즈린은 1993년생으로, 중국 광둥(廣東)성 산터우(汕頭) 출신이다. 중국 이공계 명문 칭화대 컴퓨터학과를 졸업 후, 카네기멜론대(Carnegie Mellon University)에서 박사 학위를 받았다. 졸업 후에는 구글 브레인 AI 연구소에서 일했고, 애플의 인공지능 전문가 루슬란 살라쿠트디노프(Ruslan Salakhutdinov)를 스승으로 모셨다. 컴퓨터 분야 노벨상이라 불리는 튜링상 수상자들과 함께 논문을 쓴 이력이 있으며, 판구(槃古), 우다오(悟道) 등 중국의 대규모 모델 기술 개발에 기여했다는 평가를 받는다. 지난 2016년 리커런트 AI라는 회사를 설립해 LLM을 구축한 이력을 갖고 있다.

양즈린은 2024년 5월 18일, 상하이 혁신 창업 청년 50인 포럼(上海創新創業青年50人論壇)에 참석해 창업 동기와 인공지능 기술 발전에 대한 견해를 공유했다. 그는 인터넷, 트랜스포머(Transformer), 반도체라는 3가지 요소가 향후 AI의 B2C를 촉진할 것이며, 인터넷의 최고의 가치는 AI를 위해 20여 년간 데이터를 쌓아왔다는 사실이라고 밝혔다.

"보다 급진적이고 확실한 경로로 학계와 공업계의 장벽을 허물고 싶다"

양즈린이 밝힌 창업의 이유다. 그는 "앞으로 10년 AGI(Artificial General Intelligence, 범용 인공지능)가 가장 가치 있는 일이 될 것"이라며, "AGI의 발전은 단기적으로 시장의 니즈에 부합될 뿐만 아니라, 앞으로 10~20년 전 세계를 크게 변화시킬 것"이라고 관측했다.[2]

주요 제품[편집]

Kimi의 유료화 모델

키미 챗(Kimi Chat)[편집]

키미챗(Kimi Chat)은 장문 특화형 생성형 AI다. 특히, 중국어만큼은 챗 GPT를 능가한다는 분석도 나온다. 서적, 보고서, 회의록 등 장문을 처리하는 기술은 현재 중국 대규모 언어 모델 업계의 주력 시장이자, 마침 키미의 강점이기도 하다.

학술 논문, 법률 문서, 신문 기사 등 장문의 텍스트 처리에 대한 수요가 급증하는 상황에서 중국어 장문 처리 서비스가 나오자 반응은 폭발적이었다. 사우스차이나모닝포스트(SCMP)는 텍스트 처리 안정성 면에서는 '키미'가 '챗GPT'보다 뛰어나다는 평가를 했다.

2023년 10월 발표한 키미 1.0은 한 번에 20만 자(중국어)를 처리할 수 있었다. 그리고 2024년 3월 공개된 새로운 버전은 200만 자에 달하는 장문을 처리할 수 있게 기능이 업그레이드됐다. 통계 사이트 시밀러웹(Similarweb)의 데이터에 따르면, 새 버전이 발표된 그 주, 키미 사이트의 트래픽량은 바이두의 생성형 AI 원신이옌(文心一言)를 뛰어넘어 중국 내 AI 챗봇 중 가장 높은 방문자 수를 기록할 정도로 큰 관심을 받았다.

오픈AI의 대항마로 불리는 AI 스타트업 앤트로픽은 '클로드-인스턴트-100k'모델로 약 8만자를 소화하며, 오픈AI의 GPT-4 터보 모델은 단일 프롬프트(명령어)에서 300페이지 분량의 텍스트를 이해하고 처리할 수 있는 것으로 알려져 있다. 이는 중국어로 약 10만자를 처리하는 수준이다.

중국 매체 보도에 따르면, 지금까지 무료로 서비스를 지원했던 문샷은 최근 유료화 모델을 테스트 중인 것으로 보인다. 키미 챗봇에 '팁(打賞)'을 주는 기능을 추가한 것이다. 일정 금액의 팁을 지불하면, 그에 상응하는 기간 동안 피크타임 우선 사용권을 누릴 수 있다. 오피스, 엔터테인먼트, 일상 실용 등 다양한 사용 환경을 포괄하는 '키미+' 기능도 추가했다.[2][1]

Kimi 익스플로러 에디션[편집]

2024년 10월 10일, '키미 익스플로러 에디션'을 공개하고 OpenAI의 최신 대규모 언어 모델 GPT-O1에 도전장을 내밀었다. 이 신제품은 수학, 프로그래밍, 추론 등 여러 분야에서 뛰어난 성능을 보이며 AI 업계의 관심을 한몸에 받았다.

키미 익스플로러 에디션은 OpenAI의 O1 모델과 경쟁하기 위해 특별히 설계됐다. 사고 연쇄(Chain of Thought, CoT) 기술과 자가 학습 강화(Self-Play Reinforcement Learning, Self-Play RL)를 도입해 기존 모델보다 한층 향상된 성능을 선보였다.

특히 미국 수학 경시대회(American Invitational Mathematics Examination, AIME) 수준의 고난도 수학 문제를 해결하는 능력을 입증했다. 이는 GPT-4.0이나 제미나이 1.5 프로(Gemini 1.5Pro) 등 경쟁 모델을 능가하는 성과다.

키미 익스플로러 에디션의 출시는 LLM 분야 글로벌 AI 경쟁의 중요한 전환점이 될 수 있다. CoT 기술을 활용해 복잡한 질문을 단계별로 분석하고 더 정확하고 정교한 답변을 제공한다. 또한 Self-Play RL 기술로 반복적인 시뮬레이션을 통해 자율적으로 학습하고 개선할 수 있게 했다.[3]

문 케이크[편집]

문케이크 아키텍처

핵심 추론 아키텍처인 문케이크(Mooncake)는 지연 시간을 희생하지 않으면서 처리량을 극대화할 수 있도록 설계된 새로운 추론 아키텍처이다. GPU 자원에 제한이 발생하고 운영 비용이 증가하는 상황에 도움이 될 것이라는 설명이다.

문샷AI는 2024년 12월 5일, 이 '문케dl크'를 오픈소스로 출시했다.

문케이크는 프리필(prefill)과 디코딩(decoding) 단계의 분리 및 저장-계산 분산 아키텍처를 활용해 문샷 AI의 대형언어모델(LLM) '키미(Kimi)'의 추론 처리량을 크게 향상했다고 전해졌다.

기존 LLM은 텍스트 생성을 위해 입력 프롬프트를 처리하는 프리필과 자동 회귀 방식으로 토큰을 하나씩 생성하는 디코딩 과정을 하나로 통합해 사용했으나, 이 방식은 자원 할당과 병렬 처리에서 부하를 일으키는 문제를 일으켰다.

문케이크 아키텍처는 프리필과 디코딩을 분리해 각 단계를 최적화했다.

프리필 단계에서는 재사용 가능한 캐시를 전송해 첫번째 토큰 생성을 최적화하고 중복 계산을 줄이며, 디코딩 단계에서는 'KV캐시(KVCache)'를 집합해 효율적인 배치 처리를 구현했다.

이런 분리가 성능 향상에 크게 기여했다는 설명이다. 특히 KV캐시 스케줄러는 처리량과 지연 시간을 최적화하는 데 중요한 역할을 한다. 문케이크는 GPU 자원을 모델 제공의 모든 작업에 사용하지 않고, KV캐시 관리 작업을 저활용 하드웨어인 CPU, DRAM, SSD에서 처리하도록 분리하여 자원의 효율성을 높였다.

또 예측 기반의 조기 거부 정책을 적용해 피크 시간대 시스템 과부하를 방지한다. 이 접근 방식은 높은 작업 부하에서도 첫번째 토큰 생성 시간(TTFT)과 토큰 간 시간(TBT)에 대한 서비스 수준 목표(SLO)를 유지하는 데 중요한 역할을 했다고 전했다.

실험 결과, 문케이크는 시뮬레이션 환경에서 처리량을 최대 5배 향상했고, 실제 환경에서는 75% 더 많은 요청을 처리할 수 있었다고 밝혔다.

이처럼 문케이크의 분산 아키텍처는 LLM 추론 작업의 효율성을 높이고, 단일 하드웨어 자원의 병목 현상을 방지한다. KV캐시 중심의 스케줄링 모델은 리소스 부하를 효과적으로 균형 있게 조정해 서비스 제공자가 지연 시간 요구사항을 위반하지 않으면서 처리량을 극대화할 수 있게 했다고 강조했다.

문샷 AI는 문케이크의 첫번째 오픈 소스 구성 요소인 고성능 데이터 전송 프레임워크 '트랜스퍼 엔진(Transfer Engine)'을 깃허브에 공개했다. 추가 구성 요소들은 향후 공개될 예정이다.[4]

각주[편집]

  1. 1.0 1.1 전효진 기자, 〈[비즈톡톡 알리바바·텐센트가 투자한 中 AI 스타트업 ‘문샷 AI’… 1년 만에 기업가치 4조 돌파]〉, 《조선비즈》, 2024-06-02
  2. 2.0 2.1 홍성현 차이나나랩 기자, 〈대기업 제쳤다, 화제성 1위 중국판 챗 GPT 만든 AI 천재〉, 《중앙일보》, 2024-06-11
  3.  〈문샷AI, ‘Kimi 익스플로러 에디션’ 공개… OpenAI의 GPT-O1에 도전장〉, 《에이아이매터스》, 2024-10-14
  4. 박찬 기자, 〈문샷 AI, 추론 처리 향상한 아키텍처 ‘문 케이크’ 오픈 소스 공개〉, 《AI타임스》, 2024-12-08

참고자료[편집]

같이 보기[편집]


  질문.png 이 문서는 로고 수정이 필요합니다.  

  질문.png 이 문서는 인물사진 수정이 필요합니다.  

  검수요청.png검수요청.png 이 문샷AI 문서는 인공지능 기업에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.