미스트랄AI
![](/images/thumb/7/75/%EC%95%84%EB%A5%B4%ED%8A%80%EB%A5%B4_%EB%A9%98%EC%8A%88.png/200px-%EC%95%84%EB%A5%B4%ED%8A%80%EB%A5%B4_%EB%A9%98%EC%8A%88.png)
미스트랄AI(Mistral AI)는 2023년 설립된 프랑스의 언어 모델 개발 및 관련 서비스 제공사이다. 양적은 물론 질적인 면에서도 유럽권을 선도하고 있는 인공지능 업체이며, 아파치 라이선스 기반의 오픈소스 정책을 통한 확장 정책을 펼치고 있다. 활성 매개변수를 통한 높은 효율성을 위주로 홍보하고 있다. 공동창립자 겸 최고경영자(CEO)는 아르튀르 멘슈(Arthur Mensch)이다. 멘슈 CEO는 구글 딥마인드 출신으로, 메타 연구원 출신들과 의기투합해 미스트랄AI를 창업했다. 미스트랄AI는 자체 거대언어모델(LLM)인 믹스트랄, 멀티모달 모델 픽스트랄 등을 개발한다.
미스트랄AI는 에마뉘엘 마크롱 프랑스 대통령의 전폭적인 지원과 함께 빠르게 성장해 지난해 58억유로(약 8조6550억원)의 기업 가치를 인정받았다.
목차
개요[편집]
미스트랄AI는 2023년 4월 프랑스에서 설립된 AI 전문 스타트업이다. 구글 딥마인드와 메타(페이스북) 출신의 연구원인 아르튀르 멘슈, 기욤 램플(Guillaume Lample), 티모시 라크로와(Timothée Lacroix) 등이 공동 창업했다. 아르튀르 멘슈는 구글 딥마인드 출신이고, 기욤 랑플과 티모시 라크로와는 메타 출신이다. 이들은 프랑스의 명문학교인 에콜 폴리테크니크에서 만난 것으로 전해진다.
미스트랄AI는 오픈소스 AI를 추구한다. 오픈AI나 앤트로픽 등 각광 받는 AI 스타트업이 폐쇄형 모델로 접근하는 것과는 다른 방식이다. 오픈AI의 경우 오픈소스를 표방하며 창업했지만, 오픈소스는 안전하지 않다며 폐쇄형으로 바뀐 바 있다. 반면 미스트랄 AI는 기술의 개방성이 AI 안전을 위해 필수적이라며 오픈소스의 가치를 중요시한다.
미스트랄AI의 모든 오픈소스 모델은 누구나 어디에서나 제한없이 사용할 수 있는 완전 허용 라이선스인 아파치 2.0이 적용돼 있다. 하지만 미스트랄AI의 모든 모델이 오픈소스로 공개돼 있는 것은 아니다. 미스트랄AI는 누구나 접근할 수 있는 오픈소스를 제공하면서도 상업용 모델을 함께 출시해 수익화도 동시에 꾀하고 있다.
미스트랄AI는 오픈소스와 상업용 모두 여러 종류의 LLM을 제공한다. 각 모델은 고유한 강점과 능력을 가지고 있다. 이외에 챗GPT와 유사한 AI 챗봇 서비스인 르챗(Le Chat)도 제공한다.
주요 인물[편집]
- 아르튀르 멘슈(Arthur Mensch) 미스트랄AI(Mistral AI) 공동창립자 겸 최고경영자(CEO)
아르튀르 멘슈는 1992년 7월 17일에 태어난 프랑스의 엔지니어이자 기업가이다. 그는 미스트랄AI 공동 창업자 겸 CEO로 인공지능 분야에서 활동하고 있다. 처음엔 École polytechnique와 Télécom Paris에서 엔지니어링 공부를 했고, 그 후 École Normale Supérieure에서도 공부했다. 박사 과정은 Inria와 파리 사클레이 대학에서 마쳤다. 그
멘슈는 구글의 인공지능 연구소인 DeepMind에서 3년 동안 일하면서 경력을 쌓았고, 그 후 Guillaume Lample, Timothée Lacroix와 함께 Mistral AI를 설립했다.
2023년 9월에는 프랑스 총리 엘리자베트 보른이 만든 생성형 인공지능 위원회에 합류했고, 2024년에는 프랑스에서 가장 부유한 스타트업 창업자 중 하나로 꼽혔다. Mistral AI의 가치는 약 30억 유로에 달하고, 그는 Time 매거진의 '가장 유망한 혁신자' 리스트에도 이름을 올렸다.
그는 또한 경제 문제에 대해서도 발언했는데, 예를 들어 프랑스의 노동법을 좀 더 유연하게 바꿔야 한다고 주장했고, 연구 개발에 대한 투자도 늘려야 한다고 강조했다. 그리고 Mistral AI의 가치는 인공지능이 인터넷만큼 큰 혁명이라고 믿기 때문에 적절하다고 했다.
2024년에는 아버지가 되었다.
역사[편집]
2023년 4월, 구글 딥마인드와 메타의 파리 연구소에서 근무하던 임직원들이 설립했다. 티모시 라크로와와 기욤 랑플은 2014년 페이스북에 인턴으로 입사한 이후, 2016년부터 파리에 위치한 메타의 인공지능 연구소(FAIR)에서 함께 근무해왔다. 2020년에는 랑플과 에콜 폴리테크니크 석사 과정을 함께했던 아르튀르 멘슈가 딥마인드 파리 지사에 합류했으며, 친칠라, 플라밍고, 레트로 등의 프로젝트에 핵심 기여했다. 현직 CEO인 아르튀르 멘슈에 의하면, 충분히 혁신적이지 못했던 기업 문화와 더불어 유럽에도 오픈소스를 기반으로 인공지능 분야를 발전시키겠다는 포부로 인해 창업에 도전하게 되었다고 한다.
2023년 6월, 에릭 슈밋 등의 투자자들로부터 2억 4,000만 유로의 기업가치를 평가받으며 1억 500만 유로 투자를 조달했다는 소식이 알려졌다. 마침 얀 르쿤과 클레망 드랑주 등의 업계 인물들은 인공지능의 중요성이 대두됨에 따라, 미국으로부터 비종속적이고 자체적인 프랑스 내 연구개발의 중요성을 강조하고 있었으며 프랑스 정치권에서도 관련 현안을 다루기 시작했기 때문에 설립 초기부터 주목을 받으며 높은 기업가치를 평가받을 수 있었다.
2023년 9월 27일, 회사는 70억 개의 파라미터를 가진 언어 처리 모델 "Mistral 7B"를 무료 아파치 2.0 라이선스 하에 공개했다. 이는 경쟁 모델들에 비해 상대적으로 작은 크기입니다.
2023년 12월, 앤드리슨 호로위츠와 세일즈포스 등으로부터 20억 달러의 기업가치를 평가받으며 3억 8,500만 유로 투자를 조달했다. 이로서 유니콘 기업에 등극했다.
2023년 12월 11일, 회사는 Mixtral 8x7B 모델을 출시했다. 이 모델은 467억 개의 파라미터를 가지고 있지만, 전문가 혼합 아키텍처를 통해 1개 토큰당 129억 개의 파라미터만을 사용한다. 이 모델은 5개 언어(프랑스어, 스페인어, 이탈리아어, 영어, 독일어)를 마스터하고 있으며, 개발자 테스트에 따르면 메타의 "LLama 2 70B" 모델을 초과하는 성능을 보여준다. 또한, "Mixtral 8x7B Instruct"라는 명령에 따르는 버전도 제공된다.
2024년 2월에는 Microsoft와의 계약을 체결했다는 소식이 알려졌으며, Microsoft Azure 플랫폼을 사용할 예정이다.[2] 뿐만 아니라 IBM과도 플랫폼 통합 협업을 체결하는 등 인공지능 업계에서 입지를 넓혀가고 있다.
2024년 4월 10일, 회사는 Mixtral 8x22B 모델을 출시하며 다양한 벤치마크에서 다른 오픈 모델들과 비교하여 뛰어난 성능을 보였다.
2024년 4월, 50억 달러의 기업가치로 5억 유로를 조달할 것이라는 보도가 나왔다. 또한 데이터브릭스와 협업을 맺으며, 미스트랄의 7B와 8x7B를 인텔리전스 플랫폼에 도입했다는 소식을 밝혔다.
2024년 6월, 60억 달러 기업가치로 6억 달러를 조달했다.
2024년 11월 19일, 회사는 Le Chat 업데이트를 발표했으며, Black Forest Labs와 협력하여 Flux Pro 모델을 활용한 이미지 생성 기능을 추가했다. 또한, 최신 정보를 제공하기 위해 인터넷 검색 기능을 도입하고, 코드 생성과 수정이 가능한 협업 인터페이스인 Canvas 시스템을 출시했다. 더불어, Pixtral Large라는 새로운 모델을 소개했으며, 이는 Pixtral 12B보다 개선된 성능을 보였다.
2024년 가을까지 회사에는 100명 이상의 직원이 근무하고 있다.
주요 제품 및 서비스[편집]
오픈소스 모델[편집]
아마존 웹 서비스, 마이크로소프트 애저, 스노우플레이크 등을 통해 손쉬운 활용이 가능하다. 허깅페이스, Cloudflare, MongoDB 등의 관련 테크 업체들은 물론 BNP 파리바, CMA-CGM 등의 레거시 기업들도 주요 고객사로 두고 있다.
믹스트랄 7B[편집]
Mistral 7B는 73억 개의 파라미터를 가진 언어 모델로, 트랜스포머 아키텍처를 사용한다. 2023년 9월 27일 비트토렌트 마그넷 링크와 Hugging Face를 통해 공식적으로 출시되었으며, Apache 2.0 라이선스 하에 배포되었다. 이 모델은 LLaMA 2 13B보다 모든 벤치마크에서 더 나은 성능을 보이며, 많은 벤치마크에서 LLaMA 34B와 유사한 성능을 보였다.
Mistral 7B는 그룹화된 쿼리 어텐션(GQA)을 사용하여 효율성과 확장성을 개선한다. 기본 모델과 "instruct" 모델이 제공되며, 후자는 채팅 스타일의 프롬프트를 따르도록 추가 조정된 버전이다. 이 모델은 데모용으로만 제공되며, 가드레일이나 모더레이션 기능은 포함되지 않았다.
믹스트랄 8x7B[편집]
Mixtral 8x7B는 2023년 12월 9일 비트토렌트 링크를 통해 공개되었고, 그 후 Hugging Face와 블로그 게시물이 2일 뒤에 발행되었다. 이 모델은 전문가 혼합 아키텍처를 사용하며, 8개의 서로 다른 전문가 그룹이 총 467억 개의 유효 파라미터를 제공한다. 각 토큰은 129억 개의 파라미터만을 사용하여 속도와 비용을 줄인다.
Mistral AI의 테스트에 따르면, 이 모델은 대부분의 벤치마크에서 LLaMA 70B와 GPT-3.5를 능가한다고 한다.
믹스트랄 8x22B[편집]
Mixtral 8x22B는 2024년 4월 10일 비트토렌트 링크를 통해 출시되었고, Hugging Face에도 곧 배포되었다. 이 모델은 Mixtral 8x7B와 유사한 아키텍처를 사용하나, 각 전문가 그룹이 7B 대신 22B의 파라미터를 가진다. 전체 모델은 1410억 개의 파라미터를 가지며, 일부 파라미터는 전문가들 간에 공유된다. 매개변수 390억개, 영어, 프랑스어, 스페인어, 독일어, 이탈리아어, 코드 생성. 1,410억 개의 매개변수를 가지고 있다.
NeMo[편집]
NVIDIA와 합작하여 만든 모델. 120억 매개변수를 가진 소형 모델이다.
Pixtral 12B[편집]
NeMo 12B를 기반으로 한 Mistral AI 최초의 멀티모달 모델이다.
Codestral 22B[편집]
Codestral은 Mistral의 첫 번째 코드 중심의 오픈 웨이트 모델로, 2024년 5월 29일에 출시되었다. 이 모델은 코드 생성 작업에 특화되어 있으며, HumanEval FIM 벤치마크에서 Meta의 Llama3 70B와 DeepSeek Coder 33B를 초과하는 성능을 보인다. Codestral은 80개 이상의 프로그래밍 언어를 구사할 수 있다고 주장하며, 상업적 용도로는 사용할 수 없는 라이선스를 가진다.
Codestral Mamba 7B[편집]
Codestral Mamba는 Mamba 2 아키텍처를 기반으로 하여 긴 입력에 대한 응답도 생성할 수 있다. 이전의 Codestral 모델과는 달리 Apache 2.0 라이선스 하에 제공되며, "instruct" 버전만 출시되었다.
상업용 API 제품[편집]
미스트랄 AI의 상업용 모델은 소스코드가 공개돼 있지 않으며, API 형태로만 이용할 수 있다.
- 미스트랄 라지 : Mistral Large는 2024년 2월 26일에 출시되었으며, Mistral은 이 모델이 세계에서 두 번째로 강력한 AI 모델이라고 주장한다. 영어, 프랑스어, 스페인어, 독일어, 이탈리아어에 능숙하며, 문법과 문화적 맥락을 이해하고 코드 작업도 수행할 수 있다. 이 모델은 Microsoft Azure에서도 제공된다.
- 미스트랄 라지2 : Mistral Large 2는 2024년 7월 24일에 발표되었으며, Hugging Face에서 제공된다. 이전 Mistral Large와는 달리 오픈 웨이트로 제공되며, Mistral 연구 라이선스와 상업적 목적으로는 상업 라이선스로 제공된다. 이 모델은 1230억 개의 파라미터를 가지고 있으며, 128,000개의 토큰을 처리할 수 있다. 프로그래밍 관련 작업에서 Llama 3.1 405B 모델과 경쟁력을 보여준다.
- 미스트랄 미듐 : 2024년 2월 26일 출시된 3가지 모델 중 중간 정도 크기를 가지는 모델. Mistral Medium은 영어, 프랑스어, 이탈리아어, 독일어, 스페인어, 코드에 대해 훈련되었으며, MT-Bench에서 8.6점을 기록했다. LMSys ELO Arena 벤치마크에서 Claude보다 높은 성과를, GPT-4보다는 낮은 성과를 보였다. 이 모델의 파라미터 수와 아키텍처는 공개되지 않았다.
- 미스트랄 스몰 : Mistral Large와 함께 2024년 2월 26일에 출시되었다. 간단한 텍스트 생성에 적합한 모델. 2024년 2월 26일 출시된 3가지 모델 중 가장 크기가 작은 모델.
- 미스트랄 임베드 : 텍스트를 벡터로 표현
르챗(Le Chat)[편집]
르챗은 오픈API의 챗GPT, 구글의 제미나이, 앤트로픽의 클로드와 비교할 수 있는 AI 챗봇이다. 인터넷에 실시간으로 연결해 답을 하는 것이 아니라 사전학습 모델이기 때문에 최신의 답을 하지는 못한다. 웹사이트에서 무료로 이용할 수 있다.
참고자료[편집]
- 미스트랄AI 공식 홈페이지 - https://mistral.ai/
- "Mistral AI", Wikipedia
- "Arthur Mensch", Wikipedia
- 정호준 기자, 〈미스트랄AI, 싱가포르에 아시아 첫 거점 만든다...“IPO도 준비”〉, 《 매일경제》, 2025-01-22
- AI리포터, 〈미스트랄 AI, 매각설 일축…"상장으로 글로벌 확장"〉, 《디지털투데이》, 2025-01-22
- 심재석, 〈[그게 뭔가요 유럽 AI의 희망으로 떠오른 ‘미스트랄 AI’]〉, 《바이라인네트워크》, 2024-06-26
같이 보기[편집]
이 문서는 로고 수정이 필요합니다.
이 문서는 인물사진 수정이 필요합니다.