픽스트랄

픽스트랄(Pixtral)은 프랑스의 인공지능 스타트업 미스트랄(Mistral)에서 개발한 멀티모달 인공지능 모델이다. 이미지와 텍스트를 모두 처리할 수 있는 기능을 갖추고 있다. 이 모델은 오픈소스로 공개되어 누구나 상업적으로 사용할 수 있는 장점이 있다.

[아사달] 스마트 호스팅

개요[편집]

픽스트랄은 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 인공지능(Multimodal AI) 모델이다. 멀티모달 AI는 서로 다른 형태의 데이터를 결합하여 분석하고 처리하는 인공지능을 의미하는데, 픽스트랄은 이미지와 텍스트를 동시에 이해하고 처리하는 데 특화되어 있다. 픽스트랄의 핵심은 픽스트랄 12B로, 이는 기존의 거대언어모델(LLM)인 네모(Nemo) 12B에 비전 어댑터(Vision Adapter)가 추가된 형태이다. 이 비전 어댑터는 총 4억 개의 매개변수로 구성되어 있으며, 네모 12B 모델의 텍스트 처리 능력을 보완해 이미지 처리 기능을 추가한다. 이를 통해 단순 텍스트뿐만 아니라 이미지를 입력받고 이를 해석해 물체 인식과 이미지 자막 작성, 질문에 대한 답변 제공 등 시각적 작업을 수행할 수 있다.^[1]

픽스트랄 12B는 경쟁사인 클로드(Claude)가 제공하는 멀티모달 능력과 유사한 기능을 갖추고 있지만, 이미지 생성 기능은 포함되지 않는다. 대신 클로드와의 주요 차이점은 오픈소스로 공개되었다는 것이다. 이는 개발자나 연구자들이 자유롭게 픽스트랄을 사용할 수 있도록 한다는 점에서 큰 의미를 가진다.^[2]

특징[편집]

비전 어댑터[편집]

비전 어댑터는 픽스트랄 12B에서 핵심적인 역할을 담당한다. 비전 어댑터는 AI 모델이 이미지 데이터를 처리할 수 있도록 지원하는 기능 모듈이다. 이를 통해 픽스트랄은 텍스트 기반 모델에 이미지 처리를 추가해, 해상도가 1024x1024인 이미지를 입력받고 분석할 수 있다. 웹상의 URL 이미지를 불러오거나 Base64 인코딩을 통해 이미지를 텍스트 형식으로 변환하여 처리하는 것도 가능하다. 이를 바탕으로 이미지에서 물체를 인식하고, 해당 이미지에 맞는 자동 자막 생성 작업을 수행할 수 있다.^[3]

오픈소스[편집]

픽스트랄 12B는 깃허브(GitHub)와 허깅페이스(Hugging Face)의 토렌트 링크를 통해 오픈소스로 제공된다. 이를 통해 누구나 이 모델을 다운받아 사용할 수 있으며, 전체 파일 크기는 약 24GB에 달한다. 이 모델은 개인 개발자뿐만 아니라 상업적 용도로도 자유롭게 활용할 수 있다는 점에서 큰 잠재력을 가지고 있다.

또한, AI 챗봇인 르챗(Le Chat)과 AI 개발 플랫폼 라플랫폼(La Platforme)에서도 픽스트랄 12B를 테스트용으로 제공할 예정이다. 이를 통해 기업이나 개인 개발자는 픽스트랄을 기반으로 다양한 AI 애플리케이션을 개발하고 각자의 목적에 맞게 커스터마이징할 수 있다. 예를 들어, 시각적인 작업을 필요로 하는 프로젝트나 서비스에 적용하여 업무 효율성을 크게 향상시킬 수 있을 것이다.^[4]

각주[편집]

↑ 이덕주 기자, 〈유럽 대표 AI기업 미스트랄, 멀티모달 능력 갖춘 ‘픽스트랄’공개〉, 《매일경제》, 2024-09-12
↑ 이석원 기자, 〈미스트랄, 첫 멀티모달 AI 모델 발표했다〉, 《테크레시피》, 2024-09-13
↑ 박찬 기자, 〈미스트랄, 최초의 멀티모달모델 '픽스트랄 12B' 출시〉, 《AI타임스》, 2024-09-12
↑ 남혁우 기자, 〈미스트랄AI, 텍스트·이미지 한번에 처리하는 멀티모달 AI 선보여〉, 《지디넷코리아》, 2024-09-12

참고자료[편집]

남혁우 기자, 〈미스트랄AI, 텍스트·이미지 한번에 처리하는 멀티모달 AI 선보여〉, 《지디넷코리아》, 2024-09-12
박찬 기자, 〈미스트랄, 최초의 멀티모달모델 '픽스트랄 12B' 출시〉, 《AI타임스》, 2024-09-12
이덕주 기자, 〈유럽 대표 AI기업 미스트랄, 멀티모달 능력 갖춘 ‘픽스트랄’공개〉, 《매일경제》, 2024-09-12
이석원 기자, 〈미스트랄, 첫 멀티모달 AI 모델 발표했다〉, 《테크레시피》, 2024-09-13

같이 보기[편집]

미스트랄

이 픽스트랄 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

인공지능 : 인공지능 서비스^□^■^⊕, 인공지능 로봇, 인공지능 기술, 인공지능 기업, 인공지능 인물

거대언어모델(LLM)	그록 • 네모 • 라마 • 몰모 • 믹스트랄 • 믿음 • 바드 • 사하바트-AI • 솔라 미니 • 솔라 프로 • 아야23 • 엑사원 • 인플렉션 2.5 • 제미나이 • 제미나이 나노 • 챗GPT • 클로드 • 파이-3.5 • 팔미라-X-004 • 하이퍼클로바X

챗봇	라온 • 브리티 코파일럿 • 샵봇 • 시리 • 심심이 • 아숙업(AskUp) • 알로 • 알리GPT • 애플 인텔리전스 • 오토GPT • 이루다 • 채티 • 챗뤼튼 • 챗베이스 • 클로바X • 키미챗 • 테이 • 패브릭스 • 픽스트랄 • 허깅챗

인공지능 검색	구버 • 라이너 • 빙 • 서치GPT • 옴니서치 • 퍼플렉시티

인공지능 문서	감마 • 구글 번역 • 노션AI • 다글로 • 딥엘(DeepL) • 뤼튼 • 비토 • 스위치미팅 • 에버노트 • 캔바 • 클로바노트 • 클로바더빙 • 파파고

인공지능 코딩	깃허브 코파일럿 • 데빈 • 커서AI • 코덱스 • 코디움메이트 • 탭나인

인공지능 이미지	AI 모션 • AI 프로필 • NUI 스튜디오 • 달리(DALL·E) • 드림스튜디오 • 레오나르도 AI • 미드저니 • 비디스커버 • 스테이블 디퓨전 • 에픽 • 카카오브레인 • 칼로 • 캐럿 • 코파일럿 • 파이어플라이 • 플레이그라운드

인공지능 웹툰	딥툰 • 로어머신

인공지능 음악 및 음성	AI 보이스 스튜디오 • 뮤직LM • 복스박스 • 사운드풀 • 수노 • 에이바 • 유디오 • 이봄 • 일레븐랩스 • 타입캐스트

인공지능 동영상	더 프로스트 • 드림머신 • 디-아이디 • 런웨이 젠 • 런웨이 젠3 • 무비 젠 • 브루 • 브이 • 소라 • 스테이블 비디오 디퓨전 • 인비디오 AI • 카이버 AI • 크레아 AI • 클링 AI • 피카아트 • 피포 디퓨전 • 픽스버스 • 픽토리

인공지능 서비스	슈퍼로이어

인공지능 무기	가스펠 • 라벤더

인공지능 스피커(한국)	갤럭시홈미니 • 기가지니 • 기가지니2 • 누구 • 누구네모 • 엑스붐AI씽큐 • 카카오아이 • 카카오미니 • 큐보이스 • 클로바 • 클로바웨이브

인공지능 스피커(글로벌)	구글홈 • 구글홈미니 • 구글홈허브 • 두어 • 빅스비 • 샤오두 • 스마트스피커 • 알렉사 • 어시스턴트 • 에코 • 에코닷 • 에코쇼 • 코타나 • 티몰지니 • 홈팟

인공지능 행사	2024년 제2차 AX 컨퍼런스

위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

[1] 이덕주 기자, 〈유럽 대표 AI기업 미스트랄, 멀티모달 능력 갖춘 ‘픽스트랄’공개〉, 《매일경제》, 2024-09-12

[2] 이석원 기자, 〈미스트랄, 첫 멀티모달 AI 모델 발표했다〉, 《테크레시피》, 2024-09-13

[3] 박찬 기자, 〈미스트랄, 최초의 멀티모달모델 '픽스트랄 12B' 출시〉, 《AI타임스》, 2024-09-12

[4] 남혁우 기자, 〈미스트랄AI, 텍스트·이미지 한번에 처리하는 멀티모달 AI 선보여〉, 《지디넷코리아》, 2024-09-12

[1]

[2]

[3]

[4]

위키원

이름공간

변수

보기

더 보기

검색