검수요청.png검수요청.png

"그록"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
잔글 (같이 보기)
 
6번째 줄: 6번째 줄:
 
== 개요 ==
 
== 개요 ==
 
그록은 [[엑스AI]]가 개발한 LLM 그록-1을 기반으로 개발한 인공지능 [[챗봇]]이다. 330억 개의 매개변수를 활용하지만 700억 개의 매개변수를 가진 [[메타]]의 [[라마|라마2]](LLaMA 2)와 유사한 성능을 낸다. 오직 [[X]](구 [[트위터]]) 계정으로만 가입이 가능하며, 베타 서비스 기간을 거친 뒤 X의 유료 서비스인 '프리미엄 플러스(+)' 가입자(월 16달러)에 한해 공식 출시었다. 2024년 3월에는 전체 프리미엄 사용자(월 8달러 이상)로 배포 범위를 확대했다. 그록은 [[미국]]의 공상과학 작가 로버트 하인라인이 1961년 출간한 SF 소설 《낯선 땅의 이방인》에 나오는 화성인 용어로, '무언가를 직관적으로 철저히 이해한다'는 뜻을 담고 있다. 엑스AI의 창립자인 [[일론 머스크]]는 2015년 [[챗GPT]] 개발사인 [[오픈AI]]를 [[샘 알트먼]]과 공동으로 설립했지만, AI 개발에 대한 의견 차이로 3년 뒤인 2018년 회사를 떠났었다. 그리고 2023년 7월에 '우주의 진실을 추구하는 AI'를 만들겠다며 xAI를 공식 출범시켰다.<ref> 〈[https://terms.naver.com/entry.naver?docId=6711774&cid=43667&categoryId=43667 그록]〉, 《시사상식사전》 </ref> 2024년 3월에는 GPT-4 수준에 근접한 그록-1.5를 발표했다. 그록-1.5는 코딩과 수학을 포함한 모든 주요 벤치마크에서 이전 모델보다 상당 수준 향상되었다.<ref name="타임스"></ref>  
 
그록은 [[엑스AI]]가 개발한 LLM 그록-1을 기반으로 개발한 인공지능 [[챗봇]]이다. 330억 개의 매개변수를 활용하지만 700억 개의 매개변수를 가진 [[메타]]의 [[라마|라마2]](LLaMA 2)와 유사한 성능을 낸다. 오직 [[X]](구 [[트위터]]) 계정으로만 가입이 가능하며, 베타 서비스 기간을 거친 뒤 X의 유료 서비스인 '프리미엄 플러스(+)' 가입자(월 16달러)에 한해 공식 출시었다. 2024년 3월에는 전체 프리미엄 사용자(월 8달러 이상)로 배포 범위를 확대했다. 그록은 [[미국]]의 공상과학 작가 로버트 하인라인이 1961년 출간한 SF 소설 《낯선 땅의 이방인》에 나오는 화성인 용어로, '무언가를 직관적으로 철저히 이해한다'는 뜻을 담고 있다. 엑스AI의 창립자인 [[일론 머스크]]는 2015년 [[챗GPT]] 개발사인 [[오픈AI]]를 [[샘 알트먼]]과 공동으로 설립했지만, AI 개발에 대한 의견 차이로 3년 뒤인 2018년 회사를 떠났었다. 그리고 2023년 7월에 '우주의 진실을 추구하는 AI'를 만들겠다며 xAI를 공식 출범시켰다.<ref> 〈[https://terms.naver.com/entry.naver?docId=6711774&cid=43667&categoryId=43667 그록]〉, 《시사상식사전》 </ref> 2024년 3월에는 GPT-4 수준에 근접한 그록-1.5를 발표했다. 그록-1.5는 코딩과 수학을 포함한 모든 주요 벤치마크에서 이전 모델보다 상당 수준 향상되었다.<ref name="타임스"></ref>  
 +
 +
== 모델 ==
 +
===그록-2===
 +
그록-2(Grok-2)는 2024년 8월 14일 공개된 대형 멀티모달 모델(LMM)이다. 이 모델은 특히 채팅, 코딩, 추론, 비전 기반 애플리케이션 등 다양한 작업에서 탁월한 성능을 발휘한다. 그록-2는 최신 인공지능 모델들과 비교했을 때도 뛰어난 성능을 자랑하며, 벤치마크 테스트에서 [[오픈AI]]의 GPT-4o, 앤트로픽의 [[클로드]] 3.5 소네트, 구글의 [[제미나이]] 프로 1.5 등 주요 모델을 능가하는 성능을 보여주었다고 평가된다. 그록-2는 대학원 수준의 과학 지식(GPQA), 일반 지식(MMLU, MMLU-Pro) 그리고 수학 경쟁 문제(MATH)와 같은 분야에서 다른 프런티어 모델들과 경쟁할 수 있을 정도로 높은 성능을 기록했다. 특히 수학적 추론 능력에서는 MathVista 벤치마크에서 탁월한 성능을 보였으며, 문서 기반 질문 답변(DocVQA) 작업에서도 매우 우수한 성과를 나타냈다. 이 모델은 시각적 정보를 기반으로 한 작업에서도 높은 평가를 받았다. 그록-2는 또한 인간 선호도를 평가하는 LMSYS 챗봇 아레나에서 "sus-column-r"이라는 이름으로 GPT-4o 및 제미나이 최신 버전의 뒤를 이은 것으로 보고되었다. 이러한 성과는 그록-2가 최첨단 대형 언어 모델(LM)로 자리잡았음을 보여준다. 그록-2는 성능뿐만 아니라 효율성도 중시하는 두 가지 버전으로 제공된다. 그록-2 미니(Grok-2 Mini)는 기본 모델보다 작고 빠른 버전으로, 간단한 텍스트 기반 작업에 최적화되어 있다. 반면, 기본 그록-2는 광범위한 작업을 처리하는 데 탁월한 성능을 발휘한다. 이 모델들은 현재 베타 버전으로 X(트위터)를 통해 제공되고 있으며, 월 $7의 X 프리미엄 구독자만 사용할 수 있다.
 +
 +
그록-2의 가장 주목할 만한 특징 중 하나는 이미지 생성 기능의 추가이다. 이 기능은 인공지능 모델 플럭스.1(FLUX.1)을 통합한 결과로, 독일 스타트업 블랙 포레스트 랩스와의 협력으로 이루어졌다. 블랙 포레스트 랩스는 스태빌리티 AI 출신 연구원들이 설립한 회사로, 이들은 트랜스포머와 확산(Diffusion) 기술을 결합한 하이브리드 아키텍처를 개발해 주목받고 있다. 플럭스.1은 이미지 생성 기능에서 매우 높은 품질을 자랑하며, 최근 AI 및 AI 아트 커뮤니티에서 화제를 모은 바 있다. 트랜스포머와 확산 기반 기술을 결합한 이 모델은 다양한 이미지 스타일과 효과를 제공하며, 그록-2에 이미지 생성 기능을 더한 것은 이 모델의 활용성을 더욱 확장하는 데 기여했다.<ref> 임대준 기자, 〈[https://www.aitimes.com/news/articleView.html?idxno=162533 xAI, 이미지 생성 통합한 '그록-2' 출시..."세계 최고 성능 입증"]〉, 《AI타임스》, 2024-08-15 </ref>
  
 
== 성능 ==
 
== 성능 ==
31번째 줄: 37번째 줄:
 
* 이윤순 기자, 〈[https://www.apple-economy.com/news/articleView.html?idxno=73425 머스크, “‘그록’ 업그레이드 위한 ‘슈퍼컴퓨터’ 개발”]〉, 《애플경제》, 2024-05-26
 
* 이윤순 기자, 〈[https://www.apple-economy.com/news/articleView.html?idxno=73425 머스크, “‘그록’ 업그레이드 위한 ‘슈퍼컴퓨터’ 개발”]〉, 《애플경제》, 2024-05-26
 
* 김현철 기자, 〈[https://www.g-enews.com/ko-kr/news/article/news_all/2024072812114410919a1f309431_1/article.html <nowiki>[초점]</nowiki> X, xAI ‘그록’ 학습에 X 사용자 정보 '무단 사용' 논란]〉, 《글로벌이코노믹》, 2024-07-28
 
* 김현철 기자, 〈[https://www.g-enews.com/ko-kr/news/article/news_all/2024072812114410919a1f309431_1/article.html <nowiki>[초점]</nowiki> X, xAI ‘그록’ 학습에 X 사용자 정보 '무단 사용' 논란]〉, 《글로벌이코노믹》, 2024-07-28
 +
* 임대준 기자, 〈[https://www.aitimes.com/news/articleView.html?idxno=162533 xAI, 이미지 생성 통합한 '그록-2' 출시..."세계 최고 성능 입증"]〉, 《AI타임스》, 2024-08-15
  
 
== 같이 보기 ==
 
== 같이 보기 ==

2024년 9월 24일 (화) 17:54 기준 최신판

그록(Grok)
그록(Grok)

그록(Grok)은 2023년 11월 4일 공개된 일론 머스크(Elon Musk)의 인공지능(AI) 업체 엑스AI(xAI)가 개발한 첫 생성형 인공지능 챗봇이다. LLM(대형 언어 모델)을 기반으로 하며, 오픈AI에서 개발한 챗GPT의 급격한 성장에 대응하기 위해 개발되었다.

개요[편집]

그록은 엑스AI가 개발한 LLM 그록-1을 기반으로 개발한 인공지능 챗봇이다. 330억 개의 매개변수를 활용하지만 700억 개의 매개변수를 가진 메타라마2(LLaMA 2)와 유사한 성능을 낸다. 오직 X(구 트위터) 계정으로만 가입이 가능하며, 베타 서비스 기간을 거친 뒤 X의 유료 서비스인 '프리미엄 플러스(+)' 가입자(월 16달러)에 한해 공식 출시었다. 2024년 3월에는 전체 프리미엄 사용자(월 8달러 이상)로 배포 범위를 확대했다. 그록은 미국의 공상과학 작가 로버트 하인라인이 1961년 출간한 SF 소설 《낯선 땅의 이방인》에 나오는 화성인 용어로, '무언가를 직관적으로 철저히 이해한다'는 뜻을 담고 있다. 엑스AI의 창립자인 일론 머스크는 2015년 챗GPT 개발사인 오픈AI샘 알트먼과 공동으로 설립했지만, AI 개발에 대한 의견 차이로 3년 뒤인 2018년 회사를 떠났었다. 그리고 2023년 7월에 '우주의 진실을 추구하는 AI'를 만들겠다며 xAI를 공식 출범시켰다.[1] 2024년 3월에는 GPT-4 수준에 근접한 그록-1.5를 발표했다. 그록-1.5는 코딩과 수학을 포함한 모든 주요 벤치마크에서 이전 모델보다 상당 수준 향상되었다.[2]

모델[편집]

그록-2[편집]

그록-2(Grok-2)는 2024년 8월 14일 공개된 대형 멀티모달 모델(LMM)이다. 이 모델은 특히 채팅, 코딩, 추론, 비전 기반 애플리케이션 등 다양한 작업에서 탁월한 성능을 발휘한다. 그록-2는 최신 인공지능 모델들과 비교했을 때도 뛰어난 성능을 자랑하며, 벤치마크 테스트에서 오픈AI의 GPT-4o, 앤트로픽의 클로드 3.5 소네트, 구글의 제미나이 프로 1.5 등 주요 모델을 능가하는 성능을 보여주었다고 평가된다. 그록-2는 대학원 수준의 과학 지식(GPQA), 일반 지식(MMLU, MMLU-Pro) 그리고 수학 경쟁 문제(MATH)와 같은 분야에서 다른 프런티어 모델들과 경쟁할 수 있을 정도로 높은 성능을 기록했다. 특히 수학적 추론 능력에서는 MathVista 벤치마크에서 탁월한 성능을 보였으며, 문서 기반 질문 답변(DocVQA) 작업에서도 매우 우수한 성과를 나타냈다. 이 모델은 시각적 정보를 기반으로 한 작업에서도 높은 평가를 받았다. 그록-2는 또한 인간 선호도를 평가하는 LMSYS 챗봇 아레나에서 "sus-column-r"이라는 이름으로 GPT-4o 및 제미나이 최신 버전의 뒤를 이은 것으로 보고되었다. 이러한 성과는 그록-2가 최첨단 대형 언어 모델(LM)로 자리잡았음을 보여준다. 그록-2는 성능뿐만 아니라 효율성도 중시하는 두 가지 버전으로 제공된다. 그록-2 미니(Grok-2 Mini)는 기본 모델보다 작고 빠른 버전으로, 간단한 텍스트 기반 작업에 최적화되어 있다. 반면, 기본 그록-2는 광범위한 작업을 처리하는 데 탁월한 성능을 발휘한다. 이 모델들은 현재 베타 버전으로 X(트위터)를 통해 제공되고 있으며, 월 $7의 X 프리미엄 구독자만 사용할 수 있다.

그록-2의 가장 주목할 만한 특징 중 하나는 이미지 생성 기능의 추가이다. 이 기능은 인공지능 모델 플럭스.1(FLUX.1)을 통합한 결과로, 독일 스타트업 블랙 포레스트 랩스와의 협력으로 이루어졌다. 블랙 포레스트 랩스는 스태빌리티 AI 출신 연구원들이 설립한 회사로, 이들은 트랜스포머와 확산(Diffusion) 기술을 결합한 하이브리드 아키텍처를 개발해 주목받고 있다. 플럭스.1은 이미지 생성 기능에서 매우 높은 품질을 자랑하며, 최근 AI 및 AI 아트 커뮤니티에서 화제를 모은 바 있다. 트랜스포머와 확산 기반 기술을 결합한 이 모델은 다양한 이미지 스타일과 효과를 제공하며, 그록-2에 이미지 생성 기능을 더한 것은 이 모델의 활용성을 더욱 확장하는 데 기여했다.[3]

성능[편집]

그록-1.5는 초등학교부터 고등학교까지 수학 문제를 테스트하는 매스(MATH) 및 GSM8K 벤치마크에서 각각 50.6%, 90%의 성능을 보인다. 또 코드 생성 및 문제 해결 능력을 평가하는 휴먼이밸(HumanEval) 벤치마크에서는 74.1%를 기록했다. 언어 이해 능력을 평가하는 MMLU 벤치마크에서 새 모델은 81.3%를 기록, 그록-1의 73%를 크게 앞질렀다. 또 최대 12만 8,000개의 토큰의 컨텍스트 창을 제공, 이전 모델보다 16배 많은 양의 정보를 한 번에 받아들이고 처리할 수 있다. 이를 통해 제미나이 1.5 프로나 GPT-4. 클로드 3 및 주요 오픈소스 모델의 성능에 근접한 성능을 냄을 알 수 있다. 예를 들어 MMLU에서 그록-1.5는 81.3%로, 미스트랄 '라지'를 능가하지만 제미나이 1.5 프로(83.7%)와 GPT-4(86.4%), 클로드 3 오퍼스(86.8%)에 뒤처진다. GSM8K에서도 비슷한 양상으로, 4위를 차지했다. 그록-1.5가 우위에 있는 것으로 보이는 유일한 벤치마크는 코드 생성 능력으로, 클로드 3를 제외한 모든 모델보다 성능이 뛰어났다. 브라이언 로밀리 기술 컨설턴트는 "현 추세대로라면 그록-2는 거의 모든 지표에서 GPT-4를 능가, 가장 강력한 LLM 중 하나가 될 것"이라고 말했다.[2]

특징[편집]

그록은 우측 상단에 '펀 모드(Fun Mode)'와 '일반 모드(Regular Mode)'를 선택할 수 있는 옵션이 있다. 펀 모드에서는 그록이 익살스러운 말투로 답변하며, 풍자적인 유머를 사용할 수 있다. 예를 들어, 그록이 코카인 제조 방법을 설명하면서 "제조 시 폭발하거나 체포되지 않기를 바란다"며 "농담입니다"라고 덧붙인 사례가 있다. 그록은 실제로 코카인을 제조하지 말 것을 강조하며 불법적이고 위험하다고 경고한다.

그록의 주요 강점 중 하나는 X 플랫폼 중심의 빠른 정보 제공 능력이다. 많은 사용자가 실시간 대화를 통해 정보를 교환하는 X 플랫폼을 활용함으로써, 거의 모든 질문에 신속하게 답변할 수 있다. 또한 그록은 여러 대화를 동시에 진행하거나 전환할 수 있어 멀티태스킹이 가능하다. 응답 속도는 화면 새로고침 정도로 빠르며, X 콘텐츠에 맞춘 라이브 검색 기능도 갖추고 있다. 최대 2만 5,000자의 텍스트 입력을 지원하며, 테슬라 컴퓨팅 파워를 활용하여 작동된다. 향후 API, 이미지 인식, 오디오 인식 기능도 계획 중이다.

그록은 기존 GPT의 단점을 개선했다고 홍보하고 있으나, X의 실시간 데이터를 학습함에 따라 데이터 편향성이나 신뢰성 문제가 발생할 수 있다는 우려가 있다. 트위터, X뿐만 아니라 페이스북, 유튜브 등의 플랫폼에서 가짜뉴스 문제가 대두되고 있는 상황에서, 그록이 이러한 악성 정보나 가짜뉴스를 어떻게 차단할 것인지가 주목되고 있다. 그록은 자체 검열 시스템을 통해 이러한 문제를 해결하려 하고 있지만, 완벽한 해결책은 아직 논의 중이다.[4]

논란[편집]

그록은 X 사용자 데이터의 무단 사용 논란에 휩싸였다. 일부 사용자가 자신의 데이터가 그록의 학습에 활용되도록 기본적으로 설정되어 있음을 발견하고 이를 폭로한 것이다. 유로뉴스는 그록의 학습에 사용자의 정보가 활용되는 것을 원하지 않는 경우, 데이터 설정에서 이를 거부할 수 있지만, 이 기능이 데스크톱에서만 가능하며, 대부분의 사용자가 스마트폰 앱을 통해 X에 접속하는 현실을 감안하면 사용자 동의 없이 정보를 사용하고 있다고 지적했다. X 사용자들이 대부분 스마트폰 앱을 통해 X에 접속하는 현실을 감안하면, X가 그록 학습용으로 X 사용자의 정보를 사실상 무단사용하고 있다는 뜻이다. 이 문제는 유럽연합(EU) 관계 당국의 주목을 받고 있으며, X가 사용자 동의 없이 데이터를 공유한 것에 대해 영국과 아일랜드의 관계 당국이 X 측의 해명을 요구하고 내사에 착수했다는 보도가 있었다. 영국의 정보보호위원회(ICO)는 소셜미디어 사용자 데이터를 활용하는 과정은 투명해야 하며, X가 이와 관련해 적절한 조치를 취하지 않은 것으로 보인다며 조사에 착수했다고 밝혔다. 이러한 논란은 X가 EU로부터 제재를 받을 가능성을 시사하고 있다.[5]

전망[편집]

그록의 차기 버전을 운영하기 위해 엑스AI는 2024년 5월에 슈퍼컴퓨터 구축을 계획한다고 발표했다. 일론 머스크는 이 슈퍼컴퓨터를 2025년 가을까지 가동하고 싶다는 의사를 투자자들에게 전했다. 엑스AI의 슈퍼컴퓨터 구축은 그록의 차기 버전을 준비하기 위한 중요한 단계 중 하나로 추진되고 있다. 머스크는 그록2를 훈련하기 위해 약 2만 개의 엔비디아 H100 그래픽 처리 장치(GPU)가 필요하며, 그록3에서는 이 수가 10만 개 이상으로 증가할 것으로 예상했다. 그는 이 GPU 클러스터가 현재 존재하는 가장 큰 클러스터보다 최소 4배 이상 클 것이라고 강조했다.[6]

각주[편집]

  1. 그록〉, 《시사상식사전》
  2. 2.0 2.1 임대준 기자, 〈머스크, GPT-4 성능 근접한 '그록-1.5' 출시..."2.0에서는 모든 모델 넘을 것"〉, 《AI타임스》, 2024-03-30
  3. 임대준 기자, 〈xAI, 이미지 생성 통합한 '그록-2' 출시..."세계 최고 성능 입증"〉, 《AI타임스》, 2024-08-15
  4. 구아현 기자, 〈유머러스한 ‘그록’ 챗GPT와 무엇이 다를까?〉, 《THE AI》, 2023-11-06
  5. 김현철 기자, 〈[초점] X, xAI ‘그록’ 학습에 X 사용자 정보 '무단 사용' 논란〉, 《글로벌이코노믹》, 2024-07-28
  6. 이윤순 기자, 〈머스크, “‘그록’ 업그레이드 위한 ‘슈퍼컴퓨터’ 개발”〉, 《애플경제》, 2024-05-26

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 그록 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.