고니 (인공지능)
고니(KONI, KISTI Open Natural Intelligence)는 2023년 12월 한국과학기술정보연구원(KISTI)이 개발한 대형언어모델(LLM)이다. 과학기술 데이터에 특화되고, 출연연이나 공공기관에서 활용이 쉬운 모델이다.
[아사달] 스마트 호스팅 |
종류[편집]
고니 13b[편집]
고니 13b는 2023년 12월 한국과학기술정보연구원이 개발한 과학기술 분야에 특화된 대형언어모델이다. 기존의 범용 AI 모델과 달리, 과학기술 데이터에 최적화되어 있으며, 연구기관과 공공기관에서 활용하기 쉽게 설계되었다. 특히 보안과 민감 정보 보호가 중요한 출연연구기관 및 공공기관, 그리고 비용 문제로 인해 LLM 도입을 주저하던 중소기업을 주요 대상으로 하고 있다.
KISTI는 고니를 개발하면서 기존 LLM의 문제점 중 하나인 환각 현상(LLM이 사실과 다른 정보를 생성하는 문제)을 최소화하는 데 주력했다. 이를 위해 검색 증강 생성(RAG, Retrieval-Augmented Generation) 기술을 적용하여, 기존 정보 서비스 시스템이 보유한 데이터를 검색해 활용하도록 설계했다. 이를 통해 모델의 신뢰도를 높이고, 정확한 정보를 제공하는 데 중점을 두었다. 또한, PEFT(Parameter-Efficient Fine-Tuning) 기법을 도입하여 파인튜닝 시 필요한 컴퓨팅 비용을 줄이는 한편, 다양한 과학기술 및 산업 분야에서의 활용도를 극대화할 수 있도록 어댑터 형식의 맞춤형 튜닝을 지원한다.
고니의 보급을 통해, 기존에 보안이나 비용 문제로 인해 LLM 도입을 망설였던 연구기관과 중소기업도 보다 쉽게 AI 기술을 활용할 수 있을 것으로 기대된다. 현재 130억 개의 매개변수를 가진 모델을 기반으로 운영되고 있으며, 향후 모델 크기를 확장하고 학습 데이터를 추가 확보하여 지속적으로 성능을 개선할 계획이다.[1][2]
고니-라마3-8B[편집]
2024년 7월, 한국과학기술정보연구원은 기존 고니 모델을 업그레이드한 두 가지 새로운 버전을 공개했다. 이는 ‘고니-라마3-8B’와 ‘고니-라마3-8B-인스트럭트’ 모델로, 각각 사전학습 LLM과 대화형 LLM으로 특화된 버전이다.
이들 모델은 기존보다 2배 이상 많은 과학기술 정보를 포함하는 한국어+영어 200GB 규모의 데이터를 활용해 학습되었으며, 특히 80억 개의 파라미터를 갖추고 있어 보다 정교한 추론과 응답을 제공할 수 있도록 설계되었다. 이경하 초거대AI연구단장은 "고니가 한국어 LLM의 사고력을 측정하는 로직코(LogicKor) 벤치마크에서 동일 크기의 LLM 중 1위를 차지했다"고 밝혔다. 특히, 고니는 700억 개 이하 LLM 모델 중 최초로 로직코 점수 8.21을 기록하며 새로운 성과를 거두었다. 기존에는 700억 개 이하 LLM 모델이 8.0점을 넘긴 사례가 없었기 때문에, 이는 고니가 한국어 기반 LLM 기술에서 중요한 진전을 이루었음을 의미한다.
이번 업그레이드 과정에서 KISTI 연구팀은 고니와 RAG 기술을 연계하여 신뢰성을 더욱 강화한 질의응답 시스템을 개발했다. 과학기술 관련 법령, 규정, 지침을 중심으로 내부 검증을 거쳤으며, 연구자들의 피드백을 수집해 모델을 지속적으로 개선했다. 이를 통해 기존 LLM의 문제점인 부정확한 정보 제공을 최소화하고, 신뢰성 높은 답변을 생성할 수 있도록 했다.[3][4]
전망[편집]
KISTI는 고니 모델을 기반으로 국방, 전력, 정책 등 다양한 공공기관의 수요를 반영한 도메인 특화 LLM을 개발하고, 이를 보급할 계획이다. 또한, 연구자들의 과학적 발견을 지원하는 ‘고니 기반 자율 연구자 AI’(Agent 시스템) 구축을 추진하고 있다. 이를 통해 연구자들이 보다 효율적으로 연구를 수행할 수 있도록 지원하며, 궁극적으로 국가 과학기술 경쟁력을 강화하는 것이 목표이다.[5]
고니는 단순한 AI 모델이 아니라, 연구자와 기업이 실질적으로 활용할 수 있는 신뢰성 높은 과학기술 특화 AI로 자리 잡아 가고 있다. 앞으로의 발전이 기대되는 분야이며, 지속적인 개선과 확장을 통해 한국 과학기술 연구 환경에서 중요한 역할을 할 것으로 보인다.
각주[편집]
- 이동 ↑ 임대준 기자, 〈KISTI, 과학 데이터 특화 LLM '고니 13b' 개발〉, 《AI타임스》, 2023-12-30
- 이동 ↑ 황치규 기자, 〈KISTI, 과학기술데이터 특화 LLM '고니' 개발...공공기관·출연연 보급〉, 《디지털투데이》, 2023-12-20
- 이동 ↑ 정민호 기자, 〈과학LLM '고니' 더 똑똑해졌다...27년 'AI공학박사' 목표 '잰걸음'〉, 《데일리뉴스》, 2024-07-31
- 이동 ↑ 박희범 기자, 〈생성형 언어모델 '고니' 새 버전 공개…로직코 '이정표' 세워〉, 《지디넷코리아》, 2024-07-31
- 이동 ↑ 이준기 기자, 〈KISTI, 과학기술 특화 LLM `고니` 새 버전 공개〉, 《디지털타임스》, 2024-07-31
참고자료[편집]
- 임대준 기자, 〈KISTI, 과학 데이터 특화 LLM '고니 13b' 개발〉, 《AI타임스》, 2023-12-30
- 황치규 기자, 〈KISTI, 과학기술데이터 특화 LLM '고니' 개발...공공기관·출연연 보급〉, 《디지털투데이》, 2023-12-20
- 정민호 기자, 〈과학LLM '고니' 더 똑똑해졌다...27년 'AI공학박사' 목표 '잰걸음'〉, 《데일리뉴스》, 2024-07-31
- 박희범 기자, 〈생성형 언어모델 '고니' 새 버전 공개…로직코 '이정표' 세워〉, 《지디넷코리아》, 2024-07-31
- 이준기 기자, 〈KISTI, 과학기술 특화 LLM `고니` 새 버전 공개〉, 《디지털타임스》, 2024-07-31
같이 보기[편집]
이 고니 (인공지능) 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.