"㈜솔트룩스"의 두 판 사이의 차이
잔글 (→같이 보기) |
|||
(사용자 2명의 중간 판 2개는 보이지 않습니다) | |||
482번째 줄: | 482번째 줄: | ||
* '''주요 기능''' : 한국어, 영어, 일어, 중국어를 포함한 다국어 텍스트에 대한 형태소분석, 구문분석, 개체명 인식, 이벤트 추출, 감성 분석, 평판 트랜드 분석, 이슈 분석 등이 있다. | * '''주요 기능''' : 한국어, 영어, 일어, 중국어를 포함한 다국어 텍스트에 대한 형태소분석, 구문분석, 개체명 인식, 이벤트 추출, 감성 분석, 평판 트랜드 분석, 이슈 분석 등이 있다. | ||
− | * '''주요 고객''' : 현대자동차, | + | * '''주요 고객''' : 현대자동차, 엘지전자㈜, 삼성전자㈜, 특허청, 한화그룹, 국방부, 한국정보화진흥원 외 |
* '''고객 문제''' : 비정형 텍스트로 구성된 조직 내외부의 방대한 문서, 게시물, 트위터 등으로부터 잠재 문제와 대중의 의견을 적시에 이해하기가 어려우며 분석에 큰 비용이 요구된다. | * '''고객 문제''' : 비정형 텍스트로 구성된 조직 내외부의 방대한 문서, 게시물, 트위터 등으로부터 잠재 문제와 대중의 의견을 적시에 이해하기가 어려우며 분석에 큰 비용이 요구된다. | ||
* '''도입 효과''' : 대규모, 실시간 텍스트로부터 다양한 언어 분석, 감성 분석, 연관 주제 분석 등을 수행하고 제품, 기업 정책에 대한 대중의 불만과 인식을 이해하고 선제 대응이 가능하다. | * '''도입 효과''' : 대규모, 실시간 텍스트로부터 다양한 언어 분석, 감성 분석, 연관 주제 분석 등을 수행하고 제품, 기업 정책에 대한 대중의 불만과 인식을 이해하고 선제 대응이 가능하다. | ||
558번째 줄: | 558번째 줄: | ||
* [[인공지능]] | * [[인공지능]] | ||
− | + | {{인공지능 기업|검토 필요}} | |
− | {{인공지능 |
2024년 8월 25일 (일) 15:28 기준 최신판
㈜솔트룩스(Saltlux)는 한국의 인공지능, 데이터 과학 분야의 대표 기업이다. 주로 인간언어처리에 기반한 검색 및 정보마이닝, 시맨틱 웹 및 온톨로지 솔루션 개발, 언어와 문서 관련 테크니컬 라이팅 및 다국어 서비스를 제공하는 사업을 진행하고 있다. 2003년 모비코인터내셔널㈜과 ㈜시스메타의 합병으로 만들어진 회사로, 모비코인터내셔널㈜는 명은 소금(Salt)와 빛(Lux)의 합성어로, 새로운 지식기반의 세상에서 필요한 빛과 소금의 역할을 담당하겠다는 기업 철학을 담았다. 대표이사는 이경일이다.
개요[편집]
㈜솔트룩스는 기계학습과 자연어처리 스타트업으로 2000년에 창업된 ㈜시스메타에 그 뿌리를 두고 있으며, 창업이래 인공지능과 빅데이터 기술의 한 우물을 파온 국내 대표적인 4차 산업혁명 원천기술 기업이다. 창업 초기부터 원천기술 확보에 집중해 왔으며 2006년 ㈜솔트룩스로 기업명을 변경하고 인공지능 기술개발과 신시장 창출에 더욱 박차를 가해 왔다. ㈜솔트룩스는 알고리즘 중심의 인공지능과 빅데이터 기술개발뿐만 아니라 인공지능 사업의 글로벌 경쟁력 확보를 위해 150억건 이상의 대규모 데이터를 축적, 자산화하고 끊임없는 혁신제품 출시와 해외 진출에 노력해 왔다. ㈜솔트룩스는 '세상 모든 사람들이 자유롭게 지식 소통하도록 돕겠다'는 기업 사명을 중심으로 사람과 사람뿐 아니라 사람과 기계, 기계와 기계가 상호 소통/협력 가능한 미래 원천기술을 개발하겠다는 일념으로 세 명의 공동창업자에 의해 설립이 되었다. 설립초기에는 컴퓨터가 사람의 글과 말을 이해하기 위한 기계학습 기술 개발에 집중을 하였으며, 2005년부터는 지식공학(Knowledge Engineering)과 지식그래프(Knowledge Graph) 및 추론 기술에 대한 연구, 2010년부터는 심층 질의응답과 대화처리, 2015년 이후는 딥러닝 기반의 지식학습, 음성인식/합성 등에 많은 투자를 진행해 왔다.
㈜솔트룩스는 일본, 미국 등 국내외의 파트너들과 함께 글로벌 시장의 확장에 정성을 들이고 있다.[1] 또한 국내 인공지능업체 중 가장 많은 기술특허를 보유한 기업으로, 총 121건의 기술 특허와 150억 개의 지식베이스, 2만 시간이 넘는 음성 데이터를 구축했다. 이를 통해 음성인식 엔진에 딥러닝을 적용하여 고객센터나 챗봇 고객 응대 서비스를 위한 플랫폼 공급사업을 제공하고 있다. 한편 ㈜솔트룩스는 2020년 5월, 인공지능 소프트웨어 기업 최초 기술성 평가 부문에서 A와 AA를 받아 코스닥 상장 심사에서 통과하여 2020년 7월 ㈜독보적인 인공지능 및 빅데이터 사업을 경쟁력으로 코스닥에 상장되었다. 심사 과정에서는 독보적인 인공지능과 빅데이터가 크게 작용되었으며, ㈜솔트룩스가 국내 인공지능 대표 기업으로써 경쟁력이 있다는 것을 증명했다. 최근에는 SaaS, AlaaS, 데이터 수집과 인지 분석 등 클라우드 기반 서비스에 투자하고 있다.[2]
연혁[편집]
이 글을 숨기려면 오른쪽 '접기' 버튼을 누르세요! |
---|
|
주요 인물[편집]
- 이경일 : 솔트룩스의 대표이사이다. 인하대학교 공과대학 전기재료공학과를 나와 엘지 중앙연구소의 선임연구원이 되었다. 2001년에는 자연어 처리업체인 ㈜시스메타를 설립했고, 2003년 모비코인터내셔날㈜과 합병한 후 사명을 ㈜솔트룩스로 바꾸었다. 2017년에는 대통령 직속 4차산업혁명위원회 위원으로 활동했고, 한국소프트웨어산업협회 지능정보산업협회 부회장과 인공지능산업협의회 회장으로 활동했다. ㈜솔트룩스의 1대 주주로서, 지분을 약 15.5% 보유하고 있다.
- 정문선 : 현대비엔지스틸㈜의 부사장이자 ㈜솔트룩스의 2대 주주이다. 현대자동차㈜ 정주영 사장의 넷째 아들인 정몽우 전 현대알루미늄 회장의 차남이다. ㈜솔트룩스 지분을 약 10.5% 보유하고 있다. 2020년 ㈜솔트룩스의 코스닥 상장이 발표된 뒤, 회사의 기업공개(IPO)가 이뤄진 다음 경영권 약화가 일어날 가능성을 막기 위해서 지분 10.5%를 계속 보유하고 있다.[3]
주요 사업[편집]
인공지능[편집]
㈜솔트룩스의 인공지능 스위트(AI Suite)는 인공지능 분야별 최고 성능의 기능과 서비스를 제공하고, 적용분야에 따라 커스터마이징을 통해 최적의 결과를 제공한다. 인공지능 스위트의 머신러닝 및 딥러닝 기술은 ㈜솔트룩스의 자연어 처리기술과 방대한 언어자원에 기반하여 개발되었다. 또한, 의미 분석을 위해 필수적인 핵심 자원인 지식그래프 기술을 사용하여 세계 최고의 한국어 이해 성능을 제공한다. 인공지능이 스스로 학습하게 하여 지식을 증강하고, 강력한 관리 도구를 통해 도메인 최적화에 대한 생산성 및 경제성을 보장한다. ㈜솔트룩스는 지난 20여 년간 연구개발 프로젝트에 투자해왔고, 그 프로젝트의 결과로 언어지능, 음성지능, 학습과 추론지능, 시각 지능 4개의 영역으로 나누어, 핵심기술의 결과물을 선보였다. 인공지능 스위트는 실시간 가상 상담 및 상담 지원 서비스는 물론, 금융, 통신 및 방송, 법률, 특허, 의료, 쇼핑, 여행, 공공 등 지식 기반 고객 응대가 즉각적으로 이루어져야 하는 모든 분야에서 폭넓게 활용될 수 있다. 또한, 적용 분야에 따라 각각의 커스터마이징 할 수 있도록 사전 및 데이터 구축, 모델 학습 등의 관리 기능이 함께 제공되고 있다. 각 인공지능 분야별 주요 기술들에 대한 엔진들은 10가지로 구분되며, 엔진마다 최고 성능의 기능과 서비스를 제공한다.
- 지식 그래프와 딥러닝이 결합한 앙상블 인공지능
- 강력한 언어 이해 기반 멀티 모달 인지 기술
- 자가학습 및 지식증강을 통한 지속적인 품질 향상
- 강력한 관리 도구를 통해 도메인 최적화에 대한 생산성 및 경제성 보장
- 대규모 레거시 데이터 및 시스템 연동 체계를 통한 확장성 확보
엔진[편집]
솔트룩스 인공지능 스위트는 다음과 같은 10가지 엔진과 기능을 제공한다.
- 자연어 이해 엔진(LEA ; Language Engineering & Analysis)
- 비정형 데이터 가공을 위해 형태소 분석, 개체명 인식, 구문 분석, 감성 분석 등의 텍스트 분석 기능을 처리하는 기계학습/심층학습 기반의 언어 분석 엔진이다. 그뿐만 아니라 자연어처리 결과를 바탕으로 문장에 숨겨진 의도를 이해하거나 질문의 유형을 파악하는 등의 한 단계 높은 수준의 분석 결과를 제공함으로써, 대화처리를 위한 의도 이해 및 분석, 심층 질의응답을 위한 질문 의미 이해 등이 가능하다. 자연어 이해 엔진은 인공지능 스위트에 포함된 다른 엔진들이 동작하는데 필요한 기본 엔진이다. 자연어 이해 엔진을 구성하고 있는 고정밀 언어분석기들은 기계학습과 심층학습(인공신경망) 기술이 적용되어 있으며, 대규모 언어자원(분야별 대용량 학습데이터, 사전과 규칙)을 통해 도메인별로 품질을 최적화할 수 있다. 형태소 분석기는 98% 이상의 분석 품질을 제공하고, 구문 분석과 개체명 추출기는 병렬/분산 처리를 통해 세계 최고 성능을 제공한다. 한국어뿐 아니라 영어, 일어 등 다국어의 대응이 가능하며, 지식 그래프와 연계하여 의미해석, 질의응답, 대화 시스템 구현이 가능한 자연어처리 엔진이다.
- 음성인식 엔진(Speech Recognition)
- 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말하며 STT(Speech-to-Text)라고도 한다. 음성인식 엔진은 음성 인터페이스를 기반으로 하는 다양한 서비스에 활용하기 위해 음성인식 서비스를 제공한다. 특히 인공지능 스위트의 음성인식 엔진은 방대한 데이터를 사전 학습하였으며, 특정 도메인에 빠르게 적용하기 위한 전이학습 방식을 활용하여 적은 양의 데이터 학습만으로도 양질의 음성인식 서비스를 제공할 수 있다. 음성인식 엔진은 레스트풀 기반의 음성인식 서비스와 음향 모델 및 언어 모델의 학습 관리 기능으로 나눌 수 있다. 음성인식 서비스는 입력되는 음성데이터의 전처리, 특성 추출, 모델을 통한 텍스트 변환, 결과 보정 단계로 음성인식 결과를 제공한다. 학습 관리는 음성-텍스트의 학습데이터로 음향 모델과 언어 모델에 대한 학습을 수행한다. 적응학습 기반의 음성인식 품질을 평가한 결과, 적응학습 이전의 베이스라인의 경우 음향 및 언어 모델 모두 70% 이하의 정답률이었는데, 적응학습을 거친 후 두 모델 모두 97% 이상까지 향상되었다. 이렇게 개발된 음성인식 기술은 다양한 환경에서의 챗봇과 콜센터의 음성인식과 텍스트분석, 콜봇 시스템 구축 등에 활용되고 있다.
- 음성합성 엔진(speech synthesis)
- 인위적으로 사람의 소리를 합성하여 만들어내는 것으로, 텍스트를 음성으로 변환한다는 데서 텍스트 음성변환(text-to-speech, TTS)이라고 한다. 인공지능 스위트의 음성합성 엔진은 사람의 목소리를 학습하여 주어진 문장에 대하여 학습한 목소리와 유사한 어조와 억양으로 사람의 음성을 인공적으로 만들어 주는 엔진이다. 특히, 이미 학습된 모델에 의한 목소리뿐만 아니라 특정 개인 목소리 또는 특정 도메인의 음성파일을 실시간으로 학습하여 사용자 각각의 특성이 반영된 목소리로 음성합성 모델을 생성할 수 있다. 음성합성 엔진은 이렇게 학습된 모델을 엔드포인트를 통해 개별 서비스로 제공하여, 다양한 인공지능 서비스에 활용할 수 있다. 음성합성 엔진의 기능은 크게 학습 관리와 서비스 관리 영역으로 나눌 수 있다. 학습 관리 영역은 특정 음성데이터를 학습하여 새로운 음성합성 모델의 생성하거나 관리한다. 서비스 관리 영역은 엔진을 통해 학습된 음성합성 모델을 서비스로 구성하여 타 서비스 애플리케이션에서 접근하고 사용할 수 있도록 배포 및 관리를 담당한다. ㈜솔트룩스는 음성합성 개인화 서비스 실현을 위해 전이 학습 기술을 이용한 화자 적응 방법을 사용하고 있다. 전이 학습이란 기존에 잘 훈련된 모델을 사용하여 유사한 문제를 가지는 새로운 모델을 학습하는 방법이다. 전이학습은 새로운 모델의 학습 효율을 높여 적은 데이터양으로도 이미 학습된 모델의 가중치 값들을 의미 있게 조정하므로 높은 성능을 달성할 수 있다. 또한 전이학습은 충분한 양의 데이터로 잘 학습된 A 모델에 기반하여 데이터가 부족한 B의 목소리를 효율적으로 학습하는 것이 가능하다. 전이학습 시 사전 학습된 A 모델과 추가 학습할 B 모델의 분포가 큰 차이를 보이는 경우 음성합성 성능이 크게 떨어지게 된다. ㈜솔트룩스는 이러한 데이터 부조화 따른 학습 성능 변이 문제를 해결하기 위해서 여러 사람의 음성으로 이루어진 수십 시간의 데이터를 사용하여 음성합성 네트워크의 일부만을 미리 학습 시켜 놓는 준 지도학습(Semi-Supervised Learning) 방법을 추가로 적용하고 있다. 준 지도학습은 전사 데이터 없이 음성학습을 수행하는 것으로, 인간이 글을 배우기 전에 말하는 법을 배우는 것과 같은 원리이다. 솔트룩스는 전이학습과 함께 준 지도학습 모델을 음성합성에 적용하므로 학습 시간을 현격히 줄이면서 동시에 음성합성 성능을 극대화할 수 있다. 현재 ㈜솔트룩스의 음성합성 엔진은 30분 분량의 음성데이터로 특정인의 목소리를 학습하고, 높은 품질로 발화하는 것이 가능하다.
- 톡봇대화 엔진
- 인공지능 스위트의 톡봇 대화 엔진은 솔트룩스에서 개발한 챗봇 플랫폼으로, 기존의 챗봇 시스템의 한계를 뛰어넘은 지식 기반의 심층 대화 시스템이다. 기존의 챗봇이 간단한 자연 언어처리와 규칙 및 문장 매칭 방식의 대화 매니저를 가지고 있다면, 톡봇 대화 엔진은 지식 그래프와 복합추론 기반의 자연어 이해 결과를 바탕으로 사용자 발화의 정확한 의미를 이해하고, 탁월한 답변을 제공하는 강력하고 유연한 대화 모델을 생성할 수 있도록 지원한다. 톡봇 대화 엔진을 통한 대화 서비스는 다음과 같다. 사용자는 다양한 채널을 통해 톡봇 대화 엔진에 메시지를 전달한다. 그렇다면 입력된 메시지는 자연어 이해 엔진을 통해 분석되고 대화 매니저는 학습된 대화 모델을 통해 답변을 생성하여 음성, 텍스트, 사용자 경험(UX) 등 적절한 방법으로 사용자에게 전달한다. 톡봇 대화 엔진은 대화 모델을 학습할 때 지식 그래프, 선호추천, 사용자모델 등을 반영하여 모델을 학습한다는 점에서 기존의 대화처리 시스템들과 다르다. 또한, 대화 모델로 처리하기 어려운 메시지에 대해서는 심층 질의응답을 통하여 문제를 해결하며, 서비스 사용자와 대화 도중 문제가 발생하면 서비스 매니저를 통해 관리자가 대화에 개입할 수 있는 기능을 제공한다. 톡봇 대화 엔진은 크게 대화 서비스를 담당하는 대화 서버와 대화 모델 학습 및 관리를 담당하는 API 서버로 구성된다. 다양한 서비스 채널을 통해 대화 서비스를 제공하고, 자연어이해 엔진, 심층질의응답 엔진과 연동하여 사용자 발화의 의도를 분석하거나 처리하지 못하는 질의에 대한 답변을 제공한다. 또한, 플러그인을 통한 외부서비스 연계로 대화 처리 시 필요한 데이터나 기능을 활용할 수 있다. 이러한 톡봇 대화 엔진의 기능들은 대화 관리도구를 통해 쉽게 운영 관리될 수 있다. 톡봇 대화 엔진은 코딩과 프로그래밍 기술 없이 마우스 클릭만으로 똑똑한 상담 봇을 만들거나 다양한 채널로 즉각적인 서비스를 시작할 수 있다.
- 심층 질의응답(QA) 엔진
- 인공지능 스위트의 심층 질의응답 엔진은 사용자의 질문에 대해 다양한 지식을 스스로 학습, 추론하여 축적한 지식으로부터 최적의 답을 찾아내어 답을 제시한다. 심층 질의응답 엔진은 지식베이스 기반 질의응답기술, 정보 검색 기반 질의응답기술, 기계 독해 기술을 이용한 질의응답기술, 상담 및 대화 이력 학습 기반 질의응답기술 등이 앙상블 되어 질의 유형에 따라 최적의 풀이 방식을 채택하여 사용자에게 응답을 제시한다. 심층 질의응답 엔진은 자연어 이해 엔진의 자연어 이해 결과를 기반으로 정답을 찾기 위한 다양한 QA 방법을 적용하며, 지식 그래프를 참조하여 자연어 이해 및 답변 탐색 등을 수행한다. 별도의 관리 도구를 제공하여 도메인에 따라 심층 질의응답을 위한 지식 구축, 관리, 서비스 모니터링 등을 수행할 수도 있다.
- 기계번역 엔진
- ㈜솔트룩스의 기존 통계기반 기계번역 엔진에서 더욱 발전된 인공신경망을 기반으로 한 기계번역 엔진이다. 기계번역 학습을 도메인에 따라 특화할 수 있도록 CAT 언어자원 관리 도구를 통합 구성하여 지속해서 번역의 품질과 생산성이 개선될 수 있도록 구성되어 있다.
- 기계 독해 엔진
- 질문에 대한 답을 찾기 위해 스스로 관련된 문서를 찾고 해당 문서로부터 답을 찾아 제시하는 엔진이다. 특히 인공지능 스위트의 기계 독해 엔진은 ㈜솔트룩스가 보유한 다양한 지식자원을 활용하여 질문의 답을 찾는다는 점에서 기존의 기계 독해 기술의 문서 입력에 대한 단점을 보완하였으며, 기계 독해 서비스 사용자에게 문서 입력 없이 질문에 대한 답을 구하는 오픈 질의응답 형태의 서비스를 제시한다. 또는 기계 독해 엔진을 통해 문서에서 원하는 정보를 추출하는 용도로 활용할 수도 있다.
- 복합추론 엔진
- 정형/비정형 문서로부터 추출된 지식을 지식 그래프 형태로 축적하고, 주어진 규칙이나 지식 간의 관계에 기반하여 새로운 사실을 탐색/추론함으로써 지식을 생성하는 엔진이다. 특히, 인공지능 스위트의 복합추론 엔진이 제공하는 논리 규칙 기반 연역 추론과 기계학습 기반 귀납 추론의 복합 적용으로 이미 구축된 지식으로부터 새로운 관계를 도출하고 지식으로 활용하는 등 지식 증강 및 검증을 가능하게 한다. 그리고 대규모 시맨틱 추론, 경험 규칙 기반추론, 시공간 추론 등 다양한 추론 기능을 통합 제공하고, 그뿐만 아니라 신룃값 기반 확률/불확실 추론, 부재 추론 등 관련 연구를 통해 지속해서 기능을 확장하고 있다. 또한, 지식베이스 엔진과 연계하고 실시간 분산 처리 환경을 적용하여 대용량의 데이터로부터 초고속으로 추론된 결과를 제시한다.
- 지식학습 엔진(KENT)
- 정형/비정형 데이터로부터 지식을 추출하고 지식 추출을 위한 모델을 학습 및 관리하는 엔진이다. 추출된 지식은 지식 그래프 화하여 질의응답, 대화처리 등 다양한 지식기반 인공지능 서비스에 활용될 수 있다. 지식 자동추출 엔진의 기능만으로도 상품설명서, 계약서 등으로부터 유용한 지식정보를 추출하는 것이 가능하다. 지식학습 엔진은 지식학습 기능을 통한 지식 추출을 담당하는 지식 자동추출 엔진 서버와 학습모델 관리, 작업 관리 등을 웹 상에서 운영할 수 있도록 하는 운영관리 서버로 구성되어 있다.
- 이미지인식 엔진
- 이미지에 포함된 객체들을 인식하고 인식된 결과를 바탕으로 이미지가 어떤 장면인지를 분류할 수 있는 엔진이다. 이미지인식 엔진은 향후 앞서 소개한 시각 기반 검색, 비디오 캡셔닝, 자율주행, 시각적 질의응답 등의 응용 분야에 적용하기 위한 기반 기능을 지원한다. ㈜솔트룩스는 현재의 이미지인식 엔진의 고도화를 통해 이미지를 단순 설명하는 수준을 넘어서 이미지 속 장면의 의미를 이해하는 수준까지 발전시킬 계획이다. 이미지인식 엔진은 카메라 등을 통해 들어온 이미지를 실시간으로 처리해 상황을 인식하고, 인식된 정보를 응용 애플리케이션에 제공하는 역할을 한다. 이를 위해 이미지에서 다양한 정보를 분석하는 시각 분석 모듈과 분석된 정보를 바탕으로 상황을 이해하기 위한 시각 이해 모듈로 구성될 수 있다.
구성 엔진 주요 기술 설 명 자연어 이해 엔진 고정밀 자연언어 이해기술 형태소 분석 기술, 개체명 인식 기술, 구문 분석 기술, 감성 분석 기술,
질의응답을 위한 자연어 이해 기술음성인식 엔진 적응학습 기반 음성인식 기술 Bi-directional LSTM 기반의 음향 모델 생성 기술 음성합성 엔진 전이학습 기반 음성합성 기술 엔드투엔드 딥러닝 기반 음성합성 기술, 전이 학습 및 준 지도 학습 기술 톡봇 대화엔진 실시간 대화 학습 및 처리 기술 지식 그래프 기반 자연어 이해 기술, 심층 질의응답 연계 기술,
모듈식 대화 모델 구성 기술기계 독해 엔진 적응학습 기반 음성인식 기술 어텐션 시각화 기술, 모델 앙상블 기술, BERT 기반의 기계 독해 기술 복합추론 엔진 전이학습 기반 음성합성 기술 대규모 논리 기반 연역 추론기술, 딥러닝 기반 귀납 추론기술,
앙상블 추론 기술지식학습 엔진 고정밀 자연언어 이해기술 형태소 분석 기술, 개체명 인식 기술,
구문 분석 기술, 감성 분석 기술, 질의응답을 위한 자연어 이해 기술음성인식 엔진 실시간 대화 학습 및 처리 기술 지식 그래프 기반 자연어 이해 기술, 기계 독해 기반 지식 추출 이미지인식 엔진 고정밀 심층 질의응답 기술 딥러닝 기반 이미지 분류 기술, 딥러닝 기반 이미지 내 객체 인식 기술 심층 QA 엔진 고정밀 심층 질의응답 기술 지식베이스 기반 질의응답 기술, 정보 검색 기반 질의응답 기술,
플러그인 질의응답 기술, 심층 학습기반 질의응답 기술,
기계 독해 기술 기반 질의응답 기술, 메모리 네트워크를 활용한 질의응답 기술
사례[편집]
- 농협: 인공지능 상담 시스템이 구축된 사례로, 인공지능 가상상담 '콜봇'서비스가 제공되었다. 상담사와 고객, 온라인과 오프라인 등 인공지능 상담 서비스가 필요한 모든 환경을 수용하여, 시스템 인프라를 구축했다. 인공지능이 먼저 고객과 응대를 하면, 고객의 전화는 전문 상담사와 연결이 된다. 모바일 앱을 통한 채팅 상담 서비스로 고객의 상담 내용에 해당하는 답변이나 서비스를 자동으로 제공한다. 또한 상담사와 고객의 상담 내용을 실시간으로 텍스트화하여 질문의 답변을 제공함으로써, 재빠른 고객 대응이 가능하도록 지원한다. 농협은행은 인공지능 상담 시스템뿐만이 아니라 지능형 지식관리 시스템도 적용되었는데, 자연어 콘텐츠를 시스템이 이해할 수 있는 상태로 자동변환해서 지식베이스에 저장해준다.
- 한전케이디엔㈜: 챗봇 서비스가 제공되었다. 이를 통해 고성능의 자연어의 처리와 대화모델링 등 기본적인 대화처리 엔진을 적용했다. 그리고 향후 다양한 지식에 대한 효율적인 질의응답 서비스를 제공할 수 있도록 지식 그래프 연계 등의 업무를 진행했다. 직원들의 편의를 위한 접근성 높은 메신저를 기반으로, 출장업무, 정보기술 장비대여, 업무담당자 연계 등 단순 지식을 넘어선 맞춤 서비스를 제공한다.
- KBS : 사용자의 특성과 상황에 맞추어 제공하는 콘텐츠 추천 기술의 필요성에 따라, 방송 콘텐츠 추천 검색 시스템이 구축되었다. 시스템은 크게 데이터 수집, 콘텐츠 검색, 콘텐츠 추천, API 서버 4개의 시스템으로 구성되어 있다. 사업은 콘텐츠 분석을 위해 필요한 방송 메타 데이터 관련 정보, 사용자 프로파일 정보 등을 수집 및 정리하고, 검색 인터페이스의 개발과 프로그램 관련 페이지, 추천작품 활용 서비스를 구현하는 일을 진행했다. 또한 수집된 콘텐츠 메타데이터를 분석하여 소비자의 패턴에 따른 추천 검색 결과를 제공했으며, 수집 관리, 색인 관리, 기획 관리, API 관리, 콘텐츠 관리 등 추천 시스템에 필요한 데이터나 서비스 기능을 구현했다.
- 지니뉴스 : 인공지능을 적용한 앱 서비스를 적용했다. 1,200여 개가 넘는 국내 뉴스 및 소셜 미디어를 인공지능 엔진이 실시간으로 분석하여, 약 30만 명이 넘는 사용자에게 맞춤 정보를 제공했다. 지니 뉴스의 인공지능 엔진은 하루 700만 건의 뉴스와 블로그를 읽어 500여 개의 카테고리로 분류했는데, 이 과정에서 새로운 이슈들을 감지하여 사용자에게 맞춤 서비스를 제공했다. ㈜솔트룩스는 딥러닝 기반 사용자에게 맞춤 콘텐츠를 제공하고, 사용자의 가독성을 높이는 UI/UX 등을 적용하여 사용자에게 편의를 제공했다.
주요 제품[편집]
- 아담
- 국내 최초로 상용화된 인공지능 플랫폼이다. 10년 넘게 개발된 ㈜솔트룩스의 핵심 기술로, 아시아 최대 규모의 지식 그래프를 내장하고 있다. 지식학습 및 추론을 통한 생활 질의응답의 경우, 94% 수준의 정확도로 일반상식 수준의 질의응답이 가능하다. 질의응답은 2,000만 가지 주제에 대해 응답할 수 있으며, 콜센터 상담은 물론, 가상비서, 의료 분석 등의 역할을 수행할 수 있다. 언어, 지식, 시각 인지 등 60여 개의 APIs를 제공하고 있고, 인공지능 발전을 위해 회사 측은 아담을 오픈 플랫폼으로 제공하고 있다. 아담은 국내외의 데이터를 1,200개의 CPU를 통해 처리한다.[4]또한 초당 2천 문장을 언어분석이 가능하며, 2020년 기준 지식베이스는 3천만 개의 주제와 80만 권의 분량의 지식을 습득했다. 이미지인지 성능은 단어는 92%, 문장은 85%에 달한다.[5]아담뿐만이 아니라 금융이나 법률 지식 같은 전문지식에 사용될 인공지능 '이브'도 곧 출시될 예정이라고 밝혔으나, 아직 서비스 제공 소식은 나오지 않았다. 이브는 약 5억 개의 전문지식이 들어있다.
- 엑소브레인
- 우리나라의 대표적인 인공지능 연구개발 프로젝트 중 하나이다. 2016년 장학퀴즈에서 인간을 이기고 알려졌으며, 인간의 몸 밖 인공두뇌를 뜻한다. 1세부, 2세부, 3세부로 나뉘며, 각각 한국전자통신연구원(ETRI), ㈜솔트룩스, 카이스트(KAIST)에서 맡았다. ㈜솔트룩스는 인간의 의사소통을 이해하고 전문가 수준까지 일상 대화가 가능한 인공지능 기술을 상용화했고, ㈜베이시스테크놀러지와 계약을 맺고 다국어 분야의 합동 연구를 진행하기로 했다.
- 에바
- 2018년에 발표한 개인 맞춤형 인공지능이다. 인공지능 아담 플랫폼 등 ㈜솔트룩스에서 개발해온 기술들을 종합하여 제작되었다. 에바의 외향은 1990년대 유행했던 다마고치와 흡사하다. 모바일 앱을 설치하여 사용하고, 인공지능은 캐릭터 형태로 앱의 화면에 보인다. 소유자에 맞춰 고유한 인공지능으로 변화하며, 친구, 셀럽, 코치, 전문가, 비즈니스 등 목적에 따라 사용자의 취향에 따라서 꾸밀 수 있다. 임베딩 기능을 지원하여 1시간 정도 목소리를 들려주면 학습한 목소리와 유사하게 낼 수도 있다.[6] 앱은 클로즈드 베타 테스트(CBT)를 진행한 후, 2020년부터 오픈 베타 서비스 형태로 출시할 계획이다. 에바의 글로벌 출시를 목표로 하고 있기 때문에, 영어와 한국어를 모두 지원할 예정이다.[7]
- 아담 플랫폼 등 ㈜솔트룩스에서 개발한 기술들을 종합하여 제작되었다. 사용자가 직접 키운 에바 인공지능을 이용하여 사용자 간의 거래와 경제활동도 가능하도록 하는 것이 목표이며, 이를 위해 블록체인과 암호화폐 기술이 개발과정에 도입되었다.
빅데이터[편집]
㈜솔트룩스의 빅데이터 스위트는 하둡 생태계의 통합연계 없이 전 산업군에서 빅데이터 분석을 지능적으로 수행할 수 있는 인공지능 기반 엔드투엔드 원스톱 실시간 빅데이터 분석 통합 플랫폼을 말한다. 국내 최초로 인공지능 기술과 빅데이터 기술이 융합되어 생산된 제품으로써 경쟁력이 있다. 2010년 전후로 데이터 사용량의 급증으로, 대규모 데이터를 처리하고 저장할 수 있는 새로운 기술의 필요성이 대두됐다. ㈜솔트룩스는 이에 맞추어 로드맵을 수립하고 자연 언어처리, 시맨틱 검색, 텍스트 채굴, 빅데이터 기반 기계학습, 심층학습과 지식 그래프 기반의 추론을 융합한 플랫폼을 만들어왔다. 플랫폼은 꾸준하고 체계적인 관리 프로세스와 검증을 통해서 제공되고 있으며, 국내외의 공공기관, 기업 등에 납품되고 있다. 자연 언어처리와 기계학습, 심층학습을 포함한 다양한 인공지능 기술과 능률 높은분산 병렬 빅데이터 처리기술을 결합하고, 실시간 데이터수집, 변환, 저장, 분석, 시각화, 운영관리까지 빅데이터 생명주기에 해당하는 기능을 제공한다. 사용자가 지능화된 빅데이터를 분석할 때, 다양한 지능형 분석 기능과 고품질의 분석 결과를 제공하며, 안정성과 가용성이 뛰어나다.
- 국내 최초 인공지능과 빅데이터 기술 융합
- 검증된 인 메모리 스트림 분석 내장
- 하둡 생태계의 통합 연계 지원
- 손쉬운 통합 운영관리 체계 제공
- 상용화된 엔진들의 강력한 기능성 내장
- 실시간 확장성과 안정성 보장
엔진[편집]
㈜솔트룩스의 빅데이터 스위트의 엔진은 다음과 같은 6가지 엔진으로 나뉜다.
- 수집 엔진 토네이도
- 웹 데이터와 뉴스, RSS, 트위터, 페이스북 등의 소셜 빅데이터수집이 가능한 대용량 빅데이터수집 엔진이다. 능동적인 방식과 수동적인 방식 둘 다 고려한 빅데이터수집 엔진으로, 방대한 딥웹과 SNS, 쇼핑 사이트, 사물인터넷, 스트리밍 데이터 등 다양한 산업군에서 생성되는 빅데이터에서 사용자가 원하는 빅데이터를 실시간 자동, 병렬 수집이 가능하다. 실시간 소셜 빅데이터 분석, 경쟁자 분석, 시장 및 제품 분석, 위험 관리 및 고객 목소리 분석을 위한 최적의 빅데이터수집 환경을 제공한다. 데이터의 유실과 중복 방지, 데이터 압축, 데이터 정형화, 저장된 데이터의 암호화, 무결성 검증, 사용자 편리성 등을 고려하여 더욱 강력한 웹 수집 기능뿐만 아니라 가려져 있는 웹 페이지로부터 빅데이터를 자동 추출하고 변환하여 저장한다. 토네이도는 지능형 융합 분석에 필요한 다양한 형태의 데이터 수집을 처리하기 위해 사용자 시나리오 기반 수집, RSS 기반 수집, 심층 웹 수집, 메타 검색 수집, 소셜미디어 수집, 오픈API 수집 기능을 제공한다. 사용자가 정의한 수집 업무를 수집 엔진 내부 시뮬레이터를 통해 수집이 의도한 대로 동작하는지 테스트해 수행할 수 있으며, 실제 운영 시 수집이 실행되는 동안 실시간으로 수집 결과를 모니터링할 수 있는 스케줄링 기능, 상태 모니터링 기능, 운영관리자 기능을 제공하고 있다.
- 시맨틱 검색 엔진
- 기계학습과 딥러닝에 기반을 둔 인공지능기반 검색 엔진으로, 단어와 문서의 의미를 기계가 스스로 이해할 수 있는 지능형 시맨틱 검색엔진이다. 특징학습이 가능한 기계학습 알고리즘을 적용하여 데이터 수집을 통해 특징을 학습함으로써 검색성능 향상과 사용자가 원하는 검색 결과를 제공한다. 또한 단어와 문서의 의미를 기계가 스스로 이해할 수 있는 시맨틱 검색 솔루션으로, 입력한 키워드의 의미까지 스스로 판단해 검색 가능한 딥 서치 기능을 내장하고 있다. ㈜솔트룩스는 빅데이터 저장소로 병렬/분산 저장이 가능한 빅데이터 저장소(GFS - GLORY-FS)를 사용하고 있다. 비용적인 측면에서의 효율성, 지속해서 증가하는 데이터의 수용, 빈번하게 발생하는 장애에 대한 대처, 관리의 편리성, 신속한 입출력 성능, 데이터 최적 배치, 효과적인 캐시 사용, 부하 집중에 대한 유연한 대처, 데이터에 대한 보안 등과 같이 대용량 분산 파일 시스템이 갖추어야 할 사항들이 집약되었다. 시맨틱 검색 엔진은 두 가지 주요 특징이 있다. 지능형 시맨틱 검색 엔진과 빅데이터 저장소이다. 지능형 시맨틱 검색 엔진은 기업 내에 분산된 많은 양의 데이터베이스뿐 아니라 외부 소셜 빅데이터, 센서 및 로그 데이터, DOC, PPT, XLS, HWP 등의 오피스 문서를 포함한 초대용량 빅데이터를 특징학습을 통하여 검색 효율성 극대화 및 탁월한 검색 품질 성능을 제공한다. 빅데이터 저장소는 수천에서 수만 대의 저비용 서버들을 이용하여 저장 공간 구축을 할 수 있는 분산 파일 시스템으로 장애에 대한 효율적인 통제 능력과 높은 입출력 처리 성능을 갖춘 대용량 데이터를 처리한다.
- 텍스트 채굴 엔진
- 텍스트마이닝 엔진은 방대한 데이터의 특성, 의미, 연관성을 파악하여 의미기반의 검색, 정보 재조직화, 다차원의 분석을 수행하는 지능형 비정형 빅데이터 분석 엔진이다. 이를 통해 높은 지식 활용과 고객관리, 위험관리, 연구개발 등의 올바른 의사결정을 할 수 있도록 다양한 비정형 데이터 분석 기능을 제공한다. 방대한 문서 및 정보에서 고품질의 정보 추출, 관계 추출, 자동 정보(문서) 분류, 자동 정보(문서) 군집, 자동 정보(문서) 요약 및 지능형 비정형 데이터 분석 기능 등으로 구성되어 있으며 지식정보의 검색, 분석 및 활용에 드는 시간을 획기적으로 단축한다. 엔진에는 고성능 구문 분석기와 자동정보 분류기, 평판 추출기, 정보 추출기, 형태소 분석기, 개체명 인식기, 자동 정보 군집기가 내장되어 있고, 강력한 텍스트 채굴 기능이 탑재되어 있다.
- 스트림 분석 엔진
- 실시간 스트림 빅데이터 분석 엔진 블루볼트 은 다양한 장비와 생산라인의 로그, 센서 데이터와 같은 실시간 머신 데이터뿐 아니라 다양한 소스의 비정형 데이터를 융합 분석할 수 있는 실시간 스트리밍 데이터 분석 엔진이다. 스트림 빅데이터의 실시간 인 메모리 분석과 복잡한 이벤트 처리를 통해 보안, 안보상의 이상 징후를 감지하거나 생산 라인의 문제 예측과 최적화 체계를 갖추는 것을 가능케 한다. 특히 강력한 분산 인 메모리 분석 기능은 대규모 서비스 시스템 운영/관리, 이상 거래탐지 및 컴플라이언스와 eDiscovery를 포함한 운영 인텔리전스구현을 위해 세계 최고의 성능을 제공하고 있다.
- 스트림 분석 엔진은 강력한 워크벤치와 실시간 데이터 추출 성능, 데이터 질의 처리를 통한 데이터 분석 성능, 실시간 중요 이벤트 탐지 기능을 제공하고, 실시간 예측을 통해 빠른 의사결정을 지원한다. 다양한 형식의 스트림 데이터(비정형, 반정형)는 수집·정제를 통하여 실시간으로 복잡한 조건의 질의 및 분석을 수행한다. 분석한 결과들을 대시보드로 구성하여 실시간 모니터링 및 공유를 할 수 있으며 특정 조건에 일치하는 패턴이 발생하면 외부에 알림을 보낸다.
- 인지분석 엔진
- 컴퓨터가 사람처럼 학습을 통해 데이터에 대한 다양한 관점을 인지하거나 예측할 수 있는 인공지능 기술이 융합 적용된 기계학습 및 심층학습 기반의 세계 최고의 인지분석 엔진이다. 수집된 대용량의 빅데이터를 기계학습 및 심층학습 기반으로 사람이 분석하기에 어려운 데이터의 특성, 의미와 데이터 간의 연관성 분석 등을 빠른 속도로 찾아낼 수 있다. 더 나아가 초대용량 데이터에 대한 복잡계 분석, 음성과 텍스트 간의 융합분석, 이미지와 텍스트 간의 융합분석 기능을 제공한다. 주요 기능들을 정리하자면, 기계학습 및 심층학습을 통한 개체명 인지분석, 감성 인지분석, 지식/소셜 네트워크 분석, 음성인식 융합분석, 이미지 인식 융합분석 등 데이터 속의 의미관계망 분석을 통한 심층 분석 기능으로 나뉜다. 개체명 인지분석은 데이터에서 개체를 자동으로 추출하고 추출된 개체의 종류를 분류를 통하여 개체 간의 연관 관계를 실시간 자동 분석을 할 수 있는 기능이다. 감성 인지분석은 기계학습과 심층학습 기반 형태소, 문장구조, 개체명, 의미 등을 파악하여 토픽별 감성 분석, 긍/부정 트렌드 분석을 처리하는 고품질, 고정밀 감성 분석 기능이다.
- 지식/소셜 네트워크 분석은 초대용량 웹, 소셜미디어, 이메일 및 방대한 기업이 보유하고 있는 데이터로부터 시맨틱 소셜 네트워크를 추출해 그 구조를 분석하고, 네트워크에 흐르는 지식과 상호 영향력을 기계학습 기반의 심층분석을 통하여 중심성 분석, 군집 분석, 최단 경로 분석, 핵심 플레이어 분석, 주제별 핵심 노드 분석, 주제별 연관 노드 분석, 연관 주제별 핵심 노드 분석 등 지식 네트워크상에 유통되는 데이터에 대한 실시간 분석을 진행하는 기능이다.
- 음성인식과 텍스트 융합 분석은 사용자의 실시간 음성데이터를 입력받아 텍스트로 변환 후 비정형 빅데이터 분석 기능과 연계하여 분석을 수행하는 기능과 사용자가 보유하고 있는 테스트 데이터와 음성인식을 통한 텍스트로 변환된 데이터 간의 융합 분석하는 기능이다.
- 시각 분석 엔진
- 시각 분석 엔진은 빅데이터와 그 분석 결과를 다양한 관점으로 시각화하여 숨겨져 있는 패턴을 발견하고, 미래를 예측, 이해할 수 있도록 지원한다. 단순한 개별 데이터의 시각화뿐만 아니라, 서로 다른 데이터를 융합, 재구성하고 동적 대시보드를 통해 시각적 분석을 가능하게 한다.
- 워크벤치를 통해 다양한 시각화 라이브러리를 통해 표현되는 데이터들은 엔진 내부 임시저장소를 통해 관리되며 웹, 기업 포털 및 소셜미디어에 퍼블리싱할 수 있다. 다양한 형식의 데이터소스에 연결하여 선택된 데이터에 대하여 연산, 필터링 및 서로 다른 데이터 소스 간의 결합이 가능하며 최종 정제된 데이터를 가지고 인터렉티브 한 시각화 요소들을 쉽게 생성할 수 있다. 또한 웹 서버로의 퍼블리싱을 통하여 생성한 시각화 요소를 웹상에서 확인하거나 다른 사람들과 공유하는 기능을 제공한다.
구성 엔진 주요 기술 설 명 토네이도 엔진 대규모 심층 웹 데이터 수집 기술 - elastic DOR 엔진 초대규모 정형·비정형
데이터 저장 및 검색 기술- 블루볼트 엔진
TMS 엔진딥러닝 기반 정형·비정형
융합 심층 분석 기술BERT 기반 비정형 텍스트 분석 기술, DNN 기반의 메모리 어텐션 시계열 예측 기술 블루볼트 엔진 실시간 스트림 데이터에 대한
복잡 이벤트 분석 기술스트림 데이터 실시간 수집 기술, 실시간 인 메모리 기반 분석 기술 레인보우 엔진 대규모 실시간 데이터의
고품질 시각적 분석 기술- LEA 엔진
인지분석 엔진트렌드 및 이상징후 조기 감지 기술 정보융합 성숙도 모델 기반, 정보융합의 유형 분류 기술,
이상징후 식별 단계별 정보융합 기술, 온톨로지 기반의 상황인지 추론 기술,
이상징후 추론 기술, 이상징후 식별 자동화 기술인지분석 엔진 복잡계 네트워크 분석 기술 그래프 데이터 기반 지식 네트워크 분석 알고리즘과 질의 기술 인지분석 엔진 PSD 모델 기반 사용자 선호 예측
및 추천 기술Psychography 추천 모델, Socialgraphy 추천 모델, Demography 추천 모델
사례[편집]
- 농협 : 고객의 디지털 채널 활용량과 지능형 서비스 요구가 지속해서 증가할 것으로 예상되어, 고객의 만족도와 운영 효율성을 상승시키기 위해 콜센터 인공지능 빅데이터 시스템을 구축했다. 농협은행의 고객행복센터의 전화 상담 내용을 기록, 저장, 분석하는데 실시간 음성처리, 언어분석 처리, 대용량 분석 환경이 적용되었다. 실시간으로 텍스트 분석이 가능하도록 개발되었기 때문에 상담 데이터의 분석 결과를 바로 활용할 수 있다. 이를 통해 농협은 향후 데이터가 지속해서 증가하거나 서비스를 증설하더라도 시스템의 인프라 확장이 유연하게 되었고, 특정 시간대에 상담 전화가 몰리더라도 원활한 서비스를 제공할 수 있게 되었다.
- ㈜포스코 : ㈜포스코 경영연구소(POSRI)의 GIH 구축 사업을 맡아, 지능형 통합 검색 시스템을 구축했다. GIH는 ㈜포스코 및 패밀리사에서 자체 관리하던 국내외 사외정보를 통합 관리하고 분야별 전문가가 분석하여 임직원에게 서비스하는 정보 허브이다. 이에 따라 ㈜솔트룩스는 정형데이터와 비정형 데이터에 대한 지능형 분석과 시맨틱 검색으로 더욱 정확한 정보 검색과 모니터링 기능을 제공했다. 또한 동향분석, 트렌드 분석, 연관주제 분석 등 비정형 데이터에 대한 입체적인 분석을 지원하여 포스코 패밀리의 정보 경쟁력을 강화했다.
그래프 데이터베이스[편집]
그래프 데이터베이스 스위트는 다양하고 방대하게 쏟아지고 있는 빅데이터를 효율적으로 활용 및 관리하기 위하여 데이터 간의 상관관계를 지식그래프 구조로 자동 변환·생성하여 저장뿐만 아니라 분석에 바로 활용할 수 있는 분석 기능을 내장한다. 또한, 국내 최고의 지식그래프데이터 생성에서부터 관리, 지능형 분석(예측·추론)이 가능한 최고의 제품으로 비즈니스 환경에 따라 에드온(Add-on) 패키지를 선택적으로 사용하여 데이터 통합, 리스크 관리, 콘텐츠 추천, 데이터 공개, 대용량 추론 기능을 제공한다. 그래프 데이터베이스 Suite은 멀티 데이터 모델 통합 서비스, 데이터 예측/진단 서비스, 링크드 오픈 데이터 서비스, 대용량 지식그래프 구축 서비스를 구축할 수 있는 환경을 제공하고 있다.
엔진[편집]
- 그래프 데이터 변환 엔진
- 데이터 소스와 지식 그래프 모델 간 매핑을 통해 지식 그래프에 해당하는 데이터를 생성하기 위한 엔진이다. 사용자 데이터를 가상의 데이터 뷰로 전환하고 처리하기 위한 기능을 제공하고 있으며, 사용자는 그래프 데이터 변환 엔진을 통해 데이터 변환 업무를 쉽고 빠르게 수행할 수 있다. 데이터 변환 절차는 데이터 소스 선정, 데이터 소스에 해당하는 데이터 뷰 생성, 그래프 맵 정의, 데이터 뷰와 그래프 맵 바인딩, 그래프 데이터 생성의 절차로 진행한다. 그래프 맵은 그래프 모델에 해당하는 인스턴스를 정의하며 특정 리소스의 속성값을 생성할 때 값에 대한 필터링/정제가 필요할 경우는 함수를 이용하여 처리한다. 데이터 변환 엔진의 관리 기능은 데이터 매핑 및 변환뿐만 아니라 데이터 소스 뷰어, 데이터 모델(스키마) 뷰어, SPARQL 뷰어 및 테스트, CSV/Excel 파일 뷰어, RML 편집기 및 테스트, 변환 통계기능 등 사용자가 데이터 변환 처리(데이터 전처리, 변환, 데이터 후처리)에 있어 유용한 기능을 제공하고 있다.
- 그래프 데이터 변환 엔진은 대용량 데이터에 대한 변환뿐만 아니라 다양한 데이터 소스를 지원하는 가상의 데이터 뷰를 제공, 데이터 변환 시 데이터에 대한 정제 및 필터링 제공 등 사용자가 정의한 데이터 뷰와 필터링 함수를 직접 정의하고 엔진에 적용할 수 있다. 그래프 데이터 변환 엔진의 가장 큰 장점은 사용자가 데이터 뷰(Data View)를 만들거나 사용자 함수를 플러그인으로 만들 수 있으며, 이들은 모두 URI 주소를 가지고 있어 다른 프로젝트에서 동일한 함수가 URI를 통해서 구분하여 사용할 수 있다는 것이다. 또한, 형상 관리 서버와의 연동을 통해 작업 중인 프로젝트별 형상을 관리할 수도 있다. 특성으로는 활용성, 다양성, 유연성, 사용성이 있다. 그래프 데이터베이스 Suite에 정형과 비정형 데이터에 대한 그래프 데이터 생성을 담당하는 그래프 데이터 변환 엔진은 데이터 변환 핵심 기능과 손쉬운 변환 작업을 지원하는 관리 도구로 구성되어 있다. 정형화된 데이터의 경우 스키마 매핑을 통해 데이터를 추출/변환할 수 있으며, 비정형화 데이터의 경우는 KENT의 데이터 추출 기능을 결합하여 데이터 모델에 필요한 속성의 값을 추출하고 변환할 수 있다.
- 그래프 데이터 저장 엔진
- 100억 트리플 이상의 초대용량 그래프 데이터를 저장하고 활용할 수 있다. 그래프 데이터 저장 엔진은 데이터를 조회, 수정/삭제하기 위한 질의 언어를 제공한다. W3C의 SPARQL과 GraphQL를 제공하고 있으며, 데이터 개방, 공유, 분석 등을 위해서 Rest기반 API를 통해 쉽고 빠르게 접근할 수 있다. 그래프 데이터 저장 엔진은 기본적으로 자원 기술 프레임워크 기반 그래프 데이터를 저장하는 저장소와 프로퍼티 그래프를 저장하는 저장소 기능을 제공하며, 아파치 서버 연계를 통해 프로퍼티 그래프를 저장하고 분석할 수 있는 기능을 제공하고 있다. 주로 대용량 그래프 데이터 저장 기능, 그래프 데이터 관리 기능, SPARQL 질의 기능을 제공한다.
- 그래프 데이터 추론 엔진
- 규칙 기반 추론을 위한 2가지 리즈닝 전략(전방연쇄와 후방연쇄)을 제공하고 있다. 기본적으로 전방연쇄에 기반한 추론전략을 제공하며, 필요하면 후방연쇄 추론 엔진을 사용할 수 있다. 전방연쇄에 기반한 추론의 장단점은 데이터가 저장소에 트랜잭션 후에 유추된 사실을 확장하기 때문에 새로운 사실을 업로드, 저장, 추가, 삭제 시 상대적으로 느려질 수 있다. 그래프 데이터추론 엔진에서 추론은 데이터 입력 시점부터 시작된다. 하지만, 전방연쇄 추론기법의 장점은 모든 데이터에 대한 추론 결과를 미리 만들어 저장함으로써 질의와 검색에 상당히 빠른 성능을 제공한다. 일반적으로 후방연쇄 추론기법은 질의나 검색 시 추론이 발생하며 이로 인해 복잡한 연역 추론이나 적합성 검사나 다른 추론이 발생할 가능성이 높아 성능에 영향을 미칠 수 있다. 그래프 데이터 저장과 분석은 강력한 지식표현과 데이터 멀티 모델 지원을 통한 데이터 통합, 그래프 데이터에 대한 다양한 분석기능을 제공한다. 그래프 데이터 저장과 분석의 주요 특징은 공리와 규칙 기반 추론 내장, 다양한 지식 표현 언어 지원, 그래프 데이터 증강 및 검증이 있다. 주요 기능으로는 다양한 규칙에 기반을 둔 추론 기능, 스키마 업데이트 트랜잭션 기능, 일관성 검증 기능, 재추론 기능이 있다.
- 그래프 데이터 분석 엔진
- 외부정보에 대한 지식 그래프 생성기, 지식 네트워크 분석을 위한 그래프 인덱스 생성기, 사용자별, 시간대별, 토픽별 지식 네트워크 분석기, 네트워크상에 유통되는 콘텐츠에 핵심어 분석을 위한 토픽네트워크 분석기, 시간대별 관심 토픽에 대한 경향성 분석기, 지식 검색기로 구성되어 있다. 그래프 데이터 분석 엔진의 특징은 실시간으로 수집/변경되는 지식에 대한 실시간 반영과 분석을 제공하며, 특히 수집된 데이터를 지식으로 변환하는 그래프 데이터 변환 엔진을 포함한다. 또한, 그래프 데이터 분석에 필요한 데이터의 저장과 분석 색인 및 알고리즘을 제공하고 있으며, 분석 서비스 관점에 따라 사용자가 적절한 분석 알고리즘을 선택하여 결과를 얻을 수 있다. 모든 결과는 테이블 형태뿐만 아니라 RDF 포맷(RDF/XML, Turtle, N-Triple, RDF/JSON 등)을 지원한다. 주요 기능으로는 시계열 토픽 분석 기능, 지식 네트워크 분석 기능 등이 있다.
구성 엔진 주요 기술 설 명 그래프 데이터 변환 엔진 정형/비정형 데이터를
그래프 데이터 변환하는 기술데이터 변환/매핑 기술, 데이터 소스에 대한 가상 데이터 뷰 변환 기술 초대용량 정형/비정형 데이터를
그래프 데이터 변환시키는 기술다양한 외부 데이터 변환기술, 그래프 데이트 통합/증분 처리기술 RDF와 프로퍼티 그래프 사용을 위한
지식 프레임워크 기술RDF 프레임워크 기술, 프로퍼티 그래프 프레임워크 기술 그래프 데이터 저장 엔진 SPARQL 기반 RDF 검색 및 패싯검색 기술 RDF 색인 및 검색기술, 패싯검색 기술 SPARQL 엔드포인트를 이용한
링크드 데이터 플랫폼 기술SPARQL 표준 프로토콜, SPARQL 엔드포인트 기술 그래프 데이터 추론 엔진 초대규모 그래프 데이터 저장 및 추론 기술 RDFS, OWL, OWL2 추론 기술, SPARK 기반 대용량 분산 추론 기술 그래프 데이터 분석 엔진 SPARQL 기반 네트워크 분석기술 네트워크 분석기술, 토픽네트워크 분석기술 SPARQL 기반 공간정보 분석기술 WGS84, 오픈 GIS 공간정보 분석기술, 공간정보 색인기술
사례[편집]
- 대검찰청 : 꾸준히 발생하고 있는 범죄들은 일시적인 인력과 예산 투자만으로는 막을 수 없다. 이 때문에 검찰은 범죄를 세부적으로 분석하고 관계기관과 정보를 공유하고 협업하여 국민에게 실효성이 있는 범죄분석체계를 구축해야 했다. 여기에는 범죄정보, 행정 사회정보를 과학적으로 분석하고, 선제적 예방 중심의 형사사법 체계를 강화할 수 있는 지능적 시스템이 필요했고, 피해자와 가해자의 정상적인 사회 복귀를 위한 공동 협업 시스템이 필요했다. ㈜솔트룩스는 이 두 가지 관점을 조건으로 과학적인 범죄분석 기반 시스템 구축과 범죄 그래프 데이터 기반 지능형 범죄분석체계, 관계기관 간 범죄예방 협업 체계 구성 기반을 마련했다. 그 결과, 범죄분석을 지원하는 다양한 시나리오, 범인의 범죄 증거자료 분석, 800여 종의 반정형 비정형 문서 텍스트 분석 기능 등으로 과학적인 범죄분석 기반 시스템이 구축되었다. 또한, 심층 범죄 분석을 위해 지능형 범죄분석 지식 기반 구축이 이뤄졌고, 관계기관 간의 범죄예방 협업체계의 기반을 마련했다. 개발에는 ㈜솔트룩스의 그래프 데이터, 빅데이터 기술이 사용되었고, 그밖에 오픈소스 아파치 스파크, 스톰, 카프카 등이 적용됐다.
- 농협 : 농협은행 고객행복센터와 전 영업점에서 고객상담에 필요한 업무 지식을 관리하고 공유하는 지식관리 시스템을 개선했다. 지식 생성, 관리, 검색 등의 사용 편의성은 높이고, 지식 콘텐츠 생성 시, 업무 분야와 속성에 따라 구체적으로 관리되도록 하여 지식 그래프 기반의 지식베이스로 변환 저장한다. 이는 자연어 콘텐츠를 시스템이 이해 가능한 형태의 지식 데이터로 변환하는 것이며, 이 과정에서 인공지능 기반 지식 자동 추출도 적용됐다. 기존의 지식관리 시스템은 고객 상담을 위해 필요한 업무 지식을 생산, 저장 관리하는 시스템으로, 은행 상담사 또는 영업점 직원들 간 지식을 공유하기 위한 목적으로 사용되고 있다. 하지만, 은행 고객들의 다양한 디지털 채널 사용이 많아져, 인공지능 기반의 서비스 요구가 지속적 증가하고 있고, 별도의 인공지능 기반 지식 데이터 구축 관리가 필요했다. 기존 지식 콘텐츠와 인공지능 기반 지식 데이터는 형태와 구조가 서로 상이하여 개별적으로 관리하기에는 동일한 정보를 유지하기 어려웠고, 중복된 지식 생성, 관리 및 활용으로 여러 측면에서 사용자가 불편함을 겪었다. 농협은 10년 이상 사용한 노후화된 지식관리 시스템을 최신 인공지능 기술 트렌드에 부합하는 지능형 지식관리 시스템으로 개편하여, 직원들 간 상담 지식정보 관리 및 공유의 편의성을 높이는 것은 물론, 인공지능 기반 서비스에 활용 가능한 지식 데이터를 동시에 생성 관리함으로써, 지식 콘텐츠의 관리 효율성과 활용성을 높이는 것이 목표였다. 이에 따라 ㈜솔트룩스는 농협은행과 농협 카드의 지능형 지식관리 시스템을 각각 구축하여 별도의 콘텐츠를 관리하고 서로 지식 공유가 가능하도록 연계했다. 또한, 콜센터 상담 어드바이저로 서비스되는 인공지능 질의응답 시스템과 연계하여 지능형 지식관리 시스템을 통해 관리는 지식 데이터가 직원들과 시스템에 동시에 서비스되는 환경을 구축했다. 지식 자동 추출 부분에서는 품질 향상을 위해 언어처리와 기계학습을 포함한 다양한 방안들을 연구하였고, 농협은행의 콘텐츠에서 필요한 지식을 추출할 수 있도록 구현했다.
- 한국식품안전관리인증원 : 안전 먹거리 질의응답 시스템을 구축했다. 국민 생활과 밀접한 HACCP 인증 안심 먹거리 기반으로 제품의 원재료, 영양성분 데이터를 활용하여 지식베이스를 구축하고, 더 나아가 테마 기반의 개인화된 안심 먹거리 추천 서비스를 대국민에 제공할 수 있는 “HACCP 지능정보서비스를 위한 인공지능 기반 고객 맞춤형 지식 상담 서비스 개발”을 목표로 진행했다. 그 결과, 사용자들에게 사용자들에게 테마 기반의 맞춤형 식품 정보를 제공할 수 있게 되었고, 정보 취약계층에 대한 접근성을 강화하고 안심 먹거리에 대한 알 권리를 향상했으며, 지능형 안심 먹거리 서비스 정보를 획득하는 시간을 단축하여 비용 절감 효과를 불러왔다.
- 특허청 : 특허청이 보유한 지식재산권 정보를 중심으로 타 정부 부처 및 공공기관이 보유 중인 다양한 비즈니스 정보를 연계하여 활용할 수 있는 정보 채널을 구축하고, 중소기업 및 창업기업 등 기업 종사자들이 빠르고 편리하게 정보를 획득할 수 있는 사용자 관점의 편의 기능을 제공했다. 개발에는 텍스트 채굴 기술이 적용되었고, 연관 관계 분석을 위해 지식 그래프가 사용되었다. 링크드 데이터 서비스는 국내외 500만 건 이상의 특허정보 공개, 13개 기관의 300만 건의 특허 분석 데이터베이스 연계 정보를 제공하는 등의 성과를 냈다.
클라우드 서비스[편집]
솔트룩스 클라우드 서비스는 인공지능 서비스 개발자, 데이터 과학자, 데이터 분석가, 금융거래 이상징후 분석 담당자와 같은 사용자 모델을 대상으로 다양한 산업영역에 적용 가능한 인공지능 서비스를 제공한다. 솔트룩스 클라우드 서비스는 두 가지 서비스로 구성되어 있다. 1) 인공지능 클라우드 아담 인공지능 서비스는 솔트룩스가 지난 20년간 자연언어처리와 시맨틱, 추론을 포함한 인공지능 원천기술을 바탕으로 개발된 언어지능, 시각지능, 감성지능, 학습/추론 지능을 인공지능 서비스 개발에 필요한 API 형태로 제공하는 클라우드서비스이다. 2) 데이터과학 클라우드(DATAMIXI.com)는 아담 인공지능이 미리 학습된 일반 도메인 모델을 웹 서비스로 노출한 오픈 API의 특성을 갖는 데 반하여, 고객이 보유한 도메인 데이터셋을 이용하여 새로운 모델을 학습하고 서비스에 반영할 수 있도록 기계학습 워크플로우 서비스 및 지능형 빅데이터 인지 분석 서비스를 제공한다.
서비스[편집]
- 인공지능 클라우드 서비스
- 인공지능 아담은 사람의 말과 글을 이해하거나 사진의 내용을 요약하는 등의 고차원적 지능이 필요한 애플리케이션을 개발할 때, 웹을 통해 프로그래밍 인터페이스를 제공하는 플랫폼이다. 국내 최초로 상용화된 인공지능 플랫폼으로서 아시아 최대 규모의 지식베이스와 지식학습, 강력한 추론 엔진을 내장하고 지식, 언어, 시각 인지 등 6개 범주 60여 종의 APIs를 제공하고 있다. 지식 학습과 복합 추론에 강점이 있으며 생활 질의응답 정답 확률 94% 수준을 제공한다. 또한 아담의 서비스 파트너들은 아담 API들을 결합 사용함으로 가상비서, AI 상담원, 지능형 로봇 등 혁신적인 인공지능 서비스 구현을 할 수 있다.
- 아담에서 오픈 API를 통해 제공하는 인공지능 기술들을 국내외 기업 및 기관들이 자유롭게 활용하여 쉽고 편리하게 인공지능 제품 및 서비스 개발에 도전할 수 있다. 또한 오픈 API를 활용하여 인간의 언어를 이해하기 위한 고품질의 형태소 분석, 의미 인식, 의도 파악 기능, 제조회사의 지식을 구조화하기 위한 지식베이스, 질의응답 서비스, 대화 서비스 등을 손쉽게 구현할 수 있다. 아담은 데이터, 분석, 언어, 지식, 지능, 엑소브레인의 6개 범주에서 인공지능 제품 및 서비스 개발을 위해 필요한 총체적인 기술들을 레스트풀 기반의 오픈 API 서비스를 통하여 제공한다. 언어 분석, 이미지 분석 등에서 탁월한 성능을 보유하고 있으며, 지식베이스로 구축된 약 8억 건의 일반지식을 대상으로 하는 복합추론에서 50만 단위 지식/초의 속도를 제공한다. 또한, 이러한 복합추론과 일 데이터 수집량인 5백만 문서를 매일 지속 학습하는 강점을 통하여 생활 질의응답 정답 확률 94% 수준을 제공한다.
- 아담은 약 80만 권 분량의 도서 지식을 학습하여, 약 8억 권 이상의 일반지식 내용을 포함한 지식베이스를 보유하고 있다. 또, 언어분석 영역에서 초당 2천 문장을 처리할 수 있으며, 언어분석 성능은 99%(형태소), 95%(개체명) 분석 성능을 제공한다. 지식베이스로 구축된 약 8억 건의 일반지식을 대상으로는 복합추론 속도 50만 단위 지식/초를 제공하고, 질의응답은 초당 20개 답변을 처리할 수 있으며, 생활 질의응답 정답 확률은 94% 수준에 달한다.
- 데이터 과학 클라우드 서비스
- 데이터믹시는 데이터 과학자를 위하여 지능형 데이터 분석을 위한 통찰과 인공지능이 결합한 인지 분석 서비스로 데이터를 융합하여 심층 분석하고 다양한 관점에서 시각화함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측할 수 있는 국내 유일의 데이터 과학자들을 위한 포털 서비스이다. 데이터 과학자나 인공지능 기반 데이터 분석 서비스를 매시업 방식으로 프로젝트에 통합하고자 하는 IT 엔지니어, 개발자들을 위해 기획된 데이터 과학 컨설팅 서비스이다. 데이터믹시는 데이터 사이언스, 데이터 큐레이션, 인지 분석 서비스로 구성되어 있다. 데이터 사이언스는 빅데이터구축에서 분석 및 활용까지의 전 과정을 지원하는 클라우드서비스에 대한 명칭이다. 인지 분석 서비스는 트렌드 분석, 감성 분석, 시각화 서비스로 구성되어 있으며 수백억 단위의 인스턴스로 이루어진 데이터 세트를 바탕으로 분석 및 시각화 서비스를 제공한다. 인공지능과 데이터 과학자를 위한 국내 유일의 데이터 과학 포털 데이터믹시는 데이터 분석을 위한 통찰과 인공지능이 결합한 인지 분석으로 데이터를 융합하여 심층 분석하고 다양한 관점에서 시각화함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측할 수 있다. 데이터믹시의 주요 서비스로는 데이터 사이언스 서비스, 지능형 인지 분석 서비스, 데이터 큐레이션 서비스, 데이터 처리 및 기계학습 기능 서비스 다타이쿠가 있다.
- 데이터 사이언스 서비스는 지난 20년 동안 축적된 인지 분석과 기계학습의 성공 경험과 전문가들의 참여를 통해 데이터 수집, 정제에서 시작해 기계학습 및 분석 모델의 선정과 최적화, 예측과 지능화 결과에 대한 평가와 시각화에 이르는 전주기에 대한 실무에 바로 적용 가능한 IT 실무 지식과 기술교육 등을 제공하는 컨설팅 및 교육 서비스이다. 데이터믹시의 데이터 사이언스 서비스는 컴퓨터공학, 수리통계학, 데이터 모델링, 기계학습 알고리즘, 도메인 지식 모델링 기법이 솔트룩스만의 이중나선 방법론을 통해 융합되어 지능형 빅데이터 분석 서비스, 질의응답이나 대화 서비스와 같은 인공지능 기반 지식서비스 개발로 이어진다. 전형적 데이터 사이언스의 절차는 솔트룩스만의 이중나선 방법론을 적용하여 데이터 수집, 정제에서 시작해 기계학습 및 분석 모델의 선정과 최적화, 예측과 지능화 결과에 대한 평가와 시각화 과정이 반복적으로 수행된다. 지능형 인지 분석 서비스는 무료로 제공되는 약 100억 건 이상의 소셜 데이터를 활용하여 인공지능 기술이 적용된 융합분석, 연관주제 분석, 감성 분석, 트렌드 분석, 이슈 감지, 실시간 R 연동을 통한 고급 분석 기능과 데이터 속의 의미관계망 분석 기능을 통해 심층 분석을 할 수 있는 지능형 인지 분석 기능을 무료로 제공하고 있다.
- 데이터 큐레이션 서비스는 데이터 수집과 정제에서 메타정보 태깅과 분류, 학습용 데이터 생성 등 데이터의 활용 가치를 높이기 위한 모든 활동을 의미한다. 데이터 기반의 심층 분석과 기계학습을 위해서는 대규모 데이터의 확보뿐 아니라 기계가 읽고, 학습하고, 의미 이해 가능한 형태로 가공되어야 한다. 데이터 큐레이션은 데이터의 활용 가치를 높이는 모든 활동을 의미한다. 도서 등의 데이터 디지털화, 원시 데이터 수집, 데이터 정제 등 일반 데이터 가공 분야 외에 아래와 같이 이미지&동영상 어노테이션, 연구개발 데이터 어노테이션, 지식베이스 구축 등 전문 데이터 큐레이션 서비스를 제공하고 있다. 서비스의 절차는 수집/구축/저장관리/통합, 정제/변환, 학습/분석 준비, 학습/분석, 품질/평가 순으로 이루어진다. 데이터 처리 및 기계학습 기능 서비스 다타이쿠는 중앙화된 데이터 기반 지능형 빅데이터 플랫폼으로서 비즈니스가 데이터를 단지 저장하는 수준에서 머무르지 않고 기업의 프로세스와 긴밀한 영향을 갖도록 분석 기능을 최대한 활용한다. 이를 통해 데이터가 머신러닝 과정을 통해 모델화되고 기업 운영에 적용되는 단계까지 지원하고 있다.
사례[편집]
- ㈜케이티 : 2014년 아마존이 자사 인공지능 비서 알렉사를 기반으로 출시한 '에코'를 시초로 세계적으로 관련 시장이 가파르게 성장하고 있다. 국내에서는 ㈜케이티, 에스케이텔레콤㈜, ㈜엘지유플러스의 통신사 3곳이 인공지능 스피커 시장을 견인하고 있으며, 글로벌 인터넷 기업들이 견인하는 북미 등 주요 국가보다는 태동이 늦었지만 가파르게 성장하고 있다. 그 중에서 ㈜케이티는 가입자 150만 명에 달하는 국내 인공지능 스피커 시장 1위 기업이며, 2017년 1월 AI 스피커 '기가지니'를 출시한 이후, 기가지니 LTE, 기가지니 버디, 기가지니2, AI메이커스키드 등 제품군을 다각화하고 있다. 기가지니는 ㈜케이티의 각 홈 서비스 플랫폼 (IPTV, 음악, 통화, 홈 사물인터넷)과 밀결합하여 동작하고, 서드 파티들의 플랫폼과도 연동하여 전반적인 인공지능 생태계를 구성하고 있다. 그 중에서 이용자와 인공지능 간의 대화 품질 고도화를 위하여 ㈜솔트룩스 아담 플랫폼을 연동하였으며, 이를 통하여 광범위한 지식을 필요로 하는 생활형 심층 질의응답 서비스를 제공하고 있다.
- 우리은행 : 최근 금융 분야에서는 모바일을 비롯한 다양한 고객 서비스 채널이 확대되고 있고, 최신 인공지능 기반의 기술 트렌드에 대응하는 서비스 요구가 증가하고 있다. 우리은행은 이에 따라 대 고객, 대 직원 금융서비스의 패러다임 변화를 위하여 인공지능 상담 시스템을 구축할 필요가 있었다. 그래서 우리은행은 인공지능 기술을 이용하여 고객과 실시간 상담이 가능한 챗봇 서비스 ‘위비봇’을 2017년 9월에 개시했다. 실시간 금융 상담 서비스는 24시간 제공된다. '위비봇'은 기존의 질문과 답변을 고르는 단순 선택형 방식이 아닌 질문자의 의도를 파악해 상담원처럼 고객과 대화하는 방식으로 답변을 제공하며, 금융정보 외에도 일반상식 정보도 제공한다.
- 한국여성정책연구원 : 데이터 관련 기술이 발전됨에 따라 공공기관, 지자체, 기업 등에서 전통적인 표본조사에서 빅데이터 기반 전수 조사 연구로 변화하고 있다. 빅데이터 기반 행정 서비스 제공과 증거 기반 정책 수립을 위한 다양한 정책이 추진되고 있으며, 이에 따라 여성 정책연구 분야에서도 시시각각 변하는 사회 전반의 여론을 신속하게 분석함으로써 여성 정책 수요를 파악하고 대응 방안을 마련하기 위한 기초 자료를 구축하고자 했다. 특정 표본에 대한 제한적 이해가 아니라 대중 의견에 대한 종합적인 분석을 위해 본 연구에서는 페미니즘, 최저임금 주제와 관련된 언론, 소셜미디어, 커뮤니티 데이터를 수집했다. 또한, 수집된 데이터를 분석하여 여성 정책 추진에 필요한 기초자료를 마련했다. 이는 과거 소수에 불과했던 미디어 연구를 확장한 연구 사례로써 향후 여성 정책 수요를 발굴하고 대응 방안을 모색함에 빅데이터 활용을 촉진할 것으로 기대하고 있다.
- 현대자동차㈜ : 세계 경쟁 차량 수집 서비스는 멀티채널 다국어 외부 데이터를 준비한 후, 이를 활용한 적극적 마켓 센싱을 통해 고객 만족도 향상 및 시장 경쟁력 강화를 목표로 진행되었다. 이를 위해 수집된 전 세계 경쟁 차량 정보로부터 고객 니즈에 대한 포괄적 이해, 경쟁 시장 동향에 대한 정보 획득 그리고, 잠재적 리스크에 대한 실시간 모니터링을 위해 대용량 데이터 수집 전용 인프라를 구성했다. 데이터 수집 대상은 자동차 관련 전 세계 모든 뉴스, 잡지, 카페, 커뮤니티 및 포럼 사이트뿐만 아니라 페이스북, 트위터, 인스타그램, 유튜브 그리고, 고객 요청에 의한 커스텀 사이트로부터 데이터를 수집했다. 수집된 데이터는 자동분류, 필터링, 정제 및 가공 과정을 거쳐 정규화되어 고객이 바로 활용할 수 있는 데이터 형태로 구축하여 제공했다. 수집된 데이터를 통해 고객의 니즈에 대한 포괄적인 이해, 경쟁 시장 동향에 대한 정보 획득, 잠재적 리스크 모니터링 진행, 고객의 행동 패턴 등 숨겨진 정보를 추출, 내부 분석에 바로 활용 가능한 고객 맞춤형 데이터를 제공했다.
- AIA생명 : 보험상품의 개발에 있어 과거의 직관적 경험에 의존하던 방법에서 데이터 기반으로 상품을 기획하여 시장경쟁력을 높이는 것이 필요했다. 싱글족에 관련된 분석 대상 데이터를 확보하고, 확보된 정형/비정형 데이터를 융합분석 및 인지 분석을 통해 3545 싱글들의 관심을 끌 수 있는 보험 상품을 개발하는 것이 목표였다. 그 결과, 멀티채널의 외부 데이터를 활용한 적극적 마켓 센싱으로 고객 만족도 향상 및 시장 경쟁력을 강화할 수 있었고, 대상의 변경만으로 손쉽게 맞춤형 상품을 개발할 수 있는 검증된 플랫폼을 확보할 수 있었다.
- 프라이스워터하우스쿠퍼스(PwC) : 다양한 정보를 통해 기업의 현황 파악이 실시간으로 가능하게 함으로써 급변하는 기업의 사회적 변화에 대하여 신속히 대응하기 위한 기반이 필요했다. 특히 많은 양의 소셜 데이터와 SNS 데이터의 수집과 이를 통한 분석 및 시각화는 특정 기업의 인사이트를 얻기 위해 필요한 수단이며 목표이다. 개발 결과, 150억 건 이상의 소셜 데이터를 기업 정보와 경쟁사의 모니터링 서비스를 제공했다. 특정 기업 및 경쟁사의 데이터를 수집, 저장, 분석, 표현의 전체 과정을 통합적으로 처리할 수 있고, 기업에 대한 현황, 기술, 서비스 형태 등 다양한 정보를 수집하고, 수집된 데이터의 분석을 통해 인사이트를 제공하며 맞춤형 정보로 활용할 수 있다.
- 한국과학기술연구원(KIST) : 디지털 데이터의 비중이 점차 증가하는 현실 속에서 연구기관에서 빅데이터를 활용한 연구지원 시스템 도입은 연구기관의 전체적 생산성을 높일 수 있다. 본 사업은 한국과학기술연구원이 지속적인 연구 개발에 대한 경쟁력을 가질 수 있도록 정형·비정형 데이터의 수집 및 관리체계를 확립하여, 연구원의 연구 생산성을 높일 수 있는 글로벌 스케일의 연구자료 분석 환경 구축을 진행했다. 실험정보의 공유를 통하여 연구 생산성 및 커뮤니케이션의 질적 향상을 통한 연구지원이 가능하게 되었으며, 대내외 연구 논문 및 특허정보를 데이터베이스화함으로 촉매 분야별 최신정보 센싱 및 논문 활용을 향상했다. 각종 실험을 통하여 발생하는 실험 노트를 데이터화하고 데이터마이닝, 인공지능 등 데이터 사이언스에 응용한다.
솔루션[편집]
고객 목소리 분석[편집]
고객 목소리 분석 솔루션은 고객센터의 상담 메모뿐 아니라 이메일, 다양한 소셜 미디어와 포털 게시판에 이르기까지 다양한 채널로부터 고객 목소리를 실시간 수집, 통합한다. 고객 불만과 평판을 심층 분석하고 이상징후 조기 감지 및 실시간 대응 체계를 제공함으로 고객 만족 극대화, VVIP 대응, 회사와 서비스 평판 관리뿐 아니라 신상품 개발에 이르기보다 지능적이고 주도적인 대고객 리더십 확보를 지원한다. 고객 목소리는 기업의 경영 활동에 있어서 고객들이 기업의 서비스에 반응하는 각종 문의, 불만, 제안 등을 의미한다. 이러한 고객 목소리를 구성하고 있는 데이터는 주로 콜센터 등에서 사용하는 고객 관계 관리(CRM)의 고객지원 시스템을 통해 확보할 수 있는 상담원의 고객상담 메모, 고객지원 게시판이며, 최근에는 블로그, 트위터, 커뮤니티 사이트의 다양한 채널을 통해 확보가 가능한 고객 제품, 서비스의 반응 등 데이터를 포괄적으로 포함한다. 고객 목소리 분석 솔루션은 내/외부 비정형 상담 정보를 수집하는 정보 수집 시스템과 수집된 정보를 분석하는 고객 목소리 분석 시스템 그리고 분석된 정보를 웹으로 제공하는 웹 서비스로 구성된다. 비정형 데이터(VOC, 상담기록) 분석을 위해 다양한 구축 사례를 통하여 성능이 검증되고 기능이 최적화된 텍스트마이닝, 연관정보검색 등 데이터 수집/분석 솔루션을 활용하여 성공적인 상담 기록 분석 시스템을 구축한다.
- 필요성 : 2000년대 고객 관계 관리 시스템을 포함하는 대규모 콜센터 인프라의 구축으로 인하여 대용량의 고객 상담 메모가 시스템상에 지속해서 축적되어 왔다. 또한 디지털 환경의 보편화 및 인터넷 환경 등이 활성화되며 소비자의 적극적인 의사 표현이 이루어지고 있다. 특히 웹 2.0 패러다임의 등장으로 제품/서비스 사용자의 인터넷상의 블로그, 커뮤니티 등을 통해 적극적으로 의사 표현하는 프로슈머가 등장하였고 이들은 본인의 의견을 다른 사용자들과 적극 공유, 기업 경영에 영향력을 행사하고 있다. 따라서 다양한 고객의 필요 및 문제를 명확히 파악하고 이를 제품/서비스에 반영하는 것은 갈수록 치열해지는 기업 경쟁 환경에서 기업의 생존과 밀접한 관계가 있다.
- 주요 기능 : 콜센터 상담 메모, 소셜미디어, 포털 게시판, 내부 데이터베이스와 보고서 등 고객 목소리 분석을 위한 모든 데이터의 실시간 수집과 융합, 자동분류, 검색, 자동 평판 및 감성 분석, 트랜드 분석과 이슈 감지 및 자동 알림, 시각화/대시보드 자동 생성 기능의 제공이 있다.
- 주요 고객 : ㈜케이티, 한국도로공사, ㈜한화(10개 그룹사), 건강보험공단, 기업은행, 하나은행, 신한은행, 부산은행 외
- 특징 : 고객 목소리 데이터의 각 특징에 맞춰 적합한 분석 기법의 적용이 필요하다.
- 일반 문서 대비 짧은 텍스트 구성 : 콜센터의 상담 메모는 평균 100자 내외의 짧은 내용으로 기술되어 있다. 때에 따라서는 문장이기보다는 주요 이슈에 대한 핵심 단어의 나열인 경우가 많다.
- 민감한 정보 포함 가능 : 고객 상담 내용을 그대로 기술하는 경우는 이름, 주소, 주민등록번호, 전화번호, 카드번호 등의 다양한 고객의 개인정보를 포함한다. 이러한 개인정보는 전처리 과정 등을 통해 필터링 되어 분석 결과에 노출되지 않도록 해야 한다.
- 약어, 구어체 형태로 기술 : 콜센터의 상담원을 통해 구축되는 고객 목소리 데이터는 짧은 고객과의 상담 시간 내에 작성된다. 그래서 상담원의 편의에 맞춰 종종 약어, 구어체 등으로 기술된다. 이러한 약어 및 구어체를 언어분석 단계에서 효과적으로 처리할 수 있도록 하는 고려가 필요하다.
- 제품/서비스 도메인 종속 : 고객 목소리 데이터는 기업의 제품, 서비스 판매 등의 고객 대면 경영 활동에서 발생하는 데이터이다. 따라서 고객 목소리 데이터는 기업의 제품, 서비스에 대한 고객의 다양한 불만, 제안, 의견 등의 피드백 내용을 담고 있다. 고객 판매의 제품, 서비스에 대한 도메인 지식을 표현할 수 있는 상품명, 서비스명, 고객 분류 등의 키워드 확보 및 구축이 필요하다.
- 부분적 정형화 적용 : 콜센터 내부의 콘텐트 활용에 대한 노력으로 부분적으로 정형화된 패턴 형태로 저장된 경우가 있다. 그러나 콜센터 인력의 빠른 교체 및 다양한 고객 피드백 등으로 데이터의 오류가 많아 예외 없는 패턴 기반의 분석은 현실적으로 어려우므로, 패턴으로 기술된 부분에 대한 처리와 그 외의 데이터 처리를 복합적으로 적용해야 한다.
공공데이터 개방[편집]
솔트룩스의 공공데이터 개방을 위한 공공데이터 솔루션은 공공데이터를 위한 지식 그래프 모델링과 데이터 자동 변환 및 통합을 위한 규칙 엔진, 인스턴스 자동 변환기와 대규모 저장소를 내장하고 있으며, 레스트풀 형식의 레스트풀 엔드포인트를 통해 매우 강력한 데이터 질의를 제공한다. 시각 분석 엔진 레인보우와의 연계를 통해 다양한 시각화뿐 아니라 온라인 분석 서비스 구현도 가능하다.
- 주요 기능 : 공공데이터 변환, 통합, 관리 체계의 제공, 공공데이터 검색, 지식 그래프 모델링과 RDF 퍼블리싱, 시맨틱웹 추론과 SPARQL 질의, 엔드포인트 제공, 다양한 시각화, 대시보드 및 모바일 연계가 있다.
- 주요 고객 : 행정자치부, 한국수자원공사, 특허청, 경기도청, 한국정보화진흥원, 국토지리정보원 외
- 고객 문제 : 공공데이터의 효과적 개방과 대국민 활용 체계 확보, 산업 생태계 확산과 오픈 데이터 관리체계의 구축, 운영이 어렵다.
- 도입 효과 : 공공데이터 포털을 통해 기존 데이터를 RDF로 자동 변환 및 SPARQL 엔드포인트로 개방하고, 다양한 응용 서비스 연동을 제공함으로 1인 창조기업 지원과 공공데이터 활용이 증진한다.
- 공공데이터 서비스 체계 구축 : 공공데이터는 웹을 통한 데이터 개방과 유통을 위해 W3C에서 표준화한 데이터 표현, 출판 및 검색 방법이다. 공공데이터는 RDF 형식의 데이터 표현과 출판, REST 프로토콜과 SPARQL을 통한 검색과 질의를 제공하며 URI를 통해 모든 데이터가 연결 가능한 웹을 지향한다. 공공데이터에 기반한 공공 데이터 개방의 큰 특징은 인터넷상에서 개방된 모든 데이터를 연결, 활용하고 상이한 데이터를 통합한 개방형 지식 베이스를 구현할 수 있다는 점이다. 솔트룩스의 공공데이터 솔루션은 공공기관, 지자체에서의 정보 공개에 가치를 부여한다. 솔트룩스의 공공데이터 구축 솔루션은 지난 10년간 국내외 주요 고객을 통해 검증된 스톰 플랫폼의 SOR과 STRANSFORMER 제품에 기반하고 있다. 다양한 종류의 공공데이터로부터 지식 그래프 스키마를 구성하고, 원시데이터를 RDF로 변환, SPARQL 엔드포인트를 통해 질의, 시각화하는 것을 일괄 자동화 하는 것이 가능하다.
오피니언 마이닝[편집]
㈜솔트룩스는 지난 20년간 한국어, 영어, 일어 등을 포함한 다국어 형태소 분석, 구문 분석, 개체명 인식, 이벤트 추출 엔진을 개발해 왔으며 이를 적용한 고품질, 고정밀 감성 분석(Sentiment Analysis)과 오피니언마이닝 솔루션을 제공하고 있다. ㈜솔트룩스의 자연어 처리 및 오피니언 마이닝 기술은 기계학습과 딥러닝에 기반한 고품질의 분석을 제공한다.
- 주요 기능 : 한국어, 영어, 일어, 중국어를 포함한 다국어 텍스트에 대한 형태소분석, 구문분석, 개체명 인식, 이벤트 추출, 감성 분석, 평판 트랜드 분석, 이슈 분석 등이 있다.
- 주요 고객 : 현대자동차, 엘지전자㈜, 삼성전자㈜, 특허청, 한화그룹, 국방부, 한국정보화진흥원 외
- 고객 문제 : 비정형 텍스트로 구성된 조직 내외부의 방대한 문서, 게시물, 트위터 등으로부터 잠재 문제와 대중의 의견을 적시에 이해하기가 어려우며 분석에 큰 비용이 요구된다.
- 도입 효과 : 대규모, 실시간 텍스트로부터 다양한 언어 분석, 감성 분석, 연관 주제 분석 등을 수행하고 제품, 기업 정책에 대한 대중의 불만과 인식을 이해하고 선제 대응이 가능하다.
지식/소셜 네트워크 분석[편집]
네트워크 분석은 그래프 이론을 이용하여 객체(행위자를 포함한 모든 객체) 간의 관계를 분석하는 정량적인 분석방법론으로 분석 대상에 따른 다양한 분석 방법이 있으며, 대표적으로 사회 관계분석이 있다. 현재 조직에서는 지식의 흐름과 유통에 대한 분석을 통해 지식의 새로운 가치를 발견하거나 업무나 회사 운영에 활용하기 위해 많은 노력을 하고 있다. 조직 내에는 다양한 정보들(문서, 이메일, 웹 등)을 보유하고 있으며, 이들 정보자원에 대한 분석을 통해 지식 네트워크를 구성할 수 있다. 일반적으로 조직에서 지식 네트워크를 하게 되면 쌍방향 정보 공유의 활성화를 통해 업무 능력이 향상되거나, 조직 내 다양한 지식의 제공을 통해 소통 기회가 제공되는 등, 지식 네트워크 구성은 조직 내 분산된 지식에 대한 통합, 지식 유통 경로, 지식 흐름, 사용자 유형 분석 등을 위한 기초를 제공한다.
- 주요 기능 : 네트워크 연결 밀도, 강도, 다양한 중심성 분석, 주제별 핵심 인물, 근접 인물 분석, 주제별 연관 인물 분석, 연관 주제별 인물 프로파일링, 연결 패스 분석 등이 있다.
- 주요 고객 : 부산시청, 국방부, ㈜케이티 외
- 고객 문제 : 의사소통 채널이 다양해지고, 협력 구조가 복잡해 짐에 따라 조직 내 외부의 협업 구조 파악, 조직 내 전문가와 소셜미디어상의 마케팅 타깃 분석, 그 영향력 분석이 어렵다.
- 도입 효과 : 비용 효과적 소셜 마케팅, 문제 해결을 위한 전문가 추천과 인물 프로파일링을 통한 효과적인 지식 경영 구현, 지식 네트워크 분석을 통한 보안과 eDiscovery 체계 구현 등이 있다.
- 상세 기능 : 지식 네트워크는 조직 내에서 발생하는 다양한 주제정보 네트워크 및 사회관계 네트워크에 기반하고 있으며, 지식 네트워크 분석은 구성된 주제 및 사회관계에 대한 분석을 통해 지식 중개자, 지식 전문가 정보를 제공할 뿐만 아니라, 지식의 유통경로나 지식 흐름 경로 분석, 사용자 유형 분석 결과를 제공할 수 있다.
- 특장점 : 지식 네트워크는 조직 내에서 발생하는 다양한 주제정보 네트워크 및 사회관계 네트워크에 기반하고 있다. 지식 네트워크 분석은 구성된 주제 및 사회관계에 대한 분석을 통해 지식 중개자, 지식 전문가 정보를 제공할 뿐만 아니라, 지식의 유통경로나 지식 흐름 경로 분석, 사용자 유형 분석 결과를 제공할 수 있다. 조직 내의 지식 분석을 위한 데이터 소스와 이를 통해 가능한 분석 방법은 다음과 같다.
- 소셜네트워크 분석 알고리즘을 통한 실시간 네트워크 분석
- SSP (Service Strategy Planning)
- 주제 연관성 분석을 통한 주제 네트워크 확장
- HTML5 기반의 시각화
콘텐츠 맞춤 추천 및 개인화[편집]
동영상을 포함한 사용자 제작 콘텐츠의 생산량이 많이 증가하고 그 유통 구조가 다양해 짐에 따라 원하는 콘텐츠를 쉽게 발견하고 소비하기가 점점 어려워지고 있다. ㈜솔트룩스의 사용자 맞춤형 콘텐츠 추천 및 개인화 솔루션은 사용자의 선호를 의미상으로 분석하고 각 사용자에게 적합한 콘텐츠 만을 지능적으로 추천할 수 있는 솔루션이다.
- 주요 기능 : 데모그래피와 사용자 행동 패턴 기반 의미적 선호 분석을 통해 동영상, 방송, 뉴스, 블로그, 소셜 콘텐츠 등 다양한 미디어에 대한 개인 맞춤 추천, 지능형 검색이 있다.
- 주요 고객 : KBS 방송 추천, ㈜케이티 olleh TV, 지니어스, 지니 뉴스, 브리파이 외
- 고객 문제 : 콘텐츠의 생산량과 저장 및 관리 비용이 증가함에도 사용자의 콘텐츠 소비가 일부에 치우치며, 숨어있는 콘텐츠의 노출 및 소비 기회가 적고, 사용자의 콘텐츠 소비 만족도도 높지 않다
- 도입 효과 : 각 사용자에게 최적화된 맞춤 콘텐츠 추천과 개인화 서비스 구현을 통해 콘텐츠 소비를 증대하고 사용자 만족도 향상, 서비스 매출 증대를 기대한다.
신기술분석, 센싱, 예측[편집]
웹에서는 다양한 형태의 콘텐츠들이 지속해서 증가하고 있다. 이러한 콘텐츠들 중 원하는 정보를 얻기 위해서는 검색엔진 또는 검색기술을 통해 찾아야 한다. 그러나 발견된 정보가 세상 혹은 웹 영역에서 어떠한 정보량과 시계열적 의미가 있는지를 알아내는 것은 매우 어렵다. 구글은 '구글 트렌드' 라고 하는 검색 질의랭킹 분석 서비스를 통해 트렌드 분석을 제공하고 있으나 검색 시스템에 질의 된 검색어를 통계적으로 분석한 인기검색어 기능을 응용하여 표현한 한계를 가지고 있다. 트렌드 분석은 웹 또는 도메인 내에서 생성되는 콘텐츠를 분석하여 특정 지식의 연관 관계를 제시하거나 발생 경향을 분석함으로 단편적인 지식발견이 아닌 생성/활용/트렌드를 분석할 수 있는 기능이 있다. 트렌드 분석 기능은 웹에서 발생하는 웹페이지, 블로그, 트윗, 각종 게시판 콘텐츠를 분석하여 사회적인 이슈나 세상에 회자하는 관심 사항을 자동으로 분석하는 용도로도 사용할 수 있지만, 기업활동 영역 내에서 생성되는 고급 콘텐츠의 분석에도 효과적으로 사용될 수 있으며 그 가치는 수익 활동과 연결될 수 있는 투자자본수익률(ROI) 을 제공한다.
- 주요 기능 : 한, 영, 일, 중 등 다국어 특허, 논문, 기술문서, 연구보고서, 기술 뉴스 등의 수집과 통합 색인, 트랜드 분석, 연관 기술 분석과 부상기술, 공백기술 분석, 유사문서 검색, 맞춤 정보 추천 등이 있다.
- 주요 고객 : 삼성전자㈜, 엘지전자㈜, 특허청, 한국과학기술기획평가원, 한국연구재단, 한국과학기술정보연구원 외
- 고객 문제 : 글로벌 경쟁 가능한 차세대 기술 및 제품 개발을 위한 연구 개발 방향, 경쟁 전략, 특허 전략의 확보와 의사 결정이 점점 어려워지고 있으며, 그 투자 위험성도 많이 증가했다.
- 도입 효과 : 조직 내 외부의 연구 개발 내용 분석, 글로벌 기술 트랜드 이해와 예측, 경쟁 기업 및 경쟁 기술 대응을 통한 연구개발 성과 향상과 전략적 IPR 확보가 가능하다.
- 목적 : 기업활동에 수반되는 문서의 형태는 다양하나 그중에서 기술과 관련된 지식은 기업이 영속할 수 있는 핵심내용을 담고 있다. 내부에서 생성되는 지식뿐 아니라 외부에서 생성되고 수집되는 기술문서 역시 관리되어야 할 중요한 내용으로 최근 들어 특허 관리 및 융합기술이 특히 중요해지고 있다. 그러나 기술문서 역시 지식 활동에 따라 대량으로 발생하고 있어 모든 내용을 검토하거나 분석하는 것이 어렵다. 텍스트마이닝 기술은 이런 환경에서 특허, 논문, 지식문서 등의 기술 문헌에 대한 트렌드 분석을 수행할 수 있는 유용한 기술이다. 신기술 센싱은 지능적 분석을 통해 미래 연구개발 기술에 대한 트렌드를 파악하고, 제품의 연구/개발 의사결정에 도움을 주는 역할을 한다. 기업에서 신기술 혹은 신제품 개발 등의 연구개발 추진 시 사전 특허 조사, 기술 등의 연구개발 동향 분석은 필수적이다. 연구개발 종사자에게는 세부 기술 수준에서의 동종/이종 기술 간의 융합패턴 발견이 중요하며, 개별 제품 레벨에서의 이 제품에 적용될 수 있는 미래 기술 및 미래 시장 제품의 발견 중요성이 증대되고 있다. 신기술 센싱은 통시적 분석과 공시적 분석을 수행하며 이 기능들은 각각 기술 간의 연관 관계 분석과 부상기술 분석, 기술 트렌드 기능을 제공한다.
- 시스템 구성 : 센싱 시스템은 배치 형태의 분석, 색인 과정과 서비스를 위하는 검색과정으로 구분된다. 특히 분석은 두 가지 분석을 수행하게 되며, 통시적 분석은 통계분석 및 회귀분석을 사용하고, 공시적 분석은 토픽랭크 알고리즘을 통해 이루어진다. 공시적 현상 분석은 사용자가 입력한 질의어에 기반을 두어 검색하고, 검색 결과 문서의 키워드 벡터를 토픽랭크 분석하여 키워드의 관계 네트워크 정보를 제시한다. 통시적인 현상 분석은 주기적으로 입력받은 문헌 정보를 단위 시간대별로 나눠 분석하고 이 분석 결과에 기반을 두어 해당 단위 시간대에 중요하게 증가/변화되고 있는 기술 용어를 순위별로 제시한다.
- 결론 : 미래의 불확실성에 대한 의사결정 가이드를 제공하며 주요 관심 사항에 대한 집중적인 검토 계기를 제공할 수 있다. 트렌드 분석 시스템이 제공하는 기능들은 방대한 내외부 기술 문헌을 효율적으로 자산화할 수 있는 임무를 수행한다.
사물인터넷 대응 상황인지[편집]
웨어러블 디바이스를 필두로 스마트 시티와 스마트 홈, 헬스케어와 에너지 사물인터넷 등 센서 네트워크 기반의 혁신적 서비스들이 나오고 있다. 사물인터넷 혁신은 실시간 스트림 빅데이터에 대한 지능화와 의미기반 상황인지 기술 개발에 달려있다. ㈜솔트룩스는 지난 10년간 실시간 센서 데이터의 지능화와 의미기반 상황인지 기술을 개발 및 공급해 왔으며 다양한 상용화 실적을 보유하고 있다.
- 주요 기능 : 센서 및 상황 정보의 지식그래프 및 규칙 모델링, 센서 데이터의 수집과 저장, 색인 및 패턴 감지와 기계학습 기반 예측, 의미 기반 하이브리드 상황 추론 등이 있다.
- 주요 고객 : ㈜케이티, 국토부, 유럽 위원회, 한국전자통신연구원 외
- 고객 문제 : 사물인터넷 센서, 스마트 디바이스에서 쏟아져 들어오는 데이터의 실시간 처리와 모니터링, 지능화와 예측 상황인지 기술의 확보와 상용화가 어렵다.
- 도입 효과 : 실시간 스트림 데이터에 대한 모니터링과 이상 징후 감지, 상황인지 기반한 개인화 서비스 구현을 통한 혁신적 서비스 구현과 경쟁자 차별화를 기대한다.
지능형 감사/보안[편집]
활용 가치가 큰 빅데이터의 80%가 위치와 관련 있는 지리 공간 빅데이터라는 통계가 있을 정도로 위치 기반한 빅데이터 분석은 매우 중요하다. ㈜솔트룩스는 의미기반 지리 공간 모델링과 지리 정보 시스템 연동 가능한 빅데이터 융합 분석 솔루션을 제공하고 있으며, 소셜 빅데이터와의 연계를 통한 지역별 이슈 및 평판 분석, 실시간 마케팅 분석과 이상징후 조기 감지 등의 심층 분석을 지원한다. 지리 공간정보의 시맨틱 활용은 지리적 특징, 지리 기하학적 특징, 지리 인문학적 특징 등과 같은 지리와 관련한 다양한 계층의 데이터들이 위치 좌표를 중심으로 연계되고 추론 처리하여 새로운 지리 정보를 제공할 수 있는 활용사례들이다.
- 주요 기능 : 시맨틱 지리, 공간 모델링, 지리 지식 그래프 구성, 지리공간 추론, Geo-SPARQL 지원, 다양한 공간 질의와 추론 기능, 지역 기반 소셜 빅데이터 분석, 지역별 이슈 및 위험 감지 등이 있다.
- 주요 고객 : 국방부, 국토지리정보원, EU Citi-sense, EU LarKC 외
- 고객 문제 : 다양한 유형의 빅데이터를 지역 및 공간에 기반해 융합 분석하기 위한 기술과 시스템, 지속 가능한 운영 체계의 구현
- 도입 효과 : 교통 최적화, 환경 감시와 개선, 지역 시민 목소리 분석과 행정 서비스 개선, 재난 대응과 위험 조기 감지, 지역 마케팅 최적화, 국가 안보 체계 강화 등을 기대한다.
- 지리 공간정보 : 지리 공간정보는 위치 좌표를 가진 지리적 정보를 바탕으로 지형학, 생물학, 유전병학, 사회학, 인구통계학, 통계학 등의 연관 정보를 가진 정보이다. 여기서 위치 좌표는 이동형 단말장치의 센서 정보를 이용하여 수집된 세계 지구 좌표 시스템(WGS84)의 좌표정보이다. 세계 지구 좌표 시스템은 구체의 중심으로부터 지구 표면에 대해 위도, 경도로 표시된다.
- 시맨틱 기술 : 시맨틱 기술은 데이터에 대해 사람과 기계가 이해하고 공유 및 추론할 수 있게 하는 기술이다. 이를 위해서 프로그램 간 공유하는 데이터 집합이 가진 데이터 간에 관계를 추가, 변경하고 상호 연계시킬 수 있도록 데이터 모델링을 한다. 데이터 모델링은 데이터의 개념을 체계화하고 개념 간의 관계를 정의하고 관계에 해당하는 실체들을 정의한다. 이는 웹상의 자원들을 표현하는 RDF를 기반으로 온톨로지로 나타낸다. 온톨로지를 저장하는 시맨틱 저장소는 자원 기술 프레임워크의 형태로 저장한다. 프로그램이 처리하는데 필요한 데이터를 시맨틱 저장소에서 질의하기 위해서 SPARQL를 사용하여 질의를 수행한다. 질의 내용 중 지식 그래프 내에 표현된 데이터들의 관계성에 따라 값이 지정되지 않은 질의 내 변수는 추론기의 추론을 통해서 변숫값을 조회해볼 수 있다. 추론 처리는 개념과 속성들의 상하 관계의 정의에 따른 규칙인 공리 기반 추론과 개념 및 속성을 SWRL 규칙 언어를 이용하여 정의하여 규칙에 맞는 값을 찾아내는 Rule 기반 추론이 있다.
각주[편집]
- ↑ David 기자, 〈AI 솔트룩스, 공모가 25,000원 최종 확정〉, 《사이언스모니터》, 2020-07-10
- ↑ 콘텐츠부 기자, 〈솔트룩스, 미국 자연어처리 최고 AI기업 Basis Technology와 파트너십 체결〉, 《조선비즈》, 2020-05-18
- ↑ 강철 기자, 〈솔트룩스 IPO, 2대 주주 '정문선' 경영권 안정화 돕는다〉, 《더벨》, 2020-06-01
- ↑ 이지영 기자, 〈이경일 솔트룩스 “인공지능 원천기술로 뚝심 있게 간다”〉, 《조선비즈》, 2016-04-17
- ↑ ㈜솔트룩스 아담 인공지능 - https://www.adams.ai/
- ↑ 강승만 에디터, 〈솔트룩스 ‘EVA’ 인공지능 시스템 공개…AI X 블록체인 융합 ‘ICO’ 계획도〉, 《사이언스모니터》, 2018-12-18
- ↑ 김유성 기자, 〈다마고치 같은 인공지능 '에바' 공개..솔트룩스, 내년 CBT〉, 《이데일리》, 2018-12-17
참고자료[편집]
- ㈜솔트룩스 사람인 - http://www.saramin.co.kr/zf_user/company-info/view/csn/1028113061/company_nm/(%EC%A3%BC)%EC%86%94%ED%8A%B8%EB%A3%A9%EC%8A%A4
- ㈜솔트룩스 잡코리아 - http://www.jobkorea.co.kr/Recruit/Co_Read/C/mobico
- ㈜솔트룩스 위키백과 - https://ko.wikipedia.org/wiki/%EC%86%94%ED%8A%B8%EB%A3%A9%EC%8A%A4
- ㈜솔트룩스 공식 유튜브 - https://www.youtube.com/channel/UCczw8k5vxmjlGQmEZYQWctg
- ㈜솔트룩스 공식 홈페이지 - http://www.saltlux.com/index.do
- 아담 공식 홈페이지 - https://www.adams.ai/
- 데이터믹시 공식 홈페이지 - http://datamixi.com/
- 이지영 기자, 〈이경일 솔트룩스 “인공지능 원천기술로 뚝심있게 간다”〉, 《조선비즈》, 2016-04-17
- 김유성 기자, 〈다마고치 같은 인공지능 '에바' 공개..솔트룩스, 내년 CBT〉, 《이데일리》, 2018-12-17
- 강승만 에디터, 〈솔트룩스 ‘EVA’ 인공지능 시스템 공개…AI X 블록체인 융합 ‘ICO’ 계획도〉, 《사이언스모니터》, 2018-12-18
- 콘텐츠부 기자, 〈솔트룩스, 미국 자연어처리 최고 AI기업 Basis Technology와 파트너십 체결〉, 《조선비즈》, 2020-05-18
- 강철 기자, 〈솔트룩스 IPO, 2대주주 '정문선' 경영권 안정화 돕는다〉, 《더벨》, 2020-06-01
- David 기자, 〈AI 솔트룩스, 공모가 25,000원 최종 확정〉, 《사이언스모니터》, 2020-07-10
같이 보기[편집]