아이트리니티
아이트리니티(iTrinity)는 ㈜아이알에스소프트코리아(대표 김상욱)가 개발한 통합검색엔진이다.
개요
아이트리니티는 별도의 수집기에 의해 수집된 문서를 색인하고, 사용자 질의에 대한 검색 결과를 제공하는 검색엔진 프로그램이다.[1]
특징
아이트리니티는 웹 포털 및 KMS, EDMS, G/W 등 검색 대상 데이터와 연계가 매우 편리하여 업무 적용에 유연하게 적용할 수 있다. 그리고 HTML, 워드, 엑셀, 파워포인트, PDF, 텍스트, RTF, 아래아한글 등의 형식을 자체 기술로 개발된 파일 필터를 제공하여 어떤 파일 형식이든 검색이 가능하다. 또한, 한국어, 한자, 일본어, 중국어, 영어, 독일어, 러시아어 등 25개 국어를 지원하므로 다양한 언어 검색 지원이 가능하다. 사양으로는 펜티엄 2.8 GHz의 2 CPU 환경에서 초당 100개의 색인 처리와 1기가바이트(GB) 웹페이지 색인 시 약 4시간 소요되며, 멀티 세그먼트 단위의 색인 알고리즘을 적용하여 색인 속도를 일정하게 유지한다. 이처럼 메모리 인덱스, 멀티 스레드 색인 지원으로 색인 속도를 획기적으로 향상하게 하고 일정한 색인 속도를 유지할 수 있다. 그리고 오라클(Oracle), 사이베이스(Sybase), 엠에스-에스큐엘(MS-SQL), 마이에스큐엘(MySQL), 유니에스큐엘(UniSQL) 등 모든 데이터베이스 관리 시스템(Database Management System, DBMS)을 지원하고, 윈도우즈(Windows 98/2000/NT/XP), 리눅스(Linux), 솔라리스(Solaris), IBM AIX, HP-UX 등 모든 플랫폼을 지원한다. 제이에스피(JSP) & 서블릿(Servlet) 컨테이너가 동작하는 모든 웹서버를 수용할 수 있다. (아파치 톰캣, BEA 웹로직, IBM 웹 스피어, 제이보스, 제이런, 오라클, 9iAS, Sun App Server, 제우스, 레진 등) 그리고 색인어 검색, 불리언 검색, 문장 검색, 인접어, 필드 제한, 부스팅, 그루핑, 절대 색인 검색, 와일드카드, 자연어 검색 등 다양한 검색 기능을 제공하여 대용량의 데이터를 빠르고 정확하게 검색이 되도록 지원한다. 또, 개발자용 컴포넌트를 사용하여 자동화된 검색용 메타데이터 설계와 코드 생성을 지원하므로 개발기간을 획기적으로 단축할 수 있다. 뿐만 아니라, 다양한 운영체제(Operation System, OS), 데이터베이스(Database, DB), 프로그램 언어를 100% 수용할 수 있다. 관리자에게도 시스템 관리의 풍부한 환경을 지원한다. 최소 시스템 사양으로 대용량 데이터 색인 및 다중 동시 질의 처리를 수용하고, 색인 데이터의 독창적인 저장 기술로 원문 대비 130%~150%의 하드디스크 공간만을 소모하게 한다. 그리고 대용량 저장 데이터를 수용하며 다수의 동시 사용자들이 검색할 수 있도록 설계된 대용량 전용 시스템 인프라를 제공한다. 1억 건 (32bit 기준) 이상의 대용량 데이터베이스를 수용한다. 그리고 인덱스 디렉토리 내 데이터베이스별 기가바이트 용량으로 병렬 인덱스 데이터베이스를 자동 생성되도록 사용되는 멀티 인덱스 데이터베이스 구조이며, 멀티 인덱스 데이터베이스는 각 독립 데이터베이스에 대한 통합검색이 지원되어 수치상 언리미티드 색인 데이터를 처리하므로 향후 데이터 확장에 따른 추가 분산 설계가 필요 없다. 이외에도 시스템 안정화 유지 프로세스 가동 및 외부 스트레스 공격에 적절히 대응할 수 있고, 엔진의 다운 현상이 없어 유지보수 및 관리가 용이하다.[2] 최근에는 인공지능 알고리즘을 접목하였으며, 오타 변환, 문서 자동요약, 자동 분류, 검색 콘텐츠 추천 등 다양한 사용자 편의 환경을 제공한다. 전자문서의 내용 검색을 지원하며 이미지 문서의 텍스트 검색도 지원한다. 뿐만 아니라, 다양한 색인 방법 및 검색 알고리즘으로 정확도 높은 검색 기능을 제공한다.[3]
기능
- 검색 기능
- 사용자가 가장 많이 입력한 검색어를 바탕으로 인기 검색어를 추출하여 자동으로 리스트에 반영되며 관리자의 리스트를 임의 반영 가능하다. 그리고 사용자가 검색했던 키워드들을 리스트 형식으로 제공해 준다. 또한, 사용자가 입력한 검색어의 위치 정보를 추출하여 검색 결과에서 해당 키워드를 강조하여 보여주고, 검색 결과 검색어 내용 요약 제공 및 자료 출처, 첨부파일 정보를 제공한다. 검색 옵션도 지원하는데, TAB을 활용하여 검색 결과를 업무 시스템별로 구분하여 출력하고 검색된 검색 결과에 대해 다양한 소팅 옵션(Sorting Option)을 제공한다.(정확도, 제목, 등록일 순 등) 사용자가 검색 창에 몇 글자만 입력해도 자동으로 사용자가 원하는 검색어와 확장 검색어를 표시해 주는 기능과 사용자가 입력한 검색어와 다른 사용자들이 동일한 키워드로 검색했던 검색 패턴을 분석하여 연관도가 높은 검색어를 추천해 주는 연관 검색어 확장 기능을 제공한다. 뿐만 아니라, 검색 범위, 검색 기간, 검색 연산자를 사용하여 보다 정밀한 검색 모드를 제공하고, 사이트의 특성에 따라 기능 추가/삭제가 가능하다. 그리고 화면 이동 없이 바로 상세검색을 실행할 수 있는 사용자 인터페이스(User Interface, UI)를 제공하며, 검색 결과를 포함하고 있는 해당 웹페이지를 미리 볼 수 있는 기능을 제공한다.[2]
- 사용자 인터페이스 확장 기능
- 검색 결과를 서비스 형태의 화면으로 구성하여 사용자가 원하는 정보에 빠르고 쉽게 접근할 수 있도록 관련 정보를 제공하는 검색 기능과 테마를 손쉽게 생성하고 관리할 수 있는 관리 시스템을 제공하는 테마 검색 기능을 제공한다. 그리고 게시물별로 등록된 키워드들의 집합인 태그를 검색하는 기능을 제공하는데, 검색 질의에 해당하는 정확한 콘텐츠 검색이 가능하다. 또, 태그 정보를 사용자 스스로 만들 수 있기 때문에 유기적인 검색 집단지성체계 구축이 가능한 태그기능을 제공한다. 그리고 스마트 서치 기능을 제공하는데, 중요한 데이터베이스를 스키마별로 그룹화하여 검색 결과를 제공하므로 기존의 검색 결과 나열 방식의 한계점을 보완했으며, 사용자에게 정형화된 정보 검색의 편리성을 제공하고, 검색 결과 화면이 사용자가 원하는 정보에 빠르고 쉽게 접근할 수 있는 형태로 구성되었다. 마지막으로 시맨틱 검색을 제공하는데, 통합된 정보를 의미적으로 연결하여 지식 공유를 위한 정확한 검색 및 내비게이션이 가능한 시스템으로 구성되어 있으며, 검색 엔진과 온톨로지를 추가 구성하여 온톨로지를 기반으로 추론을 하여 의미 있는 정보를 추출할 수 있도록 구성했다.[2]
- 데이터 정합성 검출 : 기업 및 공공기관에서 보관하고 있거나 자료 이관 등 재구축된 전자문서의 파일 손상, 디지털권리관리(Digital Rights Management, DRM), 암호화, 파일 포맷 변경 등 전수조사가 불가한 환경에서 숨어 있는 다양한 오류를 자동 검증하는 솔루션으로 최대한 중요 전자문서의 무결성을 검증한다.
- 특정(개인)정보 검출 : 전자문서나 이미지 문서 내 특정(개인)정보 검출을 지원한다. (특정정보 마스킹 후 뷰어 연동)[3]
- 색인 기능 : 전체 색인
- 검색 기능 : 일반 검색, 상세 검색(검색 범위 지정, 연산자, 검색 결과수별 표시), 결과 내 검색
- 관리 기능 : 검색엔진 관리, 색인 데이터베이스 관리, 불용어 관리, 사용자 관리, 자바가상머신(Java Virtual Machine, JVM) 모니터링 등[4]
구성
- 어드민 매니저(Admin Manager) : 아이트리니티의 모든 프로세스 관리를 담당한다.
- 인덱스 매니저(Index Manager) : 인덱스 테이블의 생성 및 수정, 삭제 등을 관리한다.
- 서치 매니저(Search Manager) : 검색 사용을 위한 메모리, 동시 사용자 등을 관리한다.
- 딕셔너리 매니저(Dictionary Manager) : 명사 사전, 불용어 사전, 시소러스 사전 등을 관리한다.
- 서치 코디네이터(Search Coordinator) : 인덱스 매니저에서 생성된 데이터베이스로 검색요청을 처리한다.
- 인덱스 서처(Index searcher) : 사용자 검색 요청 발생 시 인덱스 데이터베이스와 연계 유지를 관리한다.
- 쿼리서브클래스(QuerySubclass) : 사용자에 의해 주어진 검색식을 질의 문장에 맞게 변환한다.
- 쿼리페이서(QueryPaser) : 사용자에 의해 주어진 검색식을 처리하여 가장 적합한 자료를 전달한다.
- 서치스레드(SearchThread) : 다수 사용자 발생 시 스레드 생성으로 로드밸런싱을 유지한다.
- 인덱스 코디네이터(Index Coordinator) : 인덱스 매니저에서 정의한 색인방식으로 색인 데이터베이스를 처리한다.
- 인덱스 서처(Index searcher) : 사용자 검색 요청 발생 시 인덱스 데이터베이스와 연계 유지 관리한다.
- 스트립페이서(StripPaser) : 전자문서 색인 시 전자문서 내 텍스트를 추출한다.
- 스테머(Stemmer) : 각 언어별 문장 내 색인어를 추출한다.
- 스케줄러(Scheduler) : 인덱싱(Indexing) 주기를 관리한다.
- 리포팅(Reporting) : 인덱싱 로그를 관리한다.
- 인덱스스레드(IndexThread) : 대량의 색인 발생 시 멀티 인덱싱 처리를 위한 스레드를 생성한다.
- 인덱스데이터베이스(IndexDB) : 색인 데이터베이스가 증가하면 검색 및 색인 성능을 위하여 사이즈를 자동 분할하여 멀티 인덱스 데이터베이스를 구성한다. 인덱스 파일 포맷은 자체 구조 생성한다.[2]
운영환경
동향
㈜아이알에스소프트코리아가 하드웨어와 소프트웨어에 종속되지 않은 운영환경을 지원함으로써 시스템 확장과 환경변화에 기민하게 대응할 수 있는 새 검색엔진으로 급성장하고 있다. ㈜아이알에스소프트코리아는 아이트리니티를 내세워 2010년 기준, 지난해 대비 42%의 매출 성장을 기록했다. 매출 규모는 비록 작지만 ㈜아이알에스소프트코리아는 강력하고 고도화된 검색을 통해 고품질 검색 결과로 승부를 걸고 있다. 2009년에는 국무총리실 국정 관리 DR 센터 통합검색을 구축했으며, 2008년에는 KBS의 인터넷 뉴스 검색 시스템을 구축했다. 2005년 7월 설립해 업계 경험이 5년밖에 되지 않은 중소 검색엔진 기업이 공공분야에서 이런 성과를 내기는 매우 힘든 게 사실이다.
김상욱 대표는 "앞으로는 민간분야 진출을 본격화할 계획"이라며 "검색 시장에 규모와 브랜드를 앞세운 '스윙 마케팅'이 등장하고 있지만, 나만의 검색엔진 개발로 틈새시장을 얼마든지 파고들 수 있다"고 자신했다. ㈜아이알에스소프트코리아는 작은 규모에도 불구하고 웹 포털 검색 시스템에서부터 KMS/EDMS 그룹웨어 검색 시스템, 정보 수집 시스템 구축까지 토탈 솔루션을 제공한다. 이는 대용량 데이터베이스를 수용하는 자체 알고리즘을 설계할 수 있는 능력에서 비롯됐다. 자체 엔진의 부하가 적기 때문에 반응이 신속할 뿐 아니라 검색 부가기능들을 쉽고 효율적으로 활용할 수 있다. ㈜아이알에스소프트코리아는 2009년 위축됐던 검색시장이 2010년부터 회복에 들어가 앞으로는 성장 폭이 커질 것으로 보고 '아이트리니티'를 전면에 내세워 공격적인 마케팅을 펼칠 계획임을 밝혔다.[5]
각주
- ↑ 소프트웨어시험인증연구소 GS인증 2등급 제품 목록 - http://sw.tta.or.kr/product/prod_ctsa_view.jsp?no=136&pa=1591b8d48b3f73d05487bd81e1ccc98f
- ↑ 2.0 2.1 2.2 2.3 ㈜모캣 공식 홈페이지 검색엔진 솔루션 - http://www.mocat.co.kr/sub4/sub4_2.html
- ↑ 3.0 3.1 ㈜아이알에스소프트코리아 공식 홈페이지 - http://www.irskorea.co.kr/
- ↑ 4.0 4.1 나라장터종합쇼핑몰 아이트리니티 Ver4.0 - http://www.g2b.go.kr:8092/sm/pp/goods/SMPPGoodsDtlInfoPopup.do?cntrctGoodsMngNo=001750250011#goodsAtrbInfoSection
- ↑ 이규화 기자, 〈아이알에스 신개념 검색엔진 뜬다〉, 《디지털타임스》, 2010-12-21
참고자료
- 소프트웨어시험인증연구소 GS인증 2등급 제품 목록 - http://sw.tta.or.kr/product/prod_ctsa_view.jsp?no=136&pa=1591b8d48b3f73d05487bd81e1ccc98f
- ㈜모캣 공식 홈페이지 검색엔진 솔루션 - http://www.mocat.co.kr/sub4/sub4_2.html
- ㈜아이알에스소프트코리아 공식 홈페이지 - http://www.irskorea.co.kr/
- 나라장터종합쇼핑몰 아이트리니티 Ver4.0 - http://www.g2b.go.kr:8092/sm/pp/goods/SMPPGoodsDtlInfoPopup.do?cntrctGoodsMngNo=001750250011#goodsAtrbInfoSection
- 이규화 기자, 〈아이알에스 신개념 검색엔진 뜬다〉, 《디지털타임스》, 2010-12-21
같이 보기