엑스퍼서치
엑스퍼서치(eXperSearch)는 이종경 대표가 설립한 ㈜엑스퍼넷의 기업 통합검색 솔루션이다.
개요[편집]
엑스퍼서치는 ㈜엑스퍼넷에서 개발한 기업 통합검색 솔루션으로, 대용량 데이터베이스(DB), 문서, 웹콘텐츠 등 다양한 유형의 정보를 신속하고 정확하게 검색하여 기업의 업무 효율성을 극대화함으로써 업무 생산성을 높이고 기업 경쟁력을 강화한다. 대규모 환경에 적합한 성능 및 대용량에 특화된 분산 구조로, 향후 시스템 확장성 및 가용성을 보장하는 동시에, 다양한 플랫폼 및 사이트 환경에 유연한 아키텍처로 구성되어 구축 환경에 따라 커스터마이징이 가능하다.[1]
특징[편집]
엑스퍼서치는 다양한 정보와 많은 형식의 데이터, 그리고 대용량화돼 가는 정보들을 검색하기 위해 개발된 유연한 구조의 전문 검색엔진이다. 대용량 분산 처리 검색엔진이기 때문에 원하는 정보를 신속하게 수집할 수 있다. 우선 대용량 데이터베이스 기술을 통해 많은 양의 문서와 그 문서에서 나오는 단어들을 하나하나 연관지어 색인하고 이를 빠르게 검색한다. 질의어가 두 단어 이상으로 이루어졌을 경우, 문서 내에서 단어가 갖는 위치정보를 이용한다. 이 기술은 특허도 출원돼 있다. 또, 엑스퍼서치는 자연어 형태로 구성된 문서에서 자동으로 키워드를 추출해 낼 수 있어 검색의 정확도를 높일 수 있다. 이외에도 대용량 데이터베이스, 문서, 웹콘텐츠 등 기업이 보유한 다양한 유형의 정보에 신속하고 정확하게 검색이 가능하다. 문서 수가 증가하더라도 검색의 성능은 일정하게 유지된다. 엑스퍼서치는 사용자의 요구사항을 적극 반영, 관리 기능을 대폭 개선해 웹 방식의 편리한 통합 사용자 인터페이스(UI)를 제공하고 있다. 사용자는 통합 사용자 인터페이스를 통해 검색 현황을 분석하고 기타 통계 정보, 사전 관리 기능, 인기 검색어 관리, 데이터 관리에 대한 랭킹 기능을 이용할 수 있다.[2]
기능[편집]
- 색인 및 검색 데이터 유형
- 모든 사용 관계형 데이터베이스 관리 시스템(RDBMS)에 대한 색인 기능과 인터넷 웹 문서에 대한 자동 방문 및 색인 기능을 지원하고, HTML, XML, 텍스트, MS오피스, PDF, HWP, 훈민정음 등 주요 문서 포맷에 대한 검색 기능을 지원한다. 또한, 바이너리 라지 오브젝트(BLOB, Binary Large Objects), 캐릭터 라지 오브젝트(CLOB,Character Large Objects)와 같은 대용량 필드 색인을 지원하고, 로터스 노츠(Lotus Notes), KMS/EDMS 리포지토리 등에 대한 연동 색인을 지원한다.[1]
- 색인 기능
- 실시간 인덱싱 기능을 지원하고, 색인 데이터 변경/삭제 관리 기능을 지원한다. 색인 데이터 크기는 제한이 없으며, 색인 데이터 관리를 위해 색인 그룹의 논리적 분석기능을 지원한다. 그리고 다양한 단어 추출 방법(복합 색인 가능)을 지원한다. (형태소 분석, 토큰, N-Gram, Bi-Gram, 서브스트링 및 이들의 복합 색인)[1]
- 검색 기능
- 불리언/괄호 연산자, 구문검색, 근접검색 등 자연어 검색 및 다양한 검색 옵션을 제공하고 색인그룹, 관련성, 날짜, 필드별 정렬 등 다양한 검색 정렬 기능을 제공한다. 그리고 불리언/숫자/날짜 구간 및 스트링값 지정, 리스트 수 조절 등 다양한 검색 선택 조건 필드를 제공하며 단어, 문서의 식별성 및 관련성, 문서 내 단어 응집성, 필드별 가중치 조절, 매칭률에 따른 가중치 조절 등 검색 관련성 랭킹 기능을 지원한다.[1]
- 다양한 검색방법의 지원
- 자연어 검색, 키워드/불리언 검색, 근접 검색을 지원하고 필드별 가중치 적용 기능, 결과 내 재검색 기능을 지원한다. 그리고 고급 검색(필드별 검색, 기간 내 검색, 기타 옵션 검색 등) 기능을 지원하고 에이잭스(Ajax) 기능을 이용한 검색결과 처리 기능을 지원한다. 또한, 검색 결과의 품질 만족도를 높일 수 있는 높은 정확도를 보장한다. 즉, 문서 내 단어의 위치 정보를 이용한 관련성 계산방법을 이용한 정확한 검색 알고리즘 기술을 적용하여 관련성 검색 기능을 지원하고, 특정 필드의 경우 질의어의 길이와 해당 필드의 길이에 대한 비율을 고려한 알고리즘 기술 적용을 지원한다.[1]
- 검색 편의성
- 검색어 자동완성, 검색결과 내 하이라이팅, 유사어 확장 검색, 검색결과에 대한 다양한 정렬 기능을 지원한다. 그리고 자동 요약과 빠른 검색처리를 위한 원타임쿼리(One Time Query)를 지원한다. 원타임쿼리란, 질의를 그룹지어 한 번 전송하고, 결과를 그룹별로 한 번 받는 검색의 형태이며, 질의어 및 그 결과에 대한 전송을 위한 네트워크 연결 비용을 최소화하여 성능 향상에 기여한다.[1]
- 관리 기능
- 색인그룹 관리 및 모니터링, 관리자 계정 설정, 검색 통계 등 웹 기반 관리 기능을 지원하고, config 파일을 통한 색인정보 등록, API를 이용한 문서 등록 기능 등 간편한 설정 관리 기능을 지원한다. 또, 디스크 관리, 검색어 사전 등 시스템 최적화 관리 기능을 제공한다.[1]
사양[편집]
- 지원 플랫폼(OS)
- 유닉스 : 솔라리스(Sun Solaris), HP-UX, IBM AIX
- 윈도우즈 : 마이크로소프트 윈도우즈 NT(Microsoft Windows NT), 2000 서버, 2003 서버, 비스타, 2008 서버
- 리눅스 : 레드햇(RedHat) 리눅스[1]
- 지원 콘텐츠 유형
- HTML, XML, 텍스트, MS 오피스, PDF, HWP, 훈민정음 등 주요 문서 포맷 지원(총 100여 종의 파일 포맷에 대한 검색 지원)
- 범용 관계형 데이터베이스 관리 시스템의 데이터베이스 검색 지원 (오라클(Oracle), 에스큐엘 서버(SQL Server), 사이베이스(Sybase), 데이터베이스2(DB2), 마이에스큐엘(MySQL), 인포믹스(Informix), ODBC, Free RDB 등)
- 로터스 노츠, KMS/EDMS 리포지토리 연동 색인 지원[1]
- 하드웨어 시스템 사양
- CPU : 선 스팍(Sun Sparc) 기준 4 CPU, 3.0 GHz급 이상
- RAM : 권장 4GB 이상
- 하드디스크 : 최소 100MB / 권장 30GB 이상 (색인 및 검색 범위, 검색 로그 활용 정책에 따라 달라짐)[1]
특허[편집]
엑스퍼서치가 검색 품질 정확도 향상을 위한 문서 검색 기술로 특허를 취득했다. 특허를 받은 해당 기술명은 '색인 단어의 문서 내 위치 정보에 대한 관련성을 이용한 문서 검색방법'에 관한 내용으로서, 검색 질의어가 두 단어 이상으로 된 경우, 검색 대상 문서 내의 각 단어가 갖는 위치 정보를 이용해 일정 단어 거리 이내의 군집을 형성한 질의어에 대해 색인정보와의 매칭 관련성을 순위화해 검색결과로 제공하는 기술이다. 예를 들어 '김하늘의 데뷔작'을 검색할 경우 '김하늘'과 '데뷔작' 등을 결과값을 연계해 이용자가 원하는 정보를 더욱 신뢰성 있게 찾아낼 수 있도록 하는 기술이다. 이 특허는 사용자가 원하는 문서 내의 겸색결과를 보다 정확하게 보여주게 되어 검색 만족도를 극대화하는 동시에 재검색을 시도하는 검색 재현율을 최소화해 검색속도 향상과 검색엔진 성능 향상을 도모할 수 있게 된다. 즉, 대용량 데이터베이스, 문서, 파일, 웹콘텐츠 등 기업들이 보유한 방대한 정보뿐 아니라, 인터넷 서비스 등 트래픽이 많이 요구되는 대규모 검색 환경에 보다 유연하게 대처할 수 있으며 검색 본연의 품질을 확고히 보장할 수 있다.[3]
사례[편집]
- 패션 검색 사이트 비주 론칭
엑스퍼서치에 이미지 검색 기능을 도입한 패션 검색 사이트 비주(VIZOOO)를 론칭했다. 당시 비주는 인터파크, CJ몰 등과 제휴하며 패션 검색 사이트로 조금씩 이름을 알리고 있었다. 이종경 사장은 "패션 검색 사이트 비주와 멀티미디어 이미지 검색 사업을 병행하고 있다"면서, "최근 공공기관을 비롯한 몇몇 고객사에 멀티미디어 검색과 유해차단 솔루션을 통합 개발해 공급하는 등 우리가 가진 모든 기술을 총집합시켜 볼 수 있는 다양한 방법을 고민 중"이라고 밝혔다.[4]
- 엘아이지손해보험 통합검색 구축
엘아이지손해보험(LIG손해보험, 현 케이비손해보험)은 다양한 콘텐츠의 활용성과 정확성을 높이기 위한 안정적인 검색 환경 구축이 중요한 이슈로 떠올랐다. 이미 엘아이지손해보험은 외산 솔루션인 울트라시크(Ultraseek)를 사용하고 있었으나, 검색 코어엔진의 커스터마이징의 한계와 검색의 정확성 및 성능면에서 외산 솔루션의 한계를 느끼고 있었다. 각 내/외부 사용자에게 맞는 다양한 검색 기능을 보강하고 빠른 검색 속도와 정확성을 위해 대용량 통합검색 솔루션인 엑스퍼서치를 도입했다. 이로써 엘아이지손해보험은 기존 검색 서비스의 개편 및 확장의 효과를 얻었다. 사용자 편의성을 극대화한 사용자 인터페이스 개선과 환경에 맞는 커스터마이징을 통해 쉽고 빠르게 콘텐츠를 검색할 수 있게 되었다. 또한 사용자 권한별 검색을 통한 높은 정확도의 검색 결과뿐 아니라 권한에 맞는 검색 결과만 볼 수 있게 하는 등의 차별화된 검색화면을 얻을 수 있게 되었으며, 검색속도 향상, 변경/추가된 데이터의 빠른 검색 반영 및 다양한 분류(소팅, Sorting)/랭킹 서비스를 제공할 수 있게 됐다.[5]
- 개인정보 취약점 분석 솔루션 레드스캔 출품
㈜엑스퍼넷은 개인정보의 노출을 완벽히 막을 수 있는 필터링 솔루션 레드스캔(RedScan)을 출품했다. 이 제품은 개인정보 노출 진단 및 필터링 솔루션으로, 크게 개인정보 노출 진단 스캐닝 모듈과 개인정보 및 콘텐츠 필터링 모듈 등 두 개의 시스템으로 구성돼 있다. 스캐닝 모듈의 경우 홈페이지 웹콘텐츠, 게시판에 대한 개인정보 노출 현황을 진단하고 첨부파일에 담긴 개인정보 내용을 검사, 페이지의 노출 취약성을 감지 해결한다. 이 모듈은 개인정보별 검출 건수, 위치 확인 등의 검사 결과로 바로 이동할 수 있는 '콘텐츠 바로가기'기능을 제공하고 관리자 페이지 노출 취약성 탐색과 관리자 정의 사이트 내 특성 패턴, 단어 검사를 할 수 있어 편리하다. 필터링 모듈은 게시판 등의 사용자에 의한 신규 콘텐츠 유입 시 사전에 탐지해 블로킹하고, 기존 데이터베이스 중 개인정보의 사용자 화면 출력 시 사용자 화면 치환을 통해 암호화 처리해 개인정보를 확인할 수 없도록 해 준다. 또, 관리자 정의 기능을 이용하면 욕설 등 금지어 필터링이 가능하다. 이 모듈을 이용, 레드스캔은 주민등록번호, 사업·법인 번호, 은행 계좌번호, 핸드폰번호, 이메일, 신용카드 등의 개인정보뿐만 아니라 첨부파일(hwp, doc, ppt, xls, pdf, zip)까지 정보 유출 검사가 가능하다. 특히, 진단결과 및 현황에 대한 HTML, 엑셀 파일 등의 다양한 리포트를 제공해 편리하게 사용할 수 있다. 또 블로킹을 통한 데이터베이스 입력 제한 기능이 있어 사용자가 입력하는 신규 데이터에 대한 개인정보 필터링이 가능하다. 이종경 ㈜엑스퍼넷 사장은 "레드스캔은 ㈜엑스퍼넷 검색엔진인 엑스퍼서치의 엔진 및 기술을 응용한 솔루션"이라며 "개인정보 노출 진단 스캐닝 모듈과 개인정보 및 콘텐츠 필터링 모듈 등 두 개의 시스템으로 구성해 스캐닝과 필터링 두 기능 모두 전문화할 수 있도록 했다"고 말했다.[6]
- 연세대 동영상 검색 기술 이전
㈜엑스퍼넷은 연세대학교 산학협력단의 특허기술인 'MPEG7 기반 동영상 검색 시스템' 기술을 이전 받았다. 기술 이전을 통해 ㈜엑스퍼넷은 "기존 웹 검색 엔진인 엑스퍼서치에 동영상 및 이미지 검색 기술을 통합해 국내 최초의 멀티미디어 검색 서비스를 제공할 것"이라고 설명했다. 기술 이전을 통해서 개발된 검색엔진에서는 샘플 이미지나 샘플 동영상을 질의어로 입력해 비슷한 영상을 검색할 수 있게 됐다. 기존의 이미지, 동영상 검색은 사람이 직접 입력한 메타데이터 정보만을 대상으로 검색했었다. ㈜엑스퍼넷은 기술 이전을 통해 기존 텍스트 기반 검색에 내용 기반 검색을 통합하는 것을 계획했다. ㈜엑스퍼넷 이종경 사장은 "이번 기술 이전으로 다국어 검색 기능에 멀티미디어 검색 기능을 통합해 이미 포화된 기존 검색 시장에서 새로운 블루오션을 개척할 것"이라며 "더불어 국내시장에 국한되지 않고 해외시장 진출을 적극적으로 모색하겠다"고 말했다. [7]
각주[편집]
- ↑ 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 디비가이드넷 공식 홈페이지 - http://www.dbguide.net/solution.db?cmd=view&solutionUid=522&categoryUid=&boardStep=1&movePage=2
- ↑ 허정윤 기자, 〈(신SW출품작)8월 첫째주 총평〉, 《네이버 뉴스》, 2008-08-05
- ↑ 도안구 기자, 〈엑스퍼넷, 검색솔루션 특허 취득〉, 《네이버 뉴스》, 2008-04-15
- ↑ 장윤정 기자, 〈(CEO in G밸리) 이종경 엑스퍼넷 사장〉, 《네이버 뉴스》, 2009-05-21
- ↑ 성현희, 〈기업용 검색 엔진 도입 사례 퍼레이드〉, 《디지털투데이》, 2008-06-25
- ↑ 문보경 기자, 〈(신SW대상 추천작)12월 셋째주〉, 《네이버 뉴스》, 2007-12-18
- ↑ 심재석 기자, 〈엑스퍼넷, 연세대 동영상 검색 기술 이전〉, 《디지털데일리》, 2007-07-19
참고자료[편집]
- 디비가이드넷 공식 홈페이지 - http://www.dbguide.net/solution.db?cmd=view&solutionUid=522&categoryUid=&boardStep=1&movePage=2
- 허정윤 기자, 〈(신SW출품작)81월 첫째주 총평〉, 《네이버 뉴스》, 2008-08-05
- 도안구 기자, 〈엑스퍼넷, 검색솔루션 특허 취득〉, 《네이버 뉴스》, 2008-04-15
- 장윤정 기자, 〈(CEO in G밸리) 이종경 엑스퍼넷 사장〉, 《네이버 뉴스》, 2009-05-21
- 성현희, 〈기업용 검색 엔진 도입 사례 퍼레이드〉, 《디지털투데이》, 2008-06-25
- 문보경 기자, 〈(신SW대상 추천작)12월 셋째주〉, 《네이버 뉴스》, 2007-12-18
- 심재석 기자, 〈엑스퍼넷, 연세대 동영상 검색 기술 이전〉, 《디지털데일리》, 2007-07-19
같이 보기[편집]