서치포뮬러원
서치포뮬러원(Search Formula-1)은 와이즈넛(대표 강용성)이 개발한 빅데이터 분석/대용량 통합검색/시맨틱/마이닝/중복문서처리 등의 주요기술을 접목한 통합검색 솔루션이다.
개요
서치포뮬러원은 초기 설계 시부터 대량의 데이터에 대한 신속한 처리, 안정적인 구동, 효율적인 리소스 사용까지 감안하여 개발된 검색 엔진으로, 출시 이래 현재까지 국내 최다 고객사에 제공된 검증된 제품이다. 이런 사업 경험을 통해 누적된 노하우는 보다 전문적인 검색 컨설팅과 보다 효율적인 커스터마이징을 가능하게 하여 조직의 환경, 조건에 최적화된 검색을 가능하게 해 준다. 대량의 자료가 기하급수적으로 쏟아지고 채널과 디바이스가 점차 다양화되어 가는 최근 컴퓨터 환경 속에서, 정보 경쟁력은 개인과 조직 모두에게 핵심 역량이 되고 있으며, '정보로의 접근통로'로서 검색의 중요성은 날로 강조되고 있다. 검색 분야에선 이런 시대의 흐름에 발 맞추기 위해 다양한 최신 기술과 시도들이 등장하고 있다. 특히 대량의 자료들을 빨리 찾아주던 기존의 '볼륨형 검색'은 이제, 효율적이고 체계적으로 자료들을 정보화하고 이들 정보들 속에 숨겨진 가치까지 찾아주는 '밸류형 검색'으로 진화하고 있다.
특징
- 한글 처리의 정교화, 다양한 정렬/랭킹 기능 지원
- 서치포뮬러원은 어떤 검색엔진보다 정교한 한글 처리가 가능하다. 자체 개발한 한글 형태소 분석기와 전담팀으로 구성된 고품질의 산전을 통한 자연어 검색 기능은, 잘못 입력된 질의어에 대한 단어 추천, 질의어 확장 등을 가능하게 한다. 또한 정렬 및 랭킹 알고리즘은 기본적으로 제공되는 것 이외에 사용자가 직접 설정할 수 있도록 하여 검색결과의 적합성을 한층 더 높였다.
- 동적 색인, 실시간 필드 업데이트 지원, 인메모리 지원
- 서치포뮬러원은 데이터 소스의 변경사항만을 색인할 수 있는 동적 색인을 지원한다. 따라서 서비스를 멈추지 않고 데이터 소스의 변경사항을 실시간으로 검색 결과에 반영할 수 있다. 또한, 데이터를 메모리 적재하는 인메모리 기술을 통해 보다 신속한 검색을 지원한다.
- 다양한 시스템과의 연동, 다양한 플랫폼 지원, 비정형 데이터 검색 등 지원
- 서치포뮬러원은 다종의 시스템(ex. DBMS, 웹사이트 등)과 다양한 플랫폼(ex. 윈도우즈 2000, 선(Sun) OS, 리눅스, HP-UX, AIX) 내의 데이터에 대해서도 폭넓게 통합검색이 가능하다. 또한, 문서 수집기를 통해 별다른 추가 개발 없이도 MS오피스 계열, 한글, 훈민정음, PDF 등 비정형 문서까지 검색할 수 있다.
- XML 형태의 설정 파일, 색인압축, 멀티 플랫폼 지원
- 서치포뮬러원은 3계층(3-tier)의 분산 구조로 설계되어 서버 확장이 용이하다. 뿐만 아니라 XML 방식의 환경 설정 파일, 다양한 플랫폼 지원이 가능한 쿼리 API, 다양한 형태의 수집모듈, 주요 모듈들에 대한 원격 제어 지원 등은 관리자 혹은 개발자가 최소한의 작업으로도 원하는 작업을 수행할 수 있는 환경을 지원한다.
- 대용량 분산 처리 구조, 서버/색인 이중화, 병렬 처리, 색인 압축 등
- 서치포뮬러원은 대용량 웹검색 엔진을 구현한 노하우를 기반으로 대용량 데이터에 대한 검색을 효율적으로 수행하기 위한 분산 처리 구조로 구성되어 있다. 또한, 서버와 색인의 이중화를 통해 무중단 서비스가 가능하며 멀티 스레딩, 멀티 프로세스 등의 병렬 처리는 대용량 데이터에 대해서도 효율적인 운영을 지원한다.
- 시스템 모니터링, 모듈 관리, 검색어 관리, 검색 통계 보기, 사전 관리 등
- 서치포뮬러원의 관리도구는 각종 관리 기능들을 손쉽게 관리할 수 있는 웹 기반 환경에서 운영된다. 관리도구에선 시스템 및 기본 모듈들의 모니터링/설정, 검색어 관리, 검색 통계 조회, 사전 관리 등에 대한 관리 기능을 제공해 운영자가 직관적, 효율적, 안정적, 즉각적으로 검색 시스템을 운영할 수 있게 해 준다.
기능
대용량 초고속 통합검색을 지원하고, 자연어 검색 등 다양한 검색 방식을 지원한다. 그리고 권한별 검색기능으로 사용자 권한에 따른 검색결과를 제공한다. 언어 처리에 있어서는 유니코드 기반 다국어 검색을 지원하고, 형태소 분석기를 탑재했다. 색인 기능으로는 n-gram, 토큰 등 다양한 정적/동적 색인 방식을 지원한다. 또한, 날짜별, 중요도별 랭킹 등 다양한 정렬 기법과 다중 필드, 필드별로 정렬하는 결과 처리 기능을 지원한다. 관리 기능으로는 사용자 편의성을 고려한 웹 기반 관리 도구를 제공하며 시스템을 모니터링하고, 인기 쿼리 통계, 인기 검색어 관리, 사전 관리 도구를 제공한다. 그리고 검색어 로그 보기 및 기간별 검색통계 조회 기능을 제공한다. 수집 대상 데이터 증가를 대비한 데이터 분산 기능과 사용자 증가를 대비한 트래픽 분산 기능을 제공하고, 부가 기능으로는 인기 검색어/추천 검색어/실시간 검색어/검색어 자동 추천/오토 하이퍼링크/하이라이팅/테마 검색을 지원한다.
운영환경
하드웨어
- CPU : Intel Xenon Quad Core, 2.13GHz 이상 권장/Dual Core, 2.00GHz 최소
- RAM : 8GB 이상 권장 / 4GB 최소
- 하드디스크 : 최소 100GB 이상
- 스토리지 지원 : DAS, SAN, NAS
- 이더넷 : 100Mbps 이상
운영체제
- 마이크로소프트 윈도우즈(Microsoft Windows) 2003/2008 Standard Server (32비트/64비트)
- 리눅스 계열 운영체제
- AIX 5.1 이상
- HP-UX 11.x 이상
- 선 OS 9/10 이상
기타 소프트웨어
- 마이크로소프트 인터넷 익스플로러(Microsoft Internet Explorer, IE) 7, 8, 9
- 구글 크롬(Google Chrome) 9 이상
- 모질라 파이어폭스(Mozilla FireFox) 3.5, 4, 5, 6
- 플래시 플러그인(Flash plug-in) 10 이상
각주
참고자료
같이 보기
이 문서는 로고가 필요합니다.