레피아
레피아(Repia)란 ㈜레피아에서 순수 자체 기술로 개발한 개발한 검색엔진이다.
목차
개요
레피아는 국내 최초의 검색 솔루션이었던 까치네가 1995년 개발 및 서비스를 실시한 이후로 1999년 금강개발산업이 인수해 사내 벤처기업 형태로 운영하다가 현대백화점측에 인수되고 2000년에 까치네가 'e-현대백화점'으로 바꾸고 인터넷 쇼핑몰 운영사로 바꾸자 연구진 일부가 나와서 2000년 부터 주식회사 ㈜레피아컴을 설립 하였다. 검색 솔루션(Solution)인 레피아서치서버가 순수 자체기술로 개발되어서 외국산 검색엔진들에 비해 커스터마이징이 용이하며, 하루에 수백만 검색 쿼리를 처리하는 포털 사이트의 검색서비스에 사용되었던 컴포넌트(Component)들로 구성돼 대용량의 콘텐츠와 트래픽을 안정적으로 지원한다. 또, 검색속도와 검색 결과의 정확성, 웹 기반의 시스템 관리 툴, API 제공을 통한 유연한 확장성을 가지고 있다. 2004년도에는 데스크톱 검색보다 앞선 기능으로 인트라넷 내부의 PC와 파일서버에 있는 자료를 수집해 개인별, 그룹별, 자료유형별로 권한을 가지고 검색할 수 있는 제품을 개발했다. 레피아서치서버는 멀티프로세스 방식의 강력한 자료 수집기(Spider)와 정형 및 비정형 문서를 동일한 컬렉션과 파티션 단위로 관리할 수 있는 색인기(Indexer)를 제공해 사용자들에게 실시간 검색과 정확한 검색결과를 제공한다. 이 솔루션은 관리자가 그룹화한 검색대상 자료들로 부터 추출된 전체 단어들과 관련 정보를 '컬렉션'이라는 단위로 관리할 수 있도록 해 용이성을 높였다. 2005년 당시 레피아서치서버는 재정경제부, 통일부, 농림부 등 공공기관과 LG투자증권, 대우증권, 신세계건설, LG산전, 한국과학기술원, 숭실대, 광운대 등과 같은 교육기관까지 150여 곳에 구축되었고, 현재까지 더 많은 지자체, 대학, 기관, 기업에서 이용되고 있다.[1]
연혁
- 1995년 12월 : 국내 최초 인터넷 검색엔진 개발 및 서비스 실시 - 인터넷 검색엔진 "까치네" 개발 및 운영
- 2000년 04월 : 주식회사 ㈜레피아컴 설립
- 2001년 10월 : 중소기업청 "기술혁신 중소기업(INNO-BIZ기업)" 선정
- 2002년 04월 : 정보통신부 "우주신기술(IT)" 인증
- 2003년 05월 : 제 4회 대한민국 디지털 경쟁력 향상대회 "통합검색엔진기술 부문" 대상 수상
- 2004년 07월 : 한국인터넷 진흥원 “전파식별(RFID) 검색시스템 시범 구축 업체” 로 선정
- 2005년 02월 : 국내 최초의 검색전문기기 “Repia Search Appliance S/E/K 시리즈” 출시
- 2006년 07월 : 통합검색엔진 Repia Search Server(RSS) v3.0 출시
- 2007년 07월 : 통합검색엔진 Repia Search Appliance(RSA) v3.5 출시
- 2008년 03월 : 하나TV 통합검색시스템 수주
- 2008년 05월 : 두산 인프라코어 통합검색시스템 구축
- 2008년 07월 : 국가보훈처 통합검색엔진 구축
- 2008년 08월 : 통합검색엔진 Repia search Apliance(RSA) ‘Good Software 인증’ 획득
- 2008년 11월 : 현대해상 통합검색시스템 구축
- 2009년 01월 : 현대하이카자동차손해사정 통합검색시스템 수주
- 2009년 04월 : 레미안 홈페이지 통합검색시스템 수주
- 2009년 06월 : 국세청 통합검색시스템 업그레이드 수주
- 2009년 08월 : 인천광역시청 통합검색시스템 업그레이드 수주
- 2009년 10월 : 농촌진흥청 통합검색시스템 업그레이드 수주, 중앙선거관리위원회 통합검색시스템 업그레이드 수주
- 2010년 03월 : 서울시 E-TAX 통합검색시스템 수주
- 2011년 03월 : 현대오토에버 제안문서관리시스템 구축 (검색엔진 기반 개발)
- 2012년 01월 : ㈜레피아로 법인 변경 및 통합검색엔진 Repia Search Server (RSS) v4.0 출시
- 2013년 02월 : 세종특별자치시 구축 및 대전광역시청 업그레이드, 우리투자증권 뉴스시황 검색엔진 업그레이드
- 2013년 08월 : 미래창조과학부 검색엔진 구축 (win-back case)
- 2013년 11월 : 울산광역시청 홈페이지 검색엔진 구축
- 2014년 06월 : 기초과학연구원 내부사이트 검색엔진 구축
- 2015년 04월 : 천안시 홈페이지 검색엔진 구축
- 2015년 06월 : 한국건강가정진흥원 검색엔진 구축
- 2015년 12월 : 전북교육청 홈페이지 통합검색엔진 구축
- 2016년 04월 : 모바일광주 포털 서비스 사이트 통합검색엔진 구축
- 2016년 05월 : 한국해양과학기술원 홈페이지 검색엔진 구축
- 2016년 06월 : 한국공항공사 홈페이지 검색엔진 재구축
- 2017년 01월 : 경제교육포털 홈페이지 검색엔진 구축
- 2017년 08월 : 한양대학병원 홈페이지 통합검색엔진 구축
- 2017년 12월 : 대전광역시의회 홈페이지 검색엔진 구축
- 2018년 01월 : 농림축산식품부 홈페이지 통합검색엔진 구축
- 2018년 02월 : 경남창원시청 홈페이지 통합검색엔진 구축
- 2018년 03월 : 한국문화예숭위원회 홈페이지 검색엔진 구축 [2]
특징
RSS
레피아서치서버(RSS, Repia Search Server)는 하루 수백만 검색쿼리를 처리하는 포탈사이트의 검색 서비스에 사용되는 검색엔진 컴포넌트 위에 개발된 Repia Search Server/Enterprise는 대용량의 콘텐츠 및 트래픽을 안정적으로 지원하며, 정확한 검색결과를 신속하게 제공한다.
- 고성능 실시간 검색 서비스 : 레피아서치서버는 분산·병렬처리 기법을 적용한 자료수집기, 색인기, 쿼리 프로세스(Query Process)로 구성되어 있으며, 이를 통해 사용자들에 대한 안정적이고 확장성 있는 실시간(Real Time) 검색서비스를 제공한다.
- 프로토콜 기반 구조(Decoupled Protocol based Architecture) : 레피아서치서버의 서버내 각 구성요소인 웹스파이더, DB스파이더, 쿼리 프로세스 등은 독립적으로 동작하는 한편, 효율적인 프로토콜의 기반 위에서의 상호연동이 되도록 설계 되었다. 레피아서치서버는 이를 통해 최고 수준의 시스템 확장성을 제공한다.
- 플러그인 구조(Plugin Architecture) : 레피아 서치서버는 성능 향상 모듈이나 새로운 기능을 추가할 경우, 기존 시스템(Legacy System)의 수정없이 바로 플러그인하여 설치할 수 있도록 제공된다.
- 분산 검색서버 지원 : 레피아서치서버는 컬렉션과 검색서버를 지역네트워크(Local Network) 또는 인터넷에 연결된 다중 서버상에 분산 배치할 수 있으며, 이를 통한 부하균형 기술을 적용하여 시스템의 성능 및 확장성을 보장한다.
- 자료수집 측면에서 특징 : 오라클(Oracle), DB2, Infomax, Sybase, MSSQL 등에 저장되어 있는 정형화된 자료를 수집한다. 또, 웹 페이지, HWP, MS-WORD, PDF, PPT, Excel 등의 형태로 저장되어 있는 비정형화된 자료를 수집한다. 프로세스 개수 및 자료수집 속도를 적절하게 설정하여 시스템 자원을 활용할 수 있다. 수집대상 자료의 갱신(Upadate) 주기에 따라 시간대별/일별/월별로 조정 가능하다. 자료보유 웹서버에 동시에 접근할 수 있는 자료수집기의 개수를 조정하여 부하를 조절한다. 세션(Session)을 통한 인증, 쿠키(Cookie)를 이용한 인증, 서버 인증 등 사용자 인증 정보를 필요로 하는 자료를 수집한다.
- 색인 측면에서의 특징 : 정형 또는 비정형과 같은 자료의 구조 또는 웹문서, HWP, PDF 등과 같은 자료의 유형에 관계없이 독립 또는 통합 컬렉션을 생성시킬 수 있다. 하나의 컬렉션은 관리자가 정의한 복수개의 파티션으로 세분화한다. 색인대상 자료의 제목, 본문, 대표단어, 작성자와 같은 메타데이터 필드의 색인여부와 중요도를 조정하여 고품질의 인덱스를 생성할 수 있다. 색인 주기를 자료수집 시스템과 연동하영 시간대별/일별/월별로 조정할 수 있다. 데이터의 발생 이벤트를 감지하여 실시간 색인 처리 기능을 제공한다. 어절단위 색인과 형태소 단위 색인을 지원한다. HWP, PDF, 파워포인트, 워드, 엑셀, HTML 문서와 같은 비정형 문서는 색인과정에서 문서 필터기를 통하여 본문 텍스트와 메타데이터 정보를 추출한 후 전문 검색이 가능하다. 웹문서에 링크되어 있는 BMP, JPG, GIF와 같은 이미지 파일, MP3, MIDI 등의 음악 파일, AVI, MPEG 등의 동영상파일 등을 각종 멀티 미디어 파일들의 정보를 추출하여 정교한 검색이 가능하다.
- 고객 맞춤화 측면에서의 특징 : 웹기반의 관리자 인터페이스를 통하여 검색 화면 디자인을 커스터마이징할 수 있다. 검색엔진이 설치된 웹서버에 전달되는 환경 변수 수정을 통하여 확장된 검색결과 출력형태를 커스터마이징 할 수 있다. 자바서버페이지(JSP, Java Server Page) 툴킷을 활용하여 사용자는 최소의 비용 및 시간 투자로 완벽하게 검색 화면 디자인 및 결과 출력 형태를 커스터마이징 할 수 있다. 검색 메뉴란 검색입력 화면상에서 사용자가 선택할 수 있는 특정 검색범위를 말하며, 관리자가 현재 등록되어 있는 컬렉션들과 컬렉션 내의 파티션 목록을 사용하여 한 개 이상의 검색 메뉴를 등록할 수 있다. 검색 대상 컬렉션 및 파티션들을 출력화면에 어떠한 형태로 섹션을 구성하여 표시할 것인가를 지정할 수 있으며, 각 세션별로 정렬방법, 출력개수, 출력 요약문 크기, 미리보기 요약문 크기 등을 조정할 수 있다. 검색 결과 정렬 개수, 멀티 섹션 검색시 페이지별 출력 개수, 미리보기 요약 크기, 검색 결과 개수 제한, 타겟 설정, 하이라이팅 기능 등을 조정할 수 있다.
RSA
일체형 통합지식 검색 시스템으로 웹사이트 및 기업이나 조직 내/외부에서 생산되는 유용한 정보를 체계적으로 수집, 분류, 활용할 수 있는 통합지식 검색 시스템 구축에 필요한 최적의 하드웨어에 솔루션을 임베디드한 일체형 전문기기이다.
RSA S
- 정확한 검색결과 제공 :
- 검색행위를 분석한 고객서비스 지원 :
- 네비게이션 서비스 지원 :
- 정형화된/비정형화된 자료 통합 검색 :
- 웹 기반의 통합관리 인터페이스 기능 제공 :
- 유지 보수 극대화 방안 :
RSA K
- 동적 스케쥴링 기법을 적용한 고속 병렬자료 수집 :
- 중복문서 수집 제어 :
- 인증필요 웹사이트 자료 수집 :
- 무한루프 상황 탐지 및 제외 :
- 불필요한 영역 추출 및 자료 삭제 처리 :
- 웹사이트별 수집일정 차별화 및 모니터링 :
- 쉽고 편리한 웹기반의 시스템 통합관리 :
- 장애발생 예방 및 신속한 장애대처 방안 제공 :
- 유연한 시스템 통합성 제공 :
- 완벽한 커스터마이징 서비스 제공 :
RSA E
- 정확한 검색결과 제공' :
- 검색결과 그룹핑 :
- 바로가기 서비스 :
- 컨텐츠 가이드 서비스 :
- 자동 한자/한글 전환 검색 :
- 권한별(보안) 검색 :
- 원문 미리보기 :
- 정교한 확장검색 기능 제공 :
- 웹기반의 시스템 통합관리 :
- 장애발생 예방 및 신속한 장애대처 방안 제공 :
- 유연한 시스템 통합성 제공 :
- 검색대상 컨텐츠 :
REKMS
- 정형화된/비정형화된 정보수집 및 분류 :
- 인증 사이트 정보 수집 :
- 완벽한 고객맞춤화 :
- 프로토콜 기반구조 :
- 플러그인 구조 :
- 가치창출의 극대화 :
- 기대효과 :
RWDS
- 디렉토리 서비스 측면 :
- 디렉토리 관리자 측면 :
- 기대효과 :
기능
- 확장성과 안정성이 검증된 솔루션 : 1TB의 데이터량(Volume of Data)를 보장하고 초당조회수(Queries per Second)는 대략 100 QPS정도이며 데이터의 신선도(Freshes of Data)는 1분 미만이다. 탑재되는 시스템의 CPU개수, 메모리 크기, 하드디스크 유형 등에 따라 최적화 할 수 있다.
- 정형/비정형 자료에 대한 통합 검색 : 정형화된 자료와 비정형화된 자료에 대한 통합 검색이 가능하고 구자료와 실시간으로 입력되는 신규자료에 대한 통합 검색이 가능하다. HWP, PDF, XLS, PPT, WORLD, HTML, XML, TIFF 등 다양한 유형의 파일 포맷을 지원한다.
- 유연한 시스템 통합성 : Window/UNIX/LINUX 등 다양한 운영체제를 지원한다. C, JAVA 기반의 소프트웨어 개발자 키트(SDK, Software Developer Kit)등 다양한 개발자 키트를 지원한다. 검색을 위해 CGI, JSP, ASP, PHP, C/S 인터페이스를 위한 API를 지원한다.
- 정확한 검색결과 제공 : 사용자에게 세분화된 검색영역 설정 기능과 정확한 검색결과 제공을 위해서 컬렉션, 파티션 2단계 계층(Two level Hierachy)구조의 색인 파일을 생성하고 검색 범위 설정을 지원한다. 고성능의 정교한 형태소 분석 기술을 이용하여 정확한 자료 검색이 될 수 있도록 지원한다. 신조어, 고유명시, 지역명칭, 이름등 자동 등록을 통해 색인을 지원한다. 신규자료가 등록/수정/삭제 되었을 때 즉시 색인 데이터베이스에 반영하고 색인 데이터베이스 갱신시 전체가 아닌 등록/수정/삭제 정보만을 색인 데이터베이스에 즉시 반영한다.
- 다양한 검색기능 제공 : 정형/비정형 자료 전체를 통합 검색하거나 컬렉션/파티션별로 세분화해서 검색할 수 있으며 자료 유형에 따은 선택 검색 기능을 제공한다. AND, OR, NOT등의 불린(boolean) 검색 연산자를 이용하여 보다 정교한 검색을 지원한다. 와일드 카드 연산자인 '*', '?'를 이용하여 보다 정교한 검색을 지원한다. 사용자가 입력한 질의어와 유사함 의미를 가진 동의어를 추천해주는 서비스를 지원한다. 유의어 확장 연산자는 '@'이다. 검색결과 출력시 날짜별 정렬, 중요도별 정렬 기능을 제공한다. 검색결과 페이지에서 '미리보기' 기능을 통하여 웹문서와 HWP, PDF, Word, PPT 등과 같은 일반문서의 본문 내용을 텍스트 형식으로 조회하거나 별도의 뷰어 프로그램과 연동할 수 있다. 검색창에 검색어를 입력시 관련된 단어를 자동으로 추천하여 검색어를 완성할 수 있도록 지원한다. 사용자의 인기검색어 분석을 통하여 검색결과 상단에 바로가기 기능이나 풍부한 검색결과를 제공하는 컨텐츠 가이드 서비스 기능을 제공한다. 검색대상 자료의 생성일 기준으로 기간을 정하여 검색할 수 있다. 일정기간 검색 통계분석을 통한 인기검색어 리포트를 지원한다.
- 웹기반의 통합관리 제공 : 자료 수집기, 색인기, 검색기 등 모든 컴포넌트를 웹기반으로 제어할 수 있도록 지원한다. 검색서비스를 이용한 사용자들에 대한 입력 검색어, 검색어수, 검색횟수, 접속IP 등 다양한 로그의 분석을 통하여 서비스 이용 성향을 분석한다.
활용사례
각주
- ↑ 씨엘, 〈(월요기획-검색솔루션)주요업체(2)〉, 《네이버 블로그》, 2005-01-24
- ↑ ㈜레피아 공식홈페이지 - http://www.repia.com/
참고자료
- ㈜레피아 공식홈페이지 - http://www.repia.com
- 까치네 나무위키 - https://namu.wiki/w/%EA%B9%8C%EC%B9%98%EB%84%A4
- QPS 정보통신용어사전 - http://terms.tta.or.kr/dictionary/dictionaryView.do?word_seq=053422-1
- 씨엘, 〈(월요기획-검색솔루션)주요업체(2)〉, 《네이버 블로그》, 2005-01-24
같이 보기
이 문서는 로고가 필요합니다.