검수요청.png검수요청.png

레피아

위키원
이동: 둘러보기, 검색
레피아(Repia)
레피아(Repia)

레피아(Repia)란 ㈜레피아에서 순수 자체 기술로 개발한 개발한 검색엔진이다.

개요[편집]

레피아는 국내 최초의 검색 솔루션이었던 까치네가 1995년 개발 및 서비스를 실시한 이후로 1999년 금강개발산업이 인수해 사내 벤처기업 형태로 운영하다가 현대백화점 측에 인수되고 2000년에 까치네가 'e-현대백화점'으로 바꾸고 인터넷 쇼핑몰 운영사로 바꾸자 연구진 일부가 나와서 2000년부터 주식회사 ㈜레피아컴을 설립하였다. 검색 솔루션(Solution)인 레피아서치서버가 순수 자체기술로 개발되어서 외국산 검색엔진들보다 커스터마이징이 용이하며, 하루에 수백만 검색 쿼리를 처리하는 포털 사이트의 검색 서비스에 사용되었던 컴포넌트(Component) 들로 구성돼 대용량의 콘텐츠트래픽을 안정적으로 지원한다. 또, 검색속도와 검색 결과의 정확성, 웹 기반의 시스템 관리 툴, API 제공을 통한 유연한 확장성을 가지고 있다. 2004년도에는 데스크톱 검색보다 앞선 기능으로 인트라넷 내부의 PC와 파일서버에 있는 자료를 수집해 개인별, 그룹별, 자료유형별로 권한을 가지고 검색할 수 있는 제품을 개발했다. 레피아서치서버는 멀티프로세스 방식의 강력한 자료 수집기(Spider)와 정형 및 비정형 문서를 동일한 컬렉션과 파티션 단위로 관리할 수 있는 색인기(Indexer)를 제공해 사용자들에게 실시간 검색과 정확한 검색 결과를 제공한다. 이 솔루션은 관리자가 그룹화한 검색대상 자료들로부터 추출된 전체 단어들과 관련 정보를 '컬렉션'이라는 단위로 관리할 수 있도록 해 용이성을 높였다. 2005년 당시 레피아서치서버는 재정경제부, 통일부, 농림부 등 공공기관과 LG 투자증권, 대우증권, 신세계건설, LG산전, 한국과학기술원, 숭실대, 광운대 등과 같은 교육기관까지 150여 곳에 구축되었고, 현재까지 더 많은 지자체, 대학, 기관, 기업에서 이용되고 있다.[1]

연혁[편집]

  • 1995년 12월 : 국내 최초 인터넷 검색엔진 개발 및 서비스 실시 - 인터넷 검색엔진 "까치네" 개발 및 운영
  • 2000년 04월 : 주식회사 ㈜레피아컴 설립
  • 2001년 10월 : 중소기업청 "기술혁신 중소기업(INNO-BIZ기업)" 선정
  • 2002년 04월 : 정보통신부 "우주신기술(IT)" 인증
  • 2003년 05월 : 제 4회 대한민국 디지털 경쟁력 향상대회 "통합검색엔진기술 부문" 대상 수상
  • 2004년 07월 : 한국인터넷 진흥원 “전파식별(RFID) 검색시스템 시범 구축 업체” 로 선정
  • 2005년 02월 : 국내 최초의 검색전문기기 “Repia Search Appliance S/E/K 시리즈” 출시
  • 2006년 07월 : 통합검색엔진 Repia Search Server(RSS) v3.0 출시
  • 2007년 07월 : 통합검색엔진 Repia Search Appliance(RSA) v3.5 출시
  • 2008년 03월 : 하나TV 통합검색시스템 수주
  • 2008년 05월 : 두산 인프라코어 통합검색시스템 구축
  • 2008년 07월 : 국가보훈처 통합검색엔진 구축
  • 2008년 08월 : 통합검색엔진 Repia search Apliance(RSA) ‘Good Software 인증’ 획득
  • 2008년 11월 : 현대해상 통합검색시스템 구축
  • 2009년 01월 : 현대하이카자동차손해사정 통합검색시스템 수주
  • 2009년 04월 : 레미안 홈페이지 통합검색시스템 수주
  • 2009년 06월 : 국세청 통합검색시스템 업그레이드 수주
  • 2009년 08월 : 인천광역시청 통합검색시스템 업그레이드 수주
  • 2009년 10월 : 농촌진흥청 통합검색시스템 업그레이드 수주, 중앙선거관리위원회 통합검색시스템 업그레이드 수주
  • 2010년 03월 : 서울시 E-TAX 통합검색시스템 수주
  • 2011년 03월 : 현대오토에버 제안문서관리시스템 구축 (검색엔진 기반 개발)
  • 2012년 01월 : ㈜레피아로 법인 변경 및 통합검색엔진 Repia Search Server (RSS) v4.0 출시
  • 2013년 02월 : 세종특별자치시 구축 및 대전광역시청 업그레이드, 우리투자증권 뉴스시황 검색엔진 업그레이드
  • 2013년 08월 : 미래창조과학부 검색엔진 구축 (win-back case)
  • 2013년 11월 : 울산광역시청 홈페이지 검색엔진 구축
  • 2014년 06월 : 기초과학연구원 내부사이트 검색엔진 구축
  • 2015년 04월 : 천안시 홈페이지 검색엔진 구축
  • 2015년 06월 : 한국건강가정진흥원 검색엔진 구축
  • 2015년 12월 : 전북교육청 홈페이지 통합검색엔진 구축
  • 2016년 04월 : 모바일광주 포털 서비스 사이트 통합검색엔진 구축
  • 2016년 05월 : 한국해양과학기술원 홈페이지 검색엔진 구축
  • 2016년 06월 : 한국공항공사 홈페이지 검색엔진 재구축
  • 2017년 01월 : 경제교육포털 홈페이지 검색엔진 구축
  • 2017년 08월 : 한양대학병원 홈페이지 통합검색엔진 구축
  • 2017년 12월 : 대전광역시의회 홈페이지 검색엔진 구축
  • 2018년 01월 : 농림축산식품부 홈페이지 통합검색엔진 구축
  • 2018년 02월 : 경남창원시청 홈페이지 통합검색엔진 구축
  • 2018년 03월 : 한국문화예숭위원회 홈페이지 검색엔진 구축 [2]

특징[편집]

RSS[편집]

레피아서치서버(RSS, Repia Search Server)는 하루 수백만 검색쿼리를 처리하는 포털사이트의 검색 서비스에 사용되는 검색엔진 컴포넌트 위에 개발된 Repia Search Server/Enterprise는 대용량의 콘텐츠 및 트래픽을 안정적으로 지원하며, 정확한 검색 결과를 신속하게 제공한다.

RSS 구조
  • 고성능 실시간 검색 서비스 : 레피아서치서버는 분산·병렬처리 기법을 적용한 자료 수집기, 색인기, 쿼리 프로세스(Query Process)로 구성되어 있으며, 이를 통해 사용자들에 대한 안정적이고 확장성 있는 실시간(Real Time) 검색 서비스를 제공한다.
  • 프로토콜 기반 구조(Decoupled Protocol based Architecture) : 레피아서치서버의 서버 내 각 구성요소인 웹스파이더, 데이터베이스 스파이더, 쿼리 프로세스 등은 독립적으로 동작하는 한편, 효율적인 프로토콜의 기반 위에서의 상호연동이 되도록 설계되었다. 레피아서치서버는 이를 통해 최고 수준의 시스템 확장성을 제공한다.
  • 플러그인 구조(Plugin Architecture) : 레피아 서치 서버는 성능 향상 모듈이나 새로운 기능을 추가할 경우, 기존 시스템(Legacy System)의 수정 없이 바로 플러그인하여 설치할 수 있도록 제공된다.
  • 분산 검색 서버 지원 : 레피아서치서버는 컬렉션과 검색 서버를 지역 네트워크(Local Network) 또는 인터넷에 연결된 다중 서버상에 분산 배치할 수 있으며, 이를 통한 부하 균형 기술을 적용하여 시스템의 성능 및 확장성을 보장한다.
RSS의 분산 검색서버 지원 도식도
  • 자료수집 측면에서 특징 : 오라클(Oracle), DB2, Infomax, Sybase, MSSQL 등에 저장되어 있는 정형화된 자료를 수집한다. 또, 웹 페이지, HWP, MS-WORD, PDF, PPT, Excel 등의 형태로 저장되어 있는 비정형화된 자료를 수집한다. 프로세스 개수 및 자료수집 속도를 적절하게 설정하여 시스템 자원을 활용할 수 있다. 수집대상 자료의 갱신(Update) 주기에 따라 시간대별/일별/월별로 조정할 수 있다. 자료보유 웹서버에 동시에 접근할 수 있는 자료 수집기의 개수를 조정하여 부하를 조절한다. 세션(Session)을 통한 인증, 쿠키(Cookie)를 이용한 인증, 서버 인증 등 사용자 인증 정보를 필요로 하는 자료를 수집한다.
  • 색인 측면에서의 특징 : 정형 또는 비정형과 같은 자료의 구조 또는 웹 문서, HWP, PDF 등과 같은 자료의 유형과 관계없이 독립 또는 통합 컬렉션을 생성시킬 수 있다. 하나의 컬렉션은 관리자가 정의한 복수개의 파티션으로 세분화한다. 색인대상 자료의 제목, 본문, 대표단어, 작성자와 같은 메타데이터 필드의 색인 여부와 중요도를 조정하여 고품질의 인덱스를 생성할 수 있다. 색인 주기를 자료수집 시스템과 연동하여 시간대별/일별/월별로 조정할 수 있다. 데이터의 발생 이벤트를 감지하여 실시간 색인 처리 기능을 제공한다. 어절 단위 색인과 형태소 단위 색인을 지원한다. HWP, PDF, 파워포인트, 워드, 엑셀, HTML 문서와 같은 비정형 문서는 색인 과정에서 문서 필터기를 통하여 본문 텍스트와 메타데이터 정보를 추출한 후 전문 검색이 가능하다. 웹 문서에 링크되어 있는 BMP, JPG, GIF과 같은 이미지 파일, MP3, MIDI 등의 음악 파일, AVI, MPEG 등의 동영상 파일 등을 각종 멀티미디어 파일들의 정보를 추출하여 정교한 검색이 가능하다.
JSP 툴킷 개요도
  • 고객 맞춤화 측면에서의 특징 : 웹 기반의 관리자 인터페이스를 통하여 검색 화면 디자인을 커스터마이징 할 수 있다. 검색엔진이 설치된 웹서버에 전달되는 환경 변수 수정을 통하여 확장된 검색결과 출력 형태를 커스터마이징 할 수 있다. 자바서버페이지(JSP, Java Server Page) 툴킷을 활용하여 사용자는 최소의 비용 및 시간 투자로 완벽하게 검색 화면 디자인 및 결과 출력 형태를 커스터마이징 할 수 있다. 검색 메뉴란 검색입력 화면상에서 사용자가 선택할 수 있는 특정 검색범위를 말하며, 관리자가 현재 등록되어 있는 컬렉션들과 컬렉션 내의 파티션 목록을 사용하여 한 개 이상의 검색 메뉴를 등록할 수 있다. 검색 대상 컬렉션 및 파티션들을 출력화면에 어떠한 형태로 섹션을 구성하여 표시할 것인가를 지정할 수 있으며, 각 세션별로 정렬 방법, 출력개수, 출력 요약문 크기, 미리 보기 요약문 크기 등을 조정할 수 있다. 검색 결과 정렬 개수, 멀티 섹션 검색 시 페이지별 출력 개수, 미리 보기 요약 크기, 검색 결과 개수 제한, 타깃 설정, 하이라이팅 기능 등을 조정할 수 있다.[2]

RSA[편집]

Repia Search Appliance의 약자로 일체형 통합지식 검색 시스템으로 웹사이트 및 기업이나 조직 내/외부에서 생산되는 유용한 정보를 체계적으로 수집, 분류, 활용할 수 있는 통합지식 검색 시스템 구축에 필요한 최적의 하드웨어에 솔루션을 임베디드한 일체형 전문기기이다.

RSA S (for Web Site Search)[편집]

전문화된 웹사이트 통합 검색시스템으로 웹사이트를 방문하는 고객들이 원하는 정보를 쉽고 빠르게 찾을 수 있도록 지원해주는 우수한 웹사이트 검색 서비스 솔루션으로 공공기관과 기업의 고객서비스 비용을 절감하여 고객만족도를 증대시켜준다.

RSA for Web Site Search
  • 정확한 검색 결과 제공 : 고객이 입력한 검색어와 상품/서비스 간의 유의어 그룹핑 설정 기능과 검색 결과 최상의 노출 컨텐츠 조절 기능 및 다양한 검색기능으로 빠르고 효율적인 검색 결과를 보장한다. 정형화된 자료뿐만 아니라 웹 문서와 같이 고품질의 인덱스 생성에 필요한 제목, 저작자, 대표단어 등의 메타데이터 정보에 제공하지 못하는 비정형 자료에 대해서도 메타데이터 필드별 색인 여부와 가중치 조절 기능을 통하여 정확한 검색 결과를 보장한다.
  • 검색행위를 분석한 고객서비스 지원 : 검색 로그 분석 기능을 활용한 서비스 이용 성향 분석을 지원한다. 검색 서비스를 이용한 사용자들에 대한 다양한 입력 검색어, 검색어 수, 검색 횟수, 접속 등의 로그에 대한 분석을 통하여 서비스 이용 성향을 분석하여 바로 가기, 프로파일, 컨텐츠 검색, 검색 결과 최상위 조절기능 등을 지원한다.
  • 내비게이션 서비스 지원 : 충분한 검색 결과를 제공한다. 단순한 웹페이지, 문서 파일 텍스트뿐만 아니라 카테고리별 검색 결과 서비스 관련 카테고리/장르로 직접 이동할 수 있도록 지원한다.
  • 정형화된/비정형화된 자료 통합 검색 : 정형화된 자료와 비정형화된 자료에 대한 통합검색을 지원한다. 구 자료와 실시간으로 입력되는 신규자료에 대한 통합검색을 할 수 있다. HWP, PDF, 엑셀, 파워포인트, 워드, HTML, XML, TIFF 등 다양한 유형의 파일 포맷을 지원한다.
  • 웹 기반의 통합관리 인터페이스 기능 제공 : 자료 수집기, 색인기, 검색기등 모든 컴포넌트를 웹 기반으로 제어하도록 지원한다. 다양한 검색기능, 바로 가기 기능, 동의어/유의어 그룹핑, 컨텐츠 검색기능, 최상위 노출 컨텐츠 기능 등을 웹 기반으로 제어할 수 있도록 지원한다.
  • 유지 보수 극대화 방안 : 통합 검색 엔진 이상/장애 발생 시 시스템이 자동적으로 관리자에게 장애 유형과 장애 대책 사항 등을 관리자 이메일로 발송하여 즉각적으로 처리할 수 있게 한다.

RSA K (for External Knowledge Management)[편집]

외부의 유용한 정보를 체계적으로 수집 및 관리할 수 있는 시스템으로 기업이나 조직 외부에서 생산되는 유용한 정보를 체계적으로 수집, 분류, 분배, 활용할 수 있도록 지원하는 외부지식관리 전문기기이다.

RSA for External knowledge Management
  • 동적 스케쥴링 기법을 적용한 고속 병렬자료 수집 : 관리자가 지정한 내/외부 웹사이트에 있는 웹 문서에서 유용한 정보영역만을 선별적으로 수집하고, 수집된 정보들은 관리자가 지정한 규칙에 의해서 자동 분류되어 저장된다. 수집 시 유휴시간을 최소화하여 고속수집이 가능하도록 동적 스케쥴링 기법을 적용하여 병렬적으로 수집한다.
  • 중복문서 수집 제어 : 일반적인 자료수집 알고리즘으로 구동 시 동적 웹페이지를 중복으로 수집되는 경우가 빈번하게 발생함으로 관리자가 중복문서 수집을 쉽게 제어할 수 있는 기능을 제공한다.
  • 인증 필요 웹사이트 자료 수집 : 접근 시 사용자 인증 또는 쿠키값을 요구하는 웹사이트의 자료도 운영자가 쉽게 제어할 수 있는 기능을 제공한다.
  • 무한루프 상황 탐지 및 제외 : 자료 수집기가 동적 웹페이지 자료수집 시 빈번하게 발생할 수 있는 무한루프 상황을 자동 타지하여 빠져나갈 수 있는 기능을 제공한다.
  • 불필요한 영역 추출 및 자료 삭제 처리 : 관리자가 정교하게 수집대상 및 수집제외 영역을 설정할 수 있도록 지원하며 수집된 자료에서 유용한 정보영역만을 정의하여 불필요한 영역의 데이터는 수집 및 저장되지 않도록 한다.
  • 웹사이트별 수집일정 차별화 및 모니터링 : 수집대상 웹사이트별 자료수집 일정을 스케쥴링 할 수 있으며, 수집된 자료들에 대한 상태를 모니터링할 수 있도록 합니다.
  • 쉽고 편리한 웹기반의 시스템 통합관리 : 자료 수집기, 분류기, 데이터베이스 관리기 등 모든 컴포넌트를 웹 기반으로 관리자가 쉽고 편리하게 제어할 수 있도록 지원한다.
  • 장애 발생 예방 및 신속한 장애 대처 방안 제공 : 웹 기반으로 하드웨어, 소프트웨어 상태를 실시간으로 모니터링할 수 있도록 지원하며, 예외상황 발생 시 예외상황 종류와 긴급대처 방안을 이메일로 자동 발송하여 담당자가 신속하게 장애에 대처 할 수 있도록 지원한다.
  • 유연한 시스템 통합성 제공 : 풍부한 시스템 구축 및 운영 경험을 기반으로, 고객이 보유하고 있거나 도입하려는 시스템과 완벽하게 통합되어 구동될 수 있도록 지원한다.
  • 완벽한 커스터마이징 서비스 제공 : 원천기술을 자체 보유하고 있으므로 고객의 어떠한 요구사항이라도 저렴한 비용으로 안정되게 구현될 수 있도록 지원한다.

RSA E (for Enterprise Search)[편집]

내/외부의 유용한 정보와 지식자산을 통합 검색할 수 있는 시스템으로 조직이나 기업에서 필요로 하는 내/외부 정보와 지식자산을 효과적으로 수집, 색인, 검색 그리고 조회할 수 있도록 지원해주는 엔터프라이즈 검색 전문기기이다.

RSS for Enterprise Search
  • 정확한 검색 결과 제공' : 이용자가 한두 단어를 검색어로 입력하면 정확한 정보를 찾을 수 있도록 지원하기 위하여 중요도 결정 시 문서에서 입력한 검색어의 위치, 출현 빈도수, 문서 크기 등을 반영한다. 또한, 검색어가 위치한 필드별 중요도 값을 조절 할 수 있도록 지원하고 컬렉션/필드별 검색 서비스를 지원한다.
  • 검색 결과 그룹핑 : 검색 결과들을 쉽고 명확하게 조회할 수 있도록 컬렉션/파티션 등 2단계의 관련 정보 그룹화 기능을 제공한다.
  • 바로 가기 서비스 : 검색 로그를 분석하여 인기/특정 검색어에 대해서 '바로 가기 서비스'를 등록하면 검색 결과 최상단에 운영자가 등록한 링크가 검색어와 매칭되어 출력된다.
  • 컨텐츠 가이드 서비스 : 운영자가 인기/특정 검색어에 대해서 우수한 정보를 담고 있는 컨텐츠들을 검색 결과 최상단에 노출시켜 쉽고 빠르게 우수한 컨텐츠로 접근할 수 있다.
  • 자동 한자/한글 전환 검색 : 문서 색인 시 한자가 나오면 자동으로 한글로 전환하여 색인하므로, 이용자는 힘들게 한자를 검색창에 입력하지 않고 한글로 검색어를 입력하면 한글뿐만 아니라 한자가 포함된 문서까지 검색할 수 있다.
  • 권한별(보안) 검색 : 개인 또는 그룹별 접근 가능한 문서들을 설정하고, 이용자에게 접근이 허용된 자료들만 검색할 수 있도록 한다.
  • 원문 미리 보기 : HWP, PDF, 파워포인트, 워드, 엑셀, 훈민정음 등의 일반문서, HTML 웹 문서 등과 같은 검색대상 자료 검색 시 본문 내용을 텍스트 형식으로 확인할 수 있도록 지원하며, 별도의 뷰어 프로그램과 연동하여 원본 파일 형태로 내용을 확인할 수 있다.
  • 정교한 확장검색 기능 제공 : AND, OR, NOT 연산자를 이용한 불린(Boolean) 연산자 검색, '*', '?'과 같은 와일드카드 연산자 검색, 유의어 검색, 컬렉션/파티션 별 검색, 필드별 검색, 기간지정 검색, 데이터 유형별 검색, 날짜별/중요도별 정렬 등 복잡하고 정교한 검색기능을 제공하여 이용자가 짧은 시간 내 원하는 정보를 찾을 수 있도록 지원한다.
  • 웹 기반의 시스템 통합관리 : 자료수집가, 색인기, 검색기 등 모든 컴포넌트를 웹 기반으로 관리자가 쉽고 편리하게 제어할 수 있도록 지원한다.
  • 장애 발생 예방 및 신속한 장애 대처 방안 제공 : 웹 기반으로 하드웨어, 소프트웨어 상태를 실시간으로 모니터링할 수 있도록 지원하며, 시스템에 예외상황 발생 시 예외상황 종류와 긴급대처 방안을 이메일로 자동 발송하여 신속하게 담당자가 장애 대처를 할 수 있도록 지원한다.
  • 유연한 시스템 통합성 제공 : 풍부한 시스템 구축 및 운영 경험을 기반으로, 고객이 보유하고 있거나 도입하려는 시스템과 완벽하게 통합되어 구동될 수 있도록 다양한 API를 지원한다.
  • 검색대상 컨텐츠 : 내/외부망에 위치한 오라클, IBM, DB2, MSSQL 서버, Sybase, MySQL 데이터베이스 서버에 존재하는 다양한 유형의 데이터베이스 서버 컨텐츠, 내/외부망에 위치한 파일서버에 존재하는 다양한 유형의 문서 파일, 이미지 파일, 멀티미디어 파일 등의 파일 서버 컨텐츠, 내/외부망에 위치한 웹서버에 존재하는 웹 문서와 웹 문서에 링크되어 있는 문서 파일, 이미지 파일, 멀티미디어 파일 등의 웹서버 컨텐츠 등이 있고 내/외부망에 위치한 개인 PC에 존재하는 다양한 유형의 파일을 나타내는 PC 콘텐츠와 로터스 노츠(Lotus Notes) 환경과 연동되어 로터스 도미노 서버에 존재하는 다양한 유형의 컨텐츠가 옵션으로 선택하여 대상으로 선정이 가능하다. 검색대상 파일 유형에는 HTML, HWP, PDF, MS-Word, Excel, PPT, TEXT, 아리랑, 훈민정음 등이 있다.[2]

REKMS[편집]

조직이나 기관에서 필요로 하는 외부의 지식을 체계적으로 수집, 분석, 분배, 활용하기 위해 최적화된 시스템이다.

REKMS
  • 정형화된/비정형화된 정보수집 및 분류 : 관리자가 지정한 외부의 정형화된 정보와 비정형화된 정보를 선택적으로 수집 분류할 수 있도록 지원한다.
  • 인증 사이트 정보 수집 : 세션을 통한 인증, 쿠키값을 이용한 인증, 서버 인증 등 사용자 인증 정보를 필요로 하는 웹사이트의 자료 수집을 지원한다.
  • 완벽한 고객 맞춤화 : 웹 기반의 통합관리 인터페이스를 통하여 쉽게 수집대상을 최적화할 수 있고, 관리자의 다양한 요구사항을 만족시킬 수 있는 어떠한 커스터마이징 작업도 최적의 비용으로 단기간에 구현될 수 있다.
  • 프로토콜 기반구조 : 웹 스파이더, 데이터베이스 스파이더, EKMS 데이터베이스 관리기 등 각 구성요소는 독립적으로 동작하는 한편 이들의 상호연동은 효율적인 프로토콜을 기반으로 수행되므로 최고 수준의 시스템 확장성을 제공한다.
  • 플러그인 구조 : 성능 향상 모듈이나 새로운 기능을 갖는 신규 모듈을 기존의 시스템 수정 없이 바로 플러그인하여 설치할 수 있도록 설계한다.
  • 가치 창출의 극대화 : C, JAVA 기반의 API를 제공하여 다양한 하드웨어 플랫폼, 파일 형식, 데이터 저장소를 지원하여야 하며, 시스템을 도입한 후 기존 시스템이나 KMS, EDMS, Groupware 등과의 유연한 통합으로 최고의 가치를 창출할 수 있도록 지원한다.[2]

RWDS[편집]

효과적인 디렉토리 관리 시스템으로 검색엔진 기반의 대형 포털 사이트의 일반적인 디렉토리 엔진과는 달리 웹 문서, 일반문서, 이미지, 사운드, 동영상 등의 브로드밴드 데이터에 대한 디렉토리를 통합 구축할 수 있으며, 디렉토리 내의 데이터 및 디렉토리 구조 자체에 대한 관리가 브라우저상에 트리구조 기반으로 구현되어 디렉토리 관리를 획기적으로 효율화시킬 수 있는 시스템이다.

RWDS 시스템 구성도
  • 디렉토리 서비스 측면 : 카테고리/웹사이트 추가/편집과 카테고리 전체/부분검색이 가능하다. 불린 검색연산자를 지원하며 개인별 검색환경을 지정하여 사용할 수 있다.
  • 디렉토리 관리자 측면 : 웹 인터페이스 기반으로 시스템을 통합적으로 관리할 수 있다. 카테고리별 링크를 편집 및 관리할 수 있다. 등록 웹사이트를 저장한 데이터베이스 백업, 편집 및 관리 기능을 지원한다. 카테고리별로 배너 광고를 기재할 수 있다. 웹로그 분석툴을 적용한 시간대별/일별/월별 인기 검색의/이용자 수/검색 수 조회에 대한 세부적인 분석을 활용할 수 있다.
  • 기대효과 : 웹 인터페이스상의 관리로 관리자의 원격지 작업이 가능하다. 카테고리별 배너 광고 기재에서 다양한 업체와 더 다양한 수익구조 창출이 가능하다. 웹로그 분석을 통한 검색 흐름 및 사용자 선호도 분석에 있어서 좀 더 편리하고 정확한 분석기능을 사용할 수 있다.[2]

기능[편집]

  • 확장성과 안정성이 검증된 솔루션 : 1TB의 데이터량(Volume of Data)를 보장하고 초당 조회 수(Queries per Second)는 대략 100 QPS정도이며 데이터의 신선도(Freshes of Data)는 1분 미만이다. 탑재되는 시스템의 CPU 개수, 메모리 크기, 하드디스크 유형 등에 따라 최적화 할 수 있다.
  • 정형/비정형 자료에 대한 통합 검색 : 정형화된 자료와 비정형화된 자료에 대한 통합 검색이 가능하고 구 자료와 실시간으로 입력되는 신규자료에 대한 통합 검색이 가능하다. HWP, PDF, XLS, PPT, WORLD, HTML, XML, TIFF 등 다양한 유형의 파일 포맷을 지원한다.
  • 유연한 시스템 통합성 : Window/UNIX/LINUX 등 다양한 운영체제를 지원한다. C, JAVA 기반의 소프트웨어 개발자 도구(SDK, Software Developer Kit)등 다양한 개발자 도구를 지원한다. 검색을 위해 CGI, JSP, ASP, PHP, C/S 인터페이스를 위한 API를 지원한다.
  • 정확한 검색 결과 제공 : 사용자에게 세분화된 검색영역 설정 기능과 정확한 검색 결과 제공을 위해서 컬렉션, 파티션 2단계 계층(Two level Hierarchy)구조의 색인 파일을 생성하고 검색 범위 설정을 지원한다. 고성능의 정교한 형태소 분석 기술을 이용하여 정확한 자료 검색이 될 수 있도록 지원한다. 신조어, 고유명사, 지역 명칭, 이름 등 자동 등록을 통해 색인을 지원한다. 신규자료가 등록/수정/삭제되었을 때 즉시 색인 데이터베이스에 반영하고 색인 데이터베이스 갱신 시 전체가 아닌 등록/수정/삭제 정보만을 색인 데이터베이스에 즉시 반영한다.
  • 다양한 검색기능 제공 : 정형/비정형 자료 전체를 통합 검색하거나 컬렉션/파티션별로 세분화해서 검색할 수 있으며 자료 유형에 따른 선택 검색 기능을 제공한다. AND, OR, NOT 등의 불린(Boolean) 검색 연산자를 이용하여 더욱 정교한 검색을 지원한다. 와일드카드 연산자인 '*', '?'를 이용하여 더욱 정교한 검색을 지원한다. 사용자가 입력한 질의어와 유사함 의미를 가진 동의어를 추천해주는 서비스를 지원한다. 유의어 확장 연산자는 '@'이다. 검색 결과 출력 시 날짜별 정렬, 중요도별 정렬 기능을 제공한다. 검색 결과 페이지에서 '미리 보기' 기능을 통하여 웹 문서와 HWP, PDF, Word, PPT 등과 같은 일반문서의 본문 내용을 텍스트 형식으로 조회하거나 별도의 뷰어 프로그램과 연동할 수 있다. 검색창에 검색어를 입력 시 관련된 단어를 자동으로 추천하여 검색어를 완성할 수 있도록 지원한다. 사용자의 인기 검색의 분석을 통하여 검색 결과 상단에 바로 가기 기능이나 풍부한 검색결과를 제공하는 컨텐츠 가이드 서비스 기능을 제공한다. 검색대상 자료의 생성일 기준으로 기간을 정하여 검색할 수 있다. 일정 기간 검색 통계분석을 통한 인기 검색의 리포트를 지원한다.
  • 웹 기반의 통합관리 제공 : 자료 수집기, 색인기, 검색기 등 모든 컴포넌트를 웹 기반으로 제어할 수 있도록 지원한다. 검색 서비스를 이용한 사용자들에 대한 입력 검색어, 검색어 수, 검색 횟수, 접속 IP 등 다양한 로그의 분석을 통하여 서비스 이용 성향을 분석한다.[2]

활용사례[편집]

  • 지자체 : 동대문구청, 전남도청, 의정부시청, 울산광역시동구 홈페이지, 홍성군청, 기장군청, 울산중구 홈페이지, 부산광역시동구청, 장흥군청, 동두천시청, 대전광역시의회,
  • 대학 : 연세대학교, 한국교통대학교, 한양대학교병원, 세명대학교, 청운대학교
  • 기관 : 중소기업청, 한국체육산업개발원, 한국공항공사, 국가상수도정보시스템, 경제배움e, 창업넷, 국가암정보센터, 과학기술인공제회, 극지연구소, 과학기술정보통신부, 6차산업 홈페이지,국립수산과학원, 한국문화예술위원회, 농림축산식품부, 한국해양대학교, 충청남도교육청, 인문360도
  • 기업 : kbc광주방송, 매일신문
  • 기타 : CARISYOU 홈페이지

각주[편집]

  1. 씨엘, 〈(월요기획-검색솔루션)주요업체(2)〉, 《네이버 블로그》, 2005-01-24
  2. 2.0 2.1 2.2 2.3 2.4 2.5 ㈜레피아 공식홈페이지 - http://www.repia.com/

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 레피아 문서는 솔루션에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.