검색(檢索, search)이란 특정한 키워드와 동일 또는 유사한 내용을 가진 정보를 찾는 행위를 말한다.
상세
검색은 특정 정보를 찾기 위해 검색엔진을 사용하여 웹페이지, 문서, 이미지, 동영상 등 다양한 형태의 데이터를 탐색하는 활동을 의미한다. 인터넷 검색은 현대 사회에서 매우 중요한 도구로 자리 잡았으며, 정보 탐색, 학습, 업무, 여가 등 다양한 목적에 활용되고 있다. 또한 정보 접근성을 높이고 사용자 경험을 개선하는 데 중요한 역할을 하고 있다. 검색엔진의 발전과 함께 인공지능, 머신러닝, 음성 인식, 시각 검색, AR/VR 등 다양한 기술이 결합되어 더욱 혁신적이고 개인화된 검색 경험을 제공하고 있다.
역사
1995년 설립된 알타비스타(AltaVista)는 초기 검색엔진 중 하나로, 빠르고 효율적인 검색 기능을 제공했다. 혁신적인 크롤링 기술을 사용하여 인터넷의 방대한 양의 정보를 인덱싱하고, 사용자가 입력한 키워드에 대한 관련 검색 결과를 빠르게 제공했다. 알타비스타는 인덱싱 속도와 검색 결과의 정확성으로 인해 인기를 얻었지만, 이후 구글(Google)의 등장으로 점차 사용량이 감소했다.
1994년 설립된 라이코스(Lycos)는 초기 검색엔진 중 하나로, 웹페이지와 뉴스, 이미지를 포함한 다양한 콘텐츠를 검색할 수 있는 기능을 제공했다. 라이코스는 사용자의 검색 기록을 분석하여 개인화된 검색 결과를 제공하려는 노력을 했다.
1995년에 시작된 익사이트(Excite)는 초기 검색엔진으로, 웹 크롤러를 사용하여 인터넷 상의 정보를 수집하고 인덱싱하여 사용자에게 제공했다. 익사이트는 뉴스, 날씨, 이메일 등의 다양한 서비스와 통합되어 포털 사이트로 발전했다.
1998년, 스탠포드 대학교의 두 대학원생인 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 구글(Google)을 설립했다. 구글은 페이지랭크(PageRank) 알고리즘을 도입하여 웹 페이지의 중요성을 평가하고, 검색 결과의 품질을 크게 향상시켰다. 페이지랭크는 웹 페이지 간의 링크 구조를 분석하여 페이지의 신뢰도와 권위성을 평가한다. 이를 통해 구글은 사용자에게 더 관련성 높은 검색 결과를 제공할 수 있게 되었다.[1]
오늘날의 검색엔진은 단순한 키워드 검색을 넘어, 인공지능(AI)과 머신러닝 기술을 활용하여 사용자에게 개인화된 검색 결과를 제공한다.[2] 구글, 빙(Bing), 네이버(Naver), 다음(Daum) 등이 대표적인 검색엔진으로, 텍스트, 이미지, 동영상 등 다양한 형태의 정보를 빠르고 정확하게 제공한다. 이러한 검색엔진은 사용자의 검색 기록과 패턴을 분석하여 맞춤형 콘텐츠를 제공하며, 사용자의 검색 경험을 지속적으로 개선하고 있다.
기술적 구성요소
- 웹 크롤러 : 인터넷을 자동으로 탐색하며 웹 페이지를 수집하는 프로그램이다. 크롤러는 웹페이지의 링크를 따라가며 새로운 페이지를 발견하고, 이를 데이터베이스에 저장한다. 이를 통해 검색엔진은 방대한 양의 웹페이지를 인덱싱할 수 있다. 구글의 웹 크롤러는 구글봇(Googlebot)으로 알려져 있으며, 전 세계의 웹 페이지를 크롤링하여 인덱스를 생성한다.[3]
- 인덱스 : 수집된 웹페이지의 내용을 분석하여 데이터베이스에 저장한 것이다. 인덱스는 검색엔진이 사용자에게 빠르고 정확한 검색 결과를 제공할 수 있도록 도와준다. 인덱스는 키워드, 주제, 링크 구조 등을 기반으로 구성된다. 인덱스는 매우 큰 데이터베이스로, 검색 쿼리에 대한 빠른 응답을 위해 최적화되어 있다.[4]
- 검색 알고리즘 : 사용자가 입력한 키워드에 대해 관련성 높은 검색 결과를 제공하는 데 사용되는 수학적 공식과 규칙의 집합이다. 다음은 몇 가지 주요 알고리즘이다.
- 페이지랭크(PageRank): 구글이 개발한 알고리즘으로, 웹페이지의 링크 구조를 분석하여 페이지의 중요성과 신뢰성을 평가한다.[5]
- TF-IDF(Term Frequency-Inverse Document Frequency): 특정 단어가 문서 내에서 얼마나 자주 등장하는지를 기반으로 문서의 관련성을 평가한다.[6]
- BERT(Bidirectional Encoder Representations from Transformers): 자연어처리(NLP) 기술을 사용하여 문맥을 이해하고, 사용자의 의도에 맞는 검색 결과를 제공한다.[7]
- 사용자 인터페이스 : 검색엔진의 사용자 인터페이스(UI)는 사용자가 검색 쿼리를 입력하고 결과를 볼 수 있는 화면을 제공한다. 검색창, 검색 결과 목록, 필터링 옵션, 광고 등이 포함된다. UI는 사용자가 쉽게 검색할 수 있도록 직관적으로 설계된다. 예를 들어, 구글의 검색창은 단순하고 직관적인 디자인으로, 사용자가 쉽게 키워드를 입력하고 검색 결과를 확인할 수 있도록 도와준다.
비교
서핑
검색과 서핑은 인터넷을 대하는 두 가지 주요 방법으로, 각각 목적과 방법이 다르다. 검색은 특정 정보를 찾기 위해 키워드를 사용하는 목적 지향적인 활동이며, 서핑은 주로 자유로운 탐색과 새로운 정보 발견을 위한 활동이다. 이 두 가지 방법을 적절히 활용하면 인터넷을 보다 효과적으로 사용할 수 있다.
서핑은 웹페이지를 탐색하며 다양한 콘텐츠를 자유롭게 둘러보는 활동을 의미한다. 이는 물리적인 서핑처럼 한 페이지에서 다른 페이지로 자연스럽게 이동하면서 인터넷을 탐색하는 과정을 나타낸다. 서핑의 특징은 세 가지로 요약할 수 있다. 첫 번재는 탐색 활동이다. 특정한 목적 없이 다양한 웹 페이지를 돌아다니며 새로운 정보를 발견하는 과정이다. 두 번째는 연결성이다. 하이퍼링크를 통해 관련 웹 페이지로 이동하며, 예기치 않은 정보를 발견할 수 있다. 세 번재는 브라우저 활용이다. 웹 브라우저에서 링크 클릭, 북마크, 즐겨찾기 등을 통해 이루어진다. 예를 들어 뉴스 웹사이트에서 여러 기사드를 읽거나 쇼핑몰에서 다양한 제품을 둘러보는 것, 소셜 미디어에서 친구들의 게시물을 확인하고 링크를 따라가며 다양한 웹페이지를 탐색하는 것이 서핑의 예라고 할 수 있다.
검색과 서핑의 차이
구분
|
검색
|
서핑
|
목적
|
특정 정보 찾기, 명확한 목적
|
다양한 콘텐츠 탐색, 자유로운 탐험
|
방법
|
검색 엔진 사용, 키워드 입력
|
하이퍼링크 클릭, 웹 페이지 탐색
|
활동
|
필요 정보 찾기, 문제 해결
|
새로운 정보 발견, 탐색
|
경험
|
필요한 정보에 대한 신속한 접근
|
예기치 않은 정보 접근 가능
|
각주
- ↑ 박세용, 〈<기획특집 ①> 검색엔진 알고리즘의 변천의 역사〉, 《KISO 저널》, 2016-12-22
- ↑ 〈지능형 검색이란?〉, 《IBM》
- ↑ 〈Google 크롤러 - Googlebot〉, 《구글 검색센터》
- ↑ 혀내, 〈(DB) 인덱스(Index)로 DB 검색 속도를 높여보자〉, 《티스토리》, 2023-06-18
- ↑ 〈페이지랭크〉, 《위키백과》
- ↑ 〈tf-idf〉, 《위키백과》
- ↑ 〈BERT (언어 모델)〉, 《위키백과》
참고자료
- 〈지능형 검색이란?〉, 《IBM》
- 〈Google 크롤러 - Googlebot〉, 《구글 검색센터》
- 〈페이지랭크〉, 《위키백과》
- 〈tf-idf〉, 《위키백과》
- 〈BERT (언어 모델)〉, 《위키백과》<
- 박세용, 〈<기획특집 ①> 검색엔진 알고리즘의 변천의 역사〉, 《KISO 저널》, 2016-12-22
- 혀내, 〈(DB) 인덱스(Index)로 DB 검색 속도를 높여보자〉, 《티스토리》, 2023-06-18
같이 보기
이 검색 문서는 인터넷에 관한 글로서 내용 추가가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 추가해 주세요.
|
개발 : 프로그래밍, 소프트웨어, 데이터, 솔루션, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷 □■⊕, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
인터넷
|
PC통신 • 그누텔라 • 네트워크 • 다크넷 • 다크웹 • 딥웹 • 무선인터넷 • 슈퍼피어 • 스타링크 • 아르파넷 • 아이투피(I2P) • 엑스트라넷 • 오버레이 네트워크 • 오투오(O2O) • 오프라인 • 온라인 • 온오프라인 • 유선인터넷 • 인터넷 • 인트라넷 • 초고속 인터넷 • 토어(토르) • 표면웹 • 프리넷 • 피투피(P2P) • 하이브리드 피투피(P2P) • 홈네트워크
|
|
인터넷 기술
|
ARP • DNS • FTP • G-클라우드 • HTTP • HTTPS • IPFS • IPv4 • IPv6 • IRC • IRI • ISBN • LDAP • MOIP • OpenSSL • OSI 7 계층 • RFC • RFID • SFTP • SOAP • SSH • SSL • SSO • TCP • TCP/IP • TLS • UCI • UDP • URI • URL • URN • VoIP • 강화 내부 게이트웨이 라우팅 프로토콜 • 검색 • 검색엔진 • 게이트웨이 • 경계 경로 프로토콜 • 내부 게이트웨이 라우팅 프로토콜 • 다운로드 • 데몬 • 라우팅 정보 프로토콜 • 백엔드 • 사물인터넷 • 서버 • 서버-클라이언트 • 서브넷마스크 • 세션 • 스트리밍 • 식별자 • 아이피(IP) • 업로드 • 에듀테크 • 온프레미스 • 원격 프로시저 호출(RPC) • 유비쿼터스 • 인터넷 기술 • 자율시스템 • 정보기술 • 정보통신 • 채팅 • 챗봇 • 최단경로 우선 프로토콜(OSPF) • 쿠키 • 크롤링 • 클라이언트 • 키워드 • 텔넷 • 토폴로지 • 트래픽 • 패킷 • 포털 • 포트 • 프런트엔드 • 프로토콜 • 프록시 • 해시태그
|
|
이메일
|
IMAP • POP3 • SMTP • 계정메일 • 네이버 메일 • 다음 메일 • 센드메일 • 스팸 • 스팸메일 • 스팸필터링 • 아웃룩 익스프레스 • 야후 메일 • 웹메일 • 이메일 • 지메일 • 카카오 메일 • 한메일 • 핫메일
|
|
웹
|
KWCAG • WCAG • 서핑 • 시맨틱 웹 • 오프라인 웹 • 웹 • 웹 1.0 • 웹 2.0 • 웹 3.0 • 웹개방성 • 웹서비스 • 웹접근성 • 웹접근성 인증마크 • 웹주소 • 웹표준 • 웹호환성 • 피드
|
|
웹사이트
|
BBS • GNB • LNB • UI/UX • 게시판 • 관리자 사이트 • 그래픽 사용자 인터페이스(GUI) • 누리집 • 대시보드 • 드롭다운 메뉴 • 랜딩 템플릿 • 랜딩 페이지 • 리더보드 • 마이홈피 • 메뉴 • 모달창 • 미니홈피 • 방명록 • 배너 • 사용자 경험(UX) • 사용자 인터페이스(UI) • 섹션 • 왼쪽메뉴 • 웹기획 • 웹사이트 • 웹페이지 • 인터페이스 • 쪽지 • 커뮤니티 • 탑메뉴 • 탭메뉴 • 템플릿 • 팝업 • 페이지 • 페이지뷰 • 햄버거 메뉴 • 호버 • 홈페이지 • 화면
|
|
웹브라우저
|
넷스케이프 • 모자이크 • 브라우저 • 브레이브 브라우저 • 블록체인 브라우저 • 사파리 • 삼성인터넷 • 스윙 • 엣지 • 오시리스 • 오페라 • 웨일 • 웹브라우저 • 인터넷 익스플로러(IE) • 크롬 • 파이어폭스 • 판도브라우저
|
|
인터넷 서비스
|
구글 • 구글 미트 • 구글챗 • 구글 행아웃 • 깃허브 • 네아로 • 네이버 • 네이버 웹툰 • 네이버 카페 • 넷플릭스 • 다음 • 라이코스 • 레진코믹스 • 메일루 • 멜론 • 바이두 • 바이트댄스 • 비트토렌트 • 빌리빌리 • 빙 • 소리바다 • 스포티파이 • 아마존 웹서비스(AWS) • 애플 • 야후 • 야후재팬 • 얀덱스 • 에버노트 • 에어비앤비 • 왓챠 • 웹소설 • 웹툰 • 유튜브 • 인스타툰 • 인터넷 서비스 • 인터넷카페 • 잼라이브 • 줌 • 카카오 • 카카오 웹툰 • 카카오페이지 • 탑툰 • 텐센트 • 팟캐스트 • 패스 • 페이오니아 • 페이팔 • 해시넷 • 화상통화 • 화상회의
|
|
인터넷쇼핑
|
11번가 • 그립 • 네이버 쇼핑 • 네이버 쇼핑 라이브 • 라이브방송 • 라이브커머스 • 모바일쇼핑 • 스쉐라이브 • 스타일쉐어 • 아마존 • 알리바바 • 오픈마켓 • 옥션 • 온라인쇼핑 • 위메프 • 이베이 • 인터넷쇼핑 • 인터파크 • 전자상거래 • 지마켓 • 징동닷컴 • 카카오 쇼핑 • 카카오 쇼핑 라이브 • 커머스 • 쿠팡 • 쿠팡 라이브 • 타오바오 • 티몬
|
|
소셜 네트워크
|
SNS(소셜 네트워크 서비스) • 구글 블로거 • 네이버 밴드 • 네이버 블로그 • 디시인사이드 • 링크드인 • 마이크로블로그 • 맞팔 • 브런치스토리 • 블로그 • 소셜 네트워크 • 엑스 (트위터) • 웨이보 • 인스타그램 • 트루스소셜 • 티스토리 • 팔로우 • 페이스북 • 플리커 • 핀터레스트
|
|
메신저
|
골프메신저 • 님버즈 • 대화방 • 두레이 • 디스코드 • 딩톡 • 라인 • 라인웍스 • 마이크로소프트 팀즈 • 메신저 • 버디버디 • 스냅챗 • 스노우 • 스카이프 • 슬랙 • 아이씨큐(ICQ) • 왓츠앱 • 웹메신저 • 위챗 • 잔디 • 직톡 • 카카오워크 • 카카오톡 • 카톡방 • 큐큐(QQ) • 탱고 • 텔레그램 • 틱톡 • 페이스북 메신저 • 플로우
|
|
도메인
|
네임서버 • 다국어도메인 • 도메인 • 레지스트라 • 레지스트리 • 아이피 • 인터넷주소 • 인터넷키워드 • 한글인터넷주소 • 후이즈
|
|
호스팅
|
메일호스팅 • 서버호스팅 • 웹호스팅 • 코로케이션 • 클라우드 • 클라우드 네이티브 • 파킹 • 포워딩 • 호스팅
|
|
위키
|
구스위키 • 나무위키 • 노스모크 • 더위키 • 디시위키 • 리그베다위키(엔하위키) • 리브레위키 • 미디어위키 • 바다위키 • 백괴사전 • 아이티위키 • 알파위키 • 엔하계 위키 • 요다위키 • 우만위키 • 위키 • 위키낱말사전 • 위키독스 • 위키문법 • 위키문서 • 위키문헌 • 위키미디어재단 • 위키백과 • 위키스 • 위키엔진 • 위키원 • 위키원드 • 위키트리 • 위키휴가 • 제이위키 • 제타위키 • 중국위키 • 팬덤(위키아) • 한국어 위키백과 • 한국위키미디어협회 • 항공위키
|
|
인터넷 사용자
|
가입 • 가입자 • 강퇴 • 계정 • 관리자 • 네트워크 관리자 • 네티즌 • 누리꾼 • 대기자 • 데이터베이스 관리자 • 등록자 • 디지털 원패스 • 로그아웃 • 로그인 • 방문자 • 블로거 • 블록체인 관리자 • 비회원 • 사용자 • 사이트 관리자 • 서버관리자 • 시삽 • 시스템 관리자 • 아이디(ID) • 웹관리자 • 웹마스터 • 유튜버 • 접속자 • 차단 • 최고관리자 • 탈퇴 • 탈퇴자 • 회원 • 휴면 • 휴면계정
|
|
인터넷 단체
|
IANA • ICANN • W3C • 다르파 • 유럽입자물리연구소(CERN)
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|
개발 : 프로그래밍, 소프트웨어, 데이터, 솔루션 □■⊕, 보안, 하드웨어, 컴퓨터, 사무자동화, 인터넷, 모바일, 사물인터넷, 게임, 메타버스, 디자인
|
|
솔루션
|
CMS • CRM • DRM • ERP • HMS • LCMS • LMS • PMS • SCM • VOC • 그룹웨어 • 모니터링 솔루션 • 솔루션 • 웹빌더 • 위키 • 지식관리시스템(KMS) • 커스터마이징 • 패키지 소프트웨어 • 패키지 제품
|
|
프레임워크
|
넥스코어 • 노드제이에스(node.js) • 닷넷(.NET) • 라프제이(Laf/J) • 레일즈 • 마이바티스(MyBatis) • 맵리듀스 • 스트럿츠 • 스프링 프레임워크 • 아두이노 • 아이바티스(iBatis) • 아파치 스파크 • 애니프레임 • 앵귤러제이에스(Angular.js) • 에이에스피닷넷(ASP.NET) • 인텔리제이 아이디어(IntelliJ IDEA) • 장고 • 전자정부 표준 프레임워크 • 하둡 • 하이버네이트
|
|
콘텐츠관리시스템
|
iCS • 드루팔 • 아사프로 • 오픈웍스 • 워드프레스 • 윅스 • 줌라 • 지니웍스 • 콘텐츠와이즈 • 홈스토리 • 홍익인간
|
|
홈페이지 솔루션
|
GPKI • LBS • PKI • 게시판 • 공인인증서 • 구글 애널리틱스 • 구글 애드센스 • 그누보드 • 네이버 애널리틱스 • 넷퍼넬 • 달력 • 대댓글 • 댓글 • 덱스트업로드 • 방명록 • 블로그 • 비즈니스 애널리틱스 • 선플 • 설문조사 • 소셜로그인 • 스킨 • 아이핀 • 악플 • 에이스카운터 • 웹로그 • 위젯 • 익스프레스엔진(제로보드XE) • 인증 • 접속통계 • 제로보드 • 지핀(G-PIN) • 카운터 • 커뮤니티 • 테크노트 • 투표 • 파일업로드 • 회원관리
|
|
이메일 솔루션
|
깨비메일 • 메일플러그 • 썬더메일 • 에어즈락메일
|
|
쇼핑몰 솔루션
|
고도몰 • 굿모닝샵 • 메이크샵 • 카페24 쇼핑몰 • 퍼스트몰 • 후이즈몰
|
|
동영상 솔루션
|
1그램플레이어 • 5K플레이어 • ACG플레이어 • KM플레이어 • VLC미디어플레이어 • 곰플레이어 • 디코더 • 와우자 • 웹엑스 • 인코더 • 코덱 • 코디 • 팟플레이어
|
|
검색 솔루션
|
검색 • 검색엔진 • 독크루저 • 레피아 • 루씬 • 마리너 • 미르서치 • 서치포뮬러원 • 아이트리니티 • 엑스텐 • 엑스퍼서치 • 일래스틱서치
|
|
리포팅툴
|
사이냅 • 알메이트차트 • 오즈리포트 • 유비리포트 • 차트 • 크로닉스리포트(리포트 디자이너) • 클립리포트(렉스퍼트)
|
|
BI 솔루션
|
BI • BI매트릭스 • OLAP • 옥타곤 • 코그너스 • 태블로
|
|
연계 솔루션
|
메심 • 비즈위버 • 웹크롤러 • 이크로스 비즈아이 스위트 • 인디고 • 코어브릿지 • 크롤러 • 프로버스
|
|
데이터 솔루션
|
BTL 데이터 인테그레이터 • ETL 솔루션 • 딥솔루션 • 아이샤크 • 이노쿼츠 • 인포매티카 • 탈렌드 • 탈렌드 오픈스튜디오 • 테라스트림
|
|
자료공유 솔루션
|
구글 드라이브 • 나스 • 드롭박스 • 시놀로지 나스 • 원드라이브 • 웹하드
|
|
그룹웨어
|
거래처 관리 • 구글 워크스페이스 • 근태관리 • 노츠 • 노트 • 다우오피스 • 다이렉트 클라우드 • 더존 솔루션 • 메일플러그 • 브레인스톰 • 비즈메카 • 엘지 유플러스 그룹웨어 • 연락처 • 연락처 관리 • 오피스365 • 온타임 • 웍스모바일 • 위하고 • 인사관리 • 일정관리 • 전자결재 • 지스위트 • 지투웍스 • 코디네이터 • 팀포커스 • 하이웍스 • 핸디 • 헬로윈
|
|
클라우드 솔루션
|
오픈네뷸라 • 오픈스택 • 유칼립투스 • 클라우드스택 • 클라우드잇
|
|
지도 솔루션
|
구글 지도 • 네이버 지도 • 바이두 지도 • 지도 • 지도 API • 카카오 지도 • 티맵
|
|
모바일 솔루션
|
모피어스
|
|
기타 솔루션
|
딥오씨알 • 리무트콜 • 스카우터 • 알서포트
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|