의견.png 의견.png

검색

위키원
leejia1222 (토론 | 기여)님의 2024년 7월 12일 (금) 17:47 판
이동: 둘러보기, 검색

검색(檢索, search)이란 특정한 키워드와 동일 또는 유사한 내용을 가진 정보를 찾는 행위를 말한다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

상세

검색은 특정 정보를 찾기 위해 검색엔진을 사용하여 웹페이지, 문서, 이미지, 동영상 등 다양한 형태의 데이터를 탐색하는 활동을 의미한다. 인터넷 검색은 현대 사회에서 매우 중요한 도구로 자리 잡았으며, 정보 탐색, 학습, 업무, 여가 등 다양한 목적에 활용되고 있다. 또한 정보 접근성을 높이고 사용자 경험을 개선하는 데 중요한 역할을 하고 있다. 검색엔진의 발전과 함께 인공지능, 머신러닝, 음성 인식, 시각 검색, AR/VR 등 다양한 기술이 결합되어 더욱 혁신적이고 개인화된 검색 경험을 제공하고 있다.

역사

1995년 설립된 알타비스타(AltaVista)는 초기 검색엔진 중 하나로, 빠르고 효율적인 검색 기능을 제공했다. 혁신적인 크롤링 기술을 사용하여 인터넷의 방대한 양의 정보를 인덱싱하고, 사용자가 입력한 키워드에 대한 관련 검색 결과를 빠르게 제공했다. 알타비스타는 인덱싱 속도와 검색 결과의 정확성으로 인해 인기를 얻었지만, 이후 구글(Google)의 등장으로 점차 사용량이 감소했다.

1994년 설립된 라이코스(Lycos)는 초기 검색엔진 중 하나로, 웹페이지뉴스, 이미지를 포함한 다양한 콘텐츠를 검색할 수 있는 기능을 제공했다. 라이코스는 사용자의 검색 기록을 분석하여 개인화된 검색 결과를 제공하려는 노력을 했다.

1995년에 시작된 익사이트(Excite)는 초기 검색엔진으로, 웹 크롤러를 사용하여 인터넷 상의 정보를 수집하고 인덱싱하여 사용자에게 제공했다. 익사이트는 뉴스, 날씨, 이메일 등의 다양한 서비스와 통합되어 포털 사이트로 발전했다.

1998년, 스탠포드 대학교의 두 대학원생인 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 구글(Google)을 설립했다. 구글은 페이지랭크(PageRank) 알고리즘을 도입하여 웹 페이지의 중요성을 평가하고, 검색 결과의 품질을 크게 향상시켰다. 페이지랭크는 웹 페이지 간의 링크 구조를 분석하여 페이지의 신뢰도와 권위성을 평가한다. 이를 통해 구글은 사용자에게 더 관련성 높은 검색 결과를 제공할 수 있게 되었다.[1]

오늘날의 검색엔진은 단순한 키워드 검색을 넘어, 인공지능(AI)과 머신러닝 기술을 활용하여 사용자에게 개인화된 검색 결과를 제공한다.[2] 구글, (Bing), 네이버(Naver), 다음(Daum) 등이 대표적인 검색엔진으로, 텍스트, 이미지, 동영상 등 다양한 형태의 정보를 빠르고 정확하게 제공한다. 이러한 검색엔진은 사용자의 검색 기록과 패턴을 분석하여 맞춤형 콘텐츠를 제공하며, 사용자의 검색 경험을 지속적으로 개선하고 있다.

기술적 구성요소

  • 웹 크롤러 : 인터넷을 자동으로 탐색하며 웹 페이지를 수집하는 프로그램이다. 크롤러웹페이지링크를 따라가며 새로운 페이지를 발견하고, 이를 데이터베이스에 저장한다. 이를 통해 검색엔진은 방대한 양의 웹페이지를 인덱싱할 수 있다. 구글의 웹 크롤러는 구글봇(Googlebot)으로 알려져 있으며, 전 세계의 웹 페이지를 크롤링하여 인덱스를 생성한다.[3]
  • 인덱스 : 수집된 웹페이지의 내용을 분석하여 데이터베이스에 저장한 것이다. 인덱스는 검색엔진이 사용자에게 빠르고 정확한 검색 결과를 제공할 수 있도록 도와준다. 인덱스는 키워드, 주제, 링크 구조 등을 기반으로 구성된다. 인덱스는 매우 큰 데이터베이스로, 검색 쿼리에 대한 빠른 응답을 위해 최적화되어 있다.[4]
  • 검색 알고리즘 : 사용자가 입력한 키워드에 대해 관련성 높은 검색 결과를 제공하는 데 사용되는 수학적 공식과 규칙의 집합이다. 다음은 몇 가지 주요 알고리즘이다.
  1. 페이지랭크(PageRank): 구글이 개발한 알고리즘으로, 웹페이지링크 구조를 분석하여 페이지의 중요성과 신뢰성을 평가한다.[5]
  2. TF-IDF(Term Frequency-Inverse Document Frequency): 특정 단어가 문서 내에서 얼마나 자주 등장하는지를 기반으로 문서의 관련성을 평가한다.[6]
  3. BERT(Bidirectional Encoder Representations from Transformers): 자연어처리(NLP) 기술을 사용하여 문맥을 이해하고, 사용자의 의도에 맞는 검색 결과를 제공한다.[7]
  • 사용자 인터페이스 : 검색엔진의 사용자 인터페이스(UI)는 사용자가 검색 쿼리를 입력하고 결과를 볼 수 있는 화면을 제공한다. 검색창, 검색 결과 목록, 필터링 옵션, 광고 등이 포함된다. UI는 사용자가 쉽게 검색할 수 있도록 직관적으로 설계된다. 예를 들어, 구글의 검색창은 단순하고 직관적인 디자인으로, 사용자가 쉽게 키워드를 입력하고 검색 결과를 확인할 수 있도록 도와준다.

비교

서핑

검색과 서핑인터넷을 대하는 두 가지 주요 방법으로, 각각 목적과 방법이 다르다. 검색은 특정 정보를 찾기 위해 키워드를 사용하는 목적 지향적인 활동이며, 서핑은 주로 자유로운 탐색과 새로운 정보 발견을 위한 활동이다. 이 두 가지 방법을 적절히 활용하면 인터넷을 보다 효과적으로 사용할 수 있다.

서핑은 웹페이지를 탐색하며 다양한 콘텐츠를 자유롭게 둘러보는 활동을 의미한다. 이는 물리적인 서핑처럼 한 페이지에서 다른 페이지로 자연스럽게 이동하면서 인터넷을 탐색하는 과정을 나타낸다. 서핑의 특징은 세 가지로 요약할 수 있다. 첫 번재는 탐색 활동이다. 특정한 목적 없이 다양한 웹 페이지를 돌아다니며 새로운 정보를 발견하는 과정이다. 두 번째는 연결성이다. 하이퍼링크를 통해 관련 웹 페이지로 이동하며, 예기치 않은 정보를 발견할 수 있다. 세 번재는 브라우저 활용이다. 웹 브라우저에서 링크 클릭, 북마크, 즐겨찾기 등을 통해 이루어진다. 예를 들어 뉴스 웹사이트에서 여러 기사드를 읽거나 쇼핑몰에서 다양한 제품을 둘러보는 것, 소셜 미디어에서 친구들의 게시물을 확인하고 링크를 따라가며 다양한 웹페이지를 탐색하는 것이 서핑의 예라고 할 수 있다.

검색과 서핑의 차이
구분 검색 서핑
목적 특정 정보 찾기, 명확한 목적 다양한 콘텐츠 탐색, 자유로운 탐험
방법 검색 엔진 사용, 키워드 입력 하이퍼링크 클릭, 웹 페이지 탐색
활동 필요 정보 찾기, 문제 해결 새로운 정보 발견, 탐색
경험 필요한 정보에 대한 신속한 접근 예기치 않은 정보 접근 가능

각주

  1. 박세용, 〈<기획특집 ①> 검색엔진 알고리즘의 변천의 역사〉, 《KISO 저널》, 2016-12-22
  2. 지능형 검색이란?〉, 《IBM》
  3. Google 크롤러 - Googlebot〉, 《구글 검색센터》
  4. 혀내, 〈(DB) 인덱스(Index)로 DB 검색 속도를 높여보자〉, 《티스토리》, 2023-06-18
  5. 페이지랭크〉, 《위키백과》
  6. tf-idf〉, 《위키백과》
  7. BERT (언어 모델)〉, 《위키백과》

참고자료

같이 보기


  의견.png 의견.png 이 검색 문서는 인터넷에 관한 글로서 내용 추가가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 추가해 주세요.