검수요청.png검수요청.png

문자인식

위키원
이동: 둘러보기, 검색

문자인식(Text recognition)은 일반적으로 텍스트 데이터를 이해하고 처리하는 기술을 의미한다. 이는 디지털 형태로 이미 존재하는 텍스트를 인식하는 것일 수 있다. 예를 들어 컴퓨터 프로그램웹페이지, 파일, 이메일 등의 텍스트를 읽고 분석할 때 사용된다. 자연어 처리(NLP) 기술을 사용하여 텍스트를 분석하고 이해한다.

비교[편집]

광학문자인식[편집]

OCR(광학문자인식)은 이미지에 포함된 텍스트를 기계가 인식하고, 이를 디지털 텍스트로 변환하는 기술이다. 예를 들어, 스캔문서사진 속의 텍스트컴퓨터가 읽고 편집 가능한 텍스트로 바꾸는 과정이다. 스캔된 책, 영수증, 명함, 간판 등을 디지털 텍스트로 변환할 때 사용된다. 광학문자인식 기술은 주로 이미지 처리와 패턴 인식을 통해 작동하며, 문자 모양을 인식하고 해석하여 텍스트로 변환한다.

문자인식과 광학문자인식의 비교
구분 문자인식 광학문자인식
입력 형태 이미 디지털 형식으로 존재하는 텍스트가 입력된다. 이미지 또는 스캔된 문서와 같은 비디지털 텍스트가 입력된다.
기술 사용 자연어 처리(NLP) 기술을 사용하여 텍스트를 분석하고 이해한다. 이미지 처리, 패턴 인식 및 기계 학습 기술을 사용하여 이미지에서 텍스트를 추출한다.
목적 디지털 텍스트를 이해하고 처리하는 것이 주요 목적이다. 물리적 문서를 디지털 형식으로 변환하는 것이 주요 목적이다.

같이 보기[편집]


  검수요청.png검수요청.png 이 문자인식 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.