"사이냅"의 두 판 사이의 차이
12번째 줄: | 12번째 줄: | ||
=== 사이냅 OCR === | === 사이냅 OCR === | ||
사이냅 OCR은 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식한다. 텍스트·텍스트 위치 정보와 패턴 정보를 제공한다. 로보틱프로세스자동화(RPA), DLP, 검색엔진, 웹 팩스 등 다양한 솔루션에서 활용한다. 사이냅소프트가 자체 개발한 사이냅 OCR는 한글인식이 뛰어난 AI-OCR로, '딥러닝 학습 데이터 확보 및 정제 프로세스'를 통해 인식 정확도를 지속 향상시킨다. '딥러닝 학습 데이터 확보 및 정제 프로세스'는 AI 딥러닝에서 핵심이 되는 양질 학습 데이터를 자체적으로 확보하는 기술이다. 사이냅 OCR 딥러닝 기술은 이미지 내 노이즈, 그림자, 왜곡과 학습되지 않은 글꼴로 인한 인식률 변화가 적다는 점이 특징이다. 이를 통해 간판, 책 표지 등 다양한 촬영 이미지 인식이 가능해 OCR 활용 범위를 확장한다. 자체 개발한 '텍스트 위치 기반 회전 보정 알고리즘'으로 이미지를 회전시켜야 하는 번거로운 전처리 과정 없이도 높은 인식 정확도를 제공한다. 정규식 패턴 매칭도 지원해 주민등록번호, 여권번호 등 민감 정보를 마스킹 처리한다. 템플릿 기반 서식인식 도구는 주민등록등·초본, 여권, 계약서, 영수증 등 다양한 서식에서 원하는 데이터를 추출한다. 이렇게 서식에서 추출한 데이터는 RPA, 보안 솔루션에 활용할 수 있다. OCR은 최근 뜨거운 관심을 받고 있는 RPA 핵심기술로 떠오르며, 한글인식률이 시장 기준에 부합하지 못한다는 것이 약점이었다. 사이냅 OCR은 한글 인식이 우수해 새롭게 RPA를 구축하거나 기구축한 고객으로부터 많은 관심을 받고 있다. 영수증·계약서가 활용되는 보험·금융업, 소비잦에게 정확한 상품 정보를 알려 줘야 하는 유통·이커머스, 다양한 서식이 오가는 물류업에서 사이냅 OCR을 유용하게 활용할 수 있다.<ref>전자신문, 〈[https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=030&aid=0002886587 [신SW상품대상추천작]사이냅소프트 '사이냅 OCR']〉, 2020-06-07</ref> | 사이냅 OCR은 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식한다. 텍스트·텍스트 위치 정보와 패턴 정보를 제공한다. 로보틱프로세스자동화(RPA), DLP, 검색엔진, 웹 팩스 등 다양한 솔루션에서 활용한다. 사이냅소프트가 자체 개발한 사이냅 OCR는 한글인식이 뛰어난 AI-OCR로, '딥러닝 학습 데이터 확보 및 정제 프로세스'를 통해 인식 정확도를 지속 향상시킨다. '딥러닝 학습 데이터 확보 및 정제 프로세스'는 AI 딥러닝에서 핵심이 되는 양질 학습 데이터를 자체적으로 확보하는 기술이다. 사이냅 OCR 딥러닝 기술은 이미지 내 노이즈, 그림자, 왜곡과 학습되지 않은 글꼴로 인한 인식률 변화가 적다는 점이 특징이다. 이를 통해 간판, 책 표지 등 다양한 촬영 이미지 인식이 가능해 OCR 활용 범위를 확장한다. 자체 개발한 '텍스트 위치 기반 회전 보정 알고리즘'으로 이미지를 회전시켜야 하는 번거로운 전처리 과정 없이도 높은 인식 정확도를 제공한다. 정규식 패턴 매칭도 지원해 주민등록번호, 여권번호 등 민감 정보를 마스킹 처리한다. 템플릿 기반 서식인식 도구는 주민등록등·초본, 여권, 계약서, 영수증 등 다양한 서식에서 원하는 데이터를 추출한다. 이렇게 서식에서 추출한 데이터는 RPA, 보안 솔루션에 활용할 수 있다. OCR은 최근 뜨거운 관심을 받고 있는 RPA 핵심기술로 떠오르며, 한글인식률이 시장 기준에 부합하지 못한다는 것이 약점이었다. 사이냅 OCR은 한글 인식이 우수해 새롭게 RPA를 구축하거나 기구축한 고객으로부터 많은 관심을 받고 있다. 영수증·계약서가 활용되는 보험·금융업, 소비잦에게 정확한 상품 정보를 알려 줘야 하는 유통·이커머스, 다양한 서식이 오가는 물류업에서 사이냅 OCR을 유용하게 활용할 수 있다.<ref>전자신문, 〈[https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=030&aid=0002886587 [신SW상품대상추천작]사이냅소프트 '사이냅 OCR']〉, 2020-06-07</ref> | ||
+ | ==== 기능 ==== | ||
+ | [[파일:synapocr_1.png]]<br> | ||
+ | 주민등록증을 클릭하면 1초도 걸리지 않아 주민등록증 내 텍스트가 인식되는 것을 확인할 수 있다. 주민등록증 서식이 등록되어 있어 서식 내용도 함께 확인할 수 있다. | ||
+ | 뿐만 아니라 여권, 운전면허증과 같이 양식이 정해져 있는 이미지의 경우 텍스트 위치값과 더불어 서식 정보도 확인할 수 있다. | ||
+ | |||
+ | * 정해진 서식이 아닌 촬영된 이미지에 포함된 다량의 텍스트 인식 | ||
+ | [[파일:synapocr_2.png]]<br> | ||
+ | :책 촬영 이미지는 굴곡과 그림자가 포함되어 있다. 하지만 사이냅 OCR은 문자 왜곡, 색상, 노이즈 등 인식 방해로 인한 변화에도 높은 인식률을 보여주어 상품 패키지, 간판, 책 표지 등 직접 촬영한 이미지에서도 텍스트를 추출할 수 있다. | ||
=== 사이냅 PDFocus === | === 사이냅 PDFocus === | ||
사이냅 PDFocus는 30+ 다양한 포맷의 문서를 애플리케이션 없이 PDF로 변환·병합해주는 프로그램이다. 위협 요소를 제거한 무해화된 PDF를 생성하여 안전한 문서를 공유할 수 있으며, 다양한 문서 포맷을 하나의 PDF로 병합하여 문서 관리의 효율성을 증대해 준다. <ref>사이냅소프트 공식 홈페이지 - https://www.synapsoft.co.kr/pdfocus</ref> | 사이냅 PDFocus는 30+ 다양한 포맷의 문서를 애플리케이션 없이 PDF로 변환·병합해주는 프로그램이다. 위협 요소를 제거한 무해화된 PDF를 생성하여 안전한 문서를 공유할 수 있으며, 다양한 문서 포맷을 하나의 PDF로 병합하여 문서 관리의 효율성을 증대해 준다. <ref>사이냅소프트 공식 홈페이지 - https://www.synapsoft.co.kr/pdfocus</ref> |
2020년 9월 4일 (금) 11:06 판
사이냅은 사이냅소프트에서 개발한 웹 기반 문서 제공, 관리 솔루션이다.
목차
개요
사이냅은 2000년대 사이냅소프트의 전경헌 대표 주도 하에 개발한 웹 기반 문서 제공, 관리 솔루션으로, 현재 문서뷰어, 문서필터, 에디터, OCR, PDFocus 제품으로 구성되어 있다.
종류
사이냅 문서뷰어
사이냅 문서뷰어는 홈페이지에서 아래아 한글, MS 오피스, PDF, 이미지, 텍스트와 같은 문서를 다운로드하거나 별도의 오피스 프로그램 설치 없이 웹 브라우저에서 문서를 바로 볼 수 있는 원클릭 바로보기 솔루션이다. 정부 3.0 정부 운영 패러다임에 발맞춰 국민에게 정보를 공개해야 하는 공공기관, 지방자치단체, 교육기관 홈페이지의 공개문서는 대부분 아래아 한글, PDF로 작성돼 있다. 홈페이지 방문자들은 공개된 정보를 확인하기 위해 문서를 다운로드하고 해당 뷰어를 설치해야 하는 불편함을 경험해야 했다. 사이냅 문서뷰어는 특정 문서 포맷이나 다운로드로 인한 정보 접근 장벽을 제거함으로써 홈페이지에서 원클릭만으로 아래아 한글이나 PDF 문서를 웹브라우저에서 바로 볼 수 있게 한다. [1]
사이냅 문서필터
사이냅 문서필터는 각종 문서에 포함된 텍스트를 추출하는 데 활용되는 솔루션으로, 개인정보보호를 위한 텍스트 필터링이나 포털사이트의 문서 검색 등에 쓰인다. 네이버, 다음 등이 사이냅 소프트의 기술을 활용하고 있으며, 코난테크놀로지, 와이즈넛 오픈SNS 등 주요 기업용 검색 솔루션도 사이냅 소프트를 통해 문서 내 텍스트를 검색할 때 활용한다. MS 오피스와 맥 기반 오피스인 아이웍스를 지원한다.[2]
사이냅 에디터
사이냅에디터는 MS Word, 한글과컴퓨터 한컴오피스 한글 등의 문서를 그대로 불러와 편집할 수 있는 '임포트' 기능을 제공한다. 이 기능을 쓰는 사용자는 MS Word나 한글로 작성된 문서를 곧바로 웹콘텐츠로 활용 가능하다. 또, PC 문섭편집 프로그램의 정보를 사이냅에디터로 복사, 붙여넣기해도 온전한 서식을 재현한다. PC 프로그램에서 쓴 표, 글머리기호 등 다양한 객체를 그 속성까지 살려 웹에서 편집을 이어갈 수 있다.[3]
사이냅 OCR
사이냅 OCR은 AI 딥러닝 기술을 활용해 다양한 형태 이미지에 포함된 텍스트를 인식한다. 텍스트·텍스트 위치 정보와 패턴 정보를 제공한다. 로보틱프로세스자동화(RPA), DLP, 검색엔진, 웹 팩스 등 다양한 솔루션에서 활용한다. 사이냅소프트가 자체 개발한 사이냅 OCR는 한글인식이 뛰어난 AI-OCR로, '딥러닝 학습 데이터 확보 및 정제 프로세스'를 통해 인식 정확도를 지속 향상시킨다. '딥러닝 학습 데이터 확보 및 정제 프로세스'는 AI 딥러닝에서 핵심이 되는 양질 학습 데이터를 자체적으로 확보하는 기술이다. 사이냅 OCR 딥러닝 기술은 이미지 내 노이즈, 그림자, 왜곡과 학습되지 않은 글꼴로 인한 인식률 변화가 적다는 점이 특징이다. 이를 통해 간판, 책 표지 등 다양한 촬영 이미지 인식이 가능해 OCR 활용 범위를 확장한다. 자체 개발한 '텍스트 위치 기반 회전 보정 알고리즘'으로 이미지를 회전시켜야 하는 번거로운 전처리 과정 없이도 높은 인식 정확도를 제공한다. 정규식 패턴 매칭도 지원해 주민등록번호, 여권번호 등 민감 정보를 마스킹 처리한다. 템플릿 기반 서식인식 도구는 주민등록등·초본, 여권, 계약서, 영수증 등 다양한 서식에서 원하는 데이터를 추출한다. 이렇게 서식에서 추출한 데이터는 RPA, 보안 솔루션에 활용할 수 있다. OCR은 최근 뜨거운 관심을 받고 있는 RPA 핵심기술로 떠오르며, 한글인식률이 시장 기준에 부합하지 못한다는 것이 약점이었다. 사이냅 OCR은 한글 인식이 우수해 새롭게 RPA를 구축하거나 기구축한 고객으로부터 많은 관심을 받고 있다. 영수증·계약서가 활용되는 보험·금융업, 소비잦에게 정확한 상품 정보를 알려 줘야 하는 유통·이커머스, 다양한 서식이 오가는 물류업에서 사이냅 OCR을 유용하게 활용할 수 있다.[4]
기능
주민등록증을 클릭하면 1초도 걸리지 않아 주민등록증 내 텍스트가 인식되는 것을 확인할 수 있다. 주민등록증 서식이 등록되어 있어 서식 내용도 함께 확인할 수 있다.
뿐만 아니라 여권, 운전면허증과 같이 양식이 정해져 있는 이미지의 경우 텍스트 위치값과 더불어 서식 정보도 확인할 수 있다.
- 정해진 서식이 아닌 촬영된 이미지에 포함된 다량의 텍스트 인식
- 책 촬영 이미지는 굴곡과 그림자가 포함되어 있다. 하지만 사이냅 OCR은 문자 왜곡, 색상, 노이즈 등 인식 방해로 인한 변화에도 높은 인식률을 보여주어 상품 패키지, 간판, 책 표지 등 직접 촬영한 이미지에서도 텍스트를 추출할 수 있다.
사이냅 PDFocus
사이냅 PDFocus는 30+ 다양한 포맷의 문서를 애플리케이션 없이 PDF로 변환·병합해주는 프로그램이다. 위협 요소를 제거한 무해화된 PDF를 생성하여 안전한 문서를 공유할 수 있으며, 다양한 문서 포맷을 하나의 PDF로 병합하여 문서 관리의 효율성을 증대해 준다. [5]
기능
- 워터마크
- PDF 내 워터마크 삽입은 대부분의 PDF 변환 솔루션에서 지원하는 기능이다. 하지만 워터마크를 문서의 특정 영역에만 위치시킬 수 있을 뿐 반복 표현이 불가능하다. 하지만 사이냅 PDFocus는 단일표현과 반복표현을 모두 지원한다.
텍스트, 이미지 워터마크 모두 가능하며 조직도, IP와 연동하여 워터마크로 설정할 수도 있다. 이를 통해 중요 문서가 유출될 경우 유출 경로를 역추적할 수 있다. 또한, 기존 솔루션은 워터마크를 추가하면 문서의 용량이 급격하게 늘어나지만 사이냅 PDFocus는 워터마크가 반복됨에도 불구하고 용량의 변화가 거의 없다는 것읻 특징이다. 사이냅 PDFocus의 워터마크는 PDF 포맷 워터마크가 아닌 비트맵으로 그려지는 구조라 PDF리더기에서 워터마크로 인식되지 않는다. 이로 인해 워터마크의 변경이 불가능하다는 장점이 있다.[6]
- 암호설정
- 사이냅 PDFocus에서 지원하는 암호는 '문서 열기 암호'와 '권한 암호'이다.
- 문서 열기 암호는 흔히 알고 있는 문서를 열기 위한 암호이다. 중요한 문서라면 암호를 걸어 놓고 저장하는 게 보안상 안전하다. 문서가 유출되더라도 암호를 모르기 때문에 문서를 열어 볼 수 없기 때문이다. 문서를 공유해야 한다면 암호를 함께 전달하여 문서열람 권한을 부여할 수 있다.[6]
- 또 하나의 암호는 권한암호이다. PDF에서는 인쇄, 주석달기, 내용 복사 등의 기능에 제한을 둘 수 있다. 바로 이런 권한을 설정하기 위해 권한 암호가 필요한데, 권한제어를 통해 PDF 문서의 인쇄 여부를 설정할 수 있다.[6]
각주
- ↑ ITWORLD KOREA, 〈사이냅 소프트의 문서 바로보기 소프트웨어, 나라장터에서 판매〉
- ↑ 디지털데일리, 〈사이냅소프트, 문서필터 솔루션 신제품 출시〉, 2013-05-31
- ↑ ZDNet Korea, 〈사이냅소프트, 웹오피스 노하우 살린 에디터 출시〉, 2018-11-27
- ↑ 전자신문, 〈[신SW상품대상추천작사이냅소프트 '사이냅 OCR']〉, 2020-06-07
- ↑ 사이냅소프트 공식 홈페이지 - https://www.synapsoft.co.kr/pdfocus
- ↑ 6.0 6.1 6.2 사이냅소프트, 〈점점 더 강력해진다! 사이냅 PDFocus〉, 2020-08-04
참고자료
같이 보기
이 문서는 로고가 필요합니다.