검수요청.png검수요청.png

"비토"의 두 판 사이의 차이

위키원
이동: 둘러보기, 검색
(새 문서: 비토)
 
 
(같은 사용자의 중간 판 2개는 보이지 않습니다)
1번째 줄: 1번째 줄:
비토
+
[[파일:비토 글자.png|썸네일|300픽셀|'''비토'''(VITO)]]
 +
 
 +
'''비토'''(VITO)는 2021년 4월 [[㈜리턴제로]](ReturnZero)에서 출시한 [[통화]] [[녹음]]을 [[문자]]로 변환해주는 [[AI]] 서비스이다.
 +
{{:인터넷 배너|호스팅}}
 +
 
 +
== 개요 ==
 +
비토는 ㈜리턴제로가 보유한 독자적인 [[인공지능]] 기술을 활용해 [[통화]] [[녹음]]을 [[텍스트]]로 변환해주는 [[안드로이드]] 전용 앱이다. 이 앱은 출시된 지 1년이 채 되지 않았음에도 불구하고, 사용자들에게 큰 호응을 얻으며 빠르게 성장했다. 현재까지 비토는 1억 5,888만 회 이상의 통화 처리 건수를 기록하였으며, 누적 다운로드 수는 48만 건을 돌파했다. 이러한 성과는 비토의 뛰어난 기술력과 사용자 친화적인 [[인터페이스]](UI) 덕분이다. 비토의 주요 기능은 통화 녹음을 정확하고 신속하게 텍스트로 변환하는 것이다. 이 기능은 특히 중요한 통화 내용을 기록하고 관리해야 하는 사용자들에게 유용하다. 비토는 이러한 기능을 통해 많은 사용자들로부터 높은 평가를 받고 있다. 실제로 [[구글 플레이스토어]]에서 비토의 평점은 4.5점으로, 앱 이용자들이 비토의 서비스에 대한 만족도가 매우 높음을 알 수 있다.
 +
 
 +
비토는 또한 지속적인 서비스 업데이트를 통해 사용자 편의성을 끊임없이 개선하고 있다. 이로 인해 사용자들은 점점 더 높은 만족도를 느끼고 있으며, 비토는 통화 녹음이 필요한 사용자들에게 필수적인 앱으로 자리잡고 있다. 비토는 간편한 사용자 인터페이스와 안정적인 운영으로도 주목받고 있다. 이러한 요소들은 비토가 통화 녹음 앱 시장에서 빠르게 인기를 얻고 있는 중요한 이유들이다. 더 나아가 비토는 안드로이드 환경뿐만 아니라, [[아이폰]] [[iOS]]와 [[웹]] 환경에서도 사용할 수 있는 서비스를 출시할 예정이다. 이러한 확장은 비토의 기술력을 더 많은 사용자들에게 제공할 수 있는 기회를 열어줄 것이다. 특히, [[음성]] 파일을 텍스트로 변환한 후 [[메신저]]처럼 보여주는 기능은 사용자들에게 더 큰 편리함을 제공할 것으로 기대된다.<ref> 박광하 기자, 〈[https://www.koit.co.kr/news/articleView.html?idxno=94061 AI 통화 앱 '비토', 서비스 전면 무료화 선언]〉, 《정보통신신문》, 2022-02-27 </ref>
 +
 
 +
== 특징 ==
 +
* 통화 내용의 빠른 확인이 가능하다. 비토를 이용하면 한 시간 동안의 통화 내용을 스크롤하면서 5분 안에 모두 확인할 수 있다. 이는 중요한 대화 내용을 빠르게 확인하고 정리해야 하는 사용자들에게 매우 유용한 기능이다.
 +
* 빠른 검색 기능을 제공한다. 비토는 모든 통화 내용을 단어 검색을 통해 언제든지 다시 찾아볼 수 있도록 지원한다. 이를 통해 사용자는 특정 단어나 문구를 빠르게 검색하여 필요한 정보를 즉시 찾아낼 수 있다.
 +
* 다시 듣기 기능이 있다. 대화 내용을 눈으로 보다가 특정 부분을 다시 듣고 싶을 때, 그 부분만 선택해서 재생할 수 있다. 이 기능은 중요한 부분을 반복적으로 확인해야 할 때 매우 유용하다.
 +
* 이전 통화 내용 미리보기 기능을 제공한다. 저장되지 않은 번호로 걸려온 전화도 비토를 통해 이전 통화 내용을 미리 볼 수 있어, 사용자는 스마트한 통화 관리가 가능하다. 이 기능은 특히 비즈니스 통화나 중요한 연락처 관리에 있어 큰 도움이 된다.<ref> 〈[https://www.vito.ai/ 비토]〉, 《비토》 </ref>
 +
 
 +
== 유료 멤버십 ==
 +
비토는 유료 멤버십을 도입하며 사용자들에게 보다 차별화된 서비스를 제공하고 있다. 유료 멤버십은 기본적인 [[문자]] 변환 서비스에 더해 다양한 프리미엄 기능을 추가로 제공함으로써, 사용자 경험을 한층 향상시키는 데 중점을 두고 있다. 유료 멤버십 가입자에게 제공되는 주요 혜택 중 하나는 [[통화]] 전 미리보기 기능이다. 이 기능은 사용자가 통화 중에 음성을 녹음하고 텍스트로 변환하기 전에, 미리 어떤 형태로 [[텍스트]]가 변환될지를 미리 볼 수 있게 해준다. 이를 통해 사용자들은 중요한 통화 내용을 보다 명확하고 정확하게 관리할 수 있다. 또한, 유료 멤버십 가입자는 오디오가 포함된 텍스트 변환 내용 공유 기능을 이용할 수 있다. 이 기능은 단순히 텍스트로 변환된 내용을 공유하는 것에 그치지 않고, 해당 텍스트와 연계된 오디오 파일도 함께 공유할 수 있도록 해준다. 이를 통해 사용자들은 비즈니스 파트너나 팀원들과의 커뮤니케이션을 더욱 원활하게 할 수 있으며, 중요한 정보를 놓치지 않고 공유할 수 있다.
 +
 
 +
또한, 비토는 300GB의 [[오디오]] 파일 [[클라우드]]를 제공함으로써, 많은 통화량에도 용량 부담 없이 서비스를 이용할 수 있도록 하고 있다. 이 클라우드는 유료 멤버십 사용자들에게 추가 비용 없이 제공되며, 이는 많은 데이터를 처리해야 하는 사용자들에게 큰 혜택이 될 수 있다. 이러한 클라우드 용량 확대는 특히나 비즈니스 사용자들이나 데이터 저장이 중요한 사용자들에게 큰 도움이 된다. 비토가 추가로 제공할 파일 업로드 및 녹음 기능은 유료 멤버십 사용자들에게 제공될 예정으로, 사용자는 비토 앱을 통해 보다 효율적이고 체계적으로 통화 데이터를 관리할 수 있을 것으로 기대된다.
 +
 
 +
비토의 유료 멤버십 도입은 리턴제로의 독자적인 [[AI]] [[음성인식]] 엔진을 기반으로 한 서비스 고도화의 일환으로, 이를 통해 비토는 더 많은 전문 수요 고객층을 확보할 수 있을 것으로 보인다. 이러한 프리미엄 기능들은 특히 특정 전문 분야 종사자들 사이에서 큰 인기를 끌 것으로 예상되며, 사용자들을 더욱 비토 서비스에 묶어두는 락인(Lock-in) 효과를 기대할 수 있다.<ref> 전미준 기자, 〈[https://www.aitimes.kr/news/articleView.html?idxno=27285 눈으로 보는 AI 전화 ‘비토’, 유료 멤버십 도입으로 보다 차별화된 서비스 제공]〉, 《인공지능신문》, 2023-02-03 </ref>
 +
 
 +
== 버전 ==
 +
===PC===
 +
비토는 [[PC]] 버전을 정식으로 출시하며 [[모바일]]에서만 가능했던 서비스의 사용 환경을 확장했다. 이를 통해 사용자들은 더 넓은 접점에서 비토를 활용할 수 있게 되었으며, 특히 업무 환경에서의 편의성이 크게 강화되었다. PC 버전 출시로 기존 모바일 사용자들은 별도의 회원 가입 절차 없이 기존 계정으로 웹 서비스에 쉽게 로그인할 수 있다. 이로 인해 사용자들은 이전에 앱에서만 확인할 수 있었던 통화 녹음의 텍스트 변환 내용을 이제 PC에서도 확인하고 관리할 수 있게 되었다. 이를 통해 사용자들은 큰 화면에서 더 편리하게 대화 내용을 보고, 듣고, 편집할 수 있으며, 작업 효율성이 크게 증가할 것으로 예상된다. 또한, 휴대폰 용량이 부족한 사용자들을 위해 기본 [[클라우드]] 기능을 제공하여 데이터를 백업할 수 있는 기능도 포함되었다. PC 버전 출시를 기념해 비토는 17시간 상당의 통화 음성 파일을 저장할 수 있는 1GB의 클라우드 용량을 무료로 제공하고 있다. 이는 사용자가 중요한 통화 [[데이터]]를 안전하게 보관할 수 있는 방법을 제공하며, 서비스에 대한 신뢰도를 높이는 데 기여하고 있다.
 +
 
 +
PC 버전 출시와 함께 비토는 다양한 부가 기능을 추가하며 사용자 경험을 더욱 강화했다. 통화 내용의 편집 및 공유 기능, 그리고 북마크 기능이 대표적이다. 사용자는 이제 문자 변환된 통화 내용을 편집하고, 중요한 통화 내용을 가족이나 지인과 쉽게 공유할 수 있다. 특히 공유 기능은 설정된 기간 동안만 통화 내용을 볼 수 있도록 하며, [[보안]]을 강화하기 위해 자동 생성된 [[비밀번호]]와 링크를 제공한다. 또한, 북마크 기능을 통해 사용자들이 중요하다고 생각하는 대화 내용을 저장하고, 필요할 때 빠르게 찾을 수 있는 검색 편의성이 높아졌다. 저장된 북마크는 특정 단어를 검색할 때 최상단에 노출되며, 별도의 메모를 추가할 수도 있어 자주 검색 기능을 사용하는 사용자들에게 유용할 것이다.
 +
 
 +
비토는 음성인식 기술의 지속적인 발전을 통해 더욱 정교한 서비스를 제공하고 있다. 최근에는 소머즈 엔진에 새로운 [[인공신경망]](NNLM) 언어모델을 적용해 텍스트 변환의 정확도를 한층 더 높였다. 이와 함께 ARS 음성 인식 및 구분 기능, 감탄사 및 비속어 제외 기능, 가독성 개선 기능 등을 포함한 다양한 업데이트가 이루어져, 사용자가 더욱 편리하게 비토 서비스를 활용할 수 있도록 했다.<ref> 최광민 기자, 〈[https://www.aitimes.kr/news/articleView.html?idxno=25471 통화 내용, 이제 PC에서도 간편하게 확인...눈으로 보는 통화 앱 ‘비토’, PC버전 출시]〉, 《인공지능신문》, 2022-07-08 </ref>
 +
 
 +
== 비토 스피치 ==
 +
비토 스피치(VITO Speech)는 [[㈜리턴제로]]가 2022년 6월 30일에 출시한 음성인식 문자 변환(STT, Speech-to-Text) 기능을 제공하는 오픈 [[API]]로, 다양한 개발자들과 기업들이 비토의 우수한 [[음성인식]] 기술을 활용할 수 있도록 만든 플랫폼이다. 이와 함께 비토 스피치의 [[개발자]] [[웹사이트]]인 비토 디벨로퍼(VITO Developer)도 베타 버전으로 함께 출시되었다. 비토 스피치가 탄생한 배경에는 리턴제로가 개발한 뛰어난 STT 기술을 더 많은 사용자들에게 제공하고자 하는 목표가 있었다. 비토라는 서비스는 원래 전화 통화 음성을 [[텍스트]]로 변환하는 기능을 중심으로 하고 있었는데, 이 기술을 단지 사내에서만 사용하는 것이 아니라 더 넓은 개발자 및 기업 커뮤니티와 공유할 필요성을 느꼈다. 특히, 시장에 이미 존재하는 한국어 STT API들 중에서 성능이 뛰어나면서도 비용 부담 없이 사용할 수 있는 제품이 거의 없었기에, 리턴제로는 비토 스피치가 이를 해결할 수 있는 중요한 도구가 될 수 있다고 판단했다.
 +
 
 +
비토 스피치는 높은 성능의 한국어 STT API를 초기 비용 걱정 없이 사용할 수 있다는 큰 장점을 지닌다. 비토 디벨로퍼 웹사이트에 가입만 하면 매월 100시간의 무료 사용이 가능해, 타 경쟁사의 무료 제공량과 비교할 때 초기 비용 부담이 현저히 낮다. 이로 인해 더 많은 개발자와 기업들이 비토 스피치를 쉽게 접하고 활용할 수 있다. 기술적으로 비토 스피치는 다양한 강점을 가지고 있다. 그중에서도 가장 주목할 만한 점은 8K 전화 데이터에 최적화되어 있어, AICC, 세일즈 콜, 앱 내 통화 등에 특화된 성능을 제공한다는 것이다. 이러한 성능은 공개된 방송 [[오디오]]나 대본을 읽은 데이터를 학습한 것이 아니라, 실제 사람이 일상에서 나눈 대화를 기반으로 학습된 인공지능을 통해 가능해졌다. 이는 비토 스피치가 단순한 음성인식 API를 넘어, 실제 생활에서 사용 가능한 매우 정밀한 도구로 자리 잡게 하는 요소다. 또한 다양한 고급 기능을 제공한다. 먼저, 화자 분리 기술을 통해 두 명 이상의 화자가 대화를 나누는 음성 데이터에서 각 화자를 분리해 텍스트로 변환할 수 있다. 이 기술은 전화 통화 데이터와 같은 환경에서 매우 유용하게 쓰인다. 또한, 다중 채널 지원 기능을 통해 여러 채널이 포함된 오디오 파일을 채널별로 나누어 텍스트로 변환할 수 있으며, 실시간 STT 제공 기능은 스트리밍 형태로 음성을 실시간으로 텍스트로 변환할 수 있게 한다. 이를 위해 GRPC와 WebSocket 방식을 지원하며, 다양한 오디오 코덱도 지원한다.
 +
 
 +
이 외에도 비토 스피치는 영어/숫자/단위 변환, 간투어 필터, 비속어 필터, 문단 나누기 등 사용자 편의를 높이는 여러 기능들을 제공하고 있다. 예를 들어, 영어와 숫자, 단위를 한글이 아닌 가독성 높은 표기로 변환해주는 기능은 사용자가 텍스트를 더 쉽게 이해할 수 있도록 돕는다. 또한, 간투어 필터는 의미 없는 발음을 제거해 텍스트의 가독성을 높여주며, 비속어 필터는 욕설 등을 별표로 가려준다. 문단 나누기 기능은 발화 속도와 내용을 기반으로 텍스트를 적절히 분할해, 특히 모바일 기기에서의 가독성을 높인다. 이처럼 비토 스피치는 개발자와 기업들이 음성인식 기술을 쉽게 통합하고 사용할 수 있도록 하여, 다양한 서비스와 응용 프로그램에서 한국어 STT 기술의 혜택을 누릴 수 있게 해준다.<ref> 〈[https://blog.rtzr.ai/release-vito-speech/ 음성인식 API 비토 스피치(VITO Speech) 출시 이야기]〉, 《리턴제로 블로그》, 2023-08-17 </ref>
 +
 
 +
{{각주}}
 +
 
 +
== 참고자료 ==
 +
* 〈[https://www.vito.ai/ 비토]〉, 《비토》
 +
* 박광하 기자, 〈[https://www.koit.co.kr/news/articleView.html?idxno=94061 AI 통화 앱 '비토', 서비스 전면 무료화 선언]〉, 《정보통신신문》, 2022-02-27
 +
* 최광민 기자, 〈[https://www.aitimes.kr/news/articleView.html?idxno=25471 통화 내용, 이제 PC에서도 간편하게 확인...눈으로 보는 통화 앱 ‘비토’, PC버전 출시]〉, 《인공지능신문》, 2022-07-08
 +
* 전미준 기자, 〈[https://www.aitimes.kr/news/articleView.html?idxno=27285 눈으로 보는 AI 전화 ‘비토’, 유료 멤버십 도입으로 보다 차별화된 서비스 제공]〉, 《인공지능신문》, 2023-02-03
 +
* 〈[https://blog.rtzr.ai/release-vito-speech/ 음성인식 API 비토 스피치(VITO Speech) 출시 이야기]〉, 《리턴제로 블로그》, 2023-08-17
 +
 
 +
== 같이 보기 ==
 +
* [[㈜리턴제로]]
 +
 
 +
{{인공지능 서비스|검토 필요}}

2024년 9월 4일 (수) 09:15 기준 최신판

비토(VITO)

비토(VITO)는 2021년 4월 ㈜리턴제로(ReturnZero)에서 출시한 통화 녹음문자로 변환해주는 AI 서비스이다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

개요[편집]

비토는 ㈜리턴제로가 보유한 독자적인 인공지능 기술을 활용해 통화 녹음텍스트로 변환해주는 안드로이드 전용 앱이다. 이 앱은 출시된 지 1년이 채 되지 않았음에도 불구하고, 사용자들에게 큰 호응을 얻으며 빠르게 성장했다. 현재까지 비토는 1억 5,888만 회 이상의 통화 처리 건수를 기록하였으며, 누적 다운로드 수는 48만 건을 돌파했다. 이러한 성과는 비토의 뛰어난 기술력과 사용자 친화적인 인터페이스(UI) 덕분이다. 비토의 주요 기능은 통화 녹음을 정확하고 신속하게 텍스트로 변환하는 것이다. 이 기능은 특히 중요한 통화 내용을 기록하고 관리해야 하는 사용자들에게 유용하다. 비토는 이러한 기능을 통해 많은 사용자들로부터 높은 평가를 받고 있다. 실제로 구글 플레이스토어에서 비토의 평점은 4.5점으로, 앱 이용자들이 비토의 서비스에 대한 만족도가 매우 높음을 알 수 있다.

비토는 또한 지속적인 서비스 업데이트를 통해 사용자 편의성을 끊임없이 개선하고 있다. 이로 인해 사용자들은 점점 더 높은 만족도를 느끼고 있으며, 비토는 통화 녹음이 필요한 사용자들에게 필수적인 앱으로 자리잡고 있다. 비토는 간편한 사용자 인터페이스와 안정적인 운영으로도 주목받고 있다. 이러한 요소들은 비토가 통화 녹음 앱 시장에서 빠르게 인기를 얻고 있는 중요한 이유들이다. 더 나아가 비토는 안드로이드 환경뿐만 아니라, 아이폰 iOS 환경에서도 사용할 수 있는 서비스를 출시할 예정이다. 이러한 확장은 비토의 기술력을 더 많은 사용자들에게 제공할 수 있는 기회를 열어줄 것이다. 특히, 음성 파일을 텍스트로 변환한 후 메신저처럼 보여주는 기능은 사용자들에게 더 큰 편리함을 제공할 것으로 기대된다.[1]

특징[편집]

  • 통화 내용의 빠른 확인이 가능하다. 비토를 이용하면 한 시간 동안의 통화 내용을 스크롤하면서 5분 안에 모두 확인할 수 있다. 이는 중요한 대화 내용을 빠르게 확인하고 정리해야 하는 사용자들에게 매우 유용한 기능이다.
  • 빠른 검색 기능을 제공한다. 비토는 모든 통화 내용을 단어 검색을 통해 언제든지 다시 찾아볼 수 있도록 지원한다. 이를 통해 사용자는 특정 단어나 문구를 빠르게 검색하여 필요한 정보를 즉시 찾아낼 수 있다.
  • 다시 듣기 기능이 있다. 대화 내용을 눈으로 보다가 특정 부분을 다시 듣고 싶을 때, 그 부분만 선택해서 재생할 수 있다. 이 기능은 중요한 부분을 반복적으로 확인해야 할 때 매우 유용하다.
  • 이전 통화 내용 미리보기 기능을 제공한다. 저장되지 않은 번호로 걸려온 전화도 비토를 통해 이전 통화 내용을 미리 볼 수 있어, 사용자는 스마트한 통화 관리가 가능하다. 이 기능은 특히 비즈니스 통화나 중요한 연락처 관리에 있어 큰 도움이 된다.[2]

유료 멤버십[편집]

비토는 유료 멤버십을 도입하며 사용자들에게 보다 차별화된 서비스를 제공하고 있다. 유료 멤버십은 기본적인 문자 변환 서비스에 더해 다양한 프리미엄 기능을 추가로 제공함으로써, 사용자 경험을 한층 향상시키는 데 중점을 두고 있다. 유료 멤버십 가입자에게 제공되는 주요 혜택 중 하나는 통화 전 미리보기 기능이다. 이 기능은 사용자가 통화 중에 음성을 녹음하고 텍스트로 변환하기 전에, 미리 어떤 형태로 텍스트가 변환될지를 미리 볼 수 있게 해준다. 이를 통해 사용자들은 중요한 통화 내용을 보다 명확하고 정확하게 관리할 수 있다. 또한, 유료 멤버십 가입자는 오디오가 포함된 텍스트 변환 내용 공유 기능을 이용할 수 있다. 이 기능은 단순히 텍스트로 변환된 내용을 공유하는 것에 그치지 않고, 해당 텍스트와 연계된 오디오 파일도 함께 공유할 수 있도록 해준다. 이를 통해 사용자들은 비즈니스 파트너나 팀원들과의 커뮤니케이션을 더욱 원활하게 할 수 있으며, 중요한 정보를 놓치지 않고 공유할 수 있다.

또한, 비토는 300GB의 오디오 파일 클라우드를 제공함으로써, 많은 통화량에도 용량 부담 없이 서비스를 이용할 수 있도록 하고 있다. 이 클라우드는 유료 멤버십 사용자들에게 추가 비용 없이 제공되며, 이는 많은 데이터를 처리해야 하는 사용자들에게 큰 혜택이 될 수 있다. 이러한 클라우드 용량 확대는 특히나 비즈니스 사용자들이나 데이터 저장이 중요한 사용자들에게 큰 도움이 된다. 비토가 추가로 제공할 파일 업로드 및 녹음 기능은 유료 멤버십 사용자들에게 제공될 예정으로, 사용자는 비토 앱을 통해 보다 효율적이고 체계적으로 통화 데이터를 관리할 수 있을 것으로 기대된다.

비토의 유료 멤버십 도입은 리턴제로의 독자적인 AI 음성인식 엔진을 기반으로 한 서비스 고도화의 일환으로, 이를 통해 비토는 더 많은 전문 수요 고객층을 확보할 수 있을 것으로 보인다. 이러한 프리미엄 기능들은 특히 특정 전문 분야 종사자들 사이에서 큰 인기를 끌 것으로 예상되며, 사용자들을 더욱 비토 서비스에 묶어두는 락인(Lock-in) 효과를 기대할 수 있다.[3]

버전[편집]

PC[편집]

비토는 PC 버전을 정식으로 출시하며 모바일에서만 가능했던 서비스의 사용 환경을 확장했다. 이를 통해 사용자들은 더 넓은 접점에서 비토를 활용할 수 있게 되었으며, 특히 업무 환경에서의 편의성이 크게 강화되었다. PC 버전 출시로 기존 모바일 사용자들은 별도의 회원 가입 절차 없이 기존 계정으로 웹 서비스에 쉽게 로그인할 수 있다. 이로 인해 사용자들은 이전에 앱에서만 확인할 수 있었던 통화 녹음의 텍스트 변환 내용을 이제 PC에서도 확인하고 관리할 수 있게 되었다. 이를 통해 사용자들은 큰 화면에서 더 편리하게 대화 내용을 보고, 듣고, 편집할 수 있으며, 작업 효율성이 크게 증가할 것으로 예상된다. 또한, 휴대폰 용량이 부족한 사용자들을 위해 기본 클라우드 기능을 제공하여 데이터를 백업할 수 있는 기능도 포함되었다. PC 버전 출시를 기념해 비토는 17시간 상당의 통화 음성 파일을 저장할 수 있는 1GB의 클라우드 용량을 무료로 제공하고 있다. 이는 사용자가 중요한 통화 데이터를 안전하게 보관할 수 있는 방법을 제공하며, 서비스에 대한 신뢰도를 높이는 데 기여하고 있다.

PC 버전 출시와 함께 비토는 다양한 부가 기능을 추가하며 사용자 경험을 더욱 강화했다. 통화 내용의 편집 및 공유 기능, 그리고 북마크 기능이 대표적이다. 사용자는 이제 문자 변환된 통화 내용을 편집하고, 중요한 통화 내용을 가족이나 지인과 쉽게 공유할 수 있다. 특히 공유 기능은 설정된 기간 동안만 통화 내용을 볼 수 있도록 하며, 보안을 강화하기 위해 자동 생성된 비밀번호와 링크를 제공한다. 또한, 북마크 기능을 통해 사용자들이 중요하다고 생각하는 대화 내용을 저장하고, 필요할 때 빠르게 찾을 수 있는 검색 편의성이 높아졌다. 저장된 북마크는 특정 단어를 검색할 때 최상단에 노출되며, 별도의 메모를 추가할 수도 있어 자주 검색 기능을 사용하는 사용자들에게 유용할 것이다.

비토는 음성인식 기술의 지속적인 발전을 통해 더욱 정교한 서비스를 제공하고 있다. 최근에는 소머즈 엔진에 새로운 인공신경망(NNLM) 언어모델을 적용해 텍스트 변환의 정확도를 한층 더 높였다. 이와 함께 ARS 음성 인식 및 구분 기능, 감탄사 및 비속어 제외 기능, 가독성 개선 기능 등을 포함한 다양한 업데이트가 이루어져, 사용자가 더욱 편리하게 비토 서비스를 활용할 수 있도록 했다.[4]

비토 스피치[편집]

비토 스피치(VITO Speech)는 ㈜리턴제로가 2022년 6월 30일에 출시한 음성인식 문자 변환(STT, Speech-to-Text) 기능을 제공하는 오픈 API로, 다양한 개발자들과 기업들이 비토의 우수한 음성인식 기술을 활용할 수 있도록 만든 플랫폼이다. 이와 함께 비토 스피치의 개발자 웹사이트인 비토 디벨로퍼(VITO Developer)도 베타 버전으로 함께 출시되었다. 비토 스피치가 탄생한 배경에는 리턴제로가 개발한 뛰어난 STT 기술을 더 많은 사용자들에게 제공하고자 하는 목표가 있었다. 비토라는 서비스는 원래 전화 통화 음성을 텍스트로 변환하는 기능을 중심으로 하고 있었는데, 이 기술을 단지 사내에서만 사용하는 것이 아니라 더 넓은 개발자 및 기업 커뮤니티와 공유할 필요성을 느꼈다. 특히, 시장에 이미 존재하는 한국어 STT API들 중에서 성능이 뛰어나면서도 비용 부담 없이 사용할 수 있는 제품이 거의 없었기에, 리턴제로는 비토 스피치가 이를 해결할 수 있는 중요한 도구가 될 수 있다고 판단했다.

비토 스피치는 높은 성능의 한국어 STT API를 초기 비용 걱정 없이 사용할 수 있다는 큰 장점을 지닌다. 비토 디벨로퍼 웹사이트에 가입만 하면 매월 100시간의 무료 사용이 가능해, 타 경쟁사의 무료 제공량과 비교할 때 초기 비용 부담이 현저히 낮다. 이로 인해 더 많은 개발자와 기업들이 비토 스피치를 쉽게 접하고 활용할 수 있다. 기술적으로 비토 스피치는 다양한 강점을 가지고 있다. 그중에서도 가장 주목할 만한 점은 8K 전화 데이터에 최적화되어 있어, AICC, 세일즈 콜, 앱 내 통화 등에 특화된 성능을 제공한다는 것이다. 이러한 성능은 공개된 방송 오디오나 대본을 읽은 데이터를 학습한 것이 아니라, 실제 사람이 일상에서 나눈 대화를 기반으로 학습된 인공지능을 통해 가능해졌다. 이는 비토 스피치가 단순한 음성인식 API를 넘어, 실제 생활에서 사용 가능한 매우 정밀한 도구로 자리 잡게 하는 요소다. 또한 다양한 고급 기능을 제공한다. 먼저, 화자 분리 기술을 통해 두 명 이상의 화자가 대화를 나누는 음성 데이터에서 각 화자를 분리해 텍스트로 변환할 수 있다. 이 기술은 전화 통화 데이터와 같은 환경에서 매우 유용하게 쓰인다. 또한, 다중 채널 지원 기능을 통해 여러 채널이 포함된 오디오 파일을 채널별로 나누어 텍스트로 변환할 수 있으며, 실시간 STT 제공 기능은 스트리밍 형태로 음성을 실시간으로 텍스트로 변환할 수 있게 한다. 이를 위해 GRPC와 WebSocket 방식을 지원하며, 다양한 오디오 코덱도 지원한다.

이 외에도 비토 스피치는 영어/숫자/단위 변환, 간투어 필터, 비속어 필터, 문단 나누기 등 사용자 편의를 높이는 여러 기능들을 제공하고 있다. 예를 들어, 영어와 숫자, 단위를 한글이 아닌 가독성 높은 표기로 변환해주는 기능은 사용자가 텍스트를 더 쉽게 이해할 수 있도록 돕는다. 또한, 간투어 필터는 의미 없는 발음을 제거해 텍스트의 가독성을 높여주며, 비속어 필터는 욕설 등을 별표로 가려준다. 문단 나누기 기능은 발화 속도와 내용을 기반으로 텍스트를 적절히 분할해, 특히 모바일 기기에서의 가독성을 높인다. 이처럼 비토 스피치는 개발자와 기업들이 음성인식 기술을 쉽게 통합하고 사용할 수 있도록 하여, 다양한 서비스와 응용 프로그램에서 한국어 STT 기술의 혜택을 누릴 수 있게 해준다.[5]

각주[편집]

  1. 박광하 기자, 〈AI 통화 앱 '비토', 서비스 전면 무료화 선언〉, 《정보통신신문》, 2022-02-27
  2. 비토〉, 《비토》
  3. 전미준 기자, 〈눈으로 보는 AI 전화 ‘비토’, 유료 멤버십 도입으로 보다 차별화된 서비스 제공〉, 《인공지능신문》, 2023-02-03
  4. 최광민 기자, 〈통화 내용, 이제 PC에서도 간편하게 확인...눈으로 보는 통화 앱 ‘비토’, PC버전 출시〉, 《인공지능신문》, 2022-07-08
  5. 음성인식 API 비토 스피치(VITO Speech) 출시 이야기〉, 《리턴제로 블로그》, 2023-08-17

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 비토 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.