검수요청.png검수요청.png

AI 보이스 스튜디오

위키원
이동: 둘러보기, 검색

AI 보이스 스튜디오(AI Voice Studio)는 ㈜케이티가 2022년 7월 출시한 인공지능(AI) 음성합성 콘텐츠 제작 서비스이다.

아사달 스마트 호스팅 가로 배너 (since 1998).jpg
이 그림에 대한 정보
[아사달] 스마트 호스팅

개요[편집]

AI 보이스 스튜디오는 대한민국 AI 음성합성 스타트업 휴멜로퓨샷러닝(Few shot learning) 기술을 기반으로 한 음성합성 서비스로, 사용자가 텍스트를 입력하면 감정을 담은 AI 목소리를 생성해준다. AI 보이스 스튜디오는 크게 AI 보이스와 스튜디오로 나뉜다. AI 보이스는 100여 개의 AI 목소리를 활용해 감정 상태에 따라 다양한 음성을 합성할 수 있는 기능이다. 사용자들은 '즐거움', '슬픔', '화남', '침착함', '중립'이라는 5가지 감정 상태 중 선택해 감정을 담은 음성을 생성할 수 있다. 이러한 감정 음성 합성은 사용자에게 보다 몰입감 있는 콘텐츠를 제공할 수 있도록 돕는다. 또한, 이 스튜디오에서는 텍스트를 입력하여 오디오북, 팟캐스트, 비디오 내레이션 등 다양한 형태의 오디오 콘텐츠를 제작할 수 있다. KT AI 보이스 스튜디오는 이처럼 감정 더빙을 활용한 음성 합성 기술이 탑재된 국내 최초의 상업적 서비스라는 점에서 주목받고 있다. 또한, 한국어뿐만 아니라 영어, 중국어, 일본어의 다국어 합성도 가능해, 글로벌 콘텐츠 제작자에게 유용한 도구로 평가받고 있다. AI 보이스 스튜디오가 선보인 셀럽 AI 보이스 기능은 유명인의 목소리를 AI로 재현하여 다양한 콘텐츠에 활용할 수 있는 서비스이다. 가수 윤도현이 첫 번째 셀럽 AI 보이스로 등장하였으며, 그의 목소리로 오디오북 '인간관계가 힘들어서 퇴사했습니다'가 제작되었다. 이 기능은 셀럽의 권리를 보호하기 위해 별도 문의 절차를 통해 이용할 수 있다.[1][2]

상품[편집]

마이AI보이스[편집]

마이AI보이스는 2022년 11월 출시된 서비스로, 사용자가 30개의 예시 문장만 녹음하면 자신만의 AI 목소리를 생성할 수 있다. 이 AI 목소리는 사용자가 녹음한 목소리의 톤, 감정, 말투 등을 반영해, 개인의 특성을 담아낸 음성을 제공한다. 사용자는 자신의 목소리와 비슷한 AI 목소리를 유튜브 영상, 오디오북, 팟캐스트 등 다양한 콘텐츠에 쉽게 적용할 수 있다. 마이AI보이스의 가장 큰 장점은 녹음 장비에 대한 요구가 낮다는 점이다. 녹음실이 필요 없이 조용한 집에서 평소 쓰는 이어폰 마이크만으로도 쉽게 녹음할 수 있다. 또한, 한국어뿐만 아니라 영어, 중국어, 일본어, 스페인어로도 AI 목소리를 합성할 수 있어 다국어 콘텐츠 제작에 매우 유리하다. 생성된 AI 음성은 사용자가 구독한 회원 유지 기간 동안 계속 보관되고, 언제든지 재사용할 수 있다. 이 서비스는 월 구독 요금제로 제공되며, 무료 플랜부터 시작해 유료 플랜으로는 라이트(1만 2,000원), 슈퍼(4만 8,000원), 슈퍼 플러스(12만 원) 플랜이 있다. 각 요금제에 따라 월간 사용할 수 있는 음성 콘텐츠의 글자 수가 차등 적용되며, 무료 플랜은 월 4000자, 슈퍼 플러스 플랜은 최대 36만 자까지 제작이 가능하다.

KT는 AI 보이스 스튜디오의 기술을 다양한 실제 프로젝트에 활용해왔다. 대표적으로 국방부와 협업하여 해외 파병 장병의 목소리를 AI로 복원해 가족들에게 동화책을 읽어주는 서비스를 제공한 사례가 있다. 2022년 9월, 레바논에 파병된 동명부대 27진 장병들의 AI 목소리를 제작해 자녀들에게 동화책을 읽어주는 특별한 선물을 전했다. 또한, 2022년 카타르 월드컵 공식 응원가 '더 뜨겁게, 한국'에도 마이AI보이스 기술이 적용되었다. 이 기술을 통해 고 유상철 감독의 목소리를 복원하여 국가대표팀을 응원하는 내레이션을 담은 광고가 제작되었다. 이러한 사례들은 AI 보이스 스튜디오의 기술이 단순히 상업적 콘텐츠뿐만 아니라 감성적이고 개인적인 콘텐츠 제작에도 유용하게 활용될 수 있음을 보여준다. 이렇게 많은 기대를 모았으나, 2024년 9월 마이AI보이스 서비스는 종료되었다. 이는 영상 콘텐츠 시장의 기대와는 달리 실제 이용률이 높지 않았기 때문으로 분석된다.[3][4]

AI 휴먼 스튜디오[편집]

2023년 11월, KT는 AI 휴먼 스튜디오 서비스를 새롭게 출시했다. 이 서비스는 생성형 AI 기술이 창조한 실존하지 않는 가상의 인물을 기반으로 영상 콘텐츠를 제작할 수 있게 해주는 플랫폼이다. 사용자는 다양한 AI 휴먼 모델 중에서 선택하고, 원하는 텍스트를 입력하여 동영상 콘텐츠를 자동으로 생성할 수 있다. 이 AI 휴먼 모델들은 이미지 생성 AI 기술을 통해 만들어졌으며, 초상권 문제 없이 자유롭게 사용할 수 있다는 점에서 장점이 있다. 또한, 이 AI 휴먼 모델들은 AI 보이스 스튜디오에서 제공하는 다양한 음성들과 결합해 보다 자연스러운 동영상 콘텐츠를 만들 수 있다. KT는 기업, 공공기관 등에서 원하는 맞춤형 AI 휴먼 제작 서비스도 제공하며, 성별, 연령, 목소리 등을 선택하여 고객이 원하는 대로 커스터마이징할 수 있다.[1] 화질은 최대 4K UHD 해상도까지 지원해 더욱 선명한 고품질의 동영상 콘텐츠를 제작하고 다운로드할 수 있다. 특히 PDF와 PPT 형식의 파일 업로드 기능을 제공해, 발표자료나 문서만 있으면 누구나 쉽게 강의나 소개 등의 영상 콘텐츠를 만들 수 있다.[5]

생태계 확장[편집]

망고보드[편집]

KT는 망고보드와 협업하여 AI 보이스 스튜디오의 음성합성 기술을 프리미엄 동영상 제작 및 디자인 툴인 망고보드에 적용했다. 망고보드는 다양한 템플릿을 제공하여 일반 사용자도 전문가 수준의 디자인과 동영상을 제작할 수 있는 웹서비스로, 기존에도 여러 AI 기술을 활용한 기능을 제공해왔다. 이번 협력을 통해 KT의 AI 보이스는 망고보드의 다양한 캐릭터와 결합되어 동영상 제작에 있어 더욱 몰입감을 제공할 수 있게 되었다.

AI 보이스는 감정을 담아 딱딱한 음성이 아닌, 보다 생동감 있는 캐릭터의 목소리를 제공함으로써 시청자들에게 전달하고자 하는 메시지를 보다 효과적으로 전달할 수 있다. 단순한 내레이션이 아닌 감정이 담긴 음성을 통해 사용자들이 제작하는 영상이 더욱 매력적으로 표현될 수 있도록 돕는다. 향후 KT와 망고보드는 마이AI보이스를 망고보드에 적용해 사용자 자신의 목소리를 AI로 변환해 활용할 수 있는 기능을 추가할 예정이며, 웹툰 제작 서비스인 '망고툰'의 애니메이션 기능에도 AI 보이스를 적용할 계획이다.[6]

밀리의 서재[편집]

KT는 밀리의 서재와 함께 AI 보이스 스튜디오의 '아나운서 AI 보이스'를 활용하여 오디오북을 제작했다. 이 오디오북은 교양 및 자기계발 도서로, '돈과 나의 일', '내일을 바꾸는 인생 공부', '위대한 경제학 고전 30권을 1권으로 읽는 책' 등 4종의 도서가 AI 아나운서의 목소리로 녹음되었다. 이 프로젝트에 사용된 AI 보이스는 마이AI보이스 기술을 기반으로 한 것으로, 30문장만 녹음하면 해당 아나운서의 목소리를 AI가 재현하여 오디오북 제작에 활용되었다.

이 기술을 통해 아나운서 특유의 정확하고 신뢰감 있는 발음과 말투를 유지하면서도 대규모의 오디오북 콘텐츠를 빠르게 제작할 수 있다. 밀리의 서재와 KT는 앞으로도 AI 보이스 스튜디오의 기술을 더 다양한 오디오 콘텐츠에 적용할 예정이며, 향후 박물관이나 미술관의 도슨트 서비스, 기업과 공공기관의 안내 방송 등에도 이 기술을 도입할 계획이다. 이를 통해 KT는 오디오북 시장의 활성화에 기여하며 AI 기반 오디오 콘텐츠 제작의 가능성을 넓히고 있다.[7]

곰믹스 맥스[편집]

KT는 ㈜곰앤컴퍼니와 손잡고 동영상 편집 프로그램인 곰믹스 맥스에 AI 보이스를 결합한 상품을 출시했다. 이 상품은 월 5,900원의 가격으로 2만자 수준의 AI 음성을 생성할 수 있는 서비스로, 곰믹스 맥스에서 동영상에 AI 보이스를 손쉽게 삽입하고 편집할 수 있도록 돕는다. 특히, 감정 표현 기능을 통해 즐거움, 슬픔, 화남, 침착함, 중립 등의 다양한 감정을 담아 음성을 생성할 수 있어, 단순한 음성 내레이션을 넘어 콘텐츠의 분위기와 상황에 맞는 감정 표현이 가능하다. 또한, 외국어 음성 합성 기능을 제공해 영어, 일본어, 중국어, 스페인어 등의 외국어 음성을 생성할 수 있어, 국제적인 콘텐츠 제작에도 유용하다. 곰믹스 맥스는 기존에도 편리한 동영상 편집 기능을 제공하는 소프트웨어였지만, 이번 협력을 통해 AI 음성을 결합함으로써 고품질의 동영상 제작 경험을 사용자들에게 제공하게 되었다.[8]

각주[편집]

  1. 1.0 1.1 백지영 기자, 〈[2023 IT혁신상품] "나만의 AI목소리 만들어요"…KT 'AI 보이스 스튜디오'〉, 《디지털데일리》, 2023-12-21
  2. 정예린 기자, 〈KT, 사람 감정 표현하는 'AI 보이스 스튜디오' 출시〉, 《전자신문》, 2022-07-19
  3. 김가은 기자, 〈[해봤다] '도플갱어급' AI로 오디오 콘텐츠 제작하는 법, 'KT 마이 AI보이스'〉, 《테크엠》, 2023-02-04
  4. 심지혜 기자, 〈'내 목소리 AI로 제작' KT 2년여 만에 서비스 중단〉, 《뉴시스》, 2024-09-23
  5. 전미준 기자, 〈KT, AI 휴먼과 AI 보이스 활용 영상제작 서비스 ‘AI 휴먼 스튜디오’ 선보여〉, 《인공지능신문》, 2023-11-15
  6. 이지민 기자, 〈KT, 감정 담은 'AI 보이스' 망고보드에 적용〉, 《뉴스핌》, 2023-04-06
  7. 박서린 기자, 〈KT-밀리의 서재, ‘아나운서 AI 보이스 오디오북’ 출시〉, 《중소기업신문》, 2023-05-31
  8. 백연식 기자, 〈KT AI 보이스, 영상 편집 프로그램에서 바로 쓴다〉, 《디지털투데이》, 2023-10-04

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 AI 보이스 스튜디오 문서는 인공지능 서비스에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.