검수요청.png검수요청.png

음성제어

위키원
이동: 둘러보기, 검색
스티어링 휠의 음성제어 버튼
음성제어

음성제어음성 인식으로 편리하게 차량의 각종 장치와 기능을 제어할 수 있는 서비스이다. 창문, 썬루프, 공조, 열선 등을 제어하시거나 실시간 길 안내를 받을 수 있다. 예를 들면 "에어컨 켜줘", "트렁크 닫아줄래?", "후석 엉덩이 따뜻하게", "현대자동차로 길 안내 해줘" 등이 해당된다.

타고 월렌트 대형 가로 배너.jpg
이 그림에 대한 정보
[타고] 1개월 단위로 전기차가 필요할 때! 타고 월렌트 서비스

역사[편집]

1950년대 미국에서 처음 시작[편집]

음성 제어 기능은 사람의 음성을 텍스트 형식으로 처리하는 기술인 음성 인식에서 시작됐다. 최초로 음성 인식 기능을 선보인 곳은 미국의 벨 연구소이다. 이들이 1952년 선보인 '오드리(Audrey)' 시스템은 사람이 말하는 숫자를 인식할 수 있었다. 10년 뒤인 1962년, 미국의 IBM이 선보인 '슈박스(Shoebox)' 시스템은 10자리 숫자 및 더하기, 빼기 등 6개의 명령어까지 인식할 수 있었다.

당시 음성 인식 기술은 미래의 기술로 조명 받았다. 전화를 걸어 음성으로 프로그램을 다룰 수 있다면 전 세계 어디서든 프로그램을 조작할 수 있었다. 가능성에 주목한 미국 국방성 산하 방위고등연구계획국(DARPA)은 1970년대에 1,000단어 이상의 연속 음성 인식에 성공했다. 비슷한 시기에 IBM은 전화로 컴퓨터랑 대화할 수 있는 시스템을 구축하고, 1980년대에는 음성 인식 타이핑 프로그램의 개발에 착수한다.

군사용 기술에서 상용화로[편집]

이처럼 군사용 기술로 연구되던 음성 인식 기술이 상용화된 때는 1990년이다. IBM은 1992년에 최초의 패키지형 음성 인식 제품인 스피치 서버 시리즈를 내놓고, 1993년에는 개인 이용자를 위한 음성 인식 타이핑 프로그램인 '보이스 타이프(Voice Type)'를 출시했다. 97%의 정확도로 분당 70~100단어의 속도로 3만2,000여가지 단어를 인식할 수 있었.

자동차에 처음 적용된 건 2005년[편집]

음성 제어 기능이 자동차에 처음 적용된 때는 2005년이다. 당시의 음성 인식 시스템은 미리 설정된 명령어를 말하는 방식이었다. 가령 "라디오 소리 크게", "라디오 소리 작게" 등의 정해진 어휘만 인식할수 있었다. 그럼에도 음성 제어 기능은 빠르게 보급됐다. 안전을 위해서이다. 음성 제어 기능은 운전자의 시선 이동을 막는 효과가 있다. 버튼으로 시선을 옮기지 않아도 되기 때문이다.

시속 100㎞로 달리는 자동차는 1초에 27.7m를 움직인다. 특히 폭스바겐의 고향인 독일의 아우토반에서는 그 이상의 속도를 내며 달린다. 그만큼 운전자가 도로를 보고 집중할 수 있는 환경을 만드는 것이 중요하다. 음성 제어 기능이 중요한 이유다. 게다가 당대 자동차의 인포테인먼트 시스템 기능은 단순한 편에 속했으니 음성 제어에 사용할 수 있는 어휘가 한정적인 부분도 전혀 문젯거리가 되지 않았다.

자연어까지 알아 듣는 음성인식 시스템[편집]

하지만 자동차가 IT 기술과 결합하고 인포테인먼트 시스템이 발전하면서 음성 제어 기술 또한 발전할 필요가 생겼다. 몇 년 전과 지금을 비교하면 엄청난 차이를 느낄 수 있다. 과거에는 명령어도 잘 알아듣지 못했는데, 지금은 "오늘 날씨는 어때? 조금 추운 것 같아" 등의 대화를 알아듣고 기능을 조절한다. 특정 기능을 조정하기 위한 명령어를 외우는 것보다 자연스레 말하는 것이 더 쓰기 쉽기 때문이다.

음성 제어 기능이 이와 같은 본격적인 발전을 할 수 있던 계기는 네트워크 연결에 있다. 이전에는 프로그램 자체의 정보만을 이용해 음성 인식을 처리했다면, 지금은 사용자가 말한 내용을 서버에 보내 처리한다. 방대한 자료를 빠르게 처리하는 서버를 이용하는 만큼 처리 속도를 높일 수 있다. 게다가 서버에 쌓인 이용 기록을 활용한 기계 학습은 음성 인식의 정확도를 빠르게 올리는데 이바지하고 있다.

성능의 개선과 함께 음성 제어 기능은 '안전한 운전'에 초점을 두고 다양한 콘텐츠를 제공하는 쪽으로 진화했다. 대표적인 부분이 운전 중 메시지 수신 안내, 날씨 안내 등의 기능이다. 화면에 메시지를 띄울 수도 있지만, 메시지 내용을 읽어주면서 화면에 운전자의 시선이 갈 일을 최대한 줄인다.

'디지털 비서'로 진화하고 있는 음성 제어 기술[편집]

현재 자동차의 음성 제어 기능은 음성 비서의 형태로 발전하고 있다. 폭스바겐이 2017년 예고한 '디지털 비서'의 시대가 다가오고 있다. 폭스바겐이 IBM과 함께 선보인 디지털 비서 왓슨은 여행 중 식사에 어울릴 장소를 살펴 소개하고 음성 명령으로 예약을 돕는다. 추천도 함부로 하지 않는다. 운전자의 선호도나 습관을 학습해 운전자의 취향에 맞춰 작동한다.

미래의 음성 비서는 훨씬 다양한 기능을 수행할 것이다. 현재 자동차는 자율주행 시대에 맞춰 하나의 통합 제어 시스템이 모든 부분을 제어하는 방식으로 발전하고 있다. 여기에 음성 비서를 결합하면 더욱 다양한 기능을 제공할 수 있다. 만일 자동차에 이상이 생기면 음성 비서가 문제가 발생한 부분과 이상 증상을 설명하고, 가장 가까운 서비스 센터를 예약하는 기능도 구현할 수 있다.

자율주행 시대에도 음성 제어 기능의 비중은 더욱 높아질 것이다. 운전이 필요 없어지는 자율주행차에서는 버튼이 사라지고 커다란 스크린만 남을 것이다. 폭스바겐의 세드릭 콘셉트처럼 말이다. 그렇다면 여기서 의문이 생긴다. 주행에 필요한 정보는 커다란 스크린이나 스마트폰을 연동해 입력하면 되는데 음성제어 기능이 왜 필요할까?

이는 자동차와 인간의 상호 작용에서 유리하기 때문이다. 스크린은 화면을 통해 승객에게 말을 걸고, 승객이 직접 화면을 눌러 답해야 한. 하지만 음성 인식 기능이 다른 보조 시스템과 결합하면 승객의 상태를 실시간으로 살피며 즉각적인 대응이 가능해진다. 대표적인 부분이 제스처 컨트롤과 스마트 시선 추적 기술이다. 지금 제스처 컨트롤은 운전자의 손짓으로 자동차의 기능을 제어하는 데 사용한다. 하지만 여기서 더 나아가 자동차가 승객의 움직임을 훨씬 다양하게 인식할 수 있게 된다면 어떨까? 증강 현실 시스템의 화면을 손가락으로 자연스레 펼치는 것은 물론 자동차와 인간의 적극적인 대화가 가능해질 것이다. 예를 들어 승객이 카페를 바라보면서 "저기 어때?"라고 묻는다면 음성 비서가 해당 카페의 정보를 스크린에 띄우며 알려줄 수 있게 된다.[1]

음성제어 서비스[편집]

카카오 i 음성인식 제어 기술[편집]

카카오i

현대자동차가 카카오와의 협업을 통해 서버 기반으로 작동하는 '카카오 i' 음성인식 차량 제어는 뉴스 브리핑, 날씨, 스포츠 경기, 영화/TV, 주식, 시설물 검색 등은 물론 공조, 뒷유리, 스티어링 휠, 시트 열선 등을 자연어 기반으로 편리하게 제어할 수 있다. "에어컨 켜줘", "앞좌석 창문 열어줘"와 같은 직관적인 명령뿐만 아니라 "시원하게 해줘", "따뜻하게 해줘"와 같이 대화하듯 얘기해도 인식한다.

음성인식 제어 기술은 처음 스티어링 휠에 위치한 음성인식 버튼을 누른 후 휴대폰 전화 연결을 하거나 길 안내, 날씨, 뉴스 등을 물으면 대답해 주는 단순한 기능에 그쳤는데 정보통신기술과의 결합을 통해 서버 기반 음성인식 기술이 등장하면서, 커넥티드 서비스들 통해 뉴스브리핑, 날씨, 영화 및 TV 정보, 주가 정보, 일반상식, 스포츠 경기, 실시간 검색순위, 외국어 번역, 환율 등 다양한 인포테인먼트 정보를 제공해 준다.

현대자동차는 '카카오i'를 제네시스 'G70'에 처음 적용했다. 현재는 30여개 차종에 대부분 탑재, 음성인식을 통해 목적지 검색과 맛집, 관광지, 정비소 등 유용 한 정보를 제공하고 있다. 현재는 200만 명이 넘는 운전자가 현대차그룹의 음성인식 AI 커넥티드카 서비스를 이용하고 있다.

카카오i의 서버형 음성 인식 작동은 △운전자가 발화한 음성 데이터 및 위치 데이터를 카카오 음성인식 서버로 전송 △인식된 음성 정보를 카카오 지도 서버로 전송 △운전자 관심지점 정보를 차량 내비게이션으로 전송하는 3단계 과정을 거친다. 운전자의 음성 데이터를 인식해 필요한 정보를 카카오의 서버를 거쳐 이용자에게 제공하는 개념이다.

최근에는 그 기술이 고도화되면서 차량 문이나 트렁크를 열고 닫거나, 차량관리 관련 정보에 대한 질문 답변도 AI가 제공하는데 또 차량에서 음성으로 가정 내 가전제품, 조명, 난방, 환기 등을 제어할 수 있는 '카투홈' 서비스도 개발, 제공하고 있다. 현대건설과 협업, 집 안의 사물인터넷(IoT)기술이 적용된 시스템과 연결하는 방식으로 서비스가 이뤄진다.

쌍용자동차 인포콘[편집]

음성인식 AI 서비스 후발주자인 쌍용자동차도 만만치 않다. LG유플러스, 네이버와 공동개발한 커넥티드카 서비스 '인포콘'을 통해 음성으로 △내비게이션 △전화·메시지 △정보검색 △음악·라디오 스트리밍 △스마트홈 제어 등이 가능합니다. 네이버 AI 플랫폼 '클로바'를 기반으로 한 음성인식 기능은 자연어를 인식해 대화하듯이 명령을 내릴 수 있다. 또 지식검색과 파파고 영어회화도 가능합니다. LG유플러스 IoT 플랫폼에 연동 가능한 공기청정기, 로봇청소기 등의 기기는 차량에서 음성으로 제어할 수 있다.

음성인식 비서 '알렉사'[편집]

미국에선 폭스바겐, 포드, BMW, 현대차 등이 아마존의 AI 기반 음성인식 비서 '알렉사'를 탑재했다. 알렉사는 1,000여개 이상 기능을 보유한 클라우드 기반 인공지능 가상비서 서비스로, 아마존 IoT 기기 '에코(Echo)'를 비롯한 파이어TV, 아마존 탭 등에서 구현된다.

운전자는 차 안에서 아마존의 홈 무선인식서비스를 탑재해 에코를 통해 집안에서 자동차 잠금장치와 공조장치를 조절할 수 있으며 시동을 켜고 끌 수 있다. 또 음악을 틀거나 아마존닷컴에서 물건을 주문하고, 날씨나 기사를 읽을 수도 있게 된다. 뿐만 아니라 우버택시를 부르고 피자 주문 등도 할 수 있다.

SKT 통합형 인포테인먼트 서비스[편집]

볼보차는 SK텔레콤과 2년 간 300억 원을 투자, 한국 시장에 가장 특화된 'SKT 통합형 인포테인먼트 서비스'를 개발했다. 이는 해당 기존 스마트폰과의 단순 연결에서 나아가 차량용 '안드로이드 오토모티브 운영체제(AAOS)' 기반으로 개발된 차세대 연결형(커넥티비티) 서비스이다. 시스템은 SK텔레콤의 AI 플랫폼 '누구'를 기반으로 작동한다. 사용 방법도 간단한다. 차량 안에서 언제든 "아리아"라고 부르면 △차량 온도, 열선·통풍 시트 등 차량제어 △티맵 내비게이션 길 안내 △스마트폰에 저장된 연락처로 전화, 문자 등 전송 △음악 추천, 재생 등 엔터테인먼트 △날씨, 뉴스, 각종 정보 탐색 △집 안의 조명, 에어컨, 로봇청소기 등을 켜고 끌 수 있는 '누구 스마트홈 컨트롤' 등 다양한 서비스를 이용할 수 있다.

MBUX 음성 어시스턴트[편집]

메르세데스-벤츠도 음성인식 AI 탑재에 적극적이다. 지능형 AI 'MBUX 음성 어시스턴트'는 높은 수준의 자연어 이해 기술이 적용, 내비게이션 목적지 검색이나 차량 기능 제어 뿐만 아니라 간단한 대화도 가능하다. 이런 기능은 인터넷이 연결되지 않은 상태에서도 가능하다. 2023년 2월에는 KT와 협력, 음성인식 AI 활용성을 더욱 높였다. 음성으로 "안녕 벤츠"라고 부르면 운전자가 필요로 하는 정보를 음성 기반 시스템에 연결해 정보를 안전하고 직관적으로 제공한다.

'안드로이드오토'[편집]

유럽 시장은 구글이 장악하고 있다. 구글은 차량용 운영체제(OS) '안드로이드오토'를 탑재한 스텔란티스, 볼보, 벤츠, 폭스바겐 등에 음성인식 AI '구글 어시스턴트' 서비스를 제공하고 있다. 차량에서 "헤이 구글"을 부르면 △내비게이션 △공조기 △스마트홈 IoT 등의 서비스를 이용할 수 있다.

샤오두[편집]

중국에선 IT 기업 바이두가 음성인식 AI 시장을 주도하고 있다. 바이두는 중국 완성차 기업 뿐만 아니라 현대차, 아우디, 포드, 도요타 등에도 '샤오두'를 탑재시켰다. 이 밖에도 자동차 업체들은 자율주행시대를 준비하기 위해 디즈니, 넥플릭스, 엔비디아 등과 협업도 진행 중이다.[2]

동영상[편집]

각주[편집]

  1. 폭스바겐코리아, 〈<테크> 미래에도 쓰일 핵심 기술! 자동차 음성인식 기능, 어디까지 발전했니?〉, 《네이버 포스트》, 2022-02-11
  2. 한국교통안전공단, 〈"운전자가 원하는 건 척척" 자동차도 음성인식 AI 비서 전성시대〉, 《네이버 포스트》, 2023-02-13

참고자료[편집]

같이 보기[편집]


  검수요청.png검수요청.png 이 음성제어 문서는 자동차 전장에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.