음성인식(Speech Recognition)이란 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자데이터로 전환하는 처리를 말하며 STT(Speech-to-Text)라고도 한다. 키보드 대신 문자를 입력하는 방식으로 주목을 받고 있다. 로봇, 텔레매틱스 등 음성으로 기기제어, 정보검색이 필요한 경우에 응용된다. 대표적인 알고리즘은 HMM(Hidden Markov Model)으로서, 다양한 화자들이 발성한 음성들을 통계적으로 모델링하여 음향모델을 구성하며 말뭉치 수집을 통하여 언어모델을 구성한다. 미리 기록해 둔 음성 패턴과 비교해 개인 인증 등의 용도로 사용하기도 하는데 이를 화자 인식이라고 한다. 음성인식 AI는 스마트폰이나 자율주행 차량, 각종 전자기기를 비롯한 다양한 산업군에서 빠른 속도로 진화하며 생활 속에 녹아들고 있다.
음성인식 기능을 주위에서 쉽게 찾아볼 수 있게 했다. 스마트폰을 열면, 스마트폰 자체 혹은 앱에서 이러한 기능을 엿볼 수 있다. 가령 검색, 입력 등의 업무를 음성 명령어로 수행할 수 있다.
음성인식은 시스템이 음성을 인식해 문자로 바꿔주는 기술로 정의하는데, 음향 모델과 언어 모델을 기반으로 하고 있다. 음향 모델은 글자 기호의 소리에서 나타나는 음향 신호를 수집하고 분석해놓은 알고리즘이다. 특정 음향이 들리면, 이러한 알고리즘에 따라 글자 기호를 추론한다.
언어 모델은 음향 모델을 교정하는 역할을 한다. 음향모델에서 추론한 기호를 보고, 해당 기호와 매칭되는 단어 혹은 문장을 연결해 준다. 음향 모델에서 추론한 기호와 단어 간에 관계를 분석한 알고리즘으로 볼 수 있다.
최근 음성인식은 시스템이 음성 내용을 이해할 수 있는 기능까지 포함하고 있다. 따라서 이러한 기술에서 자연어 처리 기술까지 포함하는 것이 강조되고 있다. 그뿐만 아니라, 음성합성 기술까지 중요해지고 있다.
음성합성은 음성을 만들어내는 기술인데, 이러한 기술이 중요해진 이유는 시스템이 음성 내용을 이해함에 따라 사람과의 상호작용이 가능해지고 있기 때문이다. 기술 구현 방법은 음성 인식과 비슷하다. 엄밀히 말해, 음성 인식과 반대로 생각하면 된다. 음성 합성은 발음할 단어에 따른 음향 정보를 추론해 음성을 만들어내기 때문이다.
시스템이 사람 간의 상호 작용을 위해서 음성 인식과 음성 합성만으로는 충분하지 않다. 누구와 대화하고 있는지에 관한 인식도 중요하다. 다자간 대화 시에 필요한 상대방 인식이 필요한 셈이다.
화자 인식이 이러한 역할을 담당한다. 화자 인식은 시스템이 사용자의 목소리를 분석해 사용자를 인식하는 기술이다. 해당 기술은 2017년 하반기부터 적용되기 시작했는데, 이유는 AI 스피커가 사용자와 관계없이 음성 명령어에 반응했기 때문이다.
화자 인식은 생각보다 오래전인 1937년부터 연구됐다. 당시 목적은 법정에서 활용되는 목소리 출처를 분명하게 밝히기 위함이다. 녹음된 음성 주체가 본인이 아니라고 반박할 수 있는 소지가 있는데, 화자 인식은 이러한 반박의 여지를 막는다.
화자 인식 원리는 목소리 지문이라고 불리는 '성문'에 있다. 성문에 나타나는 특징으로 말하는 주체를 파악하는 셈인데, 화자 인식은 성문 분석과 함께 발전해왔다.
음성인식 서비스의 종류[편집]
음성인식기술을 바탕으로 한 다양한 음성인식 서비스들은 2000년대 후반에 본격적으로 소개되기 시작했다. 대표적인 것이 2011년에 출시된 애플의 음성 기반 개인비서 서비스인 '시리(Siri)'다. 시리는 아이폰 사용자의 음성명령을 바탕으로 모바일 검색은 물론, 일정관리, 전화 걸기, 메모, 음악 재생 등 다양한 생활편의 서비스를 제공하는 개인비서 서비스다. 애플의 시리 출시 이후, 구글은 '구글 나우(Google Now)', 마이크로소프트는 '코타나(Cortana)'와 같은 음성인식 기반의 개인비서 서비스를 출시했으며, 일본의 NTT도코모는 '샤베테콘쉐루(しゃべってコンシェル)'라는 외국어 통역 서비스를 출시하기도 했다.
삼성전자나 LG전자 같은 스마트폰 제조사들도 'S보이스'나 'Q보이스' 같은 서비스를 출시하기도 했다. 사실, 이러한 음성인식 서비스들은 서비스라기보다는 다양한 응용 서비스를 위한 음성 인터페이스 역할을 했다는 것이 더 정확할 것이다. 최근에는 아마존이 '대쉬(Dash)'나 '에코(Echo)'와 같은 음성인식 기반의 서비스 장치(Service Device)를 출시하고 있으며, 구글의 '온허브(OnHub)'처럼 음성인식 기반의 스마트홈 허브 장치들도 다양하게 출시되고 있다.
차량 음성인식 시스템[편집]
음성인식 기술은 음성명령을 인식하여 시스템에 명령을 내리는 기술로, 운전 중에 미디어를 안전하게 작동하기 위해 필수적인 기능이다. 안타깝게도, 기술적인 한계 때문에 모든 음성 명령이 시스템에서 인식되지는 않는다. 이 한계를 보완하기 위해, 시스템은 사용 가능한 음성 명령을 화면에 표시한다.
사람들 간의 소통에는 오류가 발생한다. 마찬가지로, 음성 인식도 일부 상황에서는 음성 명령을 잘못 인식할 수 있다. 이런 경우, 화면에서 제공되는 옵션을 확인하고 명령을 다시 말하거나 화면에서 해당 명령 버튼을 수동으로 선택하여 누르면 된다.
동영상[편집]
참고자료[편집]
- 〈음성 인식〉, 《위키백과》
- 〈음성인식 기술〉, 《국립중앙과학관 - 사물인터넷》
- 배유미 기자, 〈‘말하는 기기’, 음성인식이 삶에 가져올 혁신〉, 《테크월드》, 2020-07-27
- 조명의 기자, 〈음성인식 AI 시장 고속 성장…기술 고도화 ‘열전’〉, 《테크월드》, 2021-09-29
- LG, 〈음성인식 기술, 어디까지 왔을까?〉, 《네이버 포스트》, 2018-09-14
- 로라테이트, 〈자동차 내 음성 제어의 진화는 모두를위한 윈 - 윈으로 이어집니다〉, KARDOME
같이 보기[편집]
이 음성인식 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
인공지능 : 인공지능 서비스, 인공지능 로봇, 인공지능 기술 □■⊕, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • TTS • URL • 글자 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문서 • 문자 • 문자인식 • 문자채팅 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 이미지 • 인공어 • 자막 • 자연어 • 질문 • 채팅 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
데이터라벨러 • 데이터라벨링 • 데이터셋 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 임베딩 • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 확률적 경사하강법
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • RAG • XAI • 가중치 • 관계형 네트워크(RN) • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 생성대립신경망(GAN) • 생성형 AI • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 역전파 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 제한 볼츠만 머신(RBM) • 전방전달신경망 • 주의 메커니즘 • 코헨 자기조직 신경망 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 합성곱 신경망(CNN)
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 알렉스넷 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|
자동차 : 자동차 분류, 자동차 회사, 한국 자동차, 독일 자동차, 유럽 자동차, 미국 자동차, 중국 자동차, 일본 자동차, 전기자동차, 자동차 제조, 자동차 부품, 자동차 색상, 자동차 외장, 자동차 내장, 자동차 전장 □■⊕, 자동차 부품 회사, 배터리, 배터리 회사, 충전, 자동차 판매, 자동차 판매 회사, 자동차 관리, 자동차 역사, 자동차 인물
|
|
자동차 전장
|
2채널 블랙박스 • 4채널 블랙박스 • 360도 블랙박스 • CAN • CANdb • ECU • HMI 계층 • LVDS • MCU • OBD • OTA • SOS 버튼 • UVC • V2G • V2L • VCU • 가상 엔진 사운드 시스템 • 디지털 신호처리장치(DSP) • 마이크로컨트롤러 • 무선충전기 • 미들웨어계층 • 배선 • 배선도 • 블랙박스 • 블루링크 • 어드밴스드 케어 • 와이어링 하네스 • 운영체제계층 • 응용계층 • 자동차 전장 • 전자제어장치 • 접지 • 접지선 • 제어회로 • 중앙제어장치 • 집적회로(칩, IC) • 차량용 반도체 • 첨단안전장치 • 충전기 • 컨비니언스 패키지 • 컴포트 패키지 • 텔레매틱스 • 트랙패드 • 파퓰러 패키지 • 하네스 • 하드웨어계층 • 하이테크 패키지 • 하이패스 단말기 • 회로 • 회로도
|
|
운전보조
|
360도 카메라 • 3D 클러스터 • ADAS • AEB • AVM • DDREM • DMP • FCA • GPS • HDA • HDA2 • HDA3 • HDP • HSAC • LDWS • LKA • NSCC • SVM • V2X • 경사로 밀림 방지 • 경사로 저속주행 • 고속도로 자율주행(HDP) • 고속도로 주행보조 • 과속단속 카메라 감지 • 광각카메라 • 나이트비전 시스템 • 내비게이션 • 내비게이션 기반 스마트 크루즈 컨트롤(NSCC) • 능동형 전복방지(ARP) • 드라이브 와이즈 • 드라이빙 어시스턴스 패키지 • 모니터 • 모니터링 • 브레이크 오버라이드 시스템(BOS) • 비상 자동제동 시스템 • 사각지대 감지 시스템 • 사각지대 경보장치 • 서라운드 뷰 모니터 • 스마트 크루즈 컨트롤(어댑티브 크루즈 컨트롤) • 스탑앤고 스마트 크루즈 컨트롤 • 스테레오 카메라 • 시티 세이프티 • 안드로이드오토 • 액티브 노이즈 컨트롤 • 액티브 디스턴스 어시스트 디스트로닉 • 어라운드 뷰 모니터링 • 어웨이 • 옴니뷰 기술 • 운전보조 • 운전자 주의 경고(DAW) • 원격 스마트 주차 • 자동긴급제동장치 • 자율주행 시스템 • 적외선 카메라 • 전기식 스티어링 컬럼 잠금(ESCL) • 전방 주시 경고 • 전방충돌방지보조 • 전방카메라 • 전후방카메라 • 증강현실 내비게이션 • 차로 이탈방지 보조 • 차선변경지원 시스템 • 차선이탈 경보 시스템(LDWS) • 차체 자세 제어장치(ESC, ESP, VDC) • 첨단 운전자 보조 시스템 • 카메라 • 카플레이 • 콕핏 플랫폼 • 크루즈 컨트롤 • 크리핑 • 트래픽 사인 어시스트 • 트랙션 컨트롤 시스템 • 페이스커넥트 • 헤드업 디스플레이(HUD) • 후방 교차 충돌방지 시스템 • 후방 긴급자동제동 • 후방모니터 • 후방주차 충돌방지 보조(PCA) • 후방카메라 • 후측방 모니터 • 후측방 모니터링 시스템 • 후측방 충돌방지 보조(BCA) • 후측방 충돌방지 시스템
|
|
조명
|
3차원 디지털 픽셀 • DRL • DTRL • LED • LED 라이트 • LED 램프 • LED 헤드라이트 • 경고등 • 경광등 • 경보등 • 등 • 등불 • 등화관제등 • 등화장치 • 라이트 • 라이트 캔버스 • 램프 • 레이저 • 레이저 라이트 • 룸램프 • 리어램프 • 멀티빔 • 무드등 • 미등 • 방향지시등(깜빡이) • 배니티램프 • 백열등 • 번호등 • 보조제동등 • 비상등 • 빔 • 사이드리피터 • 상단표시등 • 상향등 • 소등 • 손전등 • 실내등 • 실외등 • 안개등 • 앰비언트 라이트 • 오토 헤드램프 레벨링 시스템 • 전구 • 전구색 • 전등 • 전등갓 • 전조등(헤드램프, 헤드라이트) • 점등 • 제동등(브레이크등, 정지등) • 조명 • 조명기구 • 조명기기 • 조명등 • 조명장비 • 조명장치 • 주간주행등 • 주광색 • 주백색 • 지능형 헤드램프 • 지도등 • 지시등 • 차폭등(마커램프) • 코너링 램프 • 콤비네이션 램프 • 파킹램프(주차등) • 팝업 헤드램프 • 표시등 • 픽셀 라이트 • 하이빔 어시스트 • 하향등 • 할로겐 램프 • 헤드램프 와이퍼 • 후미등(테일램프) • 후미안개등 • 후진등
|
|
인포테인먼트
|
3D 사운드 시스템 • 5.1 채널 • A/V • AVN • CD • CID • DMB • DVD • FaaS • LCD • LED • MBUX • OLED • RSE • USB • 고가 스피커 • 노이즈 캔슬링 • 돌비 • 돌비 비전 • 돌비 애트모스 • 뒷좌석 듀얼 모니터 • 디스플레이 • 디지털 디스플레이 • 라디오 • 렉시콘 사운드 • 리모컨 • 메르세데스 미 커넥트 프리미엄 패키지 • 메리디안 사운드 • 메리디안 엘리베이션 • 미드레인지 • 미드우퍼 • 바워스 앤 윌킨스 사운드 • 뱅앤올룹슨 사운드 • 보스 사운드 • 보이스 어시스턴트 • 부메스터 사운드 • 블루투스 • 빌트인캠 • 사운드 • 사운드 시스템 • 서라운드 사운드 • 서라운드 스피커 • 서브우퍼 • 센터 디스플레이 • 소너스 파베르 사운드 • 스크린 • 스피커 • 스피커 그릴 • 액티브사운드(전자배기음) • 앰프 • 오디오 • 온디맨드 • 온디맨드 인포테인먼트 • 우퍼 • 음성명령 • 음성인식 • 음성제어 • 음향기기 • 음향장비 • 인포테인먼트 • 인포테인먼트 시스템 • 인포테인먼트 시스템 컨트롤러 • 저가 스피커 • 중가 스피커 • 차량용 인포테인먼트 시스템 • 카PC • 카오디오 • 카폰 • 터치스크린 • 트위터 • 티박스 • 파워앰프 • 프로젝터 • 하만카돈 사운드 • 하이파이 • 하이퍼스크린 • 핸즈프리 • 햅틱 • 헤드유닛 • 화면
|
|
공조장치
|
PTC 히터 • 가습 • 가습기 • 공기청정기 • 난방 • 난방기(히터) • 냉각수 온도계 • 냉매 • 냉방기 • 도그모드(강아지모드, 애견모드) • 디포거(김 서림 방지 장치) • 선풍기 • 에어컨 • 에어컨필터 • 열교환기 • 예열 • 예열제상 • 온도계 • 응축기 • 이온발생기 • 제상 • 제습 • 제습기 • 증발기 • 컴프레서 • 투명히터 • 풀오토 에어컨
|
|
버튼과 스위치
|
근접스위치 • 레벨스위치 • 리드 스위치 • 리미트 스위치 • 마이크로 스위치 • 버저(부저) • 버튼 • 벨 • 볼륨 스위치 • 셀렉터 스위치 • 스위치 • 스피드 스위치 • 시동버튼(스타트 스위치) • 신호 • 신호음 • 썬루프 스위치 • 압력스위치 • 열선스위치 • 온도스위치 • 워크인 스위치 • 유량스위치 • 잠금장치 • 전기스위치 • 전조등 스위치 • 조이스틱 스위치 • 차일드락 • 창문 스위치 • 창문잠금장치 • 토글 스위치 • 트렁크 열림 버튼 • 파워윈도우 스위치 • 푸시버튼 스위치 • 하차벨 • 햅틱버튼
|
|
센서
|
MEMS센서 • 가상센서 • 가속도센서 • 가스센서 • 감압식 센서 • 공기질센서 • 광센서 • 근접센서 • 냉각수 온도센서 • 노크센서 • 녹스센서 • 라이다 • 레이다 • 레인센서(우적센서) • 바이오센서 • 배기가스온도센서 • 버클센서 • 산소센서 • 센서 • 소리센서 • 속도센서 • 스로틀 포지션 센서 • 습도센서 • 압력센서 • 액추에이터 • 에어백센서 • 에어플로우 센서 • 온도센서 • 유량센서 • 이미지센서 • 자율주행센서 • 자이로스코프(자이로센서) • 점유센서(점유감지센서) • 정전식 센서 • 조도센서(일사센서) • 조향각센서 • 주차보조센서 • 중력센서 • 지문센서 • 지자기센서 • 차량용 센서 • 초음파센서 • 충격센서 • 충돌방지센서 • 카메라센서 • 크랭크각 센서 • 타이어 공기압 경보장치(TPMS) • 타이어 공기압 센서 • 타이어 압력 경고등 • 토크센서 • 하이트센서(차고센서) • 후방감지센서 • 흡기 온도센서
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|