시리(Siri)는 미국 애플이 만든 인공지능(AI) 기반의 음성 인식 개인 비서(IPA) 소프트웨어이다. SIRI란 Speech Interpretation and Recognition Interface의 약자로서, 음성 해석과 인식 인터페이스(I/F)라는 뜻이다. 시리 회사에서 개발한 소프트웨어를 2010년 애플이 인수하여 2011년 아이폰에 적용했다. 영어, 중국어, 한국어 등 전 세계 여러 언어를 인식하고 발음할 수 있다. 오브젝티브 C(Objective-C) 및 스위프트(Swift) 언어를 사용하여 개발했다.
역사
- 2010년 4월 28일 애플이 시리사를 인수했다.
- 2011년 아이폰 4S 이상 기기에서 처음 소개했다.
- 2012년 이후 일본어, 한국어, 이탈리아어 등의 언어에 대한 지원도 시작되었지만, 영어에 비해 기능이 제한되었다.
- 2012년 말 애플은 시리를 멀티미디어 플레이어인 아이팟터치(iPod Touch) 5세대에 탑재했다.
- 2013년 발표된 iOS 7의 시리부터는 남녀 목소리 중 사용자가 시리의 목소리를 선택할 수 있다.
- 2016년 시리는 7가지 영어 버전 및 한국어, 일본어, 중국어를 포함한 38개 언어를 지원한다.
특징
- 시리는 애플 인수 이전에는 블랙베리와 안드로이드용으로도 연구가 진행되고 있었지만, 인수 후 iOS 이외의 제품을 위한 연구는 모두 취소되었다.
- 애플의 소개에 따르면 시리를 이용하는 기간이 늘어날수록 시리가 사용자의 기호를 파악하고 음식점이나 택시 예약을 하는 등의 기능도 수행할 수 있다고 한다.
- 시리는 iOS 5 이상 운영체제에 통합되어 있다.
- iOS에 탑재된 초기 버전의 시리는 iOS에 내장된 알림, 날씨, 주식 정보, 메시지 등과의 연계 기능을 수행하였으며, 영어(미국, 영국, 호주), 독일어, 프랑스어만 지원하였다.
- iOS 6를 탑재한 아이패드(iPad) 3세대의 시리에는 기존 언어에 멕시코어, 스페인어, 스위스어, 이탈리아어, 중국어 등이 추가되었으며, 스포츠 점수 또는 정보를 말해주거나 영화 시간을 체크하고 음식점을 찾아 예약하는 기능이 추가되었다.
자연어 처리
자연어 처리란 키워드가 아니라 문맥을 파악하는 것이다. 굳이 내용의 핵심 키워드가 없어도 전제 문맥을 파악하여 그 핵심을 이해하는 것이다. 예를 들어 '달력'이나 '일정' 같은 단어를 넣지 않고 '내가 오늘 뭘 해야 되지?' 라고 물어도 달력에 잡힌 오늘의 일정을 알려주는 것이다. 거기에 한 문장의 문맥만을 이해하는 것이 아니라 대화의 흐름이 가진 문맥 또한 이해한다.[1]이러한 자연어 처리의 핵심 기술은 형태소 분석 기술, 구문 분석 기술, 의미 분석 기술, 담화 분석 기술, 단어 및 문장 생성 기술 이라고 할 수 있다. 가장 기초적인 기술로 형태소 분석이 단어 단위에서 이루어 지고, 그 결과를 토대로 문장 단위, 문서 단위의 구문 분석, 의미 분석, 담화 분석이 진행되기 때문에 단어를 단위로 하는 분석 결과를 기반으로 하는 문장, 문서 단위의 구문과 의미, 담화 분석이 더욱 복잡하며 어려운 기술이라 할 수 있다.[2]
2020년 3월, 애플은 자연어 인식기능 부문에서 주목받는 스타트업 기업인 '보이시스(Voysis)'를 인수했다. 아일랜드에 기반을 둔 보이시스 사의 인수는 애플의 음성인식 어시스턴트 기능인 시리의 자연어 인식 기능 강화에 효과적일 것이라는 판단에 인수가 진행된 것으로 알려졌다. 애플의 시리는 단순히 iOS 기기에서의 작동 뿐만 아니라 데스크탑 맥은 물론이고 자동차용 인포테인먼트 시스템인 카플레이에까지 이식되고 있을 정도로 자리잡은지 오래다. 하지만 사용자들로 부터 여전히 음성 인식은 뛰어날지 몰라도 문장을 좀더 체계적이면서 자연스럽게 이해하고 검색하는 데에 미흡하다는 평가를 받아온 게 사실이다. 그러한 취약점은 결국 구글의 어시스턴트와의 비교우위에서 상대적으로 열세에 놓이는 결과를 낳았고, 애플로서는 대단히 자존심 상하게 하는 요소가 아닐 수 없었다. 이러한 문제가 AI 및 자연어 처리 능력에 의해 해결될 수 있을 것이라는 판단 하에 스타트업 기업 중에서 돋보이는 기술력을 보여주고 있는 보이시스의 인수를 추진하게 된 이유로 추정된다.[3]
각주
참고자료
같이 보기
이 시리 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
인공지능 : 인공지능 서비스, 인공지능 로봇, 인공지능 기술 □■⊕, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • TTS • URL • 글자 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문서 • 문자 • 문자인식 • 문자채팅 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 임베딩 • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 확률적 경사하강법
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • RAG • XAI • 가중치 • 관계형 네트워크(RN) • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 생성대립신경망(GAN) • 생성형 AI • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 역전파 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 제한 볼츠만 머신(RBM) • 전방전달신경망 • 주의 메커니즘 • 코헨 자기조직 신경망 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 합성곱 신경망(CNN)
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 알렉스넷 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|
이 시리 문서는 인공지능 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.
|
인공지능 : 인공지능 서비스, 인공지능 로봇, 인공지능 기술 □■⊕, 인공지능 기업, 인공지능 인물
|
|
인공지능 기술
|
AI 워싱 • 랭체인 • 로봇공학 • 로봇기술 • 인지과학 • 자동추론 • 자연어 처리 • 지능 • 지식표현 • 컴퓨터 비전 • 튜링 테스트 • 프롬프트 • 프롬프트 엔지니어링
|
|
문자인식과 음성인식
|
ICR • OCR • OMR • TTS • URL • 글자 • 답변 • 대화 • 동영상 • 디자인 • 맥락 • 문서 • 문자 • 문자인식 • 문자채팅 • 발음 • 번역 • 분류 • 상담 • 소스코드 • 스토리 • 얼굴 • 얼굴인식 • 음성 • 음성채팅 • 음성인식(STT) • 이미지 • 인공어 • 인공지능 음성 • 자막 • 자연어 • 질문 • 채팅 • 코드 • 코딩 • 텍스트 • 통번역 • 통역 • 파일 • 폴더 • 화상채팅 • 화자인식
|
|
인공지능 데이터
|
데이터라벨러 • 데이터라벨링 • 데이터셋 • 돌마 • 벡터 • 벡터DB • 벡터공간 • 스칼라 • 임베딩 • 크라우드워커 • 토큰 • 토큰화
|
|
인공지능 학습
|
ADP • CoLLM • DALL-E • DDPG • DQN • LAM • LMM • SARSA • sLLM • SLM • 강화학습 • 거대언어모델(LLM) • 결정이론적 메타추론 • 계통적 강화학습 • 과적합 • 동적 계획법 • 딥러닝 • 딥큐러닝 • 머신러닝(기계학습) • 메타추론 • 모델 기반 강화학습 • 모델 프리 강화학습 • 미세조정(파인튜닝) • 반영식 아키텍처 • 비지도학습 • 사전학습 • 수시 알고리즘 • 어니 • 에이전트 • 인공지능 학습 • 전이학습 • 준지도학습 • 지도학습 • 추론 • 학습 • 확률적 경사하강법
|
|
인공지능 알고리즘
|
AGI • ANI • ASI • RAG • XAI • 가중치 • 관계형 네트워크(RN) • 뉴런 • 다층퍼셉트론 • 단층퍼셉트론 • 데이터마이닝 • 방사신경망 • 볼츠만 머신 • 분산 샌드박스 • 생성대립신경망(GAN) • 생성형 AI • 수퍼얼라인먼트 • 순전파 • 순환신경망(RNN) • 시그모이드 함수 • 신경망 • 신경망 구조 • 심층신경망(DNN) • 심층신뢰신경망(DBN) • 양방향 비고정값 암호 체계(TSID) • 역전파 • 은닉층 • 인공신경망(ANN) • 인공지능(AI) • 제한 볼츠만 머신(RBM) • 전방전달신경망 • 주의 메커니즘 • 코헨 자기조직 신경망 • 텍스트마이닝 • 트랜스포머 • 파이 • 퍼셉트론 • 합성곱 신경망(CNN)
|
|
계산복잡도
|
NP • NP-완전 • 계산복잡도 • 공간복잡도 • 시간복잡도 • 여 NP • 여 NP-완전
|
|
인공지능 프로그램
|
BCI • GPT • 딥블루 • 딥페이크 • 멀티모달 AI • 모달 • 모달리티 • 모달창 • 알렉스넷 • 어니 • 알파고 • 알파고제로 • 알파폴드 • 왓슨 • 카페 • 컨트롤넷 • 텐서플로 • 텔레파시 • 토치 • 파이토치 • 한돌
|
|
인공지능 특징
|
결정이론 • 계산상의 합리성 • 논리학 • 논리주의자 • 분산성 • 불확실성 • 삼단논법 • 선호도 • 예측곤란성 • 완벽한 합리성 • 유계 합리성 • 이유 불충분의 원리 • 자율성 • 최대기대효용 • 할루시네이션 • 효용이론
|
|
인공지능 법적 지위
|
권리주체성 • 소버린 AI • 전자대리인 • 전자적 인간 • 책임법
|
|
위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반
|
|