자동번역
자동번역(自動飜譯)은 컴퓨터를 이용하여 어떤 언어로 된 글을 자동적으로 다른 언어로 바꾸는 일이다. 영어로는 'machine translation'으로 기계번역이라고도 한다. 기술적인 진보가 계속해서 이루어지고 있으며 통계 및 인공지능과 컴퓨터 처리 능력의 발전으로 점점 더 빠르게 성장하고 있다.
개요[편집]
아마 많은 사람들이 영화 〈스타워즈〉의 'C-3PO' 로봇을 기억하고 있을 것이다. 인간의 외모를 닮은 깡통 로봇 C-3PO는 수백만 개의 은하계 언어를 모두 알아듣고 말할 수 있는 거짓말 같은 능력을 가지고 있다.
언어 장벽이 빚은 의사소통 문제는 인류 역사의 시작과 함께 인류가 넘어야 할 가장 큰 장애로 여겨져 왔고, 현재도 그러하며, 영화에서처럼 앞으로도 그럴 것이다.
지난 4만 년 동안 인류가 축적해 온 정보의 양보다 앞으로 3년 동안 축적될 정보의 양이 더 많을 것이라는 예측이 나올 만큼 우리는 정보의 홍수 속에 살아가고 있다.
전 세계가 하나의 시장으로 묶이면서 재화와 인간의 교류 역시 점점 더 늘어나고 있다.
정보화와 세계화가 빠르게 진행될수록 언어 장벽이 만들어 놓은 불편은 점점 더 커지고 있고, 이와 함께 쉽고 빠르게 정보를 얻을 수 있는 자동 번역 기술에 대한 요구는 더욱 절실해질 수밖에 없다.
자동번역 기술이 본격적으로 연구되기 시작한 것은 제2차 세계대전이 끝나면서부터다. 구소련과 미국이 주도하는 냉전 체제가 형성되면서 두 나라 간에 서로의 군사 정보를 빼내기 위한 목적에서였다. 주로 양국 국방성의 투자로 개발되어 온 자동 번역 기술은 1966년의 ALPAC(Automatic Language Processing Advisory Committee) 보고서로 큰 타격을 받는다.
이 보고서는 "자동 번역 기술은 결코 인간의 번역 능력을 따라잡을 수 없고, 인간 번역가가 다시 작업해야 하므로 결국 인간 번역가가 번역하게 하는 것이 이득이다."라는 내용을 담고 있다. 미 국방성의 이 보고서로 인해 한동안 자동 번역 기술 개발은 침체기에 머물러 있었다.
그러던 것이 1980년대 중반부터 유럽과 일본을 중심으로 본격적으로 연구되었다. 일찍이 다국어 문화권을 이루던 유럽에서는 유럽 언어들을 서로 번역해 주는 기술에 목말라 있었다.
1982년부터 1993년까지 유럽공동체(EC: European Community)는 '유로트라(EUROTRA) 프로젝트'라는 이름으로 유럽의 9개(영어, 독일어, 프랑스어, 에스파냐어, 포르투갈어, 이탈리아어, 덴마크어, 네덜란드어, 그리스어) 언어간 자동 번역 기술 개발에 나섰다.
특히 독일은 유럽연합(EU: European Union) 결성 이전인 1993년부터 독어·영어·일어 간의 자동 통역시스템 개발을 목표로 야심차게 '버브모빌(Verbmobil) 프로젝트'를 추진했다. 그 결과 1995년에는 휴대용 통역기의 데모 버전을 출시한 상태로 대화 처리, 의미 분석 및 대화체 자동 번역 분야에서 세계적인 기술을 보유하게 되었다.
아시아의 경제 대국답게 일본도 일찌감치 통역기 개발에 나섰다. 1960년대부터 통역기 개발을 위한 터를 닦았고, 1980년대에는 언어 장벽 극복에 대한 여론에 힘입어 대규모 펀드를 조성하면서 본격적인 연구에 들어갔다. 1986년에 ATR 자동번역전화연구소가 설립된 데 이어, ATR 음성번역통신연구소, NICT 등으로 조직을 확대하며 연구를 계속하고 있다.
그 결과 일본 최대의 통신 회사인 NTT도코모는 조만간 통역 전화 서비스를 선보이겠다는 야심찬 계획을 세우고 있다. 일본 컴퓨터·통신 기기 제조업체 NEC 역시 지난 2005년 휴대전화, 개인 휴대용 단말기(PDA) 등에 일본어와 영어의 동시통역시스템을 내장하는 기술을 개발하는 등 현재 자동 번역 분야에서 미국과 함께 세계적인 기술을 보유하고 있다.
일본이나 유럽에 비해 자동 번역 분야 기술 개발에 상대적으로 소극적이던 미국은 국방부의 지원으로 군사적 이해관계가 얽혀 있는 한국어, 아랍어, 러시아어에 대한 연구가 이루어지고 있다. 펜실베이니아 대학에서 개발한 한·영 자동 번역시스템 역시 군사 작전에서 문자 번역을 주요 목적으로 하고 있다.
이처럼 자동 번역 기술은 군사적 목적에서 출발했지만 웹 세계화(Web Globalization), 소프트웨어 및 문서 현지화(Localization), 방송 자막 처리 및 채팅 문장 번역처럼 사람들의 생활과 긴밀한 분야로 확대되고 있다. 독립적인 응용 시스템으로 사용되던 자동 번역시스템은 최근에는 문서의 작성부터 번역, 검색 등 통합 시스템의 일부로 확대되고 있다.
자동번역의 과제[편집]
세계화와 정보화의 거대 물결 속에 외국어를 우리말처럼, 우리말을 외국어처럼 쉽게 접근하게 해 주는 자동번역 기술은 더 설명하지 않아도 절실한 기술임에 분명하다. 이러한 자동번역 기술이 꼭 필요하다는 인식이 만연하면서도 자동번역 기술에 대한 불신 역시 무시할 수 없을 정도로 큰 상태다. 현재의 자동번역 기술이 대중이 기대하는 품질에 미치지 못하기 때문이 아닐까 한다.
21세기로 접어들면서 자동 번역 기술에 대한 사회적 불신감을 극복하려는 노력들이 계속되고 있다. 인간의 모든 언어 현상을 모두 이해한 자동 번역이란 결코 쉬운 일이 아니다. 이런 장애 요소 때문에 사회와 사용자들이 좀 더 유용하게 사용될 수 있도록 접근하고 있다.
분야별로 나누어 언어 특성을 관찰하고 문제를 해결하여 제한된 영역에서나마 사용자에게 높은 품질의 번역 결과를 제공하게 되었다. 또한 많은 비용이 들어가는 고품질의 번역 기술이 반드시 뒷받침되지 않아도 되는 분야에서는 적은 비용으로 실시간으로 이루어지는 자동 번역 기술이 유용하다는 인식도 심어 주었다.
ETRI에서 개발한 한영·영한 특허 문서 자동 번역시스템은 특허 심사관이 번역된 특허 문서를 단순히 참고할 목적에 적합하게 설계되어 비용과 시간을 절약하면서 충분한 내용 전달을 가능하게 했다. 특허라는 분야에서 자주 사용되는 용어를 충분히 고려하고 설계한 까닭에 그 동안 50~60% 수준에 머물렀던 번역 품질을 80~85% 수준까지 끌어올렸다.
응용 특화 자동 번역 기술의 개발은 비록 분야가 한정되지만, 언어 현상의 문제점을 해결하는 동시에 점차 분야를 넓혀감에 따라 전반적인 언어 현상의 문제점을 해결해 자동 번역 기술의 향상에 크게 기여하고 있다.
특허 문서, 기술 문서, 매뉴얼, 신문 기사 등처럼 정형화된 문어체뿐 아니라 전자우편, 인터넷 게시판, 영화, 드라마, 여행 분야 등과 같은 대화체 영역에서도 특화된 자동 번역 기술 개발이 필요하다.
문어체와 달리 대화체는 문법에 어긋난 문장이 많고, 같은 문장이라도 때에 따라 다른 의미로 해석되는 까닭에 자동 번역 분야에서도 가장 난코스로 꼽힌다. 대화체 자동 번역을 요구하는 영역에서는 품질 높은 번역은 어느 정도 포기하더라도 유용하게 활용할 방안이 무엇인지에 대한 고민이 시급하다 하겠다.
대화체 자동 번역에 대한 사회적 요구와 더불어 휴대용 단말기와 무선 인터넷의 발전으로 휴대용 기기를 활용한 자동 번역에 대한 요구가 늘고 있다. 자동 번역시스템은 많은 양의 지식 데이터가 마련되어야 하고, 고성능의 대용량 하드웨어 장치가 필요하다. 휴대용 단말기의 성능이 향상된다면 자동 번역 기술이 나아갈 분야 역시 더욱 넓힐 수 있을 것이다.
현재 자동 번역 기술은 외국어 정보를 단순히 읽고 알기 위한 목적에 많이 사용된다. 하지만 외국어로 문서를 작성하거나 외국어 정보를 직접 번역할 경우에는 매우 정확한 번역을 필요로 하여 자동 번역시스템의 이용을 꺼리게 된다.
사용자가 지금의 자동 번역 기술 수준보다 높은 번역 품질을 요구하는 작업에서도 자동 번역 기술이 활용되기 위해서 대화식 자동 번역 방법(Interactive Machine Translation Method)과 자동 번역후 편집 기술이 꼭 필요하다.
대화식 자동 번역 방법은 자동 번역 기술에서 해결하기 어려운 문제이지만, 사람들은 누구나 쉽게 아는 문제를 사용자에게 질문하여 그 해결책을 찾아 자동 번역 과정에 활용해 번역 품질을 높이는 방법이다. 자동 번역 후 편집 기술은 자동 번역된 번역 문장에서 자동 번역기가 자주 틀리거나 자신이 없는 번역문이나 번역된 단어, 구를 사용자에게 제시해 사용자가 직접 그 부분을 확인하고 편집하는 기술이다.
자동 번역은 원시 언어를 분석하고 목적 언어를 생성하는 과정이므로, 언어 쌍이 바뀜에 따라 분석 및 생성 처리 기술과 번역 지식, 언어 자원의 변경 또는 추가 개발을 요구한다. 다국어 자동 번역 기술 개발은 국가 간 자동 번역 연구의 국제적 협력 체계가 필요하고, 언어 쌍이 증가하면서 자동 번역 기술 개발 과정이 자동화될 필요가 커진다.
이제 자동 번역 기술은 21세기에 들어 실용화에 초점을 두고 텍스트 및 웹 자동 번역, 특허 문서 자동 번역, 번역 지원 도구(CAT), 웹 세계화, 그리고 방송 자막 자동 번역, 모바일 자동 번역 등에서 그 결실을 보이고 있다.
하지만 자동 번역 기술이 인간의 번역 능력을 완전히 대체하리라는 섣부른 기대는 금물이다. 인간의 언어 능력은 사물과 의미에 대한 인지 능력을 포함하는 가장 고등한 지적 능력으로 인공지능 분야에서도 갈 길이 요원한 영역이다.
곧 의역을 요구하는 영역을 포함한 모든 분야에서 완전한 자동 번역이 실현되기란 결코 쉽지 않을 것이다. 그러나 우리 실생활과 밀접한 특정 응용 분야에서는 품질 높은 번역 기술, 휴대하기 편리한 번역 기술, 다국어에 걸친 번역 기술 등으로 계속 발전해 나갈 것이다.
참고자료[편집]
- 〈자동 번역이란?〉, 《훤히 보이는 음성언어기술》
- 〈자동 번역의 과제는?〉, 《훤히 보이는 음성언어기술》
- 〈자동번역의 발자취〉, 《생활 속의 임베디드 소프트웨어》
같이 보기[편집]