기계번역

스페인어 문구를 영어로 번역하고 있는 휴대전화 앱

기계번역(機械飜譯, machine translation, MT)은 인간이 사용하는 자연 언어를 컴퓨터를 사용하여 다른 언어로 번역하는 일을 말한다. 자동 번역이라고도 한다.

일관성과 통일성이 있게 번역되는 장점이 있으나 기계 번역은 현재로서는 자연스러운 번역을 보장할 수 없으며, 문장이 부자연스러운 어투로 나오는 경우가 잦다. 하지만 기술적인 진보가 계속해서 이루어지고 있으며 통계 및 인공지능과 컴퓨터 처리 능력의 발전으로 점점 더 빠르게 성장하고 있다.

기계번역의 개념 자체는 컴퓨터의 존재 이전부터 존재하기 때문에 기계 번역은 번역 소프트웨어와 동의어는 아니지만 현재 기계번역은 대부분 번역 소프트웨어로 구현된다. 예를 들어, 영어 문장을 입력하면 그것을 번역하는 한국어 문장을 출력하는 영한 번역 소프트웨어 등이 있다.

개요

긱계번역은 컴퓨터가 주체가 되어 특정 언어를 다른 언어로 번역해주는 것이다. 자연어 처리의 분야이며 인공지능과도 관련이 깊다. 번역은 인공지능의 목표 중 하나였으며 지금까지 연구되는 주제이기도 하다.

사람이 번역하는 것을 컴퓨터가 보조하는 경우는 CAT(computer-assisted translation)라고 한다.

2016년부터는 AI를 이용한 신경망 번역을 구글이 도입했고, 네이버도 파파고 등 AI 번역기를 도입했다. AI의 학습량에 따라 진화하는 덕분에 번역의 질이 전과는 비교가 안 될 정도로 좋아지고 데이터가 많은 언어는 이미 번역된 글이 명료하게 쓰여왔다. 번역기가 생성한 문장이 원어민 수준에 이르렀지만 숙어 표현 등은 여전히 사람에게 밀린다. 현재 시점에서도 여행 회화 정도는 문제없는 수준이기도 하고, 사용자가 많고 언어 유사성이 있는 영어-독일어, 영어-프랑스어 같은 경우 상당히 매끄럽게 번역되어 번역기만으로 언어를 학습해도 크게 문제가 되지 않을 수준이다.

2024년 3월 기준 번역기로 활용될 수 있는 서비스 중 Claude3 같은 모델은 한국어-영어도 거의 이 수준에 근접했고, 심지어 한국내 외국인 노동자나 이주민의 언어나 특수외국어 수준의 언어조차 번역은 대체로 잘 되고, 간단한 문법적 지식은 직접 얻거나, 어려운 지식은 아직 언어 모델이 틀리기는 하지만 그 지식에 대한 글에 대해서는 해설을 요구할 수는 있다.

데이터가 많은 영어-일본어, 한국어-영어도 외국어치고는 화자가 소수이거나 인지도가 낮은 영어와 유사한 언어에 비해 정확도가 비교적 높은 편이다. 문법이 상당히 유사한 한국어-일본어 같은 경우도 잘 번역된다. 심지어 완전히 해독되지 않은 고대 언어인 에트루리아어를 기계 번역을 통해 해석하려는 시도가 있을 정도로 발전이 있다.

참고로 일본 쪽 번역기를 사용하면 해외 아이피(IP)를 막아둔 사이트도 들어갈 수 있다.

역사

SYSTRAN은 1960년대 후반 기계 번역 시스템을 개발한 최초의 회사 중 하나이다. 이 회사는 냉전 기간 동안 인텔리전스 자료를 번역하기 시작한 미 공군과 협력했다. 목표는 번역가가 그 의미를 이해하고 텍스트를 쉽게 개선할 수 있을 만큼 기계에서 콘텐츠를 잘 번역하도록 하는 것이었다. 초기의 기계 번역 엔진은 사람이 개발하거나 사전에 들어있는 규칙을 사용하여 번역을 실행하는 시스템으로, 규칙 기반 방법을 사용했다. 이후 언어 기술은 크게 발전했다.

통계적 모델 및 하이브리드 엔진

기계 번역은 1990년대에 크게 발전했다. 당시 IBM과 같은 회사에서 번역 품질이 상당히 개선된 통계적 모델을 활용하기 시작했다. 통계적 기계 번역 엔진은 새로운 기술이었다. 이러한 엔진은 고급 통계 방법과 인터넷상의 방대한 데이터를 사용하여 늘어나는 콘텐츠를 번역하는 데 집중했다. 이후 Google에서는 사람의 모든 지식을 검색할 수 있도록 이 기술을 대규모로 배포한다.

초기의 통계적 기계 번역 엔진은 규칙 기반 엔진보다 훨씬 우수했지만 여전히 많은 오류가 발생했다. 이에 기업들은 일반적으로 통계적 기계 번역과 규칙 기반 기계 번역을 결합한 하이브리드 기계 번역 엔진을 실험하기 시작했다. 이러한 발전으로 인해 기계 번역 기술이 대중화되고 전 세계에서 채택되었다.

신경망 기계 번역

2017년에는 신경망 기계 번역(NMT)의 등장으로 기계 번역이 또 한번 기술적으로 도약했다. 신경망 기계 번역은 AI 성능을 활용하고 신경망을 사용하여 번역을 만들어 낸다.

앞에서 언급한 방법과 달리 신경망은 가능한 결과를 '추측'하기보다는 번역가의 사고 과정을 모방하려고 한다. 그 결과 문장의 의미와 미묘한 차이를 더 정확하게 포착하여 훨씬 더 자연스러운 번역이 된다. 이러한 발전을 통해 기계 번역은 방대한 양의 문서를 이해하거나 요점을 파악할 뿐만 아니라 중요 업무 이외의 정기적인 비즈니스 문서의 경우에도 충분히 우수한 품질을 제공했다.

신경망 기계 번역에서는 자동 번역의 가독성 저하 및 한국어와 같은 특정 언어와의 비호환성 등 기계 번역의 오랜 단점 중 일부가 해결되었다. 신경망 기계 번역을 개선하기 위한 노력은 지금도 계속되고 있다.

제대로 사용하는 요령

기계 번역은 사용이 편리한 만큼 그 한계가 명확하기에 반드시 제대로 된 사용법을 숙지하고 사용해야 제대로 된 결과를 얻을 수 있다.

1. 맞춤법 잘 지키기

사람이라면 간단한 맞춤법 오류 두어개가 있는 문장도 무리없이 읽을 수 있지만 번역기는 그런 오류 한 개에 문장 전체를 엉터리로 번역해버리는 경우가 잦다. 유명한 必要韓紙같은 번역기 오역의 사례도 한국어 맞춤법이 틀린 문장을 번역기에 넣었기 때문에 일어난 사태이다. 맞춤법, 띄어쓰기, 문장부호를 빠짐없이 체크하고, 오류가 없는 문장을 번역하자. 줄임말, 은어 등은 배제하고 누구나 알 수 있을만한 단어를 사용해야 한다.

2. 정확하고 간결한 문장 사용

특히 한국어는 주어나 목적어 등 문장 구성 성분이 생략되는 경우가 많은데 인도유럽어권 언어에서는 전혀 생략되지 않을 때가 많다. 때문에 문장 구성 성분이 생략된 한국어 문장을 번역할 경우 완전히 엉뚱한 내용으로 번역되거나, 사용자가 생각한 것이 아닌 엉뚱한 주어를 임의로 넣어서 정반대의 뜻으로 번역하기도 한다.[2] 때문에 한국어로서는 오히려 부자연스러워지더라도 모든 생략된 구성 성분을 빠짐없이 넣어줘야 한다. 그리고 수식 구조가 복잡해지는 장문의 문장일수록 어딘가에서 삑사리가 날 확률이 늘어나므로 어색해지더라도 간결한 수식 구조의 문장 여럿으로 쪼개서 따로따로 번역하는 것이 더 좋다. 또한 표현법 역시 최대한 심플한 단어를 사용하는 것이 좋다. 예를 들어 "감동했다"라고 쓰면 될 곳에 "감동적이었다" 같은 표현을 썼다간 "감동"과 "이었다" 사이의 "적"을 enemy로 번역하는 경우도 생긴다. 앞뒤의 문장에 enemy와 관계될법한 표현이 있었다면 그 가능성이 더 높아진다.

3. 비유적 표현 금지

같은 이유로, 속담 등 비유적 표현은 최대한 쓰지 않는 것이 좋다. 이런 비유적 표현은 사회문화적 맥락 없이 직역해버리면 전혀 이해할 수 없는 문장이 되기도 하므로 딱딱해지더라도 모든 문장을 직설적인 내용으로 써야한다.[3] 특히 고사성어의 경우 한문과 중국사/한국사에 대한 지식까지 있어야 의미가 해석되는 경우가 많으니 번역기에 넣으면 대부분 엉터리 번역이 나온다. 예를 들어 비교적 쉬운 고사성어인 두문불출을 넣어 "그 분은 두문불출하고 계십니다."라는 문장을 번역기에 넣으면 "That person is doing a double door."라는, 기계번역 오류라는 것을 알고 봐도 원 문장을 추측하기 힘든 괴악한 문장이 튀어나온다.[4] 한자 문화권의 언어일수록 이런 경향이 좀 줄어들어 '杜门不出'을 번역하려고 하면 이제는 파파고나 카카오 번역, 프롬프트 엔지니어링을 거친 ChatGPT 유료 버전은 한국어에서 직역이 가능한 두문불출이라고 번역이 된다.

4. 어떻게든 검수를 해보자

보통 목표 언어를 조금이라도 구사할 수 있다면 번역기를 쓰지는 않을 것이다. 그러나 기초도 모르는 까막눈인 언어로의 번역이라도 최소한의 검수는 해볼 수 있다. 번역 결과물이 나온 후 그대로 사용하지 말고, 다시 영어로 역 번역을 해보자. 번역하기 전의 원 문장과 뜻이 통하는 비슷한 문장이 나왔다면, 그리고 이를 다시 목표 언어로 번역했을 때 아까의 결과물과 똑같은 문장이 나온다면 100%는 아니어도 거의 신뢰할 수 있는 번역이라는 의미이다. 역번역 결과물이 이상하거나 역번역을 반복할 때마다 문장이 계속 변한다면 어딘가 잘못된 것이다. 이때는 출발 문장을 다시 수정해서 더 간단하고 명료한 문장으로 바꾼 뒤 시도해보자.

5. 뜻만 통하면 된다

보통 기계 번역기 하나에 의존해서 의사소통을 하는 상황은 공적인 자리가 아니며 여행지에서 현지 언어를 못 하거나, 혹은 국내에서 한국어도 영어도 못 하는 외국인을 상대해야 하는 경우 등 최소한의 의사 전달만 되면 충분한 상황이다. 애초에 공적인 자리에 기계 번역 결과물을 들고 갈 생각을 하면 안된다. 이럴 때는 굳이 완성된 문장을 통째로 번역해서 오류가 생길 여지를 만들기보다는 단어 하나씩만 던져주는 것이 서로에게 더 이해하기 편한 방법일 수도 있다. 가령 외국인에게 "식사는 일반식, 할랄, 채식 중 어떤 것으로 하시겠습니까?"라는 문장을 아랍어로 번역해서 던져주면 대체 저 문장이 제대로 번역되었을 지도 의문이고, 아랍어로 돌아오는 상대의 대답을 다시 영어나 한국어로 골치아파가며 번역해야 한다. 그보다는 1.normal 2.halal 3.vegetarian 이렇게 써서 아랍어로 번역시킨 뒤 손가락으로 짚어보게 하는 것이 의사소통에 걸리는 시간이 훨씬 줄어들고 오류의 여지가 적다.

6. 언어 모델(GPT, Claude 등) 기반 번역에서는 사용자가 번역에 유용한 정보를 제공할 수 있다

2022년 이후 출시된 ChatGPT 등에서 쓰이는 최신 언어 모델은 번역에 필요한 정보를, 인간 번역가가 번역을 할 때 찾는 것처럼 그런 정보를 미리 제공할 수 있다. 성능이 낮은 무료 언어 모델도 어떤 단어의 의미를 고정해서 번역하라는 명령이 가능하다. 2024년 3월에 쓰이는 최신 언어 모델에는 번역시 유의 사항, 예를 들면 번역가의 번역 원칙, 번역할 글의 특징, 시대적 배경, 캐릭터의 성격 등을 알려주면서 번역하라는 요청이 가능하다. 간단하게는 번역할 글의 분류나 출처(저작권이 있는 글이라고 하면 번역이 거부될 수는 있다.)를 알려주면서 번역할 수 있다. 2024년 3월 기준 한국어의 경우는 성능이 다소 낮은 언어 모델도 반말과 존댓말을 구분하여 번역하라는 요청이 가능하며, 성능이 좋은 모델은 어떤 글을 주고 그 글과 유사한 문체로 번역하게 하는 것이 가능하며, 하오체 같은 말투의 문법적 특징을 설명하는 글을 자료로 주며 그 말투로 번역을 하게 하는 것도 복잡한 수준이 아니면 가능하다. 번역 과정을 물어본다든가, 이상하게 번역된 문장에 대한 피드백도 가능하다. 다만 검열이 심해지면 선정적이거나 폭력적이거나 저작권 문제가 우려되는 글은 번역이 거부된다.

영어를 전혀 못 읽어서 꼭 한국어로 번역해야 하는 것이 아니라면 한국어↔타 언어 대신 영어↔타 언어의 번역을 사용하는 것이 더 좋다는 주장이 있다. 물론 영어로의 번역 품질이 가장 좋은 것은 사실이지만 2023년 기준 영어 독해 능력이 토익 800~900점대로 뛰어나지 않다면 현재는 모든 대형 검색 사이트의 번역 서비스 등 신경망 번역, 딥러닝이 이용된 서비스는 직역을 하는 것이 더 좋다. 일본어 같은 언어가 특히 직역이 요구되며 이 경우는 아무리 영어로의 번역 성능이 좋아도 한국어로의 번역 성능을 못 따라가는 일이 생길 수도 있다. 2016년 이전만 해도 아예 일본어라도 영어로 번역하고 이를 한국어로 번역하는 것이 좋았는데, 이제는 그렇게 번역하면 일본어 특유의 높임말, 중국식 고사성어[5] 등이 번역이 제대로 되지 않는다.

비록 한국어가 고맥락 언어라지만 영어조차 일정 부분에서는 유의어, 연어라는 그 문화를 모르면 이해할 수 없는 표현이 있다. 영어는 고립어이기 때문에 품사의 구분이 한국어에 비해 모호하다. 호칭어는 특히 한국어가 영어보다 세분화된 표현을 갖고 있는데, 이는 일본어나 중국어나 베트남어 같이 마찬가지로 호칭어가 발달된 언어를 영어로 번역하면 정확도가 떨어진다는 것을 의미한다. 서구에서 만들어진 번역기의 경우라도 이런 호칭어를 한 문장에서는 영어에서 중역된 표현이 나와 헷갈리게 하지만[6] 더 문구가 길어질수록 문맥이 잘 이해되어 호칭어가 영어를 거친 경우에 비해 정확하고, 국산 번역기는 한 문장에서도 직역된 표현이 나온다. 영어가 아닌 많은 서구의 언어는 이런 경향이 줄지만, 한국어와의 직접적인 번역 데이터가 현재도 쌓여가고 이를 제안할 수도 있기에 예컨대 스페인어 같이 지시대명사가 영어보다 한국어와 같이 '이/그/저'의 의미를 가진 것이 있는 언어의 경우 이 부분은 직역이 나을 수도 있다.

오역

너무나 당연한 얘기지만, 번역기는 어디까지나 참고용으로, 2016년 이후로도 유럽언어기준 B1(수능영어 3등급 이하) 이하의 실력을 가졌지만 외국어로 의사소통할 수밖에 없을 상황에만 번역기를 사용한 문장을 사용하는 것이 바람직하다. 위에서도 언급하듯, 맞춤법 등을 제대로 지켜주지 않으면 심각한 수준의 오역된 문장이 나올 수 있으며, 설령 모든 요소를 완벽하게 갖춘 문장이라고 해도 번역기는 그 문장에 대한 완벽한 번역문을 제공해줄 수 없다. 다시 말해서, 번역기를 사용한 문장을 어디 공적인 데에 가서 쓰려고 하면 제대로 엿먹을 수 있다는 뜻이다. 따라서 다음과 같은 경우에는 번역기를 사용하면 모두의 웃음거리가 될 수 있다.

컴퓨터 프로그램의 특성상은 번역을 100% 완벽하게 할 수는 없기에 오역이 나올 수밖에 없다. 언어 변화에 여리니 규범주의적으로 볼 수 있다. 어떤 사람들은 현재의 번역기들을 「오역기」로 비꼬아 부르기도 한다. 기술주의적으로 만들려면 언중들의 언어 표현을 그때그때 많이 수집해야 된다. 곧, CAPTCHA처럼 만들어야 된다는 뜻.

특히 구글 번역기로 일본어 번역을 하면 후반에 갈수록 번역이 안 되어 있다나, 이상한 단어가 나오기도 한다. 번역 성능은 차치하고서라도 동형이의어의 처리 문제도 있다. 특히 동형이의어가 많은 한국어에서 이 문제가 잘 나타난다. 예를 들어 「인도로 가다」라는 문장만 제시되면 그 문장의 '인도'가 사람이 다니는 길(人道)을 의미하는지 아니면 남아시아의 나라 가운데 하나인 인도(India, 印度)를 의미하는지 알 수 없다.

또한 일반명사에서 따온 고유명사는 이것이 일반명사인지 고유명사인지 번역기는 알 길이 없기 때문에 단어 뜻 그대로 번역하는 경우가 있다. 그래서 외국 회사의 홈페이지를 통째로 번역기로 돌린다면 내용을 이해하는 데 언어적 센스가 필요하다.

추가로 숙어가 튀어나오면 거의 99% 확률로 오역이 되어버린다. Could not help V-ing를 '도울 수가 없고 그러나 ~하는 도중에'라는 식으로 번역하거나, be used to V-ing를 '~하는 데 사용되다' 같은 식으로 번역하는 게 대표적인 예. 그나마 후자는 원체 사용 빈도가 높은지라 지금은 웬만한 번역기는 '익숙하다'라고 제대로 뱉어주지만, 전자는 2023년 들어서야 "I couldn't help thinking about you."를 "당신 생각을 안 할 수가 없었어요."로 번역하는 경우가 등장하기 시작했다.

기계 번역의 특성상은 번역 대상이 되는 언어간의 유사성에서 영향을 크게 받는다. 어순이 같고 한자 단어를 공유하는 한일 번역은 80~90% 정도의 번역을 보이고, 영어와 프랑스어 간의 번역 같은 경우도 상당한 정확도를 보인다.[14] 어순이나 문법상의 차이가 큰 한영 번역 같은 경우는 종종 무슨 내용인지 알기 어려울 정도로 번역율이 떨어진다. 중국어의 경우도 어순이 다른 데다가 중국어의 의차와 음차를 뒤섞은 무자비한 현지화 표기까지 존재한다.

알타비스타의 바벨피쉬는 충격과 공포를 선사했다. 알타비스타 만담기라고 부를 정도였다. 한동안 바벨피쉬를 이용한 개그가 유행한 적이 있다. 참고로 2013년 현재 위 짤과 같은 'How are you?'를 넣으면 '어떻게 지내세요'라고 정상적으로 번역한다.

유명한 번역기의 오역으로 일본어로 '필요한지'를 오역한 '必要韓紙'가 있으며, 영어로 "Time flies like an arrow"를 오역한 "시간 파리는 화살을 좋아한다."가 있다. 아예 영미권에선 "Fruit flies like a banana."라는 문장까지 앞 문장과 세트로 볼 지경.

심지어는 日本을 날책으로 번역하기도 한다.

기계 번역기의 종류

구글 번역 : 2016년 9월 28(현지시각)부터 영어-중국어를 시작으로 딥 러닝 기술이 적용되었다. 구글 크롬이 사용한다.
시스트란 : 시스트란에서 인공신경망 기술을 기반으로 만든 번역기다. 하버드대와 공동연구하고 있으며 OpenNMT OpenNMT에 오픈 소스화 되어 있다.
바벨피시 : 알타비스타에서 서비스하던 초기 인터넷 단문 번역 서비스의 이름. 현재는 야후!를 거쳐 Bing에서 Bing 번역으로 서비스 중이다.
빙 번역기 : 기술문서 번역에서는 구글보다 좋은 결과를 보여준다. 이유는 방대한 MSDN 번역자료가 있기 때문이다. 페이스북의 번역 기능이 바로 이 번역기 기반이다. 의외로 많은 번역 앱이나 사이트, 블로그 등이 빙 번역기에 번역 서비스를 의존하고 있다. 앱/웹 개발자에게 무료로 자신들의 서비스 API를 오픈하고 있는 혜자로운 정책 덕분. 사이트나 블로그 등에 부착할 수 있는 위젯에는 제한이 없고, 앱에서 사용할 수 있는 API는 월 200만 단어까지 무료다. Microsoft Edge의 번역 기능도 빙 번역기를 사용한다.
네이버 파파고 : 네이버에서 제작한 인공지능 기반 번역기. 네이버 웨일이 사용한다.
마이크로소프트 번역기 : 마이크로소프트가 제공하는 다언어 기계 번역 클라우드 서비스이다. 마이크로소프트 번역기 API는 여러 소비자, 개발자, 기업 제품에 연동되어 있는데, 여기에는 빙, 마이크로소프트 오피스, 셰어포인트, 마이크로소프트 엣지, 마이크로소프트 링크, 야머, 스카이프 번역기, 비주얼 스튜디오, 인터넷 익스플로러, 또 윈도우, 윈도우 폰, 아이폰, 애플 워치, 안드로이드 전화, 안드로이드 웨어용 마이크로소프트 번역기 앱이 포함된다.
DeepL : AI를 이용한 수준 높은 번역기이다. 2022년 12월부터 한국어도 지원하기 시작했다. 2023년 5월부터 Pro도 지원하기 시작했다. 세계에서 가장 정확한 번역기임을 주장하고 해외에서는 구글 번역보다 정확한 것으로 상당히 유명하다. 서구 언어를 잘 번역하는 편이다. 한국어의 경우, 한국어에서 외국어로 번역하는 것은 영어나 중국어, 독일어의 경우 구글보다 조금 나은 편이나 외국어에서 한국어로 번역하는 것이 말끔해졌다. 일본어나 프랑스어, 러시아어, 우크라이나어 등과의 번역 품질은 구글보다 차이가 커서 품질이 좋은 편이다. 관용구를 의역하는 경향이 강하다.
ChatGPT : ChatGPT 역시 높은 수준의 번역을 제공하고 있다. 초기에는 한국어와 영어 간의 번역 품질이 그리 좋지 않았으나, 한국어 데이터 업데이트 이후 파파고 이상의 번역 품질을 보여준다. 영어와 여러 다른 언어의 번역에서도 추가적인 정보없이 번역을 하라는 명령만 있을 경우, GPT4를 사용하면 구글 번역과 DeepL과 비슷한 수준의 성능을 보인다. 특히 번역에서 중요한 요소를 먼저 답변하게 하고 그런 답변에 나온 방식으로의 번역을 요청하는 등의 프롬프트 엔지니어링을 사용하면 매우 정확도가 높다.
카카오 i 번역 : 카카오 i의 서비스 중 번역 서비스이다.
플리토 : 인공지능 번역 서비스는 무료, 사람이 직접 번역해 주는 전문적인 서비스는 유료로 제공한다.
애플 번역기 : 애플에서 제작했다. iOS 14에 포함된 번들 앱으로 PC에서는 사용이 불가능하다. Mac에서는 iOS와는 달리 단독 번역 앱은 탑재되지 않으나, macOS Big Sur부터 Safari 브라우저에서 웹페이지 번역을 지원한다.
얀덱스 번역 : 이모지 번역 기능이 있다. 한국어 발음을 할때 받침이 있는 단어와 조사가 결합하는 부분에서 음절의 끝소리 규칙이 적용된 후에 발음된다.(예: 로봇을 → 로보들)
RWS 기계번역 : RWS는 현재 세계에서 가장 큰 랭귀지서비스 기업으로 통계형이 아닌 인공신경망 기술을 기반으로 번역 솔루션을 제공하고 있다. 별건 아니고 요즘은 대부분 인공신경망이다. 그리고 시장에서 가장 완성도가 높은 학습형 기능으로 알려지고 있다. RWS는 전세계적으로 가장 많은 고객들에게 서비스를 하고 있고 현재 주한미군에서도 공식적으로 체택하여 사용하고 있는 중이다. 국내에서는 클라우드솔루션 전문기업인 모코엠시스에서 RWS 인공신경망 기계번역 솔루션을 서비스하고 있다.
S 번역기 : 삼성전자에서 제작한 S 번역기 문서 참고. 현재는 서비스 중단.
Translation Services USA : 소수민족의 언어는 물론 사어까지 번역해주는 어마어마한 물량의 사이트. 다만 유료 회원가입을 해야 한다.
Claude 3 : GPT 같은 LLM의 일종이다. 번역한 문체가 매우 매끄러운 것이 특징으로, GPT4보다도 번역 성능이 앞서는 부분이 있다. GPT4보다 지원 언어가 더 많고, 데이터가 부족한 언어에서 특히 기존 기계 번역보다 강점을 보인다. 유료 버전인 Claude 3 Opus는 특히 번역 성능이 뛰어나다.

참고자료

〈기계 번역〉, 《나무위키》
〈기계 번역〉, 《위키백과》
〈기계번역〉, 《두산백과》
〈언어 기술의 미래: 기계 번역의 미래〉, 《라이온브리지》, 2021-01-22

같이 보기

이 기계번역 문서는 기술에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

산업 : 산업, 산업혁명, 기술 ^□^■^⊕, 제조, 기계, 전자제품, 정보통신, 반도체, 화학, 바이오, 건설, 유통, 서비스, 에너지, 전기, 소재, 원소, 환경, 직업, 화폐, 금융, 금융사, 부동산, 부동산 거래, 부동산 정책, 아파트, 건물, 토지

기술	R&D • 개발 • 개선 • 개혁 • 건설기술 • 건축기술 • 계측 • 고급기술 • 고신기술 • 과학 • 과학기술 • 과학자 • 관찰 • 관측 • 군사기술 • 기능 • 기술 • 기술개발 • 기술개혁 • 기술격차 • 기술경쟁 • 기술력 • 기술발전 • 기술유출 • 기술자 • 기술진보 • 기술표준 • 기술혁명 • 기술혁신 • 기예 • 기초기술 • 나노기술 • 녹색기술 • 대체기술 • 문화기술 • 바이오기술 • 발전 • 방법 • 방법론 • 복합기술 • 상용화 • 생명공학기술 • 소멸 • 신기술 • 아이디어 • 엔지니어 • 엔지니어링 • 연구 • 연구개발 • 연구기관 • 연구소 • 연구원 (사람) • 연구원 (기관) • 연구자 • 우주항공기술 • 원리 • 원천기술 • 융합기술 • 응용기술 • 적정기술 • 전기기술 • 전문가 • 전문직 • 전자기술 • 정보 • 정보기술 • 정체 • 제어 • 지성 • 지식 • 지혜 • 진보 • 집단지성 • 첨단기술 • 최첨단기술 • 출연연 • 측정 • 토목기술 • 통신기술 • 퇴보 • 표준 • 표준화 • 하이테크 • 학문 • 학술 • 학자 • 핵심기술 • 혁명 • 혁신 • 혁신기술 • 현상 • 화학기술 • 환경기술

공학	건설공학 • 건축공학 • 계측공학 • 고분자공학 • 공간정보공학 • 공학 • 공학자 • 광공학 • 광학 • 교통공학 • 구조공학 • 금속공학 • 금속재료공학 • 금융공학 • 기계공학 • 기전공학 • 기하광학 • 기후공학 • 나노공학 • 도시공학 • 디스플레이공학 • 레이저공학 • 로봇공학 • 메카트로닉스 • 반도체공학 • 방산공학 • 배터리공학 • 산업공학 • 생명공학 • 생태공학 • 석유공학 • 섬유공학 • 세라믹공학 • 소방공학 • 소프트웨어공학 • 시스템공학 • 식품공학 • 신소재공학 • 신재생에너지공학 • 안전공학 • 에너지공학 • 에듀테크(교육공학) • 예술공학 • 원자력공학 • 유전공학 • 음향공학 • 의공학 • 인간공학 • 자동차공학 • 자원공학 • 재료공학 • 전기공학 • 전기기계공학 • 전기전자공학 • 전자공학 • 전파공학 • 정보경영공학 • 정보공학 • 정보통신공학 • 제약공학 • 제어계측공학 • 제어공학 • 조선공학 • 지진공학 • 지질공학 • 철도공학 • 컴퓨터공학(전산공학) • 토목공학 • 항공우주공학 • 해양공학 • 화장품공학 • 화학공학 • 환경공학

지식재산권	2차적 저작물 • 2차적 저작물 작성권 • 가수 • 가품 • 각본 • 각색 • 간행 • 간행물 • 건축저작물 • 게임 • 게재 • 결합저작물 • 공개 • 공공누리 저작권 • 공동저작물 • 공동저작자 • 공업소유권 • 공연 • 공연권 • 공유 • 공정이용 • 공중송신권 • 공표 • 공표권 • 그림 • 기계번역 • 기술인증 • 노래 • 녹음 • 녹취 • 녹취록 • 녹화 • 대본 • 대여권 • 댄스 • 도형저작물 • 동일성 유지권 • 등록 • 등재 • 디자인 • 디자인권 • 디자인보호법 • 디지털 워터마킹 • 라이선스 • 명품 • 모방 • 모작 • 모조품 • 무용 • 문학 • 미술 • 미술가 • 미술저작물 • 발견 • 발명 • 발명가 • 발명자 • 발명진흥법 • 발명품 • 방송권 • 배우 • 배포 • 배포권 • 번안 • 번역 • 번역기 • 번역물 • 베른협약 • 변경 • 변조 • 변형 • 복제 • 복제권 • 복제물 • 불법복제 • 사본 • 사진저작물 • 산업재산권 • 상표권 • 상표법 • 상호 • 서비스표 • 성명표시권 • 세계지식재산권기구(WIPO) • 소설 • 소유 • 수록 • 시 • 시나리오 • 신기술인증 • 신문 • 신지식재산권 • 실연 • 실연자 • 실용신안 • 실용신안권 • 실용신안법 • 어문저작물 • 연주 • 연주자 • 영상 • 영상저작물 • 영상제작 • 영업표 • 영화 • 영화저작물 • 예술가 • 오디오북 • 오마주 • 워터마크 • 워터마킹 • 원곡 • 원본 • 원작 • 원저작물 • 원저작자(원작자) • 위변조 • 위조 • 위조품 • 음악 • 음악가 • 음악저작물 • 이용허락 • 인쇄 • 인쇄물 • 인쇄소 • 인증 • 자동번역 • 작곡 • 작곡가 • 작사 • 작사가 • 작품 • 잡지 • 장르 • 재산 • 재산권 • 저작권 • 저작권법 • 저작권자 • 저작권 침해 • 저작물 • 저작인격권 • 저작인접권 • 저작인접권자 • 저작자 • 저작재산권 • 저작재산권자 • 전송 • 전송권 • 전시권 • 전자책(이북) • 전자출판물 • 정품 • 조각 • 조각가 • 지분권 • 지식재산권 • 진본 • 진품 • 짝퉁 • 창작 • 창작물 • 창작성 • 창작자 • 책 • 총유 • 출판 • 출판권 • 출판사 • 출판권자 • 출판물 • 출판자 • 춤 • 컴퓨터 프로그램 저작물 • 크리에이티브 커먼즈 라이선스(CCL) • 파리협약 • 패러디 • 퍼블릭 도메인 • 편곡 • 편곡가 • 편집저작물 • 표절 • 합유 • 화가 • 회화

특허	국내특허 • 국제특허(해외특허) • 등재특허 • 디자인특허 • 물질특허 • 발명특허 • 변리사 • 선언특허 • 신약특허 • 용도특허 • 원천특허 • 제조특허 • 제형특허 • 조성물특허 • 출원 • 출원인 • 특허 • 특허괴물 • 특허권 • 특허권자 • 특허기술 • 특허등록 • 특허법 • 특허소송 • 특허증 • 특허청 • 특허출원 • 특허협력조약 • 표준특허

위키 : 자동차, 교통, 지역, 지도, 산업, 기업, 단체, 업무, 생활, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

위키원

이름공간

변수

보기

더 보기

검색

기계번역

목차

개요

역사

제대로 사용하는 요령

오역

기계 번역기의 종류

참고자료

같이 보기