기계 번역
1. 개요
Machine translation, 機械飜譯
컴퓨터가 주체가 되어 언어를 번역해 주는 프로그램. 사람이 번역하는 것을 컴퓨터가 보조하는 경우는 CAT(Computer-assisted translation)라고 한다. 기계번역 분야는 인공지능과도 관련이 깊다. 번역은 인공지능의 목표 중 하나였으며 지금까지 연구되는 주제이기도 하다.
2016년부터는 AI를 이용한 신경망 번역을 구글이 도입했고, 네이버도 파파고 등 AI 번역기를 도입했다. AI의 학습량에 따라 진화하는 덕분에 번역의 질이 전과는 비교가 안 될 정도로 좋아졌으나, 여전히 영어사전을 낀 유치원생만도 못할 정도로 문법 및 맥락 파악에서 초보적이다.
계속 발전이 거듭되면 사람을 통한 학습을 할 필요 없이 번역기를 통해 자연스레 외국인과 서로 대화를 하고 언어를 학습하는 날이 올 것이다. 현재의 시점에도 여행 회화 정도는 문제없는 수준이다.
참고로 일본 쪽 번역기를 사용하면 해외 아이피(IP)를 막아둔 사이트도 거뜬하게 들어갈 수 있다.
2. 올바른 사용법
기계 번역기는 개발 단계에서 기본적으로 '신문'과 같은 정형화된 문장을 기반으로 개발된다. 그렇기 때문에 맞춤법, 띄어쓰기, 문장부호(마침표, 물음표)들을 제대로 붙이고, 오타나 신조어도 고쳐서 표준적인 문장을 사용하면 번역률이 훨씬 나아지는 경우가 많다. 사실 必要韓紙같은 예도 '필요 한지'가 아닌 '필요한지'로 제대로 맞춤법에 맞게 쓰면 번역이 제대로 된다. 그리고 서로 다른 여러 개의 문장은 문장부호를 이용해 확실히 구분해줘야 한다. 장문의 문장의 경우 되도록 짧은 여러개의 문장으로 나눠주고 시제를 명확히 명시해 준다면 훨씬 나은 번역 결과를 얻을 수 있다.
줄임말은 가급적 풀어서 쓰는 것이 좋다. 또 우리말에서는 주어가 생략되는 경우가 많은데 생략하지 말고 쓰는 게 좋다. 특히 영어와 같이 생략이 적은 언어로 번역하는 경우 고유명사가 엉뚱하게 번역되는 경우가 있는데, 이럴 때는 A씨, B사, C단체 등의 단어로 치환해서 문장을 작성하면 정상적으로 번역되기도 한다.
짧은 문장 즉 아프거나 위치를 묻거나 주문하거나 하는 수준에서만 사용하는 것이 좋다.
영어를 어느 정도 읽을 수 있는 경우, 타 언어를 번역기로 번역하고 싶다면 일단 영어로 번역해보는 편이 좋다. 우리가 주로 쓰게 되는 영미권 번역기는 영어 번역을 제일 잘하기도 하거니와, 인도유럽어족 언어들 간에는 번역기 효율이 꽤 좋아서 그럭저럭 정확한 번역 결과를 내놓기 때문.
3. 오역
너무나 당연한 얘기지만, 번역기는 어디까지나 '''참고용'''으로, 2016년 이후로도 유럽언어기준 B1[1] 이하의 실력을 가졌지만 외국어로 의사소통할 수밖에 없을 상황에만 번역기를 사용한 문장을 사용하는 것이 바람직하다. 위에서도 언급하듯, 맞춤법 등을 제대로 지켜주지 않으면 심각한 수준의 오역된 문장이 나올 수 있으며, 설령 모든 요소를 완벽하게 갖춘 문장이라고 해도 번역기는 그 문장에 대한 완벽한 번역문을 제공해줄 수 없다.[2] 다시 말해서, 번역기를 사용한 문장을 어디 공적인 데에 가서 쓰려고 하면 제대로 엿먹을 수 있다는 뜻이다. 따라서 다음과 같은 경우에는 번역기를 사용하면 모두의 웃음거리가 될 수 있다.
오역에 대한 예시는 오역 문서의 이 문단 참고.
- 숙제
선생님께서 당신의 숙제가 번역기를 돌린 문장이란 것을 모를 것 같은가? 굳이 돌리고 싶으면 단어 수준만 돌리자. 몇 가지 문법 상의 오류가 있는 문장과 번역기를 돌린 문장은 여러 면에서 차이가 난다. 먼저 기본적인 문장의 구조부터 어긋나는 경우가 생기며,[3] 번역기가 동음이의어를 착각해버려 상황과는 전혀 어울리지 않는 단어가 갑자기 튀어나오기도 한다. 전자는 맞춤법 검사기를 사용해서 어느정도는 보정 가능하다만 여전히 기계인건 똑같은지라 완벽하진 않고 후자는 문맥을 파악해 다른 의미를 넣으면 어느정도 해결 가능하다만 어지간히 어려운 단어가 아니라면 모르면 심각한거다. 즉 안 하느니만 못한 엉터리 숙제를 제출하게 되므로 애초에 숙제는 스스로 하자. 어차피 시험 보면 다 뽀록나게 되어 있다. 가볍게 끝난다면 그냥 선생님한테 한 소리 듣고 점수 깎이는 것으로 끝나겠지만, 학년이 올라갈수록 점점 자신한테 미치는 영향이 치명적이 되며, 대학에서 이런 짓 하다간 미래가 없어진다. 상위버전으로 보고서를 번역기를 써서 제출해 내면? 더 이상의 자세한 설명은 생략한다.
- 지식iN 답변
일부 답변자들은 지식iN에서 활동할 때 번역해달라는 질문이 올라오면 곧바로 번역기를 돌려서 그걸 답변으로 올려 버리는데, 이 행위는 질문자뿐만 아니라 다른 답변자들한테도 민폐를 끼치는 행위다. 일단 질문자는 제대로 된 답변을 기대하고 질문을 올린 것인데, 누군가가 말도 안 되는 문장을 가지고 온 주제에 뻔뻔하게 채택해달라고 하면 매우 불쾌하며 만약 질문자가 답변이 번역기인 줄 모른다면 상황은 더 심각해진다. 번역기를 사용한 문장을 어디에 써먹을지 모르기 때문이다. 예를 들어 전문적인 글이나 보고서를 작성하는 상황이었더라면 바로 아웃이 되는 거다. 또한, 번역기를 사용하지 않은 제대로 된 번역가 답변자가 지식iN에는 널려 있다. 번역기를 써서 답변한다면 그들에게 제대로 된 답변을 할 기회도, 채택받을 확률도 앗아가는 것이 된다. 그러므로 지식iN에서 번역기를 써서 답변을 다는 것은 아무 성의도 없는 내공냠냠성 답변이랑 하나도 다를 바가 없다.
다만 내용도 전문적인 데다 번역업체에 의뢰하면 최소 십수만 원이 들 분량을 내공 몇 푼에 날로 먹으려 드는 질문자도 문제가 있다. 애초에 전문적인 글이나 보고서라면 제대로 된 곳을 통해 번역하는 게 품질 면에서 더 낫다. 세상에 공짜 점심은 없다.
[image]다만 내용도 전문적인 데다 번역업체에 의뢰하면 최소 십수만 원이 들 분량을 내공 몇 푼에 날로 먹으려 드는 질문자도 문제가 있다. 애초에 전문적인 글이나 보고서라면 제대로 된 곳을 통해 번역하는 게 품질 면에서 더 낫다. 세상에 공짜 점심은 없다.
[4]
컴퓨터 프로그램의 특성상은 번역을 100% 완벽하게 할 수는 없기에 오역이 나올 수밖에 없다. 언어 변화에 여리니 규범주의적으로 볼 수 있다. 어떤 사람들은 현재의 번역기들을 「오역기」로 비꼬아 부르기도 한다. 기술주의적으로 만들려면 언중들의 언어 표현을 그때그때 많이 수집해야 된다. 곧, CAPTCHA처럼 만들어야 된다는 뜻.
특히 구글 번역기로 일본어 번역을 하면 후반에 갈수록 번역이 안 되어 있다나,[5] 이상한 단어가 나오기도 한다.[6] 번역 성능은 차치하고서라도 동형이의어의 처리 문제도 있다. 특히 동형이의어가 많은 한국어에서 이 문제가 잘 나타난다. 예를 들어 「인도로 가다」라는 문장만 제시되면 그 문장의 '인도'가 사람이 다니는 길(人道)을 의미하는지 아니면 남아시아의 나라 가운데 하나인 인도(India, 印度)를 의미하는지 알 수 없다.
또한 일반명사에서 따온 고유명사[7] 는 이것이 일반명사인지 고유명사인지 번역기는 알길이 없기 때문에 단어 뜻 그대로 번역하는 경우가 있다. 그래서 외국 회사의 홈페이지를 통째로 번역기로 돌린다면 내용을 이해하는 데 언어적 센스가 필요하다.
추가로 숙어가 튀어나오면 거의 99% 확률로 오역이 되어버린다. Could not help V-ing를 '도울 수가 없고 그러나 ~하는 도중에'라는 식으로 번역하거나, be used to V-ing를 '~하는 데 사용되다' 같은 식으로 번역하는 게 대표적인 예. 그나마 후자는 원체 사용 빈도가 높은지라 지금은 왠만한 번역기는 '익숙하다'라고 제대로 뱉어주지만, 전자는 지금까지도 제대로 번역하는 번역기가 거의 없다.
기계 번역의 특성상은 번역 대상이 되는 언어간의 유사성에서 영향을 크게 받는다. 어순이 같고 한자 단어를 공유하는 한일 번역은 80~90% 정도의 번역을 보이고, 영어와 프랑스어 같은 경우도 상당한 번역율을 보인다.[8] 어순이나 문법상의 차이가 큰 한영 번역 같은 경우는 종종 무슨 내용인지 알기 어려울 정도로 번역율이 떨어진다. 중국어의 경우도 어순이 다른 데다가 중국어의 의차와 음차를 뒤섞은 무자비한 현지화 표기까지 존재한다.[9]
알타비스타의 바벨피쉬는 충격과 공포를 선사했다. 알타비스타 만담기라고 부를 정도였다. 한동안 바벨피쉬를 이용한 개그가 유행한 적이 있다. 참고로 2013년 현재 위 짤과 같은 'How are you?'를 넣으면 '어떻게 지내세요'라고 정상적으로 번역한다.
유명한 번역기의 오역으로 일본어로 '필요한지'를 오역한 '必要韓紙'가 있으며, 영어로 "Time flies like an arrow"를 오역한 "시간 파리는 화살을 좋아한다."가 있다.[10] 아예 영미권에선 "Fruit flies like a banana."라는 문장까지 앞 문장과 세트로 볼 지경.
심지어는 日本을 '''날책(...)'''으로 번역하기도 한다.
한자로 이름을 표시하는 나라들[11] 의 국적을 가진 사람들의 이름을 번역기로 돌리면 기상천외한 번역이 등장하곤 한다.(...) 예시를 들면....
- 후지하라 쇼마(藤平 尚真): 핑은 여전히 참 포도나무이다
- 야나기 유야(柳裕也): 리우 유도
- 사카이 토모히토(酒居知史): 서식지는 와인의 역사를 알고
- 도히 세이야(土肥星也): 토양과 비료도 스타
3.1. 관련 문서
4. 주요 번역기
※ '''사라진 번역기는 취소선 처리.'''
4.1. 알타비스타
바벨피쉬 문서 참조. 구글 번역 이전에 세계적으로 유명한 번역 서비스였다. 엉터리같긴 하지만 그래도 인구어간 번역은 언어간의 구조적 유사성 덕분에 그럭저럭 쓸 만했었다고. 지금은 야후!를 거쳐 Bing에서 서비스 중.
4.2. Google 번역
구글 번역 문서 참조 2016년 9월 28(현지시각)부터 영어-중국어를 시작으로 딥 러닝 기술이 적용되었다.
4.3. 파파고
네이버에서 제작한 인공지능 기반 번역기.
4.4. 카카오 i 번역
카카오 I의 서비스 중 번역 서비스이다. 카카오 i 번역 문서 참조.
4.5. S 번역기
삼성전자에서 제작한 S 번역기 문서 참조. S 번역기를 제작한 회사는 구글 번역기를 만든 회사와 동일한 회사다.
4.6. 시스트란 번역기(데모)
시스트란에서 인공신경망 기술을 기반으로 만든 번역기다. 하버드대와 공동연구하고 있으며 OpenNMT OpenNMT에 오픈 소스화 되어 있다.
4.7. 빙 번역기
마이크로소프트에서 제작했다. 2013년 7월 현재 43개 언어를 지원한다. 기술문서 번역에서는 구글보다 좋은 결과를 보여준다. 이유는 방대한 MSDN 번역자료가 있기 때문이다. [12] 페이스북의 번역 기능이 바로 이 번역기 기반이다.
[image]
엉뚱한 오역을 범한다. 대표적으로는 프란치스코가 트위터에 'War never again! Never again war!'라고 쓴 것을 '결코 다시 전쟁! 결코 다시 전쟁!'이라고 출력하는 등의 사례가 있다.(...) 2018년 5월 번역 결과도 그대로다.[13]
[image]
그리고 과거 구글 번역 때처럼 여기도 初音ミク(하츠네 미쿠)가 이명박으로 변역된 적이 있었으나 지금은 올바르게 수정되었다. 저 단어 단독적으로 사용하면 정상으로 보이지만, 특수문자나 다른 수식어와 함께 사용하면 여전히 이명박으로 나온다. 더불어 ヘ도 특수문자와 수식어랑 같이 사용하면 박근혜로 나오며, yi를 치면 이순신이 나온다.
[image]
Bing 번역기에 にごり湯를 번역하면 아잉이 나오고 露天風呂를 검색하면 튀잉이 나온다.(...)
의외로 많은 번역 앱이나 사이트, 블로그 등이 빙 번역기에 번역 서비스를 의존하고 있다. 앱/웹 개발자에게 무료로 자신들의 서비스 API를 오픈하고 있는 혜자로운 정책 덕분. 사이트나 블로그 등에 부착할 수 있는 위젯에는 제한이 없고, 앱에서 사용할 수 있는 API는 월 '''200만''' 단어까지 무료다.
이렇듯 사람들 사이에 불만이 많았지만 2016년 11월 15일부터 신경망 기반 번역이 등장하면서 앞으로는 개선될 것으로 보인다.
4.8. 애플 번역기
애플에서 제작했다.
iOS 14에 포함된 번들 앱으로 PC에서는 사용이 불가능하다.
자세한 내용은 이 문서 참고
4.9. 한↔일 전문 번역기
- EZTrans 계열
EZTrans 계열의 원조 프로그램. 아래에서 언급된 여러 프로그램 들에 플러그인 등으로 연동되어 번역 메인 엔진의 역할을 하기도 한다. 자체에도 사용자 사전 추가/편집 기능이 있으므로 본인 사용 영역에 따라 꾸준히 사용자 사전을 관리해 왔다면 순정 상태에서 일반적인 범용 사전(꿀도르 등)보다 우수한 결과물을 얻을 수 있다.
한때 NTransTalk로 대체되었다가 이후 NTransTalk가 네이버 번역기로 흡수된 것 같다. 파파고의 정식 서비스가 시작된 이후에는 서비스가 종료되었고, 그 자리를 파파고가 대체하였다.
EZTrans XP의 엔진을 사용하는 비공식 확장 프로그램[14] . 아네모네는 EZTrans XP의 엔진을 다른 곳에서 구동하기 위한 프로그램으로서 보통 후킹이나 OCR 등으로 추출해 낸 글을 자동으로 처리해서 돌려주는 형식으로 사용된다. 필터는 문장을 더 자연스럽게 다듬어 주는 역할을 하며, Ehnd가 주로 같이 쓰인다. 이 경우 흔히 짝을 이뤄서 사용되는 단어사전은 몇 가지가 있었으나 2017년 기준으로 범용으로는 꿀도르가 가장 보편적이고 무난한 일한 번역기이다. 물론 완전하지는 않다.
다만 본래 게임용(이 경우에는 ITH를 비롯한 후커의 개별 설치가 필요)으로 개발된 프로그램이라, 웹사이트 번역 기능은 없다. 웹사이트의 문장을 따로 복사해서 텍스트 번역란에 붙여넣어야만 한다. 혹은 드래그가 허용되는 사이트일 경우 클립보드 기능을 사용해 실시간 번역을 할 수도 있다.
다만 본래 게임용(이 경우에는 ITH를 비롯한 후커의 개별 설치가 필요)으로 개발된 프로그램이라, 웹사이트 번역 기능은 없다. 웹사이트의 문장을 따로 복사해서 텍스트 번역란에 붙여넣어야만 한다. 혹은 드래그가 허용되는 사이트일 경우 클립보드 기능을 사용해 실시간 번역을 할 수도 있다.
야후 JAPAN에서 서비스하는 번역기로, 크로스랭귀지의 번역 엔진을 사용하는 서비스다.
한↔일/일↔한 모두 가능하며 번역 품질이 꽤나 좋다. 다만 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있으며, 또한 2015년 겨울 이후부터는 야후 JAPAN 회원 계정이 있어야지만 세부 설정 기능을 사용할 수 있게 되었다.
번역 품질에 관련해서 독특한 부분을 한 가지 언급하자면, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있는 것이 특징. 다만 이것이 좀 지나쳐져 과잉 교정이 발생되는 일도 많아서, 붙여쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 대해서도 일괄적으로 띄어쓰기를 적용한 결과를 출력하는 경향을 보였다. 이 때문에 가독성을 위한 배려라는 점에서는 훌륭하지만 그와는 별개로 기본적인 문장 구성에 있어서 기계 번역을 거친 티가 무언가 부자연스러움을 줄 정도로 확 나는 결과가 출력되는 일이 많았었던 편. 또한 꽤 철저하게 띄어쓰기가 이루어진다고는 하지만 역시 완전하지는 않은 편이기도 해서, 띄어쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 붙여쓰기를 적용한 결과를 출력할 때도 역시 있었다. 2017년 6월 29일자로 서비스가 종료되었다.
한↔일/일↔한 모두 가능하며 번역 품질이 꽤나 좋다. 다만 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있으며, 또한 2015년 겨울 이후부터는 야후 JAPAN 회원 계정이 있어야지만 세부 설정 기능을 사용할 수 있게 되었다.
번역 품질에 관련해서 독특한 부분을 한 가지 언급하자면, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있는 것이 특징. 다만 이것이 좀 지나쳐져 과잉 교정이 발생되는 일도 많아서, 붙여쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 대해서도 일괄적으로 띄어쓰기를 적용한 결과를 출력하는 경향을 보였다. 이 때문에 가독성을 위한 배려라는 점에서는 훌륭하지만 그와는 별개로 기본적인 문장 구성에 있어서 기계 번역을 거친 티가 무언가 부자연스러움을 줄 정도로 확 나는 결과가 출력되는 일이 많았었던 편. 또한 꽤 철저하게 띄어쓰기가 이루어진다고는 하지만 역시 완전하지는 않은 편이기도 해서, 띄어쓰기를 해야 자연스러운 단어나 문장이 될 수 있는 부분에 붙여쓰기를 적용한 결과를 출력할 때도 역시 있었다. 2017년 6월 29일자로 서비스가 종료되었다.
라쿠텐의 포털 사이트인 인포시크에서 서비스하는 번역기로, 야후 JAPAN에서 서비스하는 번역기인 야후 JAPAN 번역과 마찬가지로 크로스랭귀지의 번역 엔진을 사용하는 서비스다.
한↔일/일↔한 모두 가능하며, 같은 회사의 번역 엔진을 사용하고 있기 때문에 번역 품질은 야후 JAPAN 번역과 크게 다르지 않다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
다만 자잘한 차이점도 있기는 한데, 대표적으로 회원 계정이 없이도 세부 설정 기능을 사용할 수 있다는 점을 들 수 있다. TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)는 번역이 불가능하다는 점도 야후 JAPAN 번역과는 다른 부분. 모바일 웹 페이지 버전이 없다는 게 흠. 2020년 12월 이후로는 중단 된 상황.
한↔일/일↔한 모두 가능하며, 같은 회사의 번역 엔진을 사용하고 있기 때문에 번역 품질은 야후 JAPAN 번역과 크게 다르지 않다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
다만 자잘한 차이점도 있기는 한데, 대표적으로 회원 계정이 없이도 세부 설정 기능을 사용할 수 있다는 점을 들 수 있다. TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)는 번역이 불가능하다는 점도 야후 JAPAN 번역과는 다른 부분. 모바일 웹 페이지 버전이 없다는 게 흠. 2020년 12월 이후로는 중단 된 상황.
소니의 포털 사이트인 SO-NET에서 서비스하는 SO-NET 회원 전용 번역기. 본래 야후 JAPAN 번역과 마찬가지로 크로스랭귀지 번역 엔진을 사용하는 번역기였지만, 2018년 4월 초에 있었던 리뉴얼 이후에는 YarakuZen이라는 다른 회사의 번역 엔진으로 교체된 상황이다.
한↔일/일↔한 모두 가능하며, 번역 품질은 야후 JAPAN 번역과 비슷하다(다만 번역 품질이 약간 떨어지고 오역이 상당히 많은 편). 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
야후 JAPAN 번역과 마찬가지로 TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)의 번역이 가능한 것이 특징. 번역 품질이 야후 JAPAN 번역보다는 뒤떨어지기는 하지만, 서비스가 종료된 야후 JAPAN 번역의 대체재로서 활용가치가 있다고 평가받고 있었다. 이 번역기도 모바일 웹 페이지 버전이 없다.
2018년 4월 이전까지는 비회원도 웹사이트 번역 기능의 이용이 가능하였으나, 해당 기능은 2018년 4월 초에 있었던 리뉴얼 이후에 SO-NET 회원 전용 서비스로 전환되었다. 4월 말에 있었던 후속 패치로 직링크를 이용하는 우회 방법도 막힌 것이 확인되었다. 단문 번역 기능은 여전히 비회원에게도 제공되고 있지만, 번역 엔진이 교체되었기에 번역 품질에 약간의 변동이 있다는 점은 고려할 필요가 있다.
한↔일/일↔한 모두 가능하며, 번역 품질은 야후 JAPAN 번역과 비슷하다(다만 번역 품질이 약간 떨어지고 오역이 상당히 많은 편). 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것도 동일. 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 동일하다.
야후 JAPAN 번역과 마찬가지로 TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)의 번역이 가능한 것이 특징. 번역 품질이 야후 JAPAN 번역보다는 뒤떨어지기는 하지만, 서비스가 종료된 야후 JAPAN 번역의 대체재로서 활용가치가 있다고 평가받고 있었다. 이 번역기도 모바일 웹 페이지 버전이 없다.
2018년 4월 이전까지는 비회원도 웹사이트 번역 기능의 이용이 가능하였으나, 해당 기능은 2018년 4월 초에 있었던 리뉴얼 이후에 SO-NET 회원 전용 서비스로 전환되었다. 4월 말에 있었던 후속 패치로 직링크를 이용하는 우회 방법도 막힌 것이 확인되었다. 단문 번역 기능은 여전히 비회원에게도 제공되고 있지만, 번역 엔진이 교체되었기에 번역 품질에 약간의 변동이 있다는 점은 고려할 필요가 있다.
인포시크 번역기에서 이용중이며 과거에는 야후 JAPAN 번역이나 SO-NET 번역 등에서도 이용되었었던 번역 엔진의 개발사인 크로스랭귀지에서 직접 서비스를 제공하고 있는 번역기. 2017년 10월 11일부터 서비스가 개시되었다. 2018년 1월 30일부터는 파파고와 같은 인공지능 기반 번역 서비스도 제공되고 있지만, 이미 정식 서비스 단계로 돌입한 파파고와는 달리 아직 베타 서비스 단계이며 따라서 기존의 번역 엔진과 병용되고 있는 상태이다.
한↔일/일↔한 모두 가능하며, 크로스랭귀지 번역 엔진의 개발사에서 직접 제공하는 서비스이기에 번역 품질은 인포시크 번역기나 과거의 야후 JAPAN 번역과 동일하다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것이나, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 역시 동일하다.
다만 아쉬운 점은 웹사이트 번역 기능은 아예 없으며 단문 번역 기능만 제공된다는 점.
한↔일/일↔한 모두 가능하며, 크로스랭귀지 번역 엔진의 개발사에서 직접 제공하는 서비스이기에 번역 품질은 인포시크 번역기나 과거의 야후 JAPAN 번역과 동일하다. 유저 인터페이스가 일본어이기에 일본어에 익숙하지 않으면 사용에 난점이 있다는 것이나, 띄어쓰기에 관련해서 상당히 철저하게 띄어쓰기가 이루어진 결과를 출력하도록 되어 있지만 그것이 좀 지나쳐져 과잉 교정이 발생되는 일 역시 많다는 것도 역시 동일하다.
다만 아쉬운 점은 웹사이트 번역 기능은 아예 없으며 단문 번역 기능만 제공된다는 점.
- KODENSHA 계열
EZTrans 계열에 비해 번역 품질이 상대적으로 떨어진다. TLS 프로토콜을 사용하는 웹사이트(웹사이트 주소가 http가 아닌 https로 시작되는 곳들)는 번역이 불가능하다는 점도 약점.
5. 번역 평가 방법론
5.1. 필요성
번역기를 만들어 놓고 번역이 잘되는지 만족하는 것에 끝나지 않고 얼마나 번역이 잘 되는지에 대한 수치적 데이터가 필요하기 때문이다. 번역 알고리즘끼리 성능을 비교할 때 사용된다.
5.2. 사람이 직접 평가
가장 정확도가 높은 번역으로 실제로 얼마나 제대로 번역했는지 인간이 직접 평가하는 방법이다. 번역 문장을 직접 읽고 사용하는 주체는 결국 사람이므로 기계 번역의 목적에 가장 알맞은 평가 방법이라고도 할 수 있다. 대체로 번역의 대상인 문장과 이 문장을 번역한 문장을 보여준 다음, 번역된 문장이 번역의 대상이 된 문장을 얼마나 잘 번역했는지 5택하는 설문조사를 사용한다.
대표적인 예가 네이버로,GYM이라는 서비스로 유저들에게 번역을 평가하게 한다. 활동을 할수록 포인트를 준다
단점으로는 인간 자원은 많은 비용이 든다는 점과 평가 시간이 오래 소모된다는 점, 그리고 사람마다 평가하는 기준이 다르다는 점, 평가를 할 때마다 평가를 진행하는 사람들의 집단이 동일해야 한다는 점 등이 있다. 예를 들어 사람간의 독해력의 차이가 있다. 그리고 어떤 사람은 대충 뜻만 통하면 괜찮다고 평가하지만 어떤 사람은 문맥이 좀만 이상해도 읽기 꺼림칙할 수도 있다.[15]
5.3. 자동 평가 방법
사람이 직접 평가하는 방법의 단점(돈, 시간, 객관성 등)을 보완하기 위해 컴퓨터가 번역의 정확성을 평가하기 위해 만든 알고리즘.
사람이 번역한 문장(들)을 기준으로 하여 기계 번역한 문장을 평가한다. 사람이 번역한 문장이 100% 정답이라고 할 수 없는 경우가 많기 때문에 보통 여러 개의 기준을 두고 평가한다.
6. 기타
여기서는 그 외의 번역기를 서술한다.
6.1. 외계어 번역기
인터넷에 외계어가 유행할 무렵에 외계어 번역기[16] 라는 것도 존재했다. 한자는 그대로 한글 발음으로 옮겼기 때문에 因[17] 을 '대'가 아닌 그냥 '인'으로 변환하는 등 번역기의 한계점이 드러나기도 했다
6.2. 특수문자변경기
특수문자변경기 사이트
일단 사용방법은 하얀 창에 원하는 글자를 치면 #ADFF2F 그린, 파란색, 노랑색에서 번역을 해주거나 글자를 꾸며준다.
6.3. 번역기들
번역기들
거의 모든 번역기를 동시에 이용할 수 있는 사이트이다. 현재 구글, 파파고, 카카오, azure, watson, aws 플랫폼이 지원된다. 번역 퀄리티는 파파고 > 카카오 >= 구글 > azure = watson = aws 순이다.
6.4. 사진 번역기
사진을 찍으면 곧바로 번역을 해주는 신기한 앱도 있다.
7. 관련 문서
- 왈도체
- 아이 엠 샘
- 코스타리카의 압박
- Microsoft AppLocale
- 아랄트랜스
- 알타비스타
- 컴퓨터 보조 번역: 번역기가 주체가 아니라 사람이 주체가 되고, 컴퓨터가 보조해주는 프로그램. 해당 문서 참조.
[1] 수능영어 3등급 이하[2] 일례로, 어서와~ 한국은 처음이지?에서 태국인들이 감자탕집에서 주문을 하려고 번역기를 돌렸는데, 해당 점포의 상호로 추정되는 '참'만 무한 인식해버리는 바람에 'charmcharmcharm......'으로 오역해버리는 참사가 터졌다.[3] 이는 한국어와 영어처럼, 문장의 기본 어순이 완전히 다른 언어 사이에서 자주 일어나는 현상이다.[4] 지대공 미사일은 영어로 surface-to-air missile, 약자는 SAM이다.[5] 이건 오역과는 상관없는 문제다.[6] 예를 들어 '미도리바시역'은 그냥 \''''녹색 다리''''역으로 나온다, '금구슬'을 번역하면 \''''불알''''이 뜬다. [7] 대표적인 예시로 영어권 회사명 등이 있다. '애플(Apple)', '밸브(Valve)', '윈도우(Windows)' 등.[8] 다만 위의 예시처럼 10% 정도의 오역도 전체 의미를 뒤바꿔 버릴 수 있어 주의가 필요하다. 뒤집어 말하면 문장의 10% 이상 오역으로 채워진다는 이야기다.[9] 과거 엠파스가 한·중 웹번역을 서비스한 적도 있으나 번역률이 극악했다.[10] 제대로 된 번역은 '시간은 화살과 같이 날아간다'이다. 'fly'를 동사가 아닌 명사인 '''파리'''로 보고, 'like'를 형용사로 말고 동사로 보아서 나온 사례[11] 특히 훈독과 음독 때문에 같은 한자라도 읽는 법이 다른 일본.[12] 2018년 12월 20일경 이후로 앱에서는 구글 번역 사용. PC버전 웹사이트에서는 아직도 사용되고 있다.[13] 참고로 구글 번역의 결과는 '전쟁은 다시는! 다시는 전쟁을하지 마십시오!' 2019년 11월 기준으로는 '다시는 전쟁이 없습니다! 다시는 전쟁하지 마십시오!'[14] EZTrans XP를 이용하는 비공식 확장 프로그램은 아네모네 외에도 상당히 많이 있지만, Ehnd하고의 결합 및 편의성으로 인해 일반 번역 용도라면 아네모네가 가장 흔히 사용된다.[15] 그래서 평가나 말뭉치 구축에 있어서 사람 사이의 통일성을 측정하는 kappa correlation 점수를 표기한다.[16] 번역기라기 보다는 변환기 수준. 유행이 지나간 지금은 사이트 폐쇄.[17] 원래 훈음은 '인할 인'이지만 大에 네모를 씌운 형태로 주로 사용되었다.