컴퓨터 보조 번역
컴퓨터 보조 번역 (CAT, '''Computer-aided translation''')
기계 보조 번역 (MAT, machine-aided translation)
번역 보조 전용 소프트웨어. 번역기와는 달리 번역 과정 중에 번역가가 반드시 필요하다.
번역 보조 소프트웨어의 기능을 이용하여 번거로운 반복 작업을 자동화하고 대규모 번역에서 저지르기 쉬운 실수를 크게 줄이는 등의 도움을 준다.
프리랜스 번역(벤더) 계약을 하는 번역/현지화 전문회사들은 CAT 소프트웨어를 어느정도 능숙하게 다루지 못하면 번역 일거리를 주지 않는다. 또 번역 의뢰 자체가 CAT 소프트웨어 전용 파일의 형식으로 들어오는 경우도 있기 때문에, 전문적인 번역가라면 자신이 거래하는 회사에 맞춰 CAT 소프트웨어를 쓸 줄 알아야 한다.
가장 널리 쓰이는 CAT 소프트웨인 Trados의 구동화면을 살펴보면, 화면 왼쪽 위의 창이 번역 메모리 창, 오른쪽은 용어집 창 (위 이미지에서는 용어집이 열려있지 않다), 그리고 아랫쪽 큰 창이 메인 작업창이다. 메인 작업창의 왼쪽 줄에는 원문인 소스, 오른쪽 줄에는 번역문인 타겟이 표시된다.
CAT 소프트웨어는 종류가 다양하지만, 핵심 기능인 번역 메모리 (TM, translation memory) 기능은 반드시 갖고 있다.
번역할 일감은 하드카피(종이 문서) 또는 그것을 스캔한 이미지 파일(및 이미지 포맷의 PDF 파일)의 형태로 들어오는 경우도 있지만, 좀 큰 회사의 경우 대개 MS 워드와 같은 워드프로세서 파일 형태로 일감을 보내준다. 굳이 워드 문서가 아니라도 기계가 읽을 수 있는 텍스트가 포함되어 있으면 거의 다 CAT 소스로 사용할 수 있다. 예를들어 MS 파워포인트나 엑셀 파일, 텍스트 포맷의 PDF 파일, html 파일 등등은 별도의 변환작업 없이 소스로 사용이 가능하다. (다만 CAT 툴의 종류에 따라 지원하는 포맷이 서로 다르다.)
이런 소스(원문)를 CAT 소프트웨어가 읽어들여 일정 기준에 따라 수많은 번역단위(TU 또는 segment라고도 한다)로 토막내어 "작업문서" 를 생성한다. 작업자는 작업문서를 열어서 각 번역단위별로 번역을 하는데, 일단 번역을 한 번역단위는 전부 번역 메모리에 저장되어, 나중에 그 번역단위와 동일하거나 유사한 번역단위가 다시 나올 경우 소프트웨어가 자동으로 동일/유사한 예를 제시해 준다.
번역 메모리는 대규모의 작업일수록 중요한 역할을 하는데, 하나의 용어나 문장에 대해 여러개의 번역이 혼재하는 [1] 상황을 막아주고, 하나의 큰 프로젝트를 여러 작업자가 분업할 때 사용하는 용어나 표현 등을 통일시켜 준다. 또한 기술적인 번역일수록 대동소이한 문장이 여러번 등장하는 경우가 많은데, 이럴 때 번역을 일부 자동화함으로써 작업 분량을 줄여주는 효과도 있다.
또 만약 작업 도중에 저장을 안한 상태에서 프로그램이나 컴퓨터가 작동 중지되어 버리는 경우에도, 번역 메모리는 자동으로 업데이트되므로 작업의 손실을 최소화할 수 있다. 게다가 번역 메모리가 원격 서버에 저장되는 경우, 작업자의 컴퓨터가 복구 불가능할 정도로 손상되는 경우에도 작업은 손실되지 않는다. [2]
또 흔히 제공되는 기능으로 자동번역 기능이 있다. 자동번역이라고 해도 번역기와는 전혀 다른 것으로, 번역 메모리에 저장되어 있는 번역단위와 일치하는 번역단위가 발견될 경우 그것을 미리 삽입해 주는 정도의 기능이다.
기계 번역기를 이용하여 번역한 결과물을 표시해 주는 기능이 있기도 하다. 일한 번역과 같이 비교적 기계 번역기의 성능이 괜찮은 페어의 경우, 적당히 문맥 파악이나 번역 속도 향상에 도움이 된다.
그 외에 품질검수(Quality Assurance) 기능이 있다. 번역 프로젝트에 있는 모든 문서의 내용에서 용어의 원문이 번역문으로 정확하게 번역이 되었는지를 검사하여, 다르게 번역된 것은 사용자에게 알려주는 기능이다. 이 기능을 이용하면 감수자가 감수할 때 번역가가 번역한 용어중에 용어집에 정의한 용어로 번역이 안 된 용어를 검사할 수 있으며, 원문 용어를 번역한 번역문을 새로운 번역문으로 변경할 수 있는 기능과 변경된 변경 리스트를 프로젝트별로 관리해 주는 기능도 된다.
기계 보조 번역 (MAT, machine-aided translation)
1. 소개
번역 보조 전용 소프트웨어. 번역기와는 달리 번역 과정 중에 번역가가 반드시 필요하다.
번역 보조 소프트웨어의 기능을 이용하여 번거로운 반복 작업을 자동화하고 대규모 번역에서 저지르기 쉬운 실수를 크게 줄이는 등의 도움을 준다.
프리랜스 번역(벤더) 계약을 하는 번역/현지화 전문회사들은 CAT 소프트웨어를 어느정도 능숙하게 다루지 못하면 번역 일거리를 주지 않는다. 또 번역 의뢰 자체가 CAT 소프트웨어 전용 파일의 형식으로 들어오는 경우도 있기 때문에, 전문적인 번역가라면 자신이 거래하는 회사에 맞춰 CAT 소프트웨어를 쓸 줄 알아야 한다.
1.1. 기능
가장 널리 쓰이는 CAT 소프트웨인 Trados의 구동화면을 살펴보면, 화면 왼쪽 위의 창이 번역 메모리 창, 오른쪽은 용어집 창 (위 이미지에서는 용어집이 열려있지 않다), 그리고 아랫쪽 큰 창이 메인 작업창이다. 메인 작업창의 왼쪽 줄에는 원문인 소스, 오른쪽 줄에는 번역문인 타겟이 표시된다.
CAT 소프트웨어는 종류가 다양하지만, 핵심 기능인 번역 메모리 (TM, translation memory) 기능은 반드시 갖고 있다.
번역할 일감은 하드카피(종이 문서) 또는 그것을 스캔한 이미지 파일(및 이미지 포맷의 PDF 파일)의 형태로 들어오는 경우도 있지만, 좀 큰 회사의 경우 대개 MS 워드와 같은 워드프로세서 파일 형태로 일감을 보내준다. 굳이 워드 문서가 아니라도 기계가 읽을 수 있는 텍스트가 포함되어 있으면 거의 다 CAT 소스로 사용할 수 있다. 예를들어 MS 파워포인트나 엑셀 파일, 텍스트 포맷의 PDF 파일, html 파일 등등은 별도의 변환작업 없이 소스로 사용이 가능하다. (다만 CAT 툴의 종류에 따라 지원하는 포맷이 서로 다르다.)
이런 소스(원문)를 CAT 소프트웨어가 읽어들여 일정 기준에 따라 수많은 번역단위(TU 또는 segment라고도 한다)로 토막내어 "작업문서" 를 생성한다. 작업자는 작업문서를 열어서 각 번역단위별로 번역을 하는데, 일단 번역을 한 번역단위는 전부 번역 메모리에 저장되어, 나중에 그 번역단위와 동일하거나 유사한 번역단위가 다시 나올 경우 소프트웨어가 자동으로 동일/유사한 예를 제시해 준다.
번역 메모리는 대규모의 작업일수록 중요한 역할을 하는데, 하나의 용어나 문장에 대해 여러개의 번역이 혼재하는 [1] 상황을 막아주고, 하나의 큰 프로젝트를 여러 작업자가 분업할 때 사용하는 용어나 표현 등을 통일시켜 준다. 또한 기술적인 번역일수록 대동소이한 문장이 여러번 등장하는 경우가 많은데, 이럴 때 번역을 일부 자동화함으로써 작업 분량을 줄여주는 효과도 있다.
또 만약 작업 도중에 저장을 안한 상태에서 프로그램이나 컴퓨터가 작동 중지되어 버리는 경우에도, 번역 메모리는 자동으로 업데이트되므로 작업의 손실을 최소화할 수 있다. 게다가 번역 메모리가 원격 서버에 저장되는 경우, 작업자의 컴퓨터가 복구 불가능할 정도로 손상되는 경우에도 작업은 손실되지 않는다. [2]
또 흔히 제공되는 기능으로 자동번역 기능이 있다. 자동번역이라고 해도 번역기와는 전혀 다른 것으로, 번역 메모리에 저장되어 있는 번역단위와 일치하는 번역단위가 발견될 경우 그것을 미리 삽입해 주는 정도의 기능이다.
기계 번역기를 이용하여 번역한 결과물을 표시해 주는 기능이 있기도 하다. 일한 번역과 같이 비교적 기계 번역기의 성능이 괜찮은 페어의 경우, 적당히 문맥 파악이나 번역 속도 향상에 도움이 된다.
그 외에 품질검수(Quality Assurance) 기능이 있다. 번역 프로젝트에 있는 모든 문서의 내용에서 용어의 원문이 번역문으로 정확하게 번역이 되었는지를 검사하여, 다르게 번역된 것은 사용자에게 알려주는 기능이다. 이 기능을 이용하면 감수자가 감수할 때 번역가가 번역한 용어중에 용어집에 정의한 용어로 번역이 안 된 용어를 검사할 수 있으며, 원문 용어를 번역한 번역문을 새로운 번역문으로 변경할 수 있는 기능과 변경된 변경 리스트를 프로젝트별로 관리해 주는 기능도 된다.
2. 종류
- SDL Trados Studio - 부동의 업계 1위. 그만큼 비싸다. 트라도스 스튜디오 2015 기준, 스타터 버전 1년 구독권이 99유로(약 12만원), 개인용 라이센스가 695유로(약 83만원), 기업용 1카피에 2595유로(약 330만원).
- Wordfast - Microsoft Word와의 유연한 연동성이 특징.
- Déjà Vu
- memoQ
- OmegaT - 무료 오픈소스 CAT. Java 기반이며, 상용 CAT에 비할 수 있는 유일한 오픈소스 CAT이다. 트라도스가 포토샵이라면, 이쪽은 GIMP 정도 느낌? 다운로드
- [3]
- Idiom Workbench
- Translation Workspace
- Memsource Editor
- Hyperhub
- Across
- XTM Cloud
[1] 여러명의 번역자가 동시에 작업하는 경우 흔히 발생하는 오류이지만, 원문의 분량이 많을 경우 한명이 작업할때도 이런 일이 발생할 수 있다.[2] 만에 하나 원격 서버가 손상되는 경우도 있을 수 있지만, 이럴 경우 반대로 작업자의 컴퓨터에 저장되어 있는 작업 문서로부터 새 번역 메모리를 간단히 만들어낼 수 있으므로 OK.[3] 2019년 12월 4일 서비스 종료