조합형 완성형 논쟁
1. 개요
한글 인코딩 방식을 두고 한때 PC통신 시절 하이텔 등 여러 통신망에서 일어났던 분쟁.
2. 상세
2.1. 전산화 초기
한글 자판을 입력하는 방식 중 조합형과 완성형 중 어느쪽이 더 나은가를 두고 치고받고 싸웠던 사건. 조합형 찬성파에서는 이쪽이 더 한글창제 원리에 부합한다는 이유를 들었지만, 당시에만 해도 PC의 메모리가 그다지 넉넉한 편이 아니었기 때문에 완성형이 국가표준으로 되어 있었고, 조합형이 태생적으로 각 컴퓨터 제조사들의 자체 한글표기 포맷으로 발달해 왔기 때문에[1] 완전히 호환되지 않는 독자 규격들이 난립하다가 결국 세를 통합하지 못하고 비주류로 남게 되었다.
인터넷에서 단편적으로 언급되는 글들에서는 간단하게 '정부가 완성형을 선택한 것이 오판'으로 넘어간다. 그러나 당시에는 수많은 한글 코드들을 서로 변환하기 위한 변환 유틸리티 문제로 기업별로 매번 호환이 불가능해, 싱크를 맞추기위해 이것 하나에만 수많은 작업날짜와 인력을 낭비했으므로, '''어느 한 업체의 편을 들 수 없는''' 정부의 판단에도 나름 근거가 있음을 납득 가능할 것이다. 오히려 무리를 해서라도 하나의 완성된 표준으로 통합하여 가지고 있는것이 국가적으로는 더 큰 그림을 그릴수 있었던 건지도 모른다. 아니였다면 지금도 기업간에 소모적인 한글 호환때문에 골머리를 썩고 있었을지도 모른다.
2.2. CP949의 등장
이 논쟁은 마이크로소프트가 Windows 95에 CP949라는 코드를 도입해서 어느 정도 정리되었으나, 이에 대해서도 논란이 있었다. MS에서는 완성형의 문제를 이전부터 인식하고 있었고, 표준 완성형의 한계를 넘기 위해 글자를 새로 정리하려 했으나 역시나 기존 인코딩과의 호환을 넘을 수 없어 추가되는 문자를 기존 완성형 코드가 사용하지 않는 영역에 추가했다. CP949의 문제점이라면 종전 완성형이 가나다 정렬되어 있고, 새로 추가된 확장 영역은 그 뒤에 다시 정렬되어 있기 때문에 단순히 코드만을 가지고는 가나다 순서대로로는 찾거나 정렬할 수 없었다는 점이다.
2.3. 유니코드 이후
이 분쟁이 완전히 사라진 것은 유니코드 2.0이 등장한 이후다. 유니코드 1.x대 버전에도 조합형 한글은 들어가 있었으나, 완성형 한글은 모든 글자를 수록하지 않는 등 엉망이었다. 2.0으로 버전이 올라가면서 한글 영역이 대이동, 완성형 형태의 조합가능한 11172자의 모든 한글 음절이 모두 들어갔다. 즉 유니코드를 쓰면 완성형이든 조합형이든 모두 호환이 가능하다는 것. 이 때문에 조합형 완성형 논쟁은 더이상 무의미하게 되었다. 그리고 간단한 수식을 통해 초중종성 분리가 가능한 유니코드의 특성상, 유니코드는 조합형의 특성에 더욱 가깝다고 볼 수 있다. 그리고 실제로 미리 지정된 11172개 코드 말고도 초중종을 분리해 코드로 나열한 실제 과거 조합형과 매우 유사한 형태도 정식 유니코드 활용법으로 인정되기도 한다. Mac OS X의 HFS+ 파일 시스템은 이 방식을 표준으로 채택하는 바람에 맥에서 윈도로 파일을 옮기면 소위 "자모 풀리는 현상"이 벌어지기도 한다.
3. 여담
이 때 만들어진 유명한 문장이 ''''찦차를 타고 온 펲시맨과 쑛다리 똠방각하''''인데, 조합형 지지측에서는 "이 문장은 완성형에서 쓸 수 없다"라면서 조합형의 우월성을 강조했다. 완성형에는 찦, 펲, 쑛, 똠이 포함돼 있지 않아서 쓸 수 없다. 당시 방영했던 드라마인 똠방각하의 경우 TV 편성표상에서 ''''돔'''방각하'라고 표기하는 경우가 많았으며, 펩시콜라도 1992년 이전까지만 해도 한글 표기로 '''펲시콜라'''라고 하였으나 완성형으로 펲시라고 표기할 수 없어서 1992년에 디자인이 리뉴얼 될 무렵에 펩시로 바꾸었다고 한다. 사실 '찦차, 펲시맨, 쑛다리'는 외래어라서 각각 '지프차, 펩시맨, 숏다리'라고 써도 문제가 없지만, 똠방각하는 대체할 단어가 없다.
위 문장을 예외 처리 없이 유니코드로 변환하면 완성형에 없는 글자(찦, 펲, 쑛, 똠)가 이상하게 바뀌는데, 가장 흔히 발생하는 경우로 ''''뾼차를 타고 온 최시맨과 뉵다리 馱방각하''''가 있다. 그리고 완성형 체계에서 이 문장을 쓰려고 하면 "찌ㅍ차를 타고 온 페ㅍ시맨과 쑈ㅅ다리 또ㅁ방각하"라고밖에 안 써진다.
대표적인 조합형 기반 워드프로세서였던 한글과컴퓨터 아래아 한글은 1998년 당시 한글 815의 TV 광고에서 '''''비행기가 날아간다 쓩"'''이라는 문장으로 아래한글의 우수성을 강조하였다.[2] 영상(서혜정 성우의 나레이션)
당장 완성형으로는 모든 한국어 낱말조차도 입력할 수 없다. 그 일화 중 하나로 이영도가 하이텔에 퓨처 워커를 연재할 때에도 파의 외모에 대해 '도럄직한 몸매'라고 묘사하였는데 완성형에는 '럄'자가 없어서 다른 글자로 대체해 적었다는 후기가 있었다. 또한 한국 고유종인 물고기 '''됭'''경모치도 '됭'자가 완성형 코드에 없어서 표현할 수 없었는데, 이 때문에 과거에 작성된 생물학 정보 홈페이지에서는 '?경모치'나 '�경모치' 등으로 깨져서 나타난다. CP949나 조합형으로 작성한 글자를 웹 브라우저에서는 EUC-KR로 잘못 해석해서 발생하는 오류.
이름에 들어가는 글자가 EUC-KR에 없는 경우에는 일상 생활 등에 지장을 줄 수도 있는데, 이는 업무 등에서 사용되는 시스템이 아직도 EUC-KR을 고집하는 경우가 많기 때문. 대표적인 예로 '설믜'라는 순우리말 이름을 가진 사람이 있다. 이런 불편함 때문인지 청와대 국민청원에도 해당 청원이 올라왔을 정도. 또한 워낙 심각한 문제이다 보니 국립한글박물관 기획전에서 비슷한 사연을 가진 분의 졸업증명서가 전시될 정도였다.
게다가 세계화가 진전되고 정보통신 기술이 발전하면서 그에 따른 다양한 외래어나 외국어를 한글로 표기를 해야 할 일이 많아졌는데, 문제는 이런 글자 중에서 완성형에 없는 글자들이 많다는 것이다. 일본어의 예시[3] 만 봐도 러브레터 감독으로 유명한 이와이 슌지는 당시에 이와이 '슈운지'로 알려져 있었는데, '슌'이 완성형에 없는 글자였기 때문. 또한 스즈미야 하루히의 우울을 발간할 때 쿈이라는 글자 때문에 애로사항을 겪기도 했다.[4]
[1] 일명 '상용 조합형' 이라 불리는 준 표준적 조합형 역시 제조사들 몇의 컨소시엄 비슷한 형태였다. 이 상용 조합형도 나중에 복수 표준으로 지정되기는 했다.[2] 쓩이라는 글자는 완성형에 존재하지만, 쓩을 입력하는 과정에서 나오는 '''쓔'''가 완성형에 없어서 입력하지 못했다.[3] 특히 일본 대중문화 개방 이후로 이러한 문제점이 드러나기 시작했다.[4] 이는 출판 작업 등에서 흔히 사용되는 QuarkXPress가 EUC-KR 밖에 지원하지 않는 오래된 버전이라는 점도 한몫했다.