유령 문자
幽霊文字 (ゆうれいもじ)
[clearfix]
1. 소개
일본의 컴퓨터 환경에서 입력할 수 있는 한자 중에 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 한자들을 일컫는 단어. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다.
2. 역사
일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였다.
그런데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되고 만다. 이는 한자에 대한 지식이 부족한 작업자가 착각을 하였거나 미세한 획을 잘못 입력하는 등, 전산화 작업에서의 사소한 오류로 인해 발생하였다고 여겨진다.
이 문제가 부상하면서 일본 국립 국어 연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작하여, 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.
1997년의 JIS 한자 개정의 일환으로, 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였다. 그러나 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수가 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데, 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯이 착오로 만들어진 진짜 유령 문자는 총 8자로[2] 문자 집합을 함부로 건드릴 정도로 심각하진 않다.
3. 수와 종류
1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었다. 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예: 이세돌 李世'''乭''', 살미면 '''乷'''味面) 한자 문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[3] 최초로 연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.
이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고, 열두 자를 제외하고는 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 대표적으로 이 과정에서 밝혀진 글자들은 다음과 같다.
그러나 조사 후에도 열두 자는 출처가 밝혀지지 않았었다. 이러한 글자들은 강희자전 등 주요 자전에 실려있지 않는 등 출처를 파악할 수 없으며, 어디에서 쓰이는지조차 알려져 있지 않고 어떻게 읽어야 하는지도 알 수가 없었다.
墸 壥 妛 '''彁''' 挧 暃 椢 槞 蟐 袮 閠 駲
추가 연구를 통해, 이 열두 자 중에서도 열한 자는 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데, 연구 결과는 다음과 같았다.
4. 최후의 유령 문자
소위 '유령 한자'로 불렸던 글자들은 거의 다 어디서 유래가 됐는지 출처가 밝혀졌다. 대부분 일본에서 지명/인명용으로 사용하는 국자거나, 일본 밖에서 쓰이는 글자거나, 오자라고 해도 어디서 생긴 오자인지 출처가 확실해진 것이다. 그러나 유독 彁라는 글자는 그 단서조차도 발견되지가 않았다. 訶(꾸짖을 가) 혹은 謌(노래 가)[19] 등의 초서체를 옮기다가 획을 틀린 것이 아닌가 추정할 뿐이다. 일본어 워드프로세서 등에서는 일단 입력은 할 수 있도록 한자 제자 원리에 따라 임의로 음독을 배당해 놓았다.
아사히 신문의 1923년 2월 23일자 어느 한 기사에 나온 사이타마 자강회(埼玉自彊会)의 彊(굳셀 강) 자를 彁로 잘못 본 사례가 존재하기는 한다. # 기사 내용을 보면 彊 자가 뭉개진 게 彁처럼 보인 것으로 추정된다.
[1] 심지어 한국에서도 이미 유령 문자가 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.[2] 穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁[3] 한자는 기본적으로 '''열린 집합'''이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오) 등의 새로이 만들어진 한자들이 있다.[4] 한국 옥편에는 '캘 포' 자로 등록되어 있다.[5] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.[6] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯 하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다.[7] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어(지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다.[8] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(冫土)는 인터넷 상의 문자에 없다는 것이다.[9] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많다. 각 집안 족보에 들여다보면 제법 찾을 수 있을 정도. 하지만, 후대 연구등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만드는 경우가 된다.[10] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 "정"으로 임의로 붙인 듯 하다.[11] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.[12] 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태이다. 하지만 山으로 나온 문헌도 있긴 하다. 링크 참조[13] 한국 옥편에는 '떠날 비' 자로 등록되어 있다.[14] 한국 옥편에는 '광주리 밑바닥 귀','광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.[15] 애초에 竜이 용 룡(龍)의 약자다..[16] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다.[17] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 한편, 한국 옥편에는 '꿰맬 치' 자로 등록되어 있으며, 참고로 祢는 '아비 사당 녜/니' 자로 등록되어 있다. 히라가나 ね의 뿌리이기도 하다.[18] 한국 측에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤' 으로 등록되어 있다. 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다.[19] 歌의 이체자