유령 문자

 


幽霊文字 (ゆうれいもじ)
1. 소개
2. 역사
3. 수와 종류
4. 최후의 유령 문자

[clearfix]

1. 소개


일본컴퓨터 환경에서 입력할 수 있는 한자 중에 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 한자들을 일컫는 단어. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다.

2. 역사


일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였다.
그런데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되고 만다. 이는 한자에 대한 지식이 부족한 작업자가 착각을 하였거나 미세한 획을 잘못 입력하는 등, 전산화 작업에서의 사소한 오류로 인해 발생하였다고 여겨진다.
이 문제가 부상하면서 일본 국립 국어 연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작하여, 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.
1997년의 JIS 한자 개정의 일환으로, 사사하라 히로유키를 비롯한 연구진이 유령 문자에 대한 조사를 벌였다. 그러나 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수가 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데, 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯이 착오로 만들어진 진짜 유령 문자는 총 8자로[2] 문자 집합을 함부로 건드릴 정도로 심각하진 않다.

3. 수와 종류


1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었다. 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예: 이세돌 李世'''乭''', 살미면 '''乷'''味面) 한자 문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[3] 최초연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.
이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고, 열두 자를 제외하고는 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 대표적으로 이 과정에서 밝혀진 글자들은 다음과 같다.
과거 혹은 현재에도 지명·인명으로 사용되는 한자로 밝혀진 경우

すくも(스쿠모)라고 읽는 지명용 국자임이 확인되었다. 여전히 히로시마현 아키타카타시에는 糘地(すくもぢ,스쿠모지)라는 지명이 있고, 오카야마현 츠야마(津山)시에는 糘山(すくもやま,스쿠모야마)라는 산이 있다.

ゆき(유키)라고 읽는 지명용 국자임이 확인되었다. 과거 쿠마모토현 미나마타시에 膤割(ゆきわり,유키와리)라는 지역이 있었다.

うるち(우루치)라고 읽는 지명용 국자임이 확인되었다. 과거 후쿠시마현 시라카와(白河)시에 粫田(うるちだ,우루치다)라는 지명이 있었다. 현재는 糯田(もちだ,모치다)로 변경되었다.

ほう(호)라고 읽는 지명용 국자임이 확인되었다. 아이치현 토요타시에 垉六(ほうろく,호로쿠)라는 지역이 있다.[4]

이 글자의 경우 일본에서 やま(야마)라고 읽는 지명용 한자임이 확인되었다. 쿄토부 쿄토시 사쿄구에 広岾(ひろやま/히로야마)라는 지명이 존재했었다. 현재는 広帖(こうちょう,코쵸)로 변경. 또한 이 글자는 한국에서도 비슷한 의미로 사용되는데, 옥편에는 '땅이름 점[5], 고개 재[6]' 2가지로 등록되어 있다.

だる(다루)라고 읽는 지명용 국자로 확인되었다. 시즈오카현 시즈오카시 아오이구에 石橸(いしだる/이시다루)라는 지역이 있는 것이 확인되었다.

ぬた(누타)라고 읽는 지명용 국자(한국에서도 국자로 취급된다)로 확인되었다. 야마나시현 가이(甲斐)시에 大垈(おおぬた,오누타), 후에후키시에 藤垈(ふじぬた,후지누타)라는 지명이 있다. 다만 특이하게도 한국에서는 이게 아주 많이 쓰이는 글자여서[7] 아예 상용한자로 취급하며 한자급수까지 부여되어 있다.

ぬた(누타)라는 지명에 쓰이던 메이지대 지명에 사용되었다. 고치현 시만토정에 汢の川(ぬたのかわ,누타노카와)라는 지명에 사용되었는데, 현대에는 삼수변이 이수변으로 바뀐 또 다른 국자를 사용중이다. 이 冫土는 반대로 JIS에 없다.[8] 한국 옥편에는 '물 이름 토' 자로 등록되어 있다.

せき(세키), ひろ(히로)라고 읽는 인명용 한자로 확인. 碩의 이체자로, 실제로 현대에도 이 한자를 쓰는 사람이 현존함이 확인되었다.[9][10]

ぬか(누카)라고 읽는 지명용 한자로 확인. 아키타현 아키타시에 粐蒔沢(ぬかまきざわ,누카마키자와)라는 지역이 존재한다.
어디서 나온 오자(誤字)인지 명백하게 밝혀진 경우.

오키나와현 오키나와시의 榕原(ようばる,요바루)의 榕이 잘못 전사된 것으로 확인. 두 글자의 변을 보면 벼 화(禾)와 나무 목(木)은 딱 한 획 차이라서 다른 한자의 구성요소로 쓰일 경우 혼동하기 쉽다. 원래 글자 榕의 한국식 훈독은 "벵골보리수 용".
그러나 조사 후에도 열두 자는 출처가 밝혀지지 않았었다. 이러한 글자들은 강희자전 등 주요 자전에 실려있지 않는 등 출처를 파악할 수 없으며, 어디에서 쓰이는지조차 알려져 있지 않고 어떻게 읽어야 하는지도 알 수가 없었다.
墸 壥 妛 '''彁''' 挧 暃 椢 槞 蟐 袮 閠 駲
추가 연구를 통해, 이 열두 자 중에서도 열한 자는 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데, 연구 결과는 다음과 같았다.

출전 불명. 堵의 오자(誤字)로 추정됨.

㕓의 부수를 쉽게 찾을 수 없자 土변을 넣은 글자.
그런데 몽구집주(蒙求集注)[11]라는 책에 밭을 세는 단위를 나타내는 글자로 쓰인 것이 확인되었다. 여기에서 Ctrl+F로 壥을 찾을수 있다.

𡚴(山+女)의 오자로 추정. 𡚴(山+女)는 あけび라고 읽는 일본 국자인데, 한 책에서 이를 妛로 잘못표기한 것이 유래로 확인되었다.[12]

국토지리협회 국토행정총람지에서 등장한 글자로, 栩의 오자.

국토지리협회 국토행정총람지에서 皐, 星, 早, 毘, 昆, 犀, 韮, 晃, 昌, 昇 등의 오자로 사용됨.[13]

토쿠시마현 나루토(鳴門)시에 椢原(くにはら,쿠니바라), 이바라키현 다이고정에도 해당글자를 쓰는 椢内(くぬぎうち,쿠누기우치)라는 지역이 있다. 따라서 지명용 국자.[14]

櫳의 약자로 확인.[15]

인명에 쓰였던 한자로 확인. 음독은 トウ(토), ドウ(도), ジョウ(조), 훈독은 かまきり(카마키리)[16], もみ(모미).

톳토리현 톳토리시의 祢宜(ねぎ,네기)라는 지명의 示변이 衣변으로 착각된 한자.[17]

일본에 전해진 광운 상에 통자관계로 설명되어 있다. 閏의 속자.[18]

인명용 한자. 음독은 シュウ(슈)로 확인됨.

4. 최후의 유령 문자



'''?'''
소위 '유령 한자'로 불렸던 글자들은 거의 다 어디서 유래가 됐는지 출처가 밝혀졌다. 대부분 일본에서 지명/인명용으로 사용하는 국자거나, 일본 밖에서 쓰이는 글자거나, 오자라고 해도 어디서 생긴 오자인지 출처가 확실해진 것이다. 그러나 유독 라는 글자는 그 단서조차도 발견되지가 않았다. 訶(꾸짖을 가) 혹은 謌(노래 가)[19] 등의 초서체를 옮기다가 획을 틀린 것이 아닌가 추정할 뿐이다. 일본어 워드프로세서 등에서는 일단 입력은 할 수 있도록 한자 제자 원리에 따라 임의로 음독을 배당해 놓았다.
아사히 신문의 1923년 2월 23일자 어느 한 기사에 나온 사이타마 자강회(埼玉自彊会)의 彊(굳셀 강) 자를 彁로 잘못 본 사례가 존재하기는 한다. # 기사 내용을 보면 彊 자가 뭉개진 게 彁처럼 보인 것으로 추정된다.

[1] 심지어 한국에서도 이미 유령 문자가 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다.[2] 穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁[3] 한자는 기본적으로 '''열린 집합'''이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오) 등의 새로이 만들어진 한자들이 있다.[4] 한국 옥편에는 '캘 포' 자로 등록되어 있다.[5] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다.[6] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯 하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다.[7] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어(지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다.[8] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(冫土)는 인터넷 상의 문자에 없다는 것이다.[9] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많다. 각 집안 족보에 들여다보면 제법 찾을 수 있을 정도. 하지만, 후대 연구등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만드는 경우가 된다.[10] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다. 이체자가 아닌 형성자 원리에 따라 石+貞으로 보아 "정"으로 임의로 붙인 듯 하다.[11] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책.[12] 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태이다. 하지만 山으로 나온 문헌도 있긴 하다. 링크 참조[13] 한국 옥편에는 '떠날 비' 자로 등록되어 있다.[14] 한국 옥편에는 '광주리 밑바닥 귀','광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.[15] 애초에 이 용 룡()의 약자다..[16] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다.[17] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 한편, 한국 옥편에는 '꿰맬 치' 자로 등록되어 있으며, 참고로 祢는 '아비 사당 녜/니' 자로 등록되어 있다. 히라가나 ね의 뿌리이기도 하다.[18] 한국 측에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤' 으로 등록되어 있다. 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다.[19] 歌의 이체자