보이니치 문서

 


'''Voynich Manuscript'''[1]
[image]
'''보이니치 문서 전문.'''
1. 개요
2. 해독이 불가능하다?
3. 실제 사용되던 언어가 아니다?
4. 해독 시도
4.1. 아나그램일 가능성?
4.2. 스티븐 박스의 설
4.3. 러시아 수학자들의 설
4.4. 니콜러스 깁스의 설
4.5. 캐나다 AI 전문가 그레그 콘드랙의 설
5. 대중문화에서
6. 비슷한 문서
7. 바깥고리
8. 같이보기

[clearfix]

1. 개요


중세에 제작된 고서적. 책의 이름은 이 책의 소유자 중 한 사람이었던, 미국인 서적상인 윌프리드 M. 보이니치(Wilfrid M. Voynich)의 이름에서 유래했다. 재질은 양피지이며, 저자는 미상. 한 첩당 16쪽으로 총 17첩, 272쪽으로 구성되어 있었으나, 현재는 240여 쪽만이 남아 있다. 보이니치는 1912년 7월 12일 이탈리아 로마 근교 몬드라고네 수도원에서 이 책을 발견했다. 보이니치는 오랫동안 서가에 묻혀 있던 이 책을 발견해 재정 상태가 좋지 못했던 수도원 측으로부터 사들였다고 한다. 현재 보관중인 장소는 예일 대학교 바이네케 도서관.
발견되었을 당시부터 오랫동안 수많은 언어학자들과 암호학자들을 좌절시킨 문서로 로혼치 사본, 파에스토스 원반과 함께 성배로 평가되는 물건이다.

2. 해독이 불가능하다?


발견 직후부터 정체불명의 문자로 인식했고, 어느 언어를 적은 것인지도 알아채지 못했다. 삽화를 근거로 약학부터 식물학, 생물학, 천문학과 같은 광범위한 학문에 대해 쓰인 것으로 추정하는 것이 전부였다. 아무런 교차 검증이 불가능하기에 아래 문단의 '그냥 낙서 아니냐?'는 주장까지 있는 상황이지만, 막 쓴 낙서로 보기에는 일관된 언어 같은 특징을 많이 지니고 있다.
  • 표음문자 체계에서 반드시 등장해야 하는 일정한 몇몇 글자가 있다(모음처럼).
  • 어떤 글자는 다른 글자와 연속해서 쓰이지 않았으며(영어에서 qs나 dx같이 쓸 수 없는 것처럼) 어떤 글자는 중복해서 쓰였으나 다른 것은 그렇지 못했다('attack'과 같이 tt는 쓸 수 있지만 qq는 쓸 수 없는 것처럼).
  • 어떤 단어는 일부 섹션이나 몇 장에만 등장하는 데 비해 다른 단어는 지속적으로 등장한다.
  • 단어의 빈도가 일정하므로 모든 언어가 충족하는 법칙인 지프의 법칙을 충족한다.[2]
즉, 이것은 아무렇게나 무작위로 쓴 것이 아닌 '''일정한 규칙이나 문법을 갖고 있는 언어이자 문자 체계'''라는 것이다. 그러나 더 희한한 것은 이 '언어'가 인도유럽어족의 보편적인 특징에서 심히 벗어나 있다는 사실이다. 예를 들자면…
  • 10글자가 넘어가는 단어는 거의 없으니 조어력이 약한 것이고, 무엇보다 1~2글자의 단어의 수가 적다(인도유럽어라면 전치사 때문에라도 1~2글자 단어의 수가 어느 정도 있어야 한다. 독일어처럼 3글자 이상인 경우도 있긴 하다).
  • 어떤 글자는 단어 앞에만 나오고, 다른 글자는 끝에, 혹은 중간에만 나오는 경우가 있다. 라틴 문자그리스 문자에는 이런 현상이 없다시피 하다. 이러한 양태는 오히려 히브리어 문자 같은 아프리카아시아어족(함셈어족) 언어에만 적용되는 것이다. 그러나 셈족 문자로 보기도 힘든 것이, 셈어의 대부분은 좌서문자이고 보이니치 문서는 우서문자인 것으로 보인다.
  • 같은 단어가 한 문장에 여러번 나오는가 하면 한 글자만 다른 여러 단어가 비정상적으로 반복해서 나오기도 한다. 당장 위의 페이지 13번째 줄을 보면 4oHc89라는 조합이 4번 연속 등장하는데, 상식적으로 한 문장 안에서 같은 단어가 4연속 등장하는 자연어는 거의 없다.[3]
뒷면에 아주 약간의 라틴 문자가 나오기도 하는데 어떤 언어로도 의미가 존재하지 않는 말이다. 또 천문학을 다루는 항목에 3월부터 12월까지를 라틴 문자로 적어놓은 부분도 있는데 그 철자법은 중세의 프랑스나 북서부 이탈리아, 이베리아 반도의 철자법을 연상시킨다. 하지만 이것도 원래부터 적혀 있던 건지 후일에 적힌 것인지는 불분명.
이것은 외국의 복잡한 문자를 이해하지 못한 유럽인이 스스로 문자를 고안해내 그 언어를 표기한 문서라는 설도 있다. 예를 들면 위에서 말한 같은 단어가 2~3번 반복되는 현상은 중국어베트남어에서도 나타나는 것이다. 또 서양 제어에는 대부분 있는 관사나 계사가 부재한다는 점에서도 일치한다. 어떤 학자가 이 보이니치 문서를 만주어와 연관지어 해독해보려고 했지만 아직까지는 가설일 뿐이다.
또한 대부분의 내용은 추측으로 밖에 해석할 수 없지만 일부 삽화는 실존하는 것이 확인되었는데, 대표적인 것이 삼색제비꽃(Wild pansy)의 그림이다. 하필 기괴한 것이 가장 많아보이는 식물 챕터에서 이런 것이 확인되니, 다른 식물들도 분명 무언가의 표본을 관찰하고 그린 것이 아닌가 추정되고 있다.
그리고 몇 가지 미스터리도 남아있다. 바로 천문 분야의 '''은하'''.
[image]
1438년대에 만들어졌다면 은하는 물론이고 태양계의 모습조차 밝혀지지 않은 시점인데, 저 그림은 틀림없이 은하와 은하수를 그려놓은 그림이다. 저건 아무리 생각해도 변명조차 불가능한 부분이라서[4] 여전히 논란 대상이다. 물론, 이에 대해 꽤 설득력있는 설은 있는데, 일단 이 그림은 은하가 별들의 집합이라는 사실은 모른 채로 소용돌이 모양을 한 천체를 관측하고 그린 것이라는 설이 그것이다. 20세기 초엽까지만해도 우리 은하 이외에 다른 은하가 있음은 알려지지 않았고,[5] 그래서 당대에 발견된 은하들도 죄다 '소용돌이 모양의 성운'으로 알려져있던 까닭에 그 실체는 모른 채로 천체의 모양만 파악하고 기록으로 남겼을 가능성은 있다. 즉, 저게 실제 천체관측을 한 결과를 기록으로 남긴 그림이라면, 이 그림을 남긴 사람은 이 천체의 정체가 은하인 줄을 몰랐을 것이라는 얘기다.
그리고 여담이지만, 처음 발견되었을 당시 '''맨 뒤의 세 페이지가 찢어져나가 있었다고 한다.''' 일부 음모론자들은 그 세 장이 해독을 위한 설명서 혹은 색인이었다고 추정하는 중이다.

3. 실제 사용되던 언어가 아니다?


워낙 미스터리하다보니 현대인이 위조했다거나 우리가 모르는 사라진 문명의 언어라거나 하는 설까지 나왔지만 방사성 탄소 연대측정법으로 밝혀진 이 사본의 제작시기는 1404~1438년이다. 그러므로 고대 미지의 문자나 현대인이 위조한 것일 확률은 적다.[6]
어쩌면 중세시대에 발견한 고대 문서를 그 시대에 필사한 것일 수도 있다.
아무도 이 문서를 해독하지 못하고, 역사적인 외부 기록도 없고, 기묘한 식물의 삽화 등 수상한 곳이 많다 보니 아예 무의미한 낚시 문서라는 설도 옛날부터 존재했다.
모종의 목적으로 암호화된 문서일 가능성도 배제할 수는 없다. 그러나 그렇다면, 「'''이 책의 저자는 어떻게 600년 전에 현대에 와서야 정교한 분석을 통해 연구될만한 이런 세심한 알고리즘을 사용해 한 문자를 암호화했는가?'''」라는 문제 또한 제기된다.
저자가 만들어낸 '''인공 언어'''라는 가설도 있다. 이 경우는 톨킨이 그랬던 것처럼 가상의 언어를 만들고 세계를 창작하는 취향이었던 작가가 만들었던 설정집이라거나 하는 가능성으로 생각해볼 수도 있다. 이 가설이 맞다면 저자 말고는 영원히 해석이 사실상 불가능한 물건이 되어버리며,[7] '''그 전에 해석 시도마저도 무의미해진다.'''

4. 해독 시도


보이니치 문서는 거의 매년에 한번 꼴로 누군가가 해독에 성공했다는 소식이 들려온다. 물론 이제까지 진정한 해독에 성공한 학자는 한 명도 없다.

4.1. 아나그램일 가능성?


2009년 이디스 셔우드(Edith Sherwood)가 보이니치 문서에 사용된 단어들이 아나그램 형태로 기술되었을 수 있다는 가능성이 제기해 연구자들의 관심을 끌고 있다(관련 페이지 1/관련 페이지 2).
내용에 따르면 보이니치 문서의 약초학 부분에서 사용된 단어들은 이탈리아어로 된 아나그램이며, 이를 풀이했을 경우 해당 식물의 이름과 같다는 것이 요지이다. 아나그램은 르네상스 시대에 많이 쓰였던 암호화 방법 가운데 하나인 것으로 보아 그 주장이 사실일 가능성이 있으나, 특성상 해독이 쉽지 않기 때문에[8] 검증하기 위해서는 많은 시간이 필요할 수 있다.
이와 관련해서 내셔널 지오그래픽의 다큐멘터리에 따르면 보이니치 문서에서 쓰인 아나그램 방식이 밀라노의 통치자였던 스포르차 가문에서 쓰던 방식의 아나그램 암호 방식과 흡사한 것 같다는 지적이 나왔다. 또한 수수께끼 같다는 보이니치 문서의 삽화들을 자세히 살펴보면 은하계를 묘사한 걸로 여겨진다는 그림이 실은 베네치아와 밀라노의 건물들을 의미한다는 주장도 제기되었으며 삽화 중에는 베네치아의 주력 상품인 유리 세공품과 흡사한 삽화도 있다고 한다. 그래서 이런 점들을 종합해보면 보이니치 문서는 밀라노의 베네치아 비밀 첩보 보고서일 수 있다는 것. 상당히 근거를 갖춘 주장이지만 아직까지 보이니치 문서를 해독하지 못한 이상 이 주장도 가설의 영역에 머무른다.
이곳에서 보이니치 문서를 열람해 볼 수 있다. 사이트의 왼쪽 탭에서 PDF, 온라인으로 다운받을 수 있다.
접근방법에 대한 영감을 받고 싶다면 여길 참조. 12분 정도부터 핵심적 키워드에 대한 철자 접근법에 대해 설명이 나온다.

4.2. 스티븐 박스의 설


2014년 8월에 보이니치 문서의 단어 일부를 해독했다는 주장이 제기되었다(영어 기사 참고). 영국의 한 대학교수가 문서의 식물 삽화를 토대로 추론한 것이라고 한다. 물론 아직 검증된 것이 아니며 본인이 해석했다고 주장하는 것도 총 9단어에 불과하다.[9] 스티븐 벅스는 이 문서가 중동 지역, 또는 아시아 지역의 언어로 작성된 자연과 관련된 논문이라고 주장했다.

4.3. 러시아 수학자들의 설


2017년 4월 유리 올로프 등의 러시아 수학자들이 60% 정도는 영어와 독일어, 나머지는 로망스어군으로 쓰인 것을 밝혀냈다. 다만 완벽한 해독은 불가능하다고 한다.

4.4. 니콜러스 깁스의 설


[image]
f31r을 해석해보니 kooton(cotton)이라는 영단어가 나왔다.
니콜러스 깁스(Nicholas Gibbs)라는 영국인(#1, #2)에 따르면 중세의 여성 건강의학 서적이라고 한다. 여성에게 좋은 여러 건강 웰빙 목욕법이나 향기 치료 식물들을 기술하고 있다. 당대의 여러 의학 서적, 특히 온천이나 목욕 요법에 관련된 서적 등의 내용이나 그림을 베껴서 만든 책이라는 것. 암호처럼 보이는 이유는 단어를 주로 의학 용어의 약자 위주로 적었기 때문이라고 한다. aromatics를 그냥 AR라고만 적고, aqua를 그냥 AQ라고만 적는 식이다.
##
그리고 깁스는 마침내 '''보이니치 문서에 대한 해독이 완료'''되었다고 주장했다(The mysterious Voynich manuscript has finally been decoded). 위 주장처럼 aq = aqua(water), dq = decoque / decoctio(decoction), con = confundo(mix), ris = radacis / radix(root), s aiij = seminis ana iij(3 grains each) 이런 식으로 마치 의학 용어를 줄여 쓰듯이 줄여쓴 것이 암호 해독의 가장 큰 걸림돌이 되었다.
주 내용은 '''여성을 위한 온천 가이드 및 몸에 좋은 약초를 기록한 것'''으로 식물과 탕, 여성이 자주 그려진 이유 또한 설명이 가능하다. 이 주장대로 맨 위에 올려진 보이니치 문서 스캔본을 보면 온천욕을 즐기는 여성들로 보인다.
하지만 깁스의 주장에 대해 전문가들은 이 해석에 부정적인 반응을 내놓고 있다.

(전략)
René Zandbergen은 (우리에게) 이메일로 다음과 같이 보냈다. "TLS의 요약문은 진지한 분석을 제공하기에는 너무 짧습니다." Zandbergen은 문서를 오랫동안 연구했으며 인기있는 웹 사이트 Voynich.nu를 운영하고 있다. 그의 TLS 기사에 대한 비판은 다음과 같이 요약될 수 있다: 놀라운 소식이긴 하지만 잘못된 것 같다.

"사실 TLS가 출판한 것이 놀랍습니다." 아메리카 중세 아카데미의 이사인 Lisa Fagin Davis가 말했다. Lisa는 예일 대학의 박사과정 학생이었을 때 바이네키 고문서 도서관에 보이니치 문서가 보관되어 있는 동안 문서에 관한 수십가지 이론을 읽었다. "그들이 베레니케 도서관에 (해독되었다고 주장하는 것을) 간단히 보내주었다면, 그들은 즉각 반박당했을 겁니다."라고 말했다. 그리고 우연히 베레니케 도서관의 큐레이터와 최근에 저녁식사를 했는데 TLS로부터 기사에 대해 듣지 못했다고 밝혔다.

깁스의 기사는 크게 두 부분으로 구성된다. 첫번째 부문은 보이니치 문서가 파생된 것처럼 보이는 여러가지 오래된 삽화와 저술을 자세히 설명한다.

(중략) 이 첫 번째 섹션의 문제점은 새로운 것이 아니라는 점이다. 리사의 주장에 따르면, 다른 연구자들, 암호학자들, 그리고 호사가들 중에서도 식물, 점성술 도표 및 입욕의 삽화를 보고 문서가 건강과 관련있다고 주장한 이들이 있었다고 한다. 예를 들어, 깁스가 중 하나는 보이니치 문서와 일치한 그림을 발견한 텍스트 중 하나는 De Balneis Puteolanis(입욕 가이드)인데, 이것은 이미 보이니치 문서에 관한 인기있는 웹사이트인 Voynich.nu에서 두 사료에 대한 유사점을 다룬 바 있다. 두번째 부분에서, 깁스는 그만의 해결책을 제시한다. 문서의 각 문자는 문자가 아니라 축약된 단어라는 것이다.

이는 획기적인 돌파구일 수 있지만, TLS는 단지 깁스의 방식을 사용하여 '해독되었다'는 두 문장만 기재했다. 리사는 이 두문장도 완전하게 해독된 게 아니라고 주장한다. "그 문장들은 문법적으로 올바르지 않습니다. 라틴어로는 의미가 없습니다." 문장들은 일반적인 의학적 처방전("3개의 잎과 5개의 줄기를 가져가라"와 같은)을 의미하고 있다. 깁스는 보이니치 문서에 실제로 병이나 식물 이름에 대한 단어가 포함되어 있지 않다는 점에 주목한다. 그는 이에 대해 어떤 질병의 명단과 처방법이 망실되었다고 설명했다. 그러나 리사에게는 이러한 설명은 일종의 허황된 사고로 여겨진다. 리사는 "그 부분이 바로 말도 안된다고 생각한 부분입니다."라고 말한다. 보이니치 문서에 누락된 페이지가 있고 재편된 흔적이 존재하는 건 사실이다. 하지만 색인을 했다는 증거는 없다. 리사는 깁스가 나중에 자신의 주장을 책 출판을 통해 알린다면 자신은 그것을 읽어볼 의향이 있다고 밝혔다.

깁스의 이론에 대한 일부 회의론은 그가 외부인이라는 것과 관련이 있다. 그는 전문학자 또는 보이니치 커뮤니티의 아마추어에 속하지 않은 것으로 보인다. TLS 포드 캐스트와의 인터뷰에서, 깁스는 영국 박물관 큐레이터인 어빙 핑클과 함께 일하면서 중세 사본이 아닌 설형 문자에 대한 전문지식을 가지고 있다고 밝혔다. 물론 외부인은 초보자의 실수를 범할 수 있지만 보이니치 문서 해석에 대한 새로운 관점을 제시할 수도 있다.

암호문이 축약어라 하더라도 문법적으로 전혀 말이 되지 않는 끼워맞추기라고 한다. 또한 니콜라스 깁스라는 인물부터가 전문학자 혹은 보이니치 커뮤니티의 아마추어에도 속하지 않는 외부인이라 그에 관련해 신뢰도가 하락할 뿐더러 함께 일하던 큐레이터에 따르면 깁스가 중세 사본에 대해서가 아니라 설형 문자에 대한 전문 지식을 갖고 있었다고 한다. 만약 그의 주장이 더 뒷받침되지 않는다면 그냥 해프닝으로 끝날 듯하다.

4.5. 캐나다 AI 전문가 그레그 콘드랙의 설


캐나다의 AI 전문가 그레그 콘드랙 박사는 '포커계의 알파고'인 AI ‘딥스택’(DeepStack)을 개발한 캐나다 앨버타대학의 컴퓨터공학과 AI연구소 소속이다. 그는 세계인권선언을 380개의 언어로 번역했을 때, 국가의 실제 원문과 97% 일치한 통계학적인 알고리즘을 이용하여 보이니치 문서를 해석하는 시도를 했었는데, 그 결과 이 문서에 사용된 언어는 히브리어와 가장 유사성을 보였다고 밝혔다. 그리고 모음은 삭제돼 있고, 농부, 빛, 공기, 불 과 같은 단어들이 포함돼 있는 것으로 보인다고도 하였다. 이 방법으로 해당 문서가 여성의 건강과 관련된 내용을 담은 책으로 해석했으나, 역시 인간의 번역이 뒷받침되어야 할 것 같다고 밝혔고, 히브리어학자이면서 역사가인 사람이 완전히 해독할만한 단서를 찾아낼 수 있으리라고 생각했다.(출처: 서울신문 기사)

5. 대중문화에서


이 문서의 미스터리가 많은 사람들의 상상력을 자극해 이런저런 뒷설정에 제법 사용되었다.
  • 2009년 7월 12일, 신비한 TV 서프라이즈에서 다루어진 바 있다. 신성 로마 제국황제가 기묘한 것들을 수집하는 취미가 있는 것을 이용해서, 아무 내용이나 신기한 그림이나 글자를 써서 상금을 타먹은 사기꾼의 작품이 아니었을까 하는 가설을 소개하였다.[10]
  • 이 책을 소재로 한 소설도 존재한다. 엔리케 호벤의 '보이니치 코드'.
  • 네크로노미콘 등과 함께 환상문학 등에서 소재로 나오기도 한다. 종종 마도서로 등장하기도 하며, 아예 암호화된 네크로노미콘이라는 설정도 있다는 모양. 단, 네크로노미콘 등과는 달리, 이건 현실에 존재하는 문서이다.
  • 이 문서를 패러디해서 어느 전위 예술가가 세라피니의 서라는 해독 불가의 문자와 그림으로 가득한 작품을 만들기도 했다. 물론 이쪽은 진짜 예술적인 요소 이외에는 아무 의미도 없는 문자와 그림들이다.
  • 사운드 볼텍스의 수록곡 Voynich:Manuscript의 모티브가 되었다. 자켓 이미지도 보이니치 문서의 사본과 비슷한 그림체로 되어 있다.
  • 보이니치 문서에 사용된 문자들을 입력해 볼 수 있는 폰트가 있다. 자판 대응은 임의로 설정한 것이다.
  • xkcd에는 '이건 사실 중세에서 전해져 내려오는 TRPG 매뉴얼'이라는 설정의 만화가 올라왔었다.(#)
  • 캉타우에서도 이 문서가 언급되었는데 세간에 공개된 내용은 가짜고 진짜 내용은 외계인 아이를 만나는 내용이라는 설정이다.

6. 비슷한 문서


이와 같이 현재 번역할 수 없는 사료로는 파에스토스 원반, 로혼치 사본, 롱고롱고 문자 등이 있다.

7. 바깥고리



8. 같이보기


[1] 보이니치 사본이라 부르기도 한다.[2] 다소 벗어나는 면이 없지 않지만, 설명문이라면 특정 주제를 중심으로 쓰여지기 때문에 일반적으로 일상에서 쓰이는 언어보다 특정 단어가 더 많이 나오는 것은 당연하다.[3] 물론 다대다 대응으로 만들어진 것이라면 얼마든지 가능한 일이다. 다대다 대응으로 만들어진 암호는 차분기관이나 튜링기계로도 풀 수 없다.[4] 저 그림에서 보이는 깨알같은 점들이 자세히 보면 전부 별이다.[5] 정확히 말하면, 옛날에는 은하라는 개념이 아예 없었다. 우리 은하 이외에 다른 은하가 있음을 알아내고 그 존재를 입증한 최초의 과학자는 미국의 천문학자인 에드윈 허블이었다. 그리고 이런 외부 은하들 중에서 처음 그 존재가 입증된 것이 바로 안드로메다 은하다.[6] 다만 사라진 고대 문명의 언어가 아닌 그냥 몇백년 사이에 사라진 언어일 가능성은 높다. 실제로 시대가 지나면서 수많은 언어와 문자가 사라지곤 한다.[7] 완전 불가능하지는 않다. 결국은 외국어와 다를 바 없을 테니.[8] 아나그램에 해당하는 문자들을 일일이 대입해 보아야 한다. 물론 아나그램 사전을 이용하는 방법도 있다.[9] 같은 기사에서는 다른 학자가 아즈텍어로 쓰인 문서일 것이라는 주장을 하고 있다.[10] 이와 비슷한 사례로 19세기 유럽실크로드 탐사가 한창 일어나자 현지인들이 고대 실크로드 문명의 사료라며 자신들이 만든 가짜 문서를 파는 일이 비일비재했다. 이 중에서도 가장 유명한 사기꾼이 이슬람 아훈.