합자

 


合字 / Ligature
1. 개요
2. 종류
2.1. 획이 겹쳐짐
2.2. 활자상 합자
2.3. 특수한 속성
2.3.2. 사전 배열이나 정서법상의 취급
2.3.3. 표기
2.3.4. 배열 방식
2.3.5. 별개의 음소를 표기: 다중문자
2.4. 한글: 초성, 중성, 종성으로의 합자 (합용)
2.5. 한글: 모아쓰기
3. 비교
3.1. 한자에서
3.2. 전산 입력
3.2.1. 입력상 합자(키보드)
3.2.2. 코드상 합자
3.2.3. 출력상 합자(결합 문자)
4. 글자 구성요소가 합쳐지는 경우


1. 개요


말 그대로 합쳐진 글자.
'합쳐짐'의 기준에 따라 합자 역시 여러 종류가 있을 수 있다. 일각에서는 다중문자와 같이 글자가 원래 나타내는 음소의 합과 다른 음을 낸다는 특징을 가진, '독특한 성질을 가진 글자 모임'을 합자로 생각할 수도 있다. 이에 따라 이중문자(digraph)를 이중합자라고 번역하는 경우도 있다. 한편, 물리적으로 활자가 합쳐져야지만 합자라고 볼 수도 있다.
일반적으로 ligature라는 단어는 typographic ligature, 즉 활자상 합자를 뜻한다.[1]
한글의 경우 낱자모도 자질에 의해서 가획되며, 모음은 이에 더 나아가 모든 모음이 ㅡ, ㆍ, ㅣ로 구성된다. 여기에 함께 쓰는 병서가 있고, 최종적으로 자모를 합쳐 쓰는 모아쓰기가 있어서 다양한 단계에서 합자를 정의할 수 있다.

2. 종류



2.1. 획이 겹쳐짐


우연히 획이 겹쳐지는 경우로, 엄밀히 말하면 합자라고 할 수 없다. 그러나 활자상의 합자에 영향을 준다. ci와 같은 배열은 활자상으로 합자되지 않는 데에 비해 fi는 활자상으로 합자가 되는 것은 f의 모양이 i의 점과 획이 겹쳐지는 일이 많기 때문이다.[2]
라틴 문자의 경우 rn이 m처럼 보이는 경우가 간혹 있다. 그러나 이 경우 합쳐진 모양이 m이라는 다른 글자이므로 rn을 m과 다르게 디자인하지, rn의 합자를 만들기는 어려울 것이다.
본의 아니게 획이 겹쳐지면 가독성이 떨어지기 때문에 커닝을 조절하는 것이 중요하다.
활자상으로는 글자 위로 다른 글자의 획이 겹치게 구현하는 것이 번거롭기 때문에 손으로는 획이 겹치게 쓰더라도 활자 입력시에는 떨어지게 구현하는 경우가 많다. 이는 전산 시대에도 동일하다. 문헌정보학에서 이러한 특성으로 목판본과 활자본을 구별하기도 한다.

2.2. 활자상 합자


하나의 활자로 합친 경우. 인쇄의 편의를 위해서 자주 쓰이는 글자 배열이 합쳐지는 경우가 많다. 다중문자는 하나의 음소를 나타내는 만큼 함께 배열될 가능성이 높으므로 활자상 합자(ligature)될 가능성이 많다. 'ss(ſs)'가 'ß'로 된 것이나 uu(혹은 vv)가 w가 된 것이 대표적인 사례이다.
획이 자주 겹치는 경우 활자상 합자가 되기 쉽지만 꼭 획이 겹치는 경우에만 하나의 활자로 만드는 것은 아니다. 한글의 ㅐ는 획이 붙어있는 반면 ㅔ는 떨어져있지만 대개의 경우 활자는 둘 다 하나로 되어있다.
한글은 한 음절을 이루는 모아쓰기된 글자들이 모두 활자상의 합자이다. ㄱ, ㅏ, ㄴ 등의 낱활자로 모아서 '간'이라는 글자를 인쇄할 수는 없고 '간'이라는 활자를 따로 만들어야 했다. 타자기는 이 문제를 해결했으나 다소 이질적인 타자기만의 글꼴을 형성하게 되었다.
활자상 합자의 경우 활자가 연결되어있다는 의미에서 연자(連字)라고도 한다. 그러나 이 경우 연결된 결과 '하나의 글자가 된다'라는 함의가 약해서 표준국어대사전에서는 아래의 로고그래프를 연자로 번역하고 있다.
두 글자 정도를 넘어서 단어 하나를 하나의 활자로 만든 경우 '로고타이프(logotype)'라고 한다. 'and'같이 자주 쓰는 단어는 아예 하나의 활자로 만든 것. 이 경우에 하나의 글자가 된 것은 아니므로 합자에 속하지는 않는다. 이 로고타이프라는 말이 줄어서 로고가 되었다. 회사 상징과 같은 것들은 독특한 폰트로 제작해 하나의 활자로 만드는 일이 많았기 때문이다.

2.3. 특수한 속성



2.3.1. 대문자


정서법상으로 하나의 철자로 취급하는지 여부를 기준으로 삼을 수도 있다. 중요한 것은 자주 같이 등장하는 빈도와 인식상의 차별화인데, 전자만을 생각하면 영어의 tion과 같은 배열도 합자로 취급해야 하므로 무리가 있다. 인식상으로 다른 글자임을 나타내는 증거를 더 확보할 필요가 있다.
라틴 문자에서는 어두(혹은 문두)의 글자 하나만 대문자로 쓰는 관습이 있으므로 이를 기준으로 삼을 수도 있다. 네덜란드어의 ij가 그 사례 중 하나로 I와 J가 합쳐진 이중문자이지만 독립적인 철자로 취급되어 이 단어가 첫 글자로 오면서 첫 글자를 대문자로 써야 한다면 Ij로 쓰는 게 아니라 IJ로 써야 한다.

2.3.2. 사전 배열이나 정서법상의 취급


아니면 교육상으로나 사전적으로 다른 철자로 취급하는 것도 기준으로 들 수 있다. 과거 스페인어에서는 ch, ll, rr을 둘 다 대문자로 쓰진 않았지만 별도의 철자로 취급하였다.
사전상의 배열은 정서법상으로 별개의 글자로 여겨지는지 그렇지 않은지 보여주는 강력한 증거이다. 사전상으로 본래 글자와 전혀 연관이 없는 위치에 놓인다면 분명히 다른 글자로 여겨진다고 볼 수 있다. 하지만 역은 성립하지 않는데, w는 대부분의 라틴 문자 문화권에서 v와 다른 글자로 여겨지지만 사전상으로는 v 바로 뒤에 위치한다.
근세 일본어에서는 申す와 같은 것을 이어서 쓰기도 했는데, 조선에서 일본어를 배우기 위해 이용한 첩해신어에서는 오십음도 글자 풀이와 함께 申す와 같은 것도 풀이해놓기도 했다. 워낙 자주 쓰이다 보니 합자로서 다루는 것이 더 학습에 용이할 것으로 본 것이다.

2.3.3. 표기


IPA에서는 이음선(tie bar)이 그어진 것을 합자로 취급한다. 주로 마찰음 문자 + 파열음 문자의 조합으로 표현되는 파찰음에 대해 그러한 방법을 쓴다.
위첨자, 아래첨자의 경우도 비슷하게 볼 수 있다. 유기음의 표기로 'th'를 사용한다면 [t]+[h](한글로는 '트흐' 정도)로 읽을 수도 있고 [t^^h^^]로도 읽을 수 있으니 다중문자이지만, 'th'로 적을 경우 애시당초 'th'를 [t]+[h]로 읽는 것은 불가능하다. 그러나 이 경우 좌에서 우로 쓴다는 선형적인 서기 방법의 연장선상에 있기 때문에 완전히 합자라고 보기는 어려울 수 있다. 이음선으로 적는 파찰음을 간혹 ts와 같이 위첨자로 적기도 한다.

2.3.4. 배열 방식


또한 '본래는 여러 음소로 소리나야 하는 배열인데도 하나의 음소로 소리나는 것'을 다중문자의 정의라고 한다면, 애당초 여러 음소로 소리날 수 없는 특수한 배열을 사용할 경우에는 다중문자라기보다는 합자라고 보는 게 더 타당할 수 있다. 예컨대 라틴 문자에서는 글자를 좌에서 우로 쓰면 기본적으로 각각 읽는 게 원칙이기 때문에 좌우가 아닌 상하의 방향으로 글자를 쓰는 경우 각각 읽기보다는 첨자와 비슷하게 해석될 것이다. 독일어 문헌 중에서는 움라우트된 모음의 표기로 e를 a 위에 올려서 'Gebaͤude'[3] 식으로 표기한 것이 나타난다.#
한글에서도 ㅸ에서처럼 ㅇ을 아래에 쓴 ㅇ연서(連書) 표기가 나타는데, 글자를 초성, 중성, 종성으로 합쳐서 쓰는(합용) 원리가 있는 한글에서도 자음군을 표기하는(했던 것으로 여겨지는) 것에 대해서 좌우로 쓰는 병서(並書)만을 언급했지 상하로 쓰는 연서에 대해서는 훈민정음에서 이미 순경음이라는 개별 음소를 표기하기 위함이라고 못박아두었으므로 합자에 더 가깝다고 볼 수 있다.
이러한 첨자들은 넓은 의미로 보자면 부호(diacritic)에 더 가깝다고 볼 수 있다. 부호들은 비록 부호가 없는 글자와 동일시되는 경우가 있기는 하지만 차별화되는 경우에도 부호 자체를 하나의 문자로 보기보다는 부호와 원 문자를 하나의 개별 문자로 구별한다는 점에서 합자와 비슷한 면이 있다.

2.3.5. 별개의 음소를 표기: 다중문자


어떤 문자 배열이 음소의 연쇄로서 발음되지 않고 다른 개별 음을 나타낸다면 언중들의 인식 속에서 하나의 개념으로 묶이게 된다. 이러한 것들은 다중문자에 속한다.

2.4. 한글: 초성, 중성, 종성으로의 합자 (합용)


한글의 경우 초성, 중성, 종성으로 묶이는 것을 합자로 볼 여지도 있다. 훈민정음에서는 이 단계의 합자를 '합용(合用)'이라고 한다. 풀어쓰기를 하는 다른 문자들과는 달리 초성, 중성, 종성으로 모아서 쓸 수 있는 글자들에는 언어적으로[4], 자형상으로[5], 기술적으로[6] 한계가 있으므로 기준으로서 쓰일 수 있다. 이 관점에서는 ㄲ, ㅐ, ㅘ, ㄼ 등이 모두 합자가 되며 사전 배열상으로도 별개의 순서를 가지게 될 수도 있었다. 그러나 잘 알려져있다시피 한국에서 사용되는 한글로 된 사전은 적어도 사전 배열상으로는 ㄱ과 ㄴ 사이에 ㄲ이 오는 식으로 처리하고 있다. ㄱ이 2개 연달아 나온 다중문자로 보고 있는 것이다.
분석이 불가능한 단위를 기준으로 하기에는 ㅏ 역시 제자 원리상으로는 ㅣ와 ㆍ로 분리할 수 있기 때문에 문제가 된다. 다행히(?) 오늘날에는 ㆍ가 글자 배열로서(제자 원리상이 아닌) 참여하는 가 쓰이지 않기 때문에 이 점은 문제가 되지 않는다. 천지인 자판이 쓰일 수 있는 것도 이 덕분이다.

2.5. 한글: 모아쓰기


한글의 초중성을 모두 합친 것도 합자라고 볼 수 있다. 훈민정음의 합자는 이 단계를 의미하며 합자해(合字解)는 위의 합용과 모아쓰기를 다루고 있다.

3. 비교



3.1. 한자에서


육서 문서 참조.
기존 글자를 합치는 조자법(組字法)에서 모두 합자가 나타난다. 한편 회의나 형성 등은 기존의 글자를 합친 것이다.
한글로 비유하면 ㅣ, ㆍ, ㅡ를 합쳐 모음을 만드는 것은 아래 다룰 조자법(造字法)상의 합침, ㅘ와 같이 글자 둘을 합치는 것은 여기서의 합자에 속한다고 볼 수 있다. 훈민정음에서 '전서(篆書)를 본땄다(字倣古篆)'라는 표현은 이러한 합자 개념을 본땄다고 보는 의견이 있다.

3.2. 전산 입력



3.2.1. 입력상 합자(키보드)


언어학적인 것은 아니나 컴퓨터 입력 방식도 언중들의 인식 속에서 합자인지 문자 배열인지를 결정하는 요인이 될 수 있다. 한글의 경우 2벌식 기준으로 로마자에 비하여 2글자 적다는 이점으로 원래는 ㅏㅣ, ㅓㅣ 배열로 입력해야 했을 ㅐ와 ㅔ를 하나의 키로 입력할 수 있도록 설정되었다. 마침 두 글자는 단모음화된 문자 배열의 예인데, 비슷하게 단모음화된 ㅚ와 ㅟ가 (근래엔 다시 이중모음이 되긴 했지만) 하나의 키로 배정받지는 않았다는 점에서 비교가 된다. 만약 미래에 언중들의 인식 속에서 ㅐ와 ㅔ가 ㅘ, ㅝ, ㅚ, ㅟ 등과는 다르게 합자로 여겨지게 된다면 단모음이 됐다는 사실과 더불어 컴퓨터 자판에서의 배열도 어느 정도는 영향을 끼쳤으리라고 추측해볼 수도 있겠다.
타자기 시대에는 공간 절약을 위해서 개별 문자인데도 전혀 상관 없는 두 문자를 조합해서 입력하는 경우도 있었다. !을 입력하기 위해서 l.을 합치는 등. 이런 경우 백스페이스로 뒤로 돌아가서 겹치기도 하지만 데드 키와 같이 아예 안 움직이게 하는 키를 쓰기도 했던 모양이다.
합자를 자주 쓰는 구미권에서는 æ 같은 합자를 입력하기 위한 compose 키가 따로 있기도 하다.
입력이 번거롭다는 점은 이미 합자로 굳어진 것을 뜯어내기도 한다. ſs가 합자된 ß는 오늘날 독일어 IME를 설치해야지만 입력이 가능하다는 불편함 때문에 ss로 분리시켜 쓰는 방향으로 변하고 있다. 그러면 합자가 아닌 다중문자가 되는 셈이다.

3.2.2. 코드상 합자


전산코드상으로 본다면 완성형 한글은 11,172자가 모두 분리 불가능한 개별 코드로 배당되었으므로 합자된 상태라고 할 수 있다.
앞서 합자라고도 볼 수 있다고 언급한 ij는 전산 코드로도 합쳐진 ij(U+0133)가 존재한다.

3.2.3. 출력상 합자(결합 문자)


반대로 서로 다른 두 글자를 하나의 공간에 표시하는 것도 기술적으로 가능하다. 그런 것들을 결합 문자(combining character)라고 하는데, 어떤 문자를 쓴 후 결합 문자를 잇따라 쓰면 그 문자 위에 결합 문자가 올라간다.# 코드상으로는 합쳐지지 않았지만 문자상으로는 합쳐지는 것을 구현할 수 있는 것.

4. 글자 구성요소가 합쳐지는 경우


합자는 글자가 합쳐지는 것이므로 글자가 아닌 것이 합쳐지는 것은 합자라고 할 수 없다. 여기서는 '합침'이라고 하겠다. 대개 낱글자로 기능하지 못하는 작은 선이나 부호 등의 글자 구성 요소가 결합된다. 이 중에 특히 크기가 작고 특정 위치에 규칙적으로 나타나는 것을 부호(diacritic)라고 부른다.
한글의 경우 자질(資質, feature)을 표시하기 위해서 가획(加劃)되는 특성이 있는 자질 문자이기에 이를 합자로 오해할 수 있다. 거센소리로 쓰이는 'ㅋ'은 '-(선)'와 'ㄱ'으로 나눌 수 있지만 자음에서 -가 별개의 글자로 쓰이는 것이 아니므로 합자는 아니다.
모음의 경우 글자 구성요소인 ㅣ, ㆍ, ㅡ가 실제 글자로도 쓰이기 때문에 다소 혼동될 수 있다. 실제로 한글 모음에서는 글자 구성요소로서의 합침과 개별 모음의 합자가 동시에 나타난다. 이를 구별할 수 있는 사례로 아래아와 ㅣ가 글자 구성 요소로서 결합하면 ''가 되지만 각자 개별 모음으로서 이중모음을 구성하게 되면 ''가 된다.[7]
한자의 경우 새 글자를 만드는 조자법(造字法)에서 이러한 합침이 나타난다. 예컨대 死는 시체를 나타내는 歹 모양과 우는 것을 나타낸 口 모양이 합쳐졌으나, 각각의 요소가 원래 글자인 것은 아니니 전자에 속한다.
[1] 기보법/서양에서 보듯 음표의 합침을 ligature라고 부르기도 한다. 이 경우 이탈리아어 발음으로 '리가투라'라고 한다.[2] 이 문제는 터키어에서 더 크게 문제시되는데, 아예 별개의 음가를 지닌 ı와 i 의 변별 때문. 그래서 터키어에서만큼은 fı와 fi 를 글꼴에서 명확히 구별해주어야 한다.[3] 오늘날 전산적으로는 이를 결합 문자 방식으로 구현한다.[4] 단음소의 개수가 글자 3개를 써야 할 정도로 많지 않음[5] 모아쓰기 표기 체계상 글자 3개를 연달아 쓰기 힘듦[6] 하나의 자모로 등록되지 않으면 옛한글 입력기로도 입력할 수 없음[7] 반대의 순서로 ㅣ와 아래아가 결합하면 가 된다.