대문자·소문자

 

1. 개요
2. 사용 규칙
3. 기원
4. 문자 체계
4.1. 대문자·소문자를 사용하는 문자체계
4.2. 다른 문자에서
5. 전산 처리
6. 대문자·소문자에 따라 문서가 달라지는 예
6.1. 첫 글자 대문자
6.2. 전체 대문자
6.2.1. 원소 기호
6.3. 특이 배열
7. 기타


1. 개요


Letter case
유럽 계열 언어의 문자에서 사용하는 개념. 같은 글자를 큰 것과 작은 것으로 쪼개 놓은 것이다. 이렇게 두 종류로 쪼개진 문자 체계를 영어로는 bicameral이라고 하는데 이 단어는 양원제를 뜻하기도 한다. 한글이나 한자, 아랍 문자, 태국 문자처럼 대문자와 소문자의 구별이 없이 한 가지 형태만 있는 문자를 단일형 문자(unicase/unicameral)라고 부른다.
한국에서는 보통 영어를 배우면서 처음 접하게 된다.

2. 사용 규칙


일반적으로는 다음과 같은 규칙을 따른다. 항상 지켜지는 것은 아니다.
  • 문장의 맨 첫 글자는 대문자를 쓰며, 나머지는 소문자를 쓴다.
  • 고유명사의 첫 글자는 대문자를 쓴다. 단, 고유명사의 일반명사화가 진행되면 소문자 표기가 많아진다. 링크
    • 가요, 소설 등의 작품 제목, 어절로 된 고유 명사, 문단 제목 등은 모든 단어의 첫 글자를 대문자로 쓰는 것이 보통이다. 단 at, of, and, the, a/an, to와 같은 전치사나 관사, 접속사는 소문자로만 쓰는 경우가 일반적이다.[1]
    • 독일어의 경우 일반명사의 첫 글자에도 대문자를 쓴다. 터키어도 비슷하게 제목에 한해 독일어처럼 모든 명사의 첫 글자를 대문자로 쓰는 관습이 있다. 아니면 전부 대문자로만 쓰든가.
    • 영어네덜란드어는 고유명사의 형용사형과 고유명사에서 파생된 언어·민족을 가리키는 단어에도 첫 글자를 대문자로 쓴다. 독일어의 경우 그 단어가 명사일 때는 첫 글자를 대문자로, 형용사일 때는 소문자로 쓴다.
    • 영어, 독일어, 마인어 등은 한 달이나 요일 이름의 첫 글자도 대문자로 쓴다.
  • 두문자어는 일반적으로 대문자를 쓴다. 단 위에서 든 전치사, 관사, 접속사 등에 해당하는 두문자는 소문자로 쓰기도 한다.[2]
  • 특별히 강조해야 되는 단어는 소문자로 써야 할 단어를 대문자로 쓰기도 한다.
  • 카툰이나 코믹스에서는 소문자를 쓰지 않고 대문자를 쓰는 경우가 많다. 20세기 초반에는 인쇄 능력이 조악해서 만화에 들어갈 글자(로마자)들을 손으로 써넣어야 했는데, 이 때 글씨를 똑바로 쓰기 위해서는 Ames Guide라는 도구를 써서 영어 공책처럼 가로 직선을 여러 개 긋고 그 위에다 반듯하게 글자를 쓴 다음 직선 부분만 지워야 했다. 이 때 소문자를 쓰게 되면 영어공책처럼 줄을 네 개 그어야 제대로 쓸 수 있는데, 대문자만 쓰면 세 개만 그어도 제대로 쓸 수 있으므로 편의를 위해 대문자만 쓰던 것이 지금처럼 완전 기계인쇄, 디지털 인쇄로 전환된 이후에도 남은 것이다. 상당히 오랜 관습이어서 프랭크 밀러배트맨 이어 원처럼 소문자를 쓰는 것만으로도 그 만화의 특징으로 거론될 정도이다.관련 링크
  • 띄어쓰기가 곤란한 경우[3], 단어 첫 글자를 대문자로 바꿔 쓸 수도 있다(medial capitals). 이를 낙타의 등혹 같다고 해서 카멜 표기법(camel case, camel caps)이라고 한다.
한글에는 없는 개념이기 때문에 대·소문자 구분을 소홀히 하기 쉬운데, 실제 대·소문자를 구분해 쓰는 언어권에서는 '''아주 기초적인 문법'''이다. 때문에 사무적인 곳은 물론이며 일상에서도 틀리지 않게 주의해야 한다.
영미권 인터넷에서는 '크게 소리지르는 것' '진지하게 강조하는 것' 의 뉘앙스를 표현하기 위해 일부러 대문자로만 글을 쓰기도 한다. [4]
대문자와 소문자는 글말(문어)에선 당연히 구분할 수 있지만, 입말(구어)에선 발음만으로는 구분이 불가능하다. 대문자와 소문자의 차이만으로 단어와 문장의 뜻 전체도 차이날 수 있으므로 이때는 문맥에 따라 유추하거나 아니면 화자가 사전에 '이 단어에선 대문자를 쓴다'라고 따로 언급해야 한다.

3. 기원


현재 대문자-소문자 구별이 있는 문자는 본래 대문자만이 존재하고 있었다. 소문자는 상대적으로 나중에 생겼다.
어느 문자에서나 소문자가 생긴 이유는 필기 편의를 위해서였다. 본래 대문자만 쓰이던 시절인 고대에는 대체로 기록을 점토판 등 딱딱한 재질의 기록매체에 남겼기 때문에 곡선 등을 그리는 것이 매우 어려웠고, 따라서 문자가 직선 위주로 만들어졌다. 그러나 파피루스, 양피지같이 부드러운 재질의 기록매체가 생기자 곡선을 그리는 것이 쉬워졌고, 빠르게 필기하기 위해서는 곡선을 많이 써서 획수를 줄일 필요가 있었다. 이렇게 해서 등장한 것이 소문자이다.
로마자의 대문자-소문자 체계는 프랑크 왕국카롤루스 대제 시대에 처음 체계화되었다. 중세 초기 서로 다른 지역의 문자 형식이 통일되지 않아서 통신이 불편했다. 카롤루스 대제는 프랑크 왕국에 통일성을 부여하고 행정을 효율적으로 운용하기 위해 카롤링거 소문자를 만들고 보급했다. 현대 알파벳 소문자는 모두 카롤링거 소문자를 기반으로 한다. 그러나 당시에는 지금과 다르게 가독성 향상을 위해 대소문자를 구분해서 쓰는 일은 없었으며, 그냥 서체 차이 정도에 지나지 않았다.
본격적으로 가독성 향상을 위해 대문자와 소문자를 구분해서 쓰는 용례는 영국, 아일랜드에서 처음으로 등장했다. 라틴어의 후계 언어들(불어, 서어, 포어, 이탈리아어 등의 로망스어군)이 아닌 게르만어군을 사용하는 사람에게는 라틴어로 된 글을 읽기 위해 가독성을 어떻게든 높여야 할 필요가 있었기 때문이다.출처
로마자보다 약간 늦은 시기인 9세기와 10세기에 그리스 문자에서도 오늘날 그리스 소문자의 기원이 되는 필기체가 등장했다. 그리고 로마자의 영향을 받아 오늘날처럼 가독성 향상을 위해 구분하여 쓴다. 그리스 문자를 받아들이고 변형한 키릴 문자에서도 대소문자 구분이 생겼다. 로마자와 키릴 문자 모두 그리스 문자를 받아들여 만들어진 문자지만 대문자와 달리 소문자는 각 문자마다 상당한 차이를 보이는데, 대문자는 직접적으로 그리스 문자를 받아들였지만 소문자는 독자적으로 발달했기 때문이다.
대문자와 소문자라는 이름은 인쇄술 초창기의 활자보관함에서 유래했다. 대문자는 활자보관함의 윗부분에 보관하여 uppercase, 소문자는 아랫부분에 보관하여 lowercase라고 불렀다.

4. 문자 체계



4.1. 대문자·소문자를 사용하는 문자체계


그리스 문자
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω
라틴 문자(영어 기준)
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
아르메니아 문자
Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ
ա բ գ դ ե զ է ը թ ժ ի լ խ ծ կ հ ձ ղ ճ մ յ ն շ ո չ պ ջ ռ ս վ տ ր ց ւ փ ք օ ֆ
키릴 문자(러시아어 기준)
А Б В Г Д Е Ë Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

4.2. 다른 문자에서


일본어가나에서는 스테가나라고 가나를 작게 쓰는 용법이 있다. 자세한 것은 문서 참조. 제2차 세계 대전 이후에 확립된 현대의 용법이다. 이 경우 아예 표시하는 음운이 큰 것과 작은 것이 다르기 때문에 유럽의 대-소문자 개념과는 다르다. 오히려 같은 음을 나타내면서 용도에 따라 쓰임을 달리하는 대소문자의 쓰임은 히라가나-가타카나의 관계와 더 유사하다.
히라가나와 가타카나는 단어 단위로 어떤 단어는 히라가나로만, 어떤 단어는 가타카나로만 쓰는 등으로 갈리고 한 단어의 앞 글자만 대문자로 하지는 않는다는 점이 차이점. 단, 앞서 언급했듯이 강조하고자 하는 단어는 대문자로 적는 용법이 있는데, 가나 문자도 이와 비슷한 용법이 있다. 강조하고 싶은 단어는 가타카나로 적는 식.

5. 전산 처리


[image]
Microsoft Windows는 파일/폴더명에서 대문자와 소문자를 같은 것으로 본다. 파일/폴더를 선택하거나 읽고 쓸 때 구분하지 않는다는 뜻이지, 파일/폴더명을 지을 때 대문자와 소문자를 구분해서 입력할 수 없다는 것은 아니다. 어쨌든 이로 인해 이미 존재하는 파일/폴더명에서 대문자와 소문자만 달리하는 새로운 파일/폴더를 생성하는 것은 불가능하다. 예전 MS-DOS 시절에는 파일/폴더(디렉토리)명으로 대문자만 지원되었고, 파일/폴더(디렉토리)명으로 소문자를 이용하면 자동으로 대문자로 변환되어 이용되었다.
반면 리눅스 등의 유닉스 계열 OS에서는 대문자와 소문자를 다른 것으로 취급한다.
프로그래밍 언어에서도 베이직처럼 변수/함수명에 대문자와 소문자를 같은 것으로 간주하는 것이 있는 반면 C 계열처럼 다른 것으로 취급하는 것도 있다. 헷갈리지 않도록 주의할 것.
유니코드에서도 구별된다. 예를 들어 대문자 A는 U+0041인데, 소문자 a는 U+0061이다.
Caps Lock은 대소문자 입력을 반전시키는 역할을 한다. 일반 상태 소문자/시프트 누른 상태 대문자 → 일반 상태 대문자/시프트 누른 상태 소문자가 되는 식.

6. 대문자·소문자에 따라 문서가 달라지는 예



6.1. 첫 글자 대문자


명문화된 규정은 아니나 일반 영어 단어에서 앞 글자만 대/소를 달리하여 구별되는 것은 동형으로 여기는 사측 판단이 있다. 이에 따라 Ice 문서가 Ice(작곡가)로 구분자를 달게 되었다. 아래의 예에서도 앞 글자 대/소로 구별되는 것 중 하나가 동음이의어 메타 문서인 경우 비슷하게 처리될 가능성이 있다.

6.2. 전체 대문자


전체 대문자 쪽은 두문자어인 경우가 많다.

6.2.1. 원소 기호


원소 기호는 첫 글자만 대문자로 쓰는 것이 원칙이므로 아래의 예는 모두 후자가 원소 기호이다. 화학에서 둘 다 대문자로 쓰여져있는 것은 원소끼리의 조합으로 그 의미가 완전히 다르다. 특히, 아래 예시 중 CO, HF, NO의 경우는 실제 존재하는 화합물 이름이므로 더욱 주의하여야 한다.

6.2.2. SI 단위


SI 단위는 접두어를 두어 배수를 표현하는데 대문자와 소문자가 모두 사용되며, 그 의미는 완전히 다르다. 이를테면 백만배를 뜻하는 메가는 대문자 M으로 쓰며 천분의 일을 뜻하는 밀리는 소문자 m으로 쓴다. 따라서 10mW와 10MW는 전혀 다른 의미.[5] 크기차이가 많이 나다보니 보통 단독으로 쓸때는 틀리는 일이 많지 않지만 단위 앞에 쓸때는 잘못 쓰는 예가 많아서 주의를 요한다. 특히 kWh, MWh, kHz, MHz 같은것이 많이 틀린다. (킬로의 k를 대문자로 같이 쓰던가, 심하면 전부 대분자/소문자로 쓰는 실수)
심지어 단위 자체도 대소문자에 따라 다른 의미를 띠는데, 가령 소문자 s는 시간의 단위인 지만, 대문자 S는 전기 전도도를 의미하는 지멘스#s-2가 된다.
이외에도 다음 단위가 대소문자 간 혼동을 빚는 사례이다.
  • T(테슬라) - t()[병용단위]
  • H(헨리#s-2) - h()[병용단위]

6.3. 특이 배열



7. 기타


  • 독일어 고유의 로마자 ß(에스체트)는 ss를 줄인 것으로, 순수 독일어에서 SS는 어두에 올 일이 없기 때문에 전통적으로 소문자 형태만 있다. 모든 문자를 대문자화한다면 SS로 쓰는 것이 원칙이었다. 억지로 ß를 대문자화하면 ẞ이 되는데, 비표준 표기였다가 2017년부터 정식으로 대문자 ẞ를 도입했다.
  • 그리스 문자 Σ(시그마)의 소문자 형태는 σ와 ς 두 가지가 있다. 일반적으로는 σ이 소문자로 쓰이고 ς는 단어 끝에만 쓰인다.
  • 간혹 대문자의 자형을 하고 있으면서 글자의 높이는 소문자와 똑같이 하는 경우가 있는데 이를 small capitals(small caps)라고 한다. 이런 상태에서 어두 글자만 본래 대문자의 높이로 쓰면 petit caps라고 한다. 영어 위키백과 Small caps 문서 HYUnDAI처럼 섞어서 쓰는경우도 있다.
[1] 예: I Want to Hold Your Hand, The Lord of the Rings, League of Legends(LoL)[2] 예: IoT(Internet of Things)[3] 주로 프로그래밍에서 변수나 함수 등의 이름을 지어야 하는 경우. 예를 들면 어떤 수치를 얻어오는 함수 이름을 getValue()라고 정하는 등.[4] 한국에서 궁서체로 쓰면 진지해진다는 것과 비슷한 맥락.[5] 10억배 차이. 전자는 소형 전자기기의 소비전력같은데서 주로 볼 수 있고 후자는 발전소의 발전량, 또는 무선송신소의 출력 등에 사용된다. 즉 일상적으로 둘 다 볼수 있다는 의미.[병용단위] A B 정식 SI 단위가 아니다.