바이트

 

1. 정보 단위
1.1. 유전 정보 단위와의 혼동
2. 물어뜯는 동작
3. 아르바이트의 준말
4. 아이돌 마스터 SideM의 등장 유닛
5. 영화 제목


1. 정보 단위



Byte. 컴퓨터의 저장 단위.
컴퓨터가 조작하는 정보의 최소 처리 단위. 최소 단위는 비트. 옛날에는 4비트, 6비트를 1바이트로 삼는 컴퓨터도 있었으나, 현대(적어도 1984년 이후)의 대개의 컴퓨터 아키텍처에서, 1옥텟, 즉 8비트를 1바이트로 삼는다. 표준 C 언어에서는 '8비트 이상'을 1바이트로 삼도록 규정하고 있다.
컴퓨터에서 정보의 최소단위는 이진법의 한 자리수로 표현되는 비트(Bit)이다. 그러나 비트 하나로는 0 또는 1이라는 2가지 표현밖에 할 수 없으므로, 일정한 단위로 묶어서 바이트(Byte)라고 칭하고 정보를 표현하는 기본단위로 삼고 있다.
1개당 2개의 정보를 표시 가능한 비트를 8개 묶은 1옥텟으로 2의 8제곱, 즉 256 종류의 정보를 나타낼 수 있어 숫자와 영문자[1]를 모두 표현할 수 있고 남는 공간에 특수문자까지 할당할 수 있다. 7비트보다 다루기 편하기 때문에 1옥텟=1바이트인 CPU가 나온 이래로 1옥텟이 사실상 표준 1바이트로 컴퓨터 세상을 평정했다. 사실, 7비트, 즉 128개만으로도 숫자와 영문자를 다 표현하고도 남는다. 실제로 아스키 코드는 7비트고, 이에 착안해서 실제로 7비트로 1바이트를 삼기도 한다.
한글은 여러 자모를 조합해 한 글자를 형성하기 때문에 당연히 256자로는 어림도 없다. 공인된 글자 수만도 2500자가 넘으므로 1바이트(256자)로는 이를 모두 표현할 수 없다. 때문에 한글은 한 글자가 최소 2바이트(256 x 256 = 65536자)다. 또한 한글 완성형 중에는 한글 한 글자가 3바이트인 경우도 있다.[2]
1바이트는 1캐릭터(Character)라고도 부른다. 1바이트를 가지고 한 개의 문자. 즉, 캐릭터를 표현할 수 있기 때문이다(사실 이렇게 되도록 1바이트를 정의하려고 했다). 이는 영어의 경우이고 다른 문자는 더 많은 바이트를 쓰는 경우가 많다.
따라서 일부 문자나 여러 부호, 특히 멀티미디어 표현에 필요한 각종 정보, 통신상의 주소 등은 여러개의 바이트를 묶어서 표현한다. 특히 갈수록 컴퓨터의 데이터 처리량이 많아짐에 따라 웬만한 CPU는 32비트, 많게는 64비트의 데이터를 한번에 처리한다. 이렇게 특정 CPU가 데이터를 처리하는 단위는 워드(Word)라고 하며, 컴퓨터 아키텍처를 설계할때는 중요하게 쓰이지만 애초에 CPU마다 값이 제각각이기 때문에[3] 표준단위는 아니다.
대용량 기억장치의 용량 또는 정보량을 나타내는 상위의 단위로는 우리가 흔히 사용하는 킬로바이트, 메가바이트, 기가바이트, 테라바이트, 페타바이트 등이 있고, 새롭게 나온 키비바이트, 메비바이트, 기비바이트, 테비바이트, 페비바이트 등이 있다.
접두어(SI)
이름
계산법
접두어(IEC)
이름
계산법

1바이트(byte)
1000바이트=1kB


1024바이트=1KiB
킬로(103)
1킬로바이트(kilobyte)/kB
1000KB=1MB
키비(210)
1키비바이트(kibibyte)/KiB
1024KiB=1MiB
메가(106)
1메가바이트(megabyte)/MB
1000MB=1GB
메비(220)
1메비바이트(mebibyte)/MiB
1024MiB=1GiB
기가(109)
1기가바이트(gigabyte)/GB
1000GB=1TB
기비(230)
1기비바이트(gibibyte)/GiB
1024GiB=1TiB
테라(1012)
1테라바이트(terabyte)/TB
1000TB=1PB
테비(240)
1테비바이트(tebibyte)/TiB
1024TiB=1PiB
페타(1015)
1페타바이트(petabyte)/PB
1000PB=1EB
페비(250)
1페비바이트(pebibyte)/PiB
1024PiB=1EiB
엑사(1018)
1엑사바이트(exabyte)/EB
1000EB=1ZB
엑사(260)
1엑스비바이트(exbibyte)/EiB
1024EiB=1ZiB
제타(1021)
1제타바이트(zettabyte)/ZB
1000ZB=1YB
제비(270)
1제비바이트(zebibyte)/ZiB
1024ZiB=1YiB
요타(1024)
1요타바이트(yottabyte)/YB

요비(280)
1요비바이트(yobibyte)/YiB

이 정도 크기의 용량은 잘 와닿지 않는데, 대충 페타바이트는 유튜브가 한 달 동안(2012년 기준)출처 저장하는 단위이고 그 위의 엑사바이트 단위가 유튜브 용량 정도라고 생각하면 그나마 와닿기 쉽다.
접두어의 의미와는 달리, 실제로는 10의 3제곱 단위인 1000단위로 가는 것이 아니라 그 근사수로 2의 10제곱인 1024로 끊어진다. 그러나 엄밀히 말해 기존 SI 접두어는 10의 거듭제곱에 쓰지 2의 거듭제곱에는 쓰지 않기 때문에 혼동되는 우려가 있었다. 이런 심오한 분야의 이야기가 일반인에게 현실로 다가오게 된 계기는 바로 하드디스크. 하드디스크의 용량이 커지게 되면서 "제 하드 용량이 이상해요." 같은 질문을 하는 사람이 늘어났다. 이에 대한 대안으로는 1000 단위로 쓰던 기존 십진 접두어 대신 여기에 i를 붙인 이진 접두어(각각 키비-Ki, 메비-Mi, 기비-Gi, 테비-Ti, 페비-Pi 등으로 쓴다)를 1024 단위로 분리해서 쓰는 것이 있다. 현재 리눅스와 macOS에서는 단위를 병기하거나 바꾸었지만, 윈도우는 따로 병기하거나 바꾸지 않았다.
덧붙여 약자로 대문자 B를 써야 하며, 소문자 b가 아니다. 소문자 b는 '''비트'''를 뜻하기 때문이다.[4]
2018년 시점에서는 최대 수 테라 바이트급 저장장치(하드디스크)가 보급화되어 있다.

1.1. 유전 정보 단위와의 혼동


위의 정보단위와 비슷해서 사람들이 같이 혼동하는 단위이기도 하다. 아무래도 유전자를 구성하는 핵산 단위가 단순한데다, 조합을 통해서 유전정보를 나타낼 수 있다는 점과 일맥상통하고, 약어도 비슷하니 컴퓨터에서사용하는 정보 단위와 엄연히 다름에도 똑같이 읽는 문제가 생기곤 한다.
생물학 교재에서 유전자의 양을 kb라고 써서 유전자의 양을 표기하기도 하는데, 이 때의 b는 byte가 아니라, base이다.
즉, 해당 유전자가 구성된 염기의 개수를 의미하며, 핵산을 구성하는 질소 염기 A, G, C, T, U 다섯가지를 편의상 base라고 표기한다. 그리고 앞에 써있는 접두어 k는 1000을 의미한다. M은 백만, G는 10억, T는 1조...
즉 생물학 및 유전공학에서 kb, Mb, Gb, Tb 등으로 쓴다는 것은, 해당 유전처를 구성하는 염기의 개수가 1000개, 백만개, 10억개, 1조개 단위로 끊어서 표기한 것 뿐이다.
컴공 등에서 쓰는 단위와 혼용되는 탓에 bp라고 써서 이것이 '염기쌍'(base pair)임을 명시하는 책들도 있다.

2. 물어뜯는 동작


Bite. 일반적으로 물어뜯다라는 뜻을 가지고 있으며, 한입 베어 물 수 있는 음식의 크기나 종류를 표현할 때도 사용한다. 기어나 체인 등이 맞물려 돌아가는 것도 Bite라고 한다.

3. 아르바이트의 준말


バイト. 일본에서만 쓰이는 용어라 오역하기 쉽다.

4. 아이돌 마스터 SideM의 등장 유닛


Beit 문서 참조.

5. 영화 제목


They Bite. 1996년작으로 감독은 저예산 영화를 여럿 만든 브렛 피퍼.한국에서 이 제목으로 비디오가 나왔다.
포르노 제작진들이 촬영차 간 시골 바닷가 마을에서 정체모를 바다괴물과 얽힌다는 그냥 흔하디 흔한 B급 호러 코믹물 영화이지만 포르노계 베테랑인(...) 론 제레미가 포르노 제작자로 깜짝 출연한다든지 제작진들이 포르노 제작진이라 야시시한 장면이 꽤 많다.

[1] 모든 라틴 문자를 표기하기에는 모자란다. 그래서 나온 것이 유니코드.[2] 예를 들어 KO16KSC5601, KO16MSWIN949는 한글 한 글자가 2바이트지만 UTF8/AL32UTF8에서는 한 글자가 3바이트다.[3] 8비트 컴퓨터의 1워드는 8비트, 1바이트이지만, 32비트 컴퓨터의 1워드는 32비트, 즉 4바이트다.[4] 참고로 통신과 관련된 분야에서 사용하는 Mbps는 Mega bit per second다. 100 Mbps를 우리가 흔히 생각하는 단위로 바꾼다면 초당 12.5 MB가 된다. 웹 브라우저에 나오는 전송 속도는 후자를 사용한다.

분류