디지털

 

1. 개요
2. 디지털 자료의 특징
3. 디지털 관련 이론
3.1. 샘플링
3.2. 양자화


1. 개요


Digital
[image]
아날로그와 디지털 방식의 차이를 나타낸 다이어그램
자료를 표현하고 처리하는 방식의 한가지. 연속적인 실수로서 자료를 나타내는 아날로그와 상대되는 개념으로, 자료를 특정한 최소 단위를 가지는 이산적인 수치를 사용하여 나타낸다. 디지털의 어근인 digit는 '손가락'이나 '엄지'를 뜻하기도 하는데, 이렇게 최소 단위를 사용해 나타내는 것이 마치 손가락을 하나씩 꼽아 수를 세는 것과 비슷하다는 것에서 나온 이름이다.[1]
사실 디지털이라는 개념 자체는 그렇게 새로운 것은 아니다. 모스 부호 같은 것도 짧은 전류와 긴 전류라는 단위를 사용해 정보를 나타내는 것이므로 디지털로 볼 수 있고, 더 거슬러 올라가면 봉화도 불이 켜지고 꺼지는 것으로 나타내는 것이라 디지털로 볼 수 있기 때문.[2]
다만 컴퓨터가 발달하면서 디지털은 컴퓨터를 비롯한 마이크로프로세서로 작동하는 전자기기와 관련된 용어로 더 많이 사용되고 있는 실정이다. 현재 사용되는 대부분의 컴퓨터는 전류가 흐르거나(1) 흐르지 않는(0) 것을 단위로 하는 디지털 방식으로 자료를 처리하며, 단순히 문서와 통계 자료뿐만이 아니라 음성 자료나 영상 자료도 이산적인 값으로 처리하고 있다.
컴퓨터 용어로 사용되면서 이진법과 헷갈리는 경우도 있는데 이진법은 수를 세는 방법의 일종으로 디지털과는 다르다.

2. 디지털 자료의 특징


일정한 단위를 통해 자료를 나타내는 디지털의 특성상 연속값으로 자료를 나타내는 아날로그에 비해 외부 교란이나 노이즈에 의한 정보 변조가 덜하다. 이 때문에 디지털 자료는 복제, 삭제, 편집 등의 데이터 가공이 용이하며, 원칙적으로 복제된 결과물이 원본과 차이가 없게 된다.
[image]
또한 일정한 단위로 정보를 처리하는 디지털의 특성상, 음악이나 화상과 같은 아날로그 자료를 일정한 주기로 샘플을 채집하여 디지털로 변환하는 샘플링 과정에서 원본 자료와 획득된 정보 사이에 차이가 발생할 수 있다. 위 도표에서 아날로그 정보(실선)과 이를 샘플링하여 얻어진 자료(막대 그래프)사이에는 조금씩이나마 차이가 생기며[3] 이는 얻어진 자료의 품질에 영향을 미친다.

3. 디지털 관련 이론


많은 디지털 신호들은 자연에 존재하는 아날로그 신호를 변환, 가공해서 만들어진다. 아날로그 신호를 디지털 신호로 변환하려면 일정한 주기로 샘플을 추출하는 과정인 샘플링, 샘플링된 값을 이산적인 값으로 근사시키는 과정인 양자화, 양자화된 값을 비트값으로 맵핑하는 과정인 부호화를 거쳐야 한다.
[image]
아날로그 신호를 디지털로 변환하기 위해 샘플링을 하면 위와 같이 계단 모양으로 각지게 변환이 되고[4] 이로 인해 신호의 품질이 매우 심각하게 나빠진다고 생각하는 사람들이 있는데 이는 사실과 다르다. 아래 문단에서 이를 설명한다.
심지어 박사나 교수정도 되는 사람들도 이런 오류를 가끔 저지르곤 한다. 응용 수학의 한 갈래인 신호처리를 전자공학이나 컴퓨터 공학에서 전공한 박사나 교수들은 샘플링 이론을 정확하게 이해하지만, 음향학이나 음악학 등을 전공한 쪽에서 샘플링 이론을 엉터리로 이해하고 있는 사람들이 많다. 신호처리 이론을 수학적으로 엄밀하게 이해하지 못하고 직관적으로 받아들일 경우 이런 함정에 빠지게 된다.

3.1. 샘플링


[image]
위 그림은 아날로그 신호(파란색)를 샘플링한 결과물을 나타낸 도식이다. 보라색 신호는 원본 아날로그 신호를 초당 44100번 샘플링 한 것이고, 빨간색 신호는 원본 아날로그 신호를 초당 192000번 샘플링 한 것이다.[5] 초당 샘플링 횟수가 더 많은 빨간색 신호가 보라색 신호보다 더 촘촘히 원본 신호를 표현한 것을 볼 수 있다. 이제 보라색이나 빨간색 신호를 다시 아날로그로 변환한다고 생각해보자. 직관적으로 생각했을 때 듬성듬성한 보라색 신호를 다시 아날로그로 변환한다면 사이 사이에 빈틈이 많아서 그 사이에 있는 원본에 대한 정보가 손실되었으니 변환이 부정확하게 이루어질 것 같고, 빨간색 신호를 다시 아날로그로 변환하면 샘플링 사이 간격이 좁아서 변환이 더 정확하게 이루어진다고 생각할 수 있다. '''하지만 이는 큰 착각이다.'''
해리 나이퀴스트, 클로드 섀넌 등의 학자들은 샘플링을 할때 어떻게 해야 손실이 발생하지 않을까에 대해 연구했고, 그 결과 나이퀴스트-섀넌 샘플링 정리[6] 증명했는데 정리의 내용은 아래와 같다.

$$X_{c}(f)$$를 $$x_{c}(t)$$의 푸리에 변환으로 정의하고, $$X_{c}\left( f\right) =0$$ $$for\left| f\right| \geq f_{N}$$ 조건을 충족하는 연속함수 $$x_{c}\left( t\right)$$와 0 이상의 실수 $$f_{N}$$이 있을 때, $$x_{c}\left( t\right)$$ 는 $$ \dfrac {1 } {T}\geq 2f_{N}$$인 샘플 $$x\left[ n\right] =x_{c}\left( nT\right), n=0,\pm 1,\pm 2,\ldots$$에 의해 유일하게 결정된다.

좀 더 쉽게 풀어서 쓰면 대역제한된 아날로그 신호는 샘플링을 할때 최대 주파수의 2배 이상으로 촘촘히 하면 손실이 발생하지 않는다는 의미이다. 따라서 나이퀴스트-섀넌 샘플링 정리에 따르면, 보라색이나 빨간색 신호를 다시 아날로그로 변환하면 둘 다 그 결과물은 수학적으로 파란색 원본 신호와 '''완벽하게''' 일치한다.
예를 들어 보라색 신호를 사용해 원래 신호인 파란색 아날로그 신호를 복원한다고 하자. 간단히 생각하면 보라색 동그라미를 모두 통과하도록 곡선을 이으면 아날로그가 된다.
[image]
그런데 위 그림처럼 이렇게 해서 만들 수 있는 곡선의 가짓수는 무한하므로 이렇게 만들어진 곡선은 파란색 원본 신호와 동떨어진 모양이 될 것이다. 따라서 일반적인 상황에서 파란색 아날로그 신호를 정확히 복원하는 건 불가능하다. 하지만 이때 원본 신호가 샘플링 주파수 절반 이하로 대역제한(bandlimited) 되어있다는 조건을 걸어주면(예를 들면 오디오 신호라고 가정하고 가청주파수 20kHz 이하로 대역제한 되어 있다고 조건을 걸면) 나이퀴스트-섀넌 샘플링 정리에 의해 가능한 곡선의 수가 1개로 줄어들어 유일한 해를 갖는다. 따라서 보라색 신호를 사용해서 파란색 아날로그 신호를 완벽하게 복원할 수 있다. 그리고 파란색 아날로그 곡선과 아주 조금이라도 다른 곡선은 나이퀴스트 주파수(샘플링 주파수의 절반) 너머에 위치하는 주파수 성분을 갖게 되어 대역제한 조건을 만족하지 못하므로 틀린 답이 된다.
[image]
나이퀴스트-섀넌 샘플링 정리가 왜 성립하는지는 수학적 배경 없이 직관적으로 이해 하는 게 불가능한데, 이를 이해하려면 푸리에 해석, 필터링 등의 신호처리와 관련된 기본적인 지식이 반드시 필요하다. 수식 없이 간락하게 설명하면, 샘플링을 원본 함수와 Dirac comb[7] 함수와의 곱으로 모델링 한 후 푸리에 변환을 사용해 주파수 도메인에서 스펙트럼을 관찰하면 샘플링 하기 이전의 스펙트럼이 일렬로 무한히 늘어서 있는 주기함수의 모습인 것을 확인할 수 있다. 위의 그림 참조. 이때 샘플링 속도가 느릴수록 인접한 스펙트럼 사이의 간격이 좁아지게 되며, 샘플링 속도를 최대 주파수의 2배 이하로 낮추면 결국 인접한 주파수 스펙트럼이 서로 겹처서 스펙트럼이 왜곡되게 된다. 이를 에일리어싱이라 부르며 에일리어싱이 일어나지 않는다면 0 주파수 근처에 있는 스펙트럼을 이상적인 로우 패스 필터로 뽑아내서[8] 원본 신호를 완벽하게 복원할 수 있다.
수학적으론 그렇고, 현실에서는 몇몇 문제로 나이퀴스트-섀넌 샘플링 정리를 완벽하게 적용할 수 없다. 나이퀴스트 섀넌 샘플링 정리는 대역 제한된 신호에 적용 가능한데, 자연의 신호는 대부분 대역제한 되어 있지 않다는 문제가 있다.[9] 이로 인해 안티에일리어싱 필터라 불리는 로우 패스 필터로 고주파 대역을 날려버려서 대역 제한된 신호로 만들어주는 프리 필터링이 반드시 필요한데, 이 과정에서 손실이 발생한다. 예를 들어 오디오 신호를 디지털화 할때 사람이 듣지 못하는 초음파 성분을 안티에일리어싱 필터로 적절하게 잘라서 대역제한 신호로 만드는 과정이 필요하다. 낮은 해상도를 가진 이미지나 동영상의 품질이 떨어지는 이유이기도 하다. 그리고 샘플링을 할 때와 샘플링된 신호를 아날로그로 복원할 때 로우 패스 필터가 사용되는데, 이상적인 로우 패스 필터를 구현하는 게 불가능해서[10] 왜곡이 발생한다. 이 문제를 해결하기 위해 오버샘플링[11]을 적용하는게 일반적이다.[12]

3.2. 양자화


[image]
아날로그 신호의 크기는 연속한 범위 내에서 아무 실수 값이나 가질 수 있지만(uncountable) 디지털 신호의 크기는 유한한 개수의 값만 가질 수 있다(countable). 따라서 아날로그 신호를 디지털로 바꿀 때 위에 서술된 샘플링 이외에 양자화(quantization)라는 과정을 거친다. 예를 들면 샘플링된 신호의 크기를 가장 가까운 허용된 값으로 근사시키는데, 샘플링이 세로로 신호를 자른다면 양자화는 가로로 자른다고 생각하면 쉽다.
샘플링은 나이퀴스트-섀넌 샘플링 정리에 의해 이상적인 조건에서 손실이 발생하지 않는 가역적 과정이지만, 양자화는 양자화 에러, 양자화 노이즈라 불리는 손실이 무조건 발생하는 비가역적 과정이다. 따라서 샘플당 사용하는 비트 수가 많은 아날로그-디지털 변환기를 사용하거나, 오버샘플링 및 noise shaping을 해서 양자화 노이즈를 고주파 대역으로 밀어넣은 후 고주파 대역을 디지털 로우 패스 필터, 다운샘플링으로 날리는 등 다양한 방법을 사용해서 양자화 노이즈를 허용 가능한 수준으로 충분히 감소시킬 필요가 있다.

[1] 영단어 digital은 '손가락과 관련한' 의미의 형용사로도 활용되니 참고하자.[2] 정확히는 켜져 있는 불의 개수로 표현한다. 즉 자리에 따른 가중치가 없는 시스템이다.[3] 양자화 문단에 설명되어 있듯이 이를 양자화 노이즈라고 한다.[4] sample and hold라는 과정을 거치면 신호가 이런 식으로 변환된다.[5] 정확히 따지면 후술할 양자화(quantization)를 하지 않았으므로 디지털은 아니다. 연속시간 신호와 이산시간 신호라 구분해서 부르는게 정확한 표현이겠지만, 서술 편의상 잠깐 아날로그, 디지털이라 부르기로 하자.[6] 줄여서 나이퀴스트 정리 혹은 샘플링 정리라고 많이 부른다.[7] 디랙 델타 함수를 일정한 간격으로 무한히 세워놓은 주기함수. impulse train이라고도 부른다. Dirac comb 함수를 푸리에 변환하면 Dirac comb 함수가 된다는 특이한 성질이 있다.[8] 샘플링된 함수가 적절한 형태의 sinc 함수와 convolution되면서 사이 사이의 빈틈이 채워진다.[9] 현실의 신호는 유한한 에너지를 가지므로 필연적으로 유한한 지속시간을 가지는 시간제한(timelimited) 신호이다. 그런데 시간제한과 대역제한은 동시에 성립할 수 없음을 간단히 증명 가능하다. 따라서 현실의 신호는 대역제한 신호가 아니다.[10] 일정 주파수 이하의 성분은 왜곡 없이 완벽하게 통과시키고 그 이외는 완벽하게 차단하는 이상적인 로우 패스 필터는 인과율에 어긋나는 특성을 가지고 있고(non-causal system) 무한한 길이의 임펄스 응답을 가지고 있어서(Infinite impulse response, 줄여서 IIR이라 부른다) 현실에 리얼타임으로 구현하러면 무한대의 딜레이를 줘야 한다는 문제점이 있다. 따라서 현실에 구현하는게 절대 불가능하다.[11] 아날로그-디지털 변환을 할 때 나이퀴스트 주파수보다 높은 속도로 샘플링을 하는것. 노이즈가 감소하고 아날로그 필터의 성능 요구 조건을 완화해주는 등 몇몇 이점이 있다. 참고로 거꾸로 디지털-아날로그 변환 과정에서 샘플링레이트를 올리는 것을 오버샘플링이라 부르기도 한다. 현대의 디지털-아날로그 변환기와 아날로그-디지털 변환기는 샘플링 속도를 내부적으로 적절히 변환해서 손실을 효과적으로 줄인다.[12] 참고로 신호의 최대주파수의 두배 이하로 샘플링하는 것을 언더샘플링이라 하는데 에일리어싱을 고의적으로 적절하게 일으켜서 고주파 신호의 스팩트럼을 저주파로 끌어내리는 용도로 사용된다.