손실 압축 포맷
1. 개요
사진, 음악, 동영상 등 주로 멀티미디어 데이터에서 인간이 지각하기 힘든 범위의 데이터를 버리고 압축하는 방법을 사용하는 포맷. 압축을 하는 과정에서 원본 데이터가 손실되기 때문에 무손실 압축 포맷과 비교된다.
2. 특징
손실 압축은 수학이 아닌 '''공학'''이다. 손실 압축의 기본은 '''인간의 인지'''와 관련이 있다. 이 부분이 '''압축'''이라는 말을 공유하고 있을 뿐이지, 수학적인 정보 이론적 관점의 무손실 압축 포맷과 가장 큰 것이다. 손실 압축 포맷은 인간이 인지할 때 중요하지 않다 여기는 정보를 제거함으로써 실현하는 방식이기 때문에 인간 중심적인 공학적 대안에 해당된다. 또한 손실 압축 자체는 '''디지털 기법이 아니다'''. 디지털 정보로 저장되는 '''손실 압축 포맷'''일 뿐이다. TV만 보더라도 알 수 있듯 영상 및 음향 관련 기법은 아날로그 시절(신호 처리 등)부터 내려오던 것으로, 손실 압축은 그 연장선으로 볼 수 있다.
흔히 멀티미디어 데이터로 불리는 영상(정지영상, 동영상 모두)과 소리 데이터의 저장에 있어 가장 넓게 활용되는 기법이다. 멀티미디어 데이터는 이른바 아날로그로 불리는 연속적인 데이터기 때문에, 이를 이산화(샘플링)하는 과정에서 화질이나 음질을 위해 샘플링을 더 잘게 하는 경우 데이터 크기가 방대해지기 때문이다. 따라서 데이터를 일부 손실시켜 데이터 크기를 줄이는 과정을 강제할 수 밖에 없고, 손해를 최소화 하기 위하여 인간이 인지하기 어려운 부분을 잘라내고자 하는 것이 손실 압축 포맷의 지향점이다.
예컨대 소리의 경우 일반인이 인지하기 힘든 고주파, 저주파 영역이 삭제되며, 동영상의 경우 인간이 인지하는 색각 정보와 패턴[1] 을 토대로 인지하기 힘든 영역을 삭제한다. 이 과정을 거치면서 20%도 안 되는 용량에 인간이 인지하기 힘든 손상만 생기도록 하기에 데이터 보관 및 전송에 있어 경제적으로 아주 효율적이다. 저장 장치나 네트워크[2] 비용을 덜 들이면서 고화질, 고음질 데이터를 보관 및 전송하는게 가능해지기에, 현재도 폭넓게 사용되고 있다.
위에도 적어놓았듯이, 손실 압축은 '''아날로그 데이터'''의 압축에 대한 인간 중심의 공학적 대안이므로, 일반적인 디지털 데이터의 경우 적용할 수 없다. 가령 텍스트 문서에 적힌 내용을 손실 압축하기 위해서는 의미를 추려서 압축해야 하나, 그림이나 소리와 달리 글은 사소한 변화로도 인간의 인지적 변화가 크게 나타나기 때문에 적용이 불가능하다. 문서를 그림과 같은 방식으로 손실압축할 경우 아예 의미가 없어진다.
같은 영상을 여러번 유튜브에 반복해서 올린 결과물. 횟수가 커질수록 미세한 손실이 계속 쌓이고 쌓여 눈에 띄게 증가한다. 최근에는 이를 '''디지털 풍화'''라는 밈으로 소비하기도 한다.
멀티미디어가 발달하면서 취급하는 데이터의 용량이 무지막지하게 커지게 되는데, 그것을 효율적으로 사용할 수 있도록 원본에서 안 쓰는 부분[3] 을 잘라내서 상당한 용량 절감 효과를 보여준다. 20000Hz 이상을 들을 수 있는 사람은 사실상 없다고 봐도 되기 때문에... 물론 비손실 압축 포맷에 비해서 단점은 있다. 압축률이 높기 때문에 디코딩에 필요한 프로세싱 자원이 비손실 압축 포맷에 비해 좀 더 많이 든다.
3. 종류
3.1. 동영상 포맷
원본과 형태가 달라진다고 해서 이걸 아주 못써먹을 것으로 분류하는 건 아니며, 오히려 유용한 기술이다. 애초에 동영상 쪽에서는 원본 그대로 땡 BMP로 저장하면 말도 안 되는 용량이 필요하고, 무손실 압축 포맷을 이용하더라도 어느 정도 한계가 있기에 대부분의 동영상은 손실 압축 포맷이다. 특히 동영상 코덱 중에서 효율성이 뛰어나고 상당히 범용화된 것이 H.264. 기존의 MPEG 계열 비디오 코덱의 깍두기 현상을 어느정도 해결한 코덱이기 때문.
특히 화질보다 속도를 중요시하는(그리고 '''전송량으로 인한 회선 비용'''도 더해서) 오디오 스트리밍이나 VOD 같은 서비스는 손실 압축 포맷으로 최대한 용량을 줄이는 것과, 그럼에도 어느정도 볼만한 화질을 모두 챙겨야 하기에 이 기술이 이 업계의 핵심이다. '''특히, 유튜브의 화질이 구린[4] ''' 것 등이 손실압축의 대표적인 현상이다.
동영상 분야나 디지털 지상파 TV 방송(제작, 송출 모두) 분야에서는 이를 비압축 포맷으로 썼다간 비트레이트 수치가 어머어마해지기 때문에 어쩔 수 없이 손실 압축 포맷을 사용한다. 방송국에서 사용되는 TV방송용 원본 베타캠 테이프 조차 비디오부는 손실 압축되어 있다.[5]
용량 대비 화질 효율은 일반적으로 MPEG-2 ≤ Theora < WMV 9 ≒ Xvid < VP8 < H.264 < VP9 < HEVC < AV1 < VVC 순이다.
3.2. 오디오 포맷
무손실 WAV파일을 MP3 8~128Kbps 정도로 저장하면 왠지 소리가 틱틱대는 것 등이 대표적이다. 또한, 유투브 음원 추출 사이트에서 얻는 음원도 그대로 저장하면 추후 재생시에 틱틱대는 소리가 들린다.[6][7]
참고로 오디오 분야(음반 제작 등)에서는 48kHz 16비트 스테레오의 비압축 PCM 파일의 비트레이트가 기껏 1.5Mbps에 그치기에 비압축 파일로 작업하는 경우가 많다.
3.3. 그림 포맷
그림판으로 빨간 선을 그은 다음 JPG로 저장하면 빨간색이 탁해지는 현상이 대표적이다.
여기서는 크로마 서브샘플링을 사용하며, 색차 신호가 밝기 신호보다 줄어든다는 특성이 있다.
용량 대비 화질 효율은 JPEG 2000 < JPEG < WebP < HEIF ≒ BPG < AVIF 순이다.
4. 기타
여담으로 WMA와 MP3는 무손실 포맷 역시 지원한다. WMA Lossless , MP3HD 형태로 존재하며, MP3HD 같은 경우는 일반 기기에 넣으면 320kbps, 지원 기기에 넣으면 원본음질로 재생된다. 넓은 호환성에 비해 문제점이 많아서 사장되었다.
MP3HD 사용기(영어)[8]
The Distortion of Sound라는 다큐멘터리에서는 여러 음악가들이 나와서 손실 압축 포맷은 영 좋지 않다고 까고 있는데, 정작 까기만 하고서는 무손실 포맷에 대한 얘기를 하지 않고, 음원을 압축하면 좋지 않다고 비교 청취를 하는 부분에서 압축된 부분은 MP3 64kbps 급으로 뭉턱 잘라먹은 예제를 들어버리고, 압축되지 않았다고 한 부분도 유튜브에서 재생했으니 이미 MP3 256 kpbs 수준으로 압축되었다는 사실을 시청자들에게 알리지 않는 등 굉장히 기만적인 내용으로 진실을 호도하고 있다. 무엇보다도 음질을 논한다는 음악가들 중에는 스티브 아오키, 린킨 파크, 스눕 독, 그리고 믹싱이 잘못되었기로 악명높은 메탈리카의 Death Magnetic을 믹싱한 Andrew Scheps 등 믹싱 과정에서 음량을 왕창 올리고 음질을 다 깎아먹느라 음질에 대해 얘기할 자격이 없는 인물들이 대거 등장한 탓에 신빙성을 잃어버리고 있다. 다행히도 먼저 녹음부터 제대로 하라고 비판하는 댓글이 종종 보이기는 한다.
5. 같이보기
[1] 음질의 주파수 영역대와 비슷한 개념이다.[2] 아날로그 신호 또한 대역폭 한계가 있다.[3] 그 중 음악 파일의 경우는 사람의 귀에 들리지 않는 비가청 주파수를 말한다.[4] 유튜브는 구글 인수 전에도 상당히 성능이 좋은 압축 방식 덕에 회선 사용량을 엄청나게 줄였지만, 그럼에도 불구하고 절대적인 전송량이 너무 많이 필요해서 적자 신세였다고 한다. 네트웍 대역 문제와 스토리지 문제가 돈이 빵빵한 구글덕분에 해결되었는지 요즘은 8K UHD 같은 고화질 서비스도 한다. 하지만 예전에 올라온 동영상은 고화질 파일이 없기 때문에 화질이 나쁘다. 특히 2000년대 영상 대부분이 720p조차 지원하지 않는다.[5] 물론 지상파 디지털 TV 방송 신호도 당연히 손실을 압축할 수 있다.[6] 이걸 확인하려면 spek 등 스펙트럼 확인 프로그램을 돌려보자. 이런 음원은 16kHz 정도에서 잘렸을 것이다. 20kHz에서 잘렸다면 일반인은 물론 전문가도 구분할 수 없다. 이보다 높은 음은 들을 수 없기 때문이다.[7] 일반적으로 음원 추출 사이트는 트래픽을 최소화하면서도 광고 수익을 노리는 경우가 많기 때문에, 겉만 화려하면서도 얻을 수 있는 음원은 비손실이더라도 한차례 개악되어(…) 128kbps에 그치는 게 전부이다. 왜 거의 손실압축 포멧만 지원하는지 생각해보자. 편하라고?[8] 테스트결과 원본 WAV 336MB, 기본설정 FLAC 142MB, mp3HD 175MB 수준이었다고 하며 디코딩속도도 떨어졌다고 한다. 무손실유저 상당수가 들리지도 않는 초고음역대 잘라내는 걸 꺼리는 헤비유저임을 감안할 때, 일반기기와 호환을 위한 용량증가는 차세대포맷에 용량절감을 원하는 그들의 요구사항하고 안 맞는 셈이다.