*.wav 파일 열화 논란

 

1. 개요
2. 발단
3. 내기
4. 참고
5. 관련 문서


1. 개요


오디오 파일(*.wav)을 여러 번 복사하는 과정에서 음질이 열화된다는 주장과, 이를 터무니없게 생각하는 사람들 사이에서 벌어졌던 인터넷 상의 논쟁. 그 자체는 어이없는 해프닝일지도 모르지만 500만원이라는 거금이 걸린 내기 제의로 인해 큰 관심을 받았었다.
일단 자세한 내막을 읽기 전에 혹시 모를 '그럴싸한데?' 현상을 피하기 위해 개념은 잡고 가자. 물론 정보 전송 중에 오류가 생길 확률은 0이 아니다. '''하지만 컴퓨터와 인터넷이 발전되는 동안 전 세계의 수학자들과 컴퓨터 과학자들은 정보의 오류를 정정하기 위한 알고리즘을 계속 개발해왔으며, 전송이 잘못되면 요청을 다시 한다. 연결이 안정적이라면 50기가바이트짜리 게임을 복사해도 MD5 체크섬이 같다.'''
요즘에 유행하는 음원 추출 사이트는 대부분 광고 수익 또는 사용자 정보 수집을 주 목적으로 삼아 사이트 트래픽을 최소화하는 식으로 작동하기 때문에 음질을 한차례 열화시킨 뒤 거의 손실 압축 포멧 형태로만 제공하지만, 이것은 단순 복제에 해당하지 않으므로 이 문서에서는 제외한다. 혹시라도 음질이 열화된 것을 느꼈다면 십중팔구는 이런 문제이거나, 포멧을 마구 바꾸면서 기본으로 압축하는 것 이외에도 대역을 잘라내는 등 정보를 정리했거나, 이도저도 아니라면 컴퓨터가 심하게 낡아서 오작동하기 때문일 것이다.

2. 발단


일의 발단은 오디오 커뮤니티인 레퍼런스 클럽이라는 사이트에 올라온 '뻥쟁이김이사'라는 유저의 글이었다.
WAV 파일의 경우, 우선 리핑 이전에는 CD에 기록되어 있는 디지털 신호(PCM)[1]이며, 이를 리핑하는 과정에서 데이터 에러가 일어나 binary 레벨에서 차이가 발생하지 않는다면 복사 전후의 파일 자체는 같다.
문제는 에서 뻥쟁이김이사는 다음과 같은 말을 한다.

재미난 건 CD에서 추출한 wav 파일을 이리저리 카피하거나 인터넷 다운로드를 거치면서 음질적인 손상이 일어난다는 점이다.

물론 이러한 사실을 알만한 분들은 이미 다 알고 있을 거다.

뻥쟁이 역시 회사 프로젝트의 일환으로 테스트를 해 보았기 때문에 여러 번 카피를 거친 음원파일에 손상이 일어난다는 걸 알고 있었다.

혹시라도 이런 사실이 믿기지 않는 분들은 직접 테스트를 해 보시라.

30~40번쯤 카피를 거치면, 제아무리 당신이 똥귀고 시스템이 단순해도 구분할 수 있는 수준의 심각한 손실이 일어난다.

수십번의 메일 전송이나 인터넷 다운로드를 반복해도 마찬가지다.

뻥쟁이 레퍼런스 정도의 시스템에 음악 좀 들을 줄 아는 분들이라면, 단 한번의 카피본도 구분이 가능할 정도로 손실이 온다.


이쯤 되면 무슨 소리를 하는가 싶지만, 본인은 진지하게 생각하고 있는 듯하다. 바이너리가 같다면 같은 출력값을 가질 수밖에 없으므로, 파일의 변질이 생겼거나 파일이 조각화함에 따라 버퍼링 로스가 발생하여 음질의 저하가 발생할 수도 있다는 나름대로 설득력 있는 의견도 나왔다. 애초에 음원을 복사할 때 음원을 재생하면서 이를 녹음하여 저장하는 것과 같다고 착각하는 것일 수도 있다.
하지만 뻥쟁이김이사는 파일 자체의 변조는 전혀 없고, full file buffering을 사용했기 때문에 버퍼링에 의한 렉의 발생 또한 없었다는 말을 추가적으로 댓글로 달게 된다.
거기에 새롭게 원인으로 들고 나온 것은 EMI나 RF, 즉 전자파였다. 파일의 복사 과정에서 발생한 전자파가 컴퓨터 또는 오디오 장치 자체에 영향을 미쳐서 음질이 나빠졌다고 주장하면서, 심지어 기판 회로에까지 문제를 제기한다.
이에 대해 많은 네티즌들이 반박을 하자 '그렇게 자신이 있다면 모니터 뒤에 숨어말고 내 앞에 나와라' 라는 투의 글을 남기기도 했다.

3. 내기


그 후, 뻥쟁이김이사의 댓글에서 문제가 시작된다.

나참... 웃기지도 않아서...

그냥 간단하게 하지요.

저는 오디오로 재생되는 음악에 관한한 계측기보다 정확합니다.

그걸 당신이 나서서 정밀 계측기를 들고 저와 싸움을 붙이세요.

이건 좀 예민한 사항이니 500만원빵입니다.

자신 있으시면 ██@██.com으로 연락처 주시고, 자신 없으면 꺼지세요

위와 같은 댓글을 달면서 과연 반응을 예측했는지, 아닌지는 알 수 없지만, 역시나 이에 따른 반응이 즉각적으로 나타나면서 최소 3명 이상의 내기 요청자가 등장한다. 그 중 한 명이 공식적으로 내기를 요청했고, 뻥쟁이김이사는 받아들인다. #1 #2 여기에 공증과 내기 비용을 부담하겠다는 예비 UCC 제작 업체(?)까지 가세하면서 이런 글을 남긴다.

상금을 건 블라인드 테스트를 진행하실 예정이라면 "공개테스트" 를 하는 조건으로

저희쪽에서 내기 자금, 촬영기록 및 공증등을 완전 무상으로 제공할 용의가 있습니다.

내기에서 지실 경우라도 저희쪽에서 자금을 "전액" 제공하도록 하겠습니다.

결국 논란이 된 글은 삭제되었으며, 결말은 운영자가 해당 글 및 댓글 삭제, 회원 강제 탈퇴 등의 신공을 사용하면서 흐지부지 끝나버렸다. 하지만 뻥쟁이김이사의 네이버 블로그의 포스팅#을 보면 애초부터 레퍼런스 클럽 사이트의 최고운영진이 '''뻥쟁이김이사'''였다는 것을 알 수 있다. 참고로 이 사이트는 그누보드 4로 만들었는데, 그누보드 4를 설치하면 기본으로 적용되는 스킨에 로고 이미지만 레퍼런스 클럽 것으로 바꾼 것이었다. 이 사이트 자체가 뻥쟁이김이사의 개인 홈페이지 그 이상도 이하도 아니었다.
2009년 11월 25일 뻥쟁이김이사는, 12월 초쯤 테스트를 요청한 사람들의 입회하에 테스트를 하겠다고 선언한다.
12월 4일 오후 2시 33분, 테스트 결과가 올라왔다. 테스트 결과를 요약하자면 '''"내가 틀렸다. 하지만 이건 확실히 다른데 어떻게 생각해?"'''
500만원 내기를 받아들인 '바나나'의 경우 참가 자체도 하지 못 한 것으로 보이며, 뻥쟁이김이사 혼자서 진행한 것으로 보인다. 자신의 처음 주장은 틀렸으나, '메모리나 캐쉬가 비워진 상태에서 플레이를 한 첫 번째 재생은 동일곡의 두 번째 재생과 차이 난다'라는 새로운 주장을 하고 있는 상태. 이 정도면 wav 파일 열화 문제보다 더 심각한 주장이다. 마치 '''과학은 이론이고 저는 실전입니다''' 라고 주장하는 교강용을 보는 것 같은 기분이 들지 않을 수 없다. 사이비 과학의 표본인가 싶기도 하고...
여담으로 이 '음질 열화'는 시코에서도 많이 나오는 떡밥 중 하나이다.
2020년 현재, 아직도 뻥쟁이 김이사는 이 사건과 비슷하게 불가능한 일인 글들을 자신의 블로그에 올리고 있다. 오디오 장비를 나무로 된 통 안에 넣어 두기만 하면 해상력이 엄청 올라간다며 디지털 장비는 확연하게 아날로그화 된다.[2] 라는데...# 댓글을 보면 알겠지만 원리가 무엇이냐고 묻는 질문에, '나를 아는 사람이면 알 것이다.' 라는 투의 대답을 보면 알듯, 신뢰성이 낮다. 그러나 그의 현재진행형인 오디오 이야기를 들어주는 사람들도 있긴 한 것을 보아하니 컨셉이 아니라 자신의 실제 신념인 것이 확실한 듯.

4. 참고


발상을 전환해, 중심을 '음원'이 아닌 '컴퓨터 파일'이라는 사실에 중점을 두고 생각해 보자. 모든 파일은 0과 1로만 이루어지며, 이 0과 1의 배열이 조금이라도 다른 두 파일은 서로 다르다. 그리고 원래 wav 파일과 열화된 wav 파일은 다르다. 그러니까 wav 파일을 복사할 때마다 컴퓨터가 배열을 살짝 수정한다는 것. 한 글자의 오타로 인해 실행 자체가 불가능할 수 있는 exe 파일에 이를 대입하면, '''복사의 정의를 부정'''하는 무서운 이론이다.
다만 무결성을 보장하는 디지털 전송에서도 오류가 났으나 무결성 검사를 통과할 가능성은 있으며 따라서 이런 일이 완전히 불가능한 것은 아니다. 참고로 플래시 메모리에서 정보를 읽어 컨트롤러를 통하여 컴퓨터로 전달해주는 SSD에서의 이러한 오류율 - 복구 불가능 오류율은 최대 10^16 bit 당 1 bit 이다.[3] 물리적 구동부가 존재하는 HDD는 좀 더 높아서 10^14 bit 당 1bit 이다.[4] 즉 10 TB 정도의 데이터를 하드에서 읽으면 그중 1bit 정도는 원본과 다를 수 있다. 즉 음원 파일이 100 MB 이고 샘플링 주파수가 44.1KHz 라고 가정할때, 10만번 정도 복사하면 4만 4천분의 1초 단위의 음 변화가 생길 수 있다. 당연히 이런 변화는 아무리 황금귀라고 하더라도 인간이 잡아낼 수 있는 영역이 아니다. 조금 과장해서 만약 이게 가능하다면 인간은 지구의 자전 속도 변화를 '체감'하는 게 가능할 것이다. 또한 이런 변화가 심하게 생겼을 경우, 디지털 파일은 에러 메시지를 띄우고 실행을 중지하게 되어 있다.[5] 아날로그처럼 데이터가 심하게 변경된 상태에서도 작동이 되는 것이 아니라는 이야기이다.[6] 그리고 위의 복구 불가능 오류율(URE)도 오해의 소지가 있는 수치이다. 하드디스크 회사에서 내놓는 이 스펙은 해당 장치를 사용해서 몇 비트(바이트가 아니다)의 정보를 읽을 때 잘못 읽을 수 있는 확률을 뜻하나, 실제로는 마케팅적인 의미가 다분히 담겨있는 수치일 뿐이다. 실제로, 2000년대 초반까지만 해도 그 당시의 URE 수치로 봤을 때 현재의 3TB, 4TB 하드 전체를 읽을 경우 20%나 1bit 의 오류의 발생할 위험이 있다고 여겨 RAID 업계가 변할 것이라는 전망이 있었다. 허나 시간이 지나면서 URE 확률은 더욱 낮아져서 2014년이나 그 당시나 하드 전체를 읽을 시 0.xx% 의 확률로 1bit 가 잘못 읽힐 우려가 있다고 하고 있다. 이에 대한 해외의 실험에서도 하드디스크를 며칠이나 다시 읽는 테스트를 반복하여도 아예 오류가 검출되지 않는 상황이다. 즉, 생각보다 현재 쓰이고 있는 하드나 플래시 메모리에 기반하고 있는 SSD 등의 저장매체는 매우 신뢰할만한 수준의 데이터 리드를 보장하며, 상기와 같은 복구 불가능 오류율은 현실적으로 반영이 안되는 마케팅적인 허수임을 유념해야 한다. 단, 디스켓이나 테이프 백업 장치 등에서는 오류가 잘 발생하기 때문에 해당 스토리지에서는 감안해야 하는 수치이다. 디스켓과 테이프가 과거의 저장 매체로 퇴출되어 사라진 현재의 일반 유저들로서는 체감이 불가능하다는 뜻.
이런 것을 주장하는 사람들은 가끔 CD의 염료 성분에 따라서도 음질이 바뀔 수 있으며, 블랙 CD가 가장 좋다고 주장한다. 심지어 CD를 요구르트에 담그면 음질이 좋아진다고 주장하는 사람도 있다.[7]
단, 음악 재생에 사용되는 CD 규격은 리더기의 성능차에 따라 음의 공백이 발생할 수 있다. 사실 복구용 패리티는 오디오 CD에도 다 있다. 단 수준이 주민등록번호 마지막 자리 수준. (즉, 단위 데이터 길이 당 안 읽히는 데이터가 하나만 있으면 복구 가능하다.) 컴퓨터용 ODD가 음감용 ODD보다 리딩 능력이 고성능이기 때문에, 원본을 잘 읽어내서 곱게 새로 구운 CD가 CDP에서 툭툭 튀는 흠집난 원본보다 질이 좋게 들리는 것은 가능하다. 물론 여기서 MP3 CDP같이 음악 파일이 담긴 CD를 재생하는 경우는 제외된다. 이건 CD-ROM 규격이므로 손상이나 읽기 오류를 체크할 수 있기 때문이다.
참고 자료 음악 전용 ODD(= CD 플레이어)의 음질이 전반적으로 PC 용ODD에서 신호를 받아 트는 것보다 낫게 들리는 이유는 DAC와 아날로그 부분인 노이즈 제거 회로, 스피커를 울리기 위한 앰프의 성능 차이[8] 때문이지, CD에서 신호를 읽어 주는 리더기 부분의 성능 차이는 아니다. 요즘은 새로 산다면 더 큰 데이터를 다루는 블루레이 ODD가 대세이므로 오디오/비디오 전용 장비라도 에러 복구 능력은 과거 CDP보다 더 좋아졌다.
  • 160만원짜리 음악용 PC(?)# : 사기다. 외장형 USB-DAC[9]나 광출력 사용을 전제로 한 제품으로, PC에서 나오는 디지털 음원은 어느 PC이든 데이터 무결성을 보장하며 음질은 DAC단에서 결정되므로 음질과는 아무 상관도 없다. 당연히 DAC는 따로 사야 된다. 주요 부품들은 저가형 제품[10][11]으로 도배를 했다.[12] 음감을 위해 느린 컴퓨터를[13] 사는 것은 결국 무소음 컴퓨터를 위한 것이지, 음질과의 직접적인 관련이 있어서 사는게 아니다. 케이블이나 USB 단자 등에 과도한 투자를 한 황당한 제품. 본 항목의 내용과 마찬가지로 하드디스크에서 출발한 디지털 음원 데이터가 PC 내부에서 흐르는 동안 의도치 않은 변조를 거쳐 USB나 광출력 단자로 나올 때는 원본 음원과는 달라진다는 황당한 이론으로 기존의 디지털 데이터 무결성 메커니즘을 완전히 부정하는 제품. 심지어 램의 방열판 유무도 영향을 끼친단다. 다만, 적당한 일반 PC를 쓰면서 일부 부품을 고급화하고 음원을 탑재해 판매한 경우는 있으므로, 모든 오디오 전용 (PC-Fi)이라고 내세우는 PC가 사기인 것은 아니다. 보통 정상적인 물건은 팬리스, HDD리스 제품이 많다. PC에서 가장 시끄러운 부품이 쿨링팬, 그 다음은 HDD기 때문에... 특수한 대형 방열판과 1~2TB 이상 대용량 SSD 사용을 하게 되고 이 탓에 처리성능(CPU,VGA,RAM)이 동급인 일반 PC에 비해 가격이 조금 비싸지는 건 사실이다.[14]

5. 관련 문서



[1] 황당하게도 이 논쟁은 논쟁자가 이 문장의 어디에 방점을 찍고 있느냐가 문제가 된다. [2] 당연하지만 이미 스피커로 소리가 나오는 시점에서 DAC를 통해 아날로그로 변환된 소리가 나오는 것이니 말이 안된다는 것을 알 수 있다. 실제로 저러면 원본 소리보다 훨씬 왜곡된 소리가 나오게 하는 것에는 도움을 준다고는 할 수 있을지언정 해상도가 엄청 향상되는 것과 같은 큰 효과를 보기는 어렵다.[3] http://www.seagate.com/www-content/product-content/seagate-laptop-fam/600-ssd/ko/docs/600-ssd-data-sheet-ds1780-1-1304kr.pdf[4] http://www.seagate.com/files/www-content/product-content/barracuda-fam/desktop-hdd/barracuda-7200-14/ko/docs/desktop-hdd-data-sheet-ds1770-1-1212kr.pdf[5] 오류 파일을 강제로 읽어오는 프로그램을 쓰더라도 음악파일이라고 인식 자체를 못하거나 만약 음악형태로 재생이 되는 경우라 하더라도 음악에 잡음이 낀 정도가 아닌, 지지직거리는 소음만이 날 것이다.[6] 이걸 실제로 체감해 보고 싶다면 컴퓨터 안에 저장된 음악을 HxD 등의 바이너리 편집기로 열어서 파일 가운데 쯤에 있는 바이트 하나를 바꾸고 Ctrl + S를 눌러 저장한 뒤 재생해보자. (물론 실험에 앞서 백업을 해 두길 바란다. 저장하는 순간 기껏 수집한 음악 하나 그냥 날아가니까.) 백이면 백 음악파일이 손상되었다며 읽히지 않을 것이다.[7] CD-R의 염료 성분에 따라 CD의 수명이 다를 수는 있으며, CD 표면에 긁힌 자국이 있으면 읽기 오류로 그 부분에 노이즈가 생길 수도 있고, 바나나와 치약을 사용하여 이 긁힌 자국을 어느 정도 없앨 수 있기도 하다. 하지만 그런 물리적인 손상이 아니라면 비록 싸구려 CD-R을 사용한다고 해도 음질이 열화될 리는 없다. 더구나 고등학교 물리1 교과서에서는 CD의 일부를 잘라낸 다음에 재생하는 실험이 나오는데, 결론은 '''재생이 잘 된다'''이다. 즉, 일부 정보의 손실이 있더라도 음질이나 음악재생에 큰 영향을 끼치진 못한다. 차라리 싸구려를 사용하면 보존성이 낮다거나, 저속으로 레코딩하는 것이 좋다거나 하는 이야기라면 납득은 가겠지만, 아무리 파일의 복사가 많아도 CRC나 MD5 값이 바뀌는 경우는 없다.[8] PC의 사운드 카드에 들어 있는 원 칩 앰프와 오디오 전용 앰프는 당연히 성능 차이가 난다.[9] 디지털 데이터를 아날로그 신호로 바꾸어 주는 장치[10] 실제라면 저 정도 스펙의 컴퓨터는 기껏해야 20만~30만원 정도다.[11] 다만, 알루미늄으로 된 케이스와 방열판 등은 따로 주문 제작한 것으로 보이며, 그 때문에 가격이 꽤 높아지는 것은 맞다. 일반 PC로 내놓았다면 납득할 사람이 없기 때문에 외형에서라도 차별화를 해야 하기 때문에 그렇게 했을 것이다. 그래도 100만 원 미만이면 되니 너무 비싸다.[12] 컴퓨터가 느릴수록 더 음질이 좋단다. 하지만 실제로 컴퓨터가 느릴 경우 AAC, OGG Vobis, APE같은 포멧을 재생하기 힘겨워하거나 버퍼 언더런의 영향으로 음질이 안 좋아진다. 특히 최신 디코더들은 하드웨어 자원을 적극적으로 활용하도록 설계되었기 때문에 장치의 연산성능이 떨어질수록 품질이 떨어진다.[13] 대부분 느리다기보다는 발열이 적은 쪽에 초점이 맞춰질 것이다.[14] 가장 가성비좋은건 256~512GB SSD + 2~5TB HDD 조합이지만 HDD를 무조건 배제하면서도 일정 이상 저장할 용량은 갖춰야하니 돈지랄을 해서라도 2TB짜리를 달고 나오는 수밖에.. 심한 경우 OS용 256GB NVME SSD에 데이터용 2TB SATA SSD 4대 RAID5 조합(즉, 가용 용량 6TB. 나머지 2TB는 SSD 고장시 복구용 패리티로 쓰게 된다. 1대까지는 고장나도 데이터 손실이 없다.)에다 워크스테이션용 하드웨어 레이드 카드, 팬이 없으니 발열해소용 커스텀 대형 방열판에 덕지덕지 달아놓은 게 나오기도 한다. 당연히 저렇게 하면 가성비는 안드로메다로. 하지만 조용하다는 이점은 있고, 음감용이 아니더라도 심하게 흔들리는 환경에서 쓴다거나 하면 저렇게 셋팅하는 경우는 있으니 개인이 정녕 필요를 느낀다면 추가금은 소비자의 선택에 달려있는 문제일 것이다. 가성비 위주의 소비가 실리적인 건 사실이지만 개인적인 필요가 있다면 반드시 가성비 좋은 것만 소비하라고 강요할 수는 없는 노릇이니.