본문 바로가기
Straight on Red/마스터링에 대한 N 가지 오해와 진실

Floating Point 와 믹스 레벨

by 채감독 2021. 8. 5.

믹스 레벨이 작으면 마스터링 하기에 좋지 않다?

나를 다소 어리둥절하게 했던, 그리고 심심찮게 들어왔던 말이다. 믹스 레벨이 지나치게 크다는 것이 마스터링에서 종종 언급되는 이슈인데, 반대로 너무 작은 경우의 경험도 상당히 많다. 그리고 믹스 레벨에 대한 이야기는 늘 오해가 많은 소재이다.

[믹스 레벨은 빨간 불 안뜨는 한도 내에서 가능한 크게 한다] 이것이 오랫동안 정설로 여기고 따라왔던 가이드 라인이다. 디지털 오디오에서 빨간불이란 곧 Clip = Distortion 을 의미하기 때문이다. 그런 위험에도 불구하고 왜 "가능한 크게"를 고집해 온 것인가? 
가능한 크게 라는 것은 아날로그 레코딩 시절에 매우 중요한 원칙 이었다. 녹음에 사용하던 아날로그 테입은 노이즈 플로어 Noise Floor 가 높고 다이나믹 레인지 Dynamic Range 가 좁았다. 피할 수 없는 플로어 잡음보다 가능한 크게 음악을 녹음해야 상대적으로 잡음의 비중이 작아지기 때문이다. 이를 신호-대-잡음-비율이 좋다 라고 한다. 그리고 레코딩 레벨이 충분히 큰 상태에서 오디오 시그널이 테입에 녹음되면  피크 성분들이 상당부분 녹아버리게 된다. Tape Satulation 이라는 단어로 어렵게 설명하는것 보다는 순간순간의 피크들이 녹아버린다는표현이 더 어울린다. 이 순간적인 피크는 느려터진 VU 미터에 걸리지도 않고, 디지털처럼 Clip Distortion 으로 기록되지도 않아서 보이지도, 들리지도 않은 채로 테입 안에 녹아버린다. 그래서 녹음 엔지니어는 레코딩 게인을 더 높게 올릴 수 있었다. 사실 아날로그 녹음 시절에는 이러한 마법같은 수혜를 잘 모르고 살았던 것이다. 피크 라는 것이 보이지도 들리지도 않았고, 그것이 너무도 당연했기 때문에.

16비트 그때 그 시절

그런데 디지털 녹음기는 이론상 노이즈플로어는 거의 없는 수준이다. 16비트 디지털 레코더의 노이즈 플로어는 사람이 들을 수 있는 작은소리의 한계에 근접한다. 하지만 노이즈는 발생 하는데, 이 노이즈는 거의 다 마이크와 프리앰프에서 그리고 A/D 컨버터에서 더해지는 것이고 컨버팅 이후에는 잡음이 더해 질 요인이 없다. 그럼에도 우리는 "가능한 크게"를 여전히 강조했는데, 바로 초기 디지털 장비들의 해상도 때문이다.

16비트 시스템과 높은 노이즈플로어의 콜라보.  오디오 레벨은 노이즈 플로어보다 가능하면 높게!

DAT 는 16비트 데이터를 Fixed Point 로 0dBFS 까지 기록한다. 16비트면 65,536 단계의 해상도인데 이게 많다면 많고 부족하다면 부족한 것이다. 뭐, 음질에 욕심을 내자면 턱없이 부족할 수도 있다. 그래서, 음악의 신호가 주로 움직이는 -20~0 dBFS 범위에는 비트를 많이 할당하고, 그보다 작은 소리신호에는 비트를 조금 할당하는 식으로 음질의 향상을 구현했다. 마치 LED 피크미터의 위쪽에는 1dB 당 LED 하나가 할당되어 표시되지만 아래로 가면 LED 하나에 5 또는 10dB 이상이 할당되어 있는 것과 같다고 볼 수 있다. LED 의 갯수가 한정되어 있으니까 음악이 주로 표현되는 윗쪽에 더 많은 LED 를 할당해 주는 것이다. 따라서, 디지털 레코딩에서 가능한 높은 녹음레벨을 갖는 것은 음질에 큰 이득을 가져왔다. 레코딩 레벨이 작을 수록 음질이 떨어지기 때문이다. 그런데 그 이후의 24비트 오디오는 16비트에 비해 2의 8제곱 = 256배 상승된 해상도를 지니기 때문에 이런 걱정에서 벗어날 수 있다. 평균 레벨이 대략 -40dBFS 정도로 떨어져도 16비트 수준의 음질은 보장받을 수 있기 때문이다. 그래도 습관은 무시할 수 없어서 이런 낮은 레벨의 시그널은 그냥 두고 볼 수가 없다. 평균 레벨 -40 이라니..

카세트 데크의 LED 레벨 미터. 가운데는 LED 1개에 1dB, 끝에는 LED 1개에 5dB가 할당되어 있다. 그리고 카세트테입은 노이즈플로어가 워낙 높아서 녹음레벨을 높게 잡아야 하기 때문에 레벨미터에 -20 아래로는 아예 취급을 안한다. 

그리고 Floating Point 가 강림하셨다

2020년 기준으로 이 세상 (거의) 모든 DAW 가 최소 32비트 Floating Point 로 "내부"에서 동작한다. 실은 64비트가 많아지고 있다. DAW도, 플러그인도. 그런데 "내부"라는 말은 왜 썼을까.
DAW 가 사용할 오디오 소스 파일은 아마도 24비트 웨이브 파일 일 것이다. 그리고 DAW 가 만들어 낼 결과물도 24비트 웨이브 파일이라고 해 두자. 소스에서 결과까지 사이에서 오디오 데이터는 페이더, Pan, 각종 플러그인의 조작을 거치고 섞이고 가공 당하게 된다. 사람이 느끼기에는 '소리가 섞이고 커지고 작아지고 리버브가 생기고' 하는 것이지만 컴퓨터의 입장에서는 모두가 다름 아닌 "계산과정"일 뿐이다. 이 계산의 과정이 32 (또는 64) 비트 라는 것이다. 계산 과정은 매우 고해상도로 수행해서 에러를 가능하면 줄인 뒤 마지막 결과를 24비트 또는 16비트로 뽑아내는 것이다. 게다가 Floating Point 란다. Floating Point 란, 소수점의 "점" (= point) 위치가 막 변할 수 있다는 뜻이다.

8자리로 한정된 수 에서 소수점이 고정되 있으면 99,999.999 부터 00000.001 까지 표현이 된다. 최소부터 최대까지 9,999,999,900배 차이가 난다. 그런데 8자리로 한정해 두고 소수점을 아래로 내리면 99,999,999 가 최대 숫자이고, 위로 올리면 0.0000001 이 최소 숫자가 된다. 소수점 위치를 옮길 수 있기 때문에 표현의 범위가 최소부터 최대까지 99,999,999,000,000배 차이가 난다. 이건 10진수로 예를 든 것이다. 2진수로 설명하자고 들면 더 힘들어질 뿐이다. 실감나게 dB 로 이야기 하면 24비트 (Fixed Point) 의 다이나믹 레인지가 약 144 dB 인데 32비트 Floating Point 는 약 1,500dB 정도 된다. 더 놀라운 것은, 0dBFS 아래로 750dB, 위로 750dB 합이 1,500dB 라는 것으로, 0dBFS 보다 큰 값이 존재한 다는 것이다. 따라서 아무리 페이더를 올리고 메이크업 게인을 올려도 내부에서는 찌그러지지 않는다. 단, Master Fader 까지만이고 그 이후에서는 유효하지 않다. 32비트 Floating 이라도 Master Fader 의 레벨미터에서 빨간불이 뜨면 안된다는 이야기다.

16, 24 그리고 32(Floating Point). 이 그림만 보면 32비트의 우주적인 위대함이 느껴진다. 

다시 믹스 레벨을 이야기 하자

디지털 오디오 이론은 따로 떼어서 이야기 하는것이 좋다. 지금은 믹스 레벨 이야기만.
그래서, 오디오 시그널 레벨이 작으면 작은대로 크면 큰 대로 충분한 해상도는 유지가 된다. 그렇다면 믹스레벨이 매우 작아도 문제가 없는것일까? 기술적으로는 그렇다. 단, 믹스레벨이 매우 작은 경우의 상황적 특징을 볼 필요가 있다.
경험상, 매우 작은 레벨의 믹스를 만드는 이들은 (대부분) 믹스에 전문적이지 않은 뮤지션들이다. 이들은 각 채널의 레벨을 효율적으로 다루는것에 익숙하지 않고, 그룹/마스터 버스에 피크리미터를 인서트 하는 노하우가 충분하지 않다. 이런 상태에서 마스터 피크미터의 빨간불이 뜨지 않게 페이더를 내리고 내리다 보면 결국 상당히 낮은 레벨의 믹스가 만들어진다. 또 문제는 각 트랙에 담긴 소스들이다. 음향제작에 전문적이지 않은 뮤지션 믹스는 그들 스스로 만들어 낸 뮤지션 레코딩일 확률이 높고, 이러한 레코딩 환경에 놓인 마이크와 케이블, 마이크프리앰프와 인터페이스의 A/D 컨버터가 종합적으로 만들어 내는 노이즈플로어와 음향적인 퀄리티는 전문 스튜디오에 비해 열악할 수 밖에 없다. 노이즈플로어가 상대적으로 높은 트랙들이 모이고 쌓여 멀티트랙을 만들고 이렇게 믹스된 음악의 믹스 레벨이 낮을 때 마스터링 과정에서 한껏 증폭시킨 믹스는 노이즈 역시 함께 한껏 증폭된다. 기술적으로 안될 것은 없지만 이러한 환경적인 요소를 감안할 때 매우 낮은 레벨의 믹스가 문제가될 확률이 높다.

믹스 레벨이 너무 큰 경우는 어떨까.

믹스 과정에서 다이나믹 프로세서를 효율적으로 잘 사용하는 경우라면 매우 큰 레벨의 믹스도 문제없이 마무리가 될 수 있다. 버스프로세서로 어떤 것을 사용하는지, 왜 사용하는지, 무엇때문에 자신이 뭘 하고 있는 지 알고 정확하게 들으면서 사용한다면 말이다. 난감한 것은 이런 예가 별로 많지 않더라는 것이다. 단지 믹스 레벨을 높이는 것이 목적이어서 무리하게 리미터 등을 적용한다. 앞서와 마찬가지로 뮤지션 믹스에서 종종 접하는 사례이다. 높은 레벨의 믹스를 만드는 이유에 대해서는 스스로도 명확하지 않다. 그저 작은것이 싫어서 크게 만드는 경우가대부분이며, 그렇게 크게 했을때 뭔가 더 좋게 들리더라 라고 해 버린다. 레벨이 크다고 헤서 문제삼을 일은 없지만, 이들의 모니터 환경이 그다지 좋지 않아 과도하게 눌리고 찌그러지는 것을 인지하지 못하는게 문제다.

Mastering the mix 사이트에서 펌


발매된 다른 음악들 처럼 Loud 한 최종 음압은 마스터링 단계에서 만들어진다는 것을 알면서도 그러는 것도 문제이지만, 모니터링이 잘 안된다는것이 더욱 큰 문제이다. 실제로 믹싱을 직접 하는 뮤지션들 중에 모니터 환경이 안좋아서 아쉬워 하는 이도 있지만 모니터 환경이 안좋다는 것을 잘 모르는 이들도 적지 않다. 믹스의 퀄리티는 믹싱 스킬 뿐만 아니라 모니터환경에 의해서도 결정된다는 것을 이해 하여야 한다. 

믹스를 32Float 로 저장한다?

믹스가 끝나면 24비트 파일로 저장한다. 내부 처리는 32비트이지만 오디오 D/A 컨버터는 32비트 Floating Point 동작이 아니기 때문에 24비트로 저장하고, 소비자용 콘텐츠라면 16비트로 저장해야 한다. 소비자용의 D/A 컨버터는 16비트 동작이기 때문이다.
하지만 믹스가 끝나면 그 다음 소비자 직전에 마스터링 단계가 있다. 마스터링 스튜디오의 DAW 가 32비트 Floating Point 를 지원할 것이기 때문에 32 Floating 으로 저장을 해도 작업에 문제는 없다. 단, 실질적으로 큰 의미가 없는 이유는 알고 있기를 바란다.

0dBFS 보다 큰 레벨을 유지할 수 있다는 장점은 생각보다 유용하지 않다. 구지 0dBFS 보다 큰 믹스레벨을 유지해야 할 이유도 없거니와, 어차피 그렇다 하여도 마스터링 작업 시작 전에 0dBFS 밑으로 줄일 것이기 때문에 믹스에서 마스터페이더를 내려서 24비트로 저장하는것과 다를 바가 없게 된다. 그러면, 0dBFS 밑으로 750dB 라는 어마어마한 다이나믹 레인지가 주는 장점은 있을것인가. 24비트의 다이나믹 레인지가 이미 144dB 수준으로, 사람의 귀가 갖는 다이나믹 레인지 (약 130dB)보다도 크다. 요즘 대중음악의 사운드에 사용되는 다이나믹레인지는 고작 10dB 도 안된다. 24보다 큰 숫자의 시스템이 내 손 안에 있게 되면 그것을 최대한 활용하고 싶어지는 것은 막을 도리가 없다. 하지만 32 Floating 의 의미는 믹싱 할 때 DAW 내부에서 계산을 더 잘하고 있다는 의미로 이해하면 좋을 것이다. 믹스를 32 Float 로 저장하는 것에 아무런 문제는 없지만 24비트 파일과 실제로 다를 것은 없을 것이라는 것 정도만 알고 있으면 되겠다. 

 

채승균

댓글