본문 바로가기
Better Days Ahead

작업용과 감상용의 경계 - 이어폰을 이해하는 법 [2]

by 채감독 2020. 1. 6.

이어폰이 그저 휴대용 소형 스피커라고?

나는 일반인/소비자들이 스피커와 이어폰의 차이를 이해하고 숙지함으로써 올바른 사용법을 널리 퍼트리자는 캠페인을 벌이고자 하는 의도가 전혀 없다. 

원래 음악이라는 콘텐츠는 영화의 사운드와 소비의 방식이 다르다. 영화는 모든 사람들이 극장이라는 정형화된 환경에서 보고 듣게 되는데, 극장의 음향시스템은 대단히 정확하게 조정되어있고 대부분 극장에 대한 그 기준은 (어느 정도) 동일하다. 다시 말해서 [포드 대 페라리] 영화를 보는 사람들은 대부분 같은 환경에서 같은 크기의 같은 사운드를 듣게 된다는  말이고, 영화가 끝난 뒤 사운드를 이야기할 때 보편적인 동일 경험을 바탕으로 말하게 되므로 서로의 공감이 잘 이루어지는 편이다. 평화롭다. 그런데 음악판은 어떠한가.

지난주에 발표된 빌리 아이리쉬의 신곡을 1,000명이 듣고서 서로 다른 1,000가지의 이야기를 할 수 있다. 이들이 1,000가지 다른 [환경+시스템+시간+공간+볼륨] 의 조합 하에서 듣기 때문에 1,000가지의 다른 감성과 1,000가지의 의견이 생기는 것이 당연하다. 대중음악을 만드는 우리가 갖는 문제는, 이 1,000가지의 다른 상황을 다 만족시켜야 한다는 것이다. 이 문제는 소비자들의 문제가 아니라 음악을 만드는 프로들의 문제이다. 프로답게, 돈을 받으면 밥값을 해야 하나보다. 

아, 빌리 아일리쉬는 지난주에 신곡을 낸 적이 없으니 찾아보지 않아도 된다. 그보다. 스피커와 이어폰의 차이에 대해 이야기를 시작하며 다음 4가지를 정리한 바 있으니 궁금하면 지난 블로그를 찾아보기 바란다.

작업용과 감상용의 경계 - 이어폰을 이해하는 법 [1]

1. 반사와 간섭의 유무, 머리가 작용하는가의 여부
2. 음상의 위치 - 전면과 머리 내부
3. 고막과 청각신경의 손상 보호 회로
4. 외이도공진의 개입

스피커 믹스와 이어폰 믹스에 있어 이 사항들이 어떤 의미가 되는지 알아 볼까.

1. 스피커 재생시에 생기는 반사와 간섭 그리고 머리의 개입이 이어폰 재생시에는 완벽하게 사라진다. 이는 공간계 이펙트 사용과 패닝에 있어 주의할 점이 있음을 알려준다. 

믹스에 적용하는 리버브와 딜레이 등의 공간계 이펙트가 있다. 믹스에는 멀티트랙 소스에 없던 공간이 묻어 있다. 그런데 믹스를 스피커로 재생할 때 스피커에서 발사되는 소리는 내가 듣는 방 안의 반사음으로 만들어 지는 울림이 더해져서 나의 귀로 들어온다. 즉, 믹스의 리버브 + 내 방의 리버브 = 내가 듣는 총 리버브가 된다. 스피커로 들으면서 믹스할 때 믹서 (영국에서 믹싱을 하는 사람을 Mixer 라고 하던데, 믹싱 엔지니어 혹은 믹싱 음향감독 보다 짧아서 앞으로 믹서라고 하겠다)가 듣는 소리는 믹스의 리버브 + 믹싱룸의 리버브 이다. 이를 이어폰으로 들으면 룸 리버브가 없는 '믹스 자체에 들어있는 리버브' 만 듣게 되므로 리버브 양의 기준이 많이 다르게 된다. 제작환경과 소비환경에서 룸의 개입이 있고 없음은 서로 약속할 수 없는 개인적인 변수들인데, 대중음악 제작에서의 기준은 스피커 재생을 기준으로 하고 있으며 이어폰재생을 부가적으로 체크하는 것이 대다수 프로들의 현실이다.

패닝에 있어서도 좌/우의 간섭이 없음은 큰 차이를 만든다. 스피커 재생에서 Left 스피커에서 나오는 소리가 오로지 우리의 왼쪽 귀로만 들리는가? 오른쪽 귀에는 들리지 않는가? 앞서 설명한 바와 같이 스피커로부터 우리 귀 까지 이르는 경로에서 좌/우의 소리는 서로 섞이고 상호 반응하며 그 최종 결과를 듣게 된다. 반면에 이어폰으로 들으면 경로와 간섭이라는 변수들이 제거되기 때문에 Left 이어폰에서 나오는 소리가 오른쪽 귀로 진입할 수 없다. 전혀 다른 결과를 듣게 되는 셈이다. 그리고 사운드 재생의 공간이 사라지기 때문에 미세한 패닝 조정도 더 잘 느끼게 되는데 이렇게 되면 패닝을 조금만 해도 위치변화가 잘 들리고 결과적으로 패닝이 필요 이상 소극적이게 될 수 있다. 다시 말하면, 스피커 믹싱에 비해 좌우 이미지가 좁은 믹스가 될 가능성이 높아진다. 이런 이유 때문에 스피커 믹싱에서도 양 스피커 사이의 거리(또는 각도)에 따라 믹스의 스테레오 이미지가 과하게 넓어질수도, 필요 이상 좁아질 수도 있게 되는 것이다. 이어폰 재생은 스피커를 양 귀 옆으로 옮겨놓은 것과 같은 극단적으로 넓은 재생환경과 흡사하다. 

[아주 좁은 스피커 배치 + 룸 반사 = 패닝을 과하게 넓게 쓰게 된다. 리버브를 많이 쓰게 된다.]
[너무 넓은 스피커 배치 + 룸 반사 = 패닝을 너무 소심하게 하게 된다. 리버브를 조금만 쓰게 된다.]
[극단적인 스피커 배치 + 룸 반사 없음 = 이어폰 (?)]

2. 음상의 위치는 두 음원(스피커는 좌/우 두개의 음원이다. 이어폰 역시 좌/우 두개의 음원이다)에서 나오는 울림이 우리 뇌를 조정하여 특정 소리가 어떤 방향에 위치해 있다고 알려주는 정보의 결과이다. 이 점에서 스피커는 우리가 너무도 자연스럽게 받아들일 수 있는 환경을 제공한다. 우리가 태어나서 다시 죽을 때 까지 듣는 모든 소리는 우리의 머리 밖에서 발생하며, 대부분은 우리 몸 밖에서 발생한다. 특히 우리가 집중해서 중요한 소리를 들을 때는 소리나는 쪽을 바라보게 되는데, 이로 인해 중요한 소리는 앞에서 나에게로 다가오는 음상을 형성한다. 우리 몸 속에서 나는 소리라 할 지라도 하품하는 소리, 배가 고파 나는 꼬르륵 소리 등 모든 소리는 뇌보다 아래쪽인 몸통 어딘가에서 난다는 것을 우리는 알고 있다. 그런데, 언제인가 인간이 이어폰을 발명한 이후로 ....

[전면 앞에 맺히는 음상]
[머리 안에 맺히는 음상]

조상들이 경험하지 못한 신기한 사건이 벌어진다. 소리가 머리 속에 생기는 것이다. 사운드를 만들어 가는 믹싱은 악기들의 위치와 공간을 만들어 나가는 작업이다. 스피커를 쓰던 이어폰을 쓰던 나름의 기준에서 위치와 공간을 잘 만들어 나가면 된다. 다만, 스피커가 제공하는 위치와 공간 그리고 이어폰이 제공하는 위치와 공간이 전혀 다르다는 것에 대한 이해는 반드시 필요하다. 

 

3. 고막의 진동은 매우 비선형적이다. 0dB 에 가까운 작은 소리에도 진동하지만 천만배 큰 압력인 140dB 의 소리에도 진동한다. 그런데 진동하는 폭이 압력에 비례해서 커진다면 매우 곤란한 일이 생긴다. 0dB 소리에 1 만큼 진동했다면, 140dB 소리에는 140 만큼 진동해야 할텐데 그러자면 고막의 탄력이 대단히 유연함은 물론 우리 귀가 장착된 머리의 크기도 몇 미터쯤 되어야 한다. 

[청각이 선형적이라면, 고막의 움직임을 감당할 수 있는가]

실제로 10dB 에 대한 고막의 진동폭과 130dB 에 대한 고막의 진동폭은 별 차이가 없다. 그리고 매우 큰소리에 대해서는 고막 이후의 전달계통인 이소골과 달팽이관 청신경의 움직임이 적절한 선에서 멈추는 일종의 컴프레션이 동작하기 때문에 우리는 몇 차례의 클럽 출입과 콘서트 방문 뒤에도 청력을 유지할 수 있다. (하지만 아무리 클럽이 좋아도 매일 반복된다면 곤란하다. 큰 소리에 충격받은 청신경이 회복되기 전에 또 충격을 주는 것이 반복되면 만성 청각 장애에 이른다.) 외부로 부터의 소리는 우리 귀에 진입하는 과정에서 적절한 수준으로 진동에너지의 컴프레션이 발생하며 귀에서는 2차의 컴프레션이 적용되지만, 이어폰으로 귀에 직접 발사하는 경우는 귀에서 더 강한 컴프레션을 적용하게 된다. 그 결과, 작은 소리와 큰 소리의 차이에 대한 구별이 한결 어려워진다. 실제로는 매우 큰 소리이지만 적절한 수준으로 감쇄시켜 인식하기 때문에 그 크기의 심각성을 객관적으로 느끼기 어려워 진다. 마찬가지로, 믹서 (로직이나 큐베이스 믹서창의 믹서 말이다) 채널이나 버스에서 컴프레션을 과하게 써도 그것이 과하게 눌린 소리인지, 내 귀가 컴프레스 한것인지 명확히 구분하기가 어렵다. 

결국 믹싱에서 크기 밸런스 잡기가 어렵고 컴프레션 양 조절하기가 어렵다. 무서운 일이다. 

 

4. 어떤 소리든 귀의 외이도를 지나면서 실제보다 2~3kHz 주변이 증폭되어 뇌에 입력된다. 플렛처와 먼슨의 등청감곡선을 보면 우리가 가장 민감하게 잘 들을 수 있는 구간이 그 쪽인데, 외이도에서 그 구간을 증폭시켜 주는 덕분이다. 그런데, 실제보다 중역대가 증폭된 소리가 실제소리가 아니냐 하면 그렇지는 않다. 어차피 우리가 듣는 소리가 그렇게 증폭되어 인식되므로 원래 그런 소리다 라고 하는것이 맞다. 내가 들을 때 그것이 소리이지, 내가 듣지 않는 소리가 무슨 의미가 있을까.

다만, 귓 속에 꽂아 넣는 커널 타입의 이어폰은 외이도 구간을 상당히 생략해 버리게 된다. 귀를 덮는 헤드폰이 HRTF 와 귓불의 영향을 생략해 버린다면, 귀에 꽂는 이어폰은 거기에 외이도의 역할 까지 생략해 버리는 셈이다. 이래도 이어폰이 그저 휴대용 스피커라고 할 것인가.

등청감 곡선에서 인간의 최 민감 대역을 밝힌것은 인간이 위험한 동물과 자연의 소리를 잘 들어서 생명을 연장시키고, 아이의 울음소리를 잘 들어서 종족 보존을 잘 하게끔 진화되었음을 증명하는 것이다. 음악 믹싱은 그보다 훨씬 이후에 등장했기 때문에 우리는 중역대에 대부분의 중요한 악기소리를 몰아넣게 되었다. 중역대의 크고 작음을 제대로 판단하지 못하는 것은 곧 믹싱의 실패로 이어진다. 혹시라도, 이어폰으로 믹싱하면 실패한다고 오해하면 곤란하다. 거듭 말하지만, 이어폰만으로 믹싱하고 끝낼 수 없는 이유를 설명하는 중이다.

 사실, 귀에 직접 착용하는 이어폰의 설계에는 외이도공진을 대신하여 중역대를 증폭시켜 주는 패시브 회로를 포함한다. (물론 초저가 이어폰에서는 기대하기 어려운 기능이다.) 하지만 공장에서 일률적으로 조작된 공진주파수 특성이 내 귀의 선천적 특성과 어느정도 맞아 떨어질 지는 미지수이다. 

 

채승균

댓글