오디오가이 :: 디지털처럼 정확하고 아날로그처럼 따뜻한 사람들
플러그인

서라운드 오디오 칼럼 3-1 [심리음향 1 - 2008.02. Update]

페이지 정보

본문

서라운드 오디오뿐 아니라 2채널 스테레오 및 1채널 스테레오에 있어서 사운드 엔지니어가 잊지말아야 할 점은 바로 어떠한 영역에서든지 사운드 엔지니어들이 다루어야 하는 대상은 바로 '사람'이라는 점입니다.

우리들이 만들고 가공하는 소리는 사람이 듣기 위한 것이지
저멀리 우주에 살고 있으리라 생각되는 외계인이나 물속 깊은 곳으로 쏘는 탐사용 신호가 아니라는 점입니다.

사람으로 듣는다는 행위를 할때 생기는 뇌의 반응과 그에 따르는 심리적인 인식을, 그리고 그 인식에 대한 연구를 흔히 '심리음향[psychoacoustic]'이라고 합니다.

여러분들도 잘 알고계신 몇가지 예가 있습니다.
주파수와 핏치[pitch-음정?이라고 번역할수 있을까요?]
그리고
레벨과 크기의 상관관계입니다.

하나의 음원이 가지는 주파수와 레벨은 물리적인 데이타입니다.
하나의 음원이 발생하게 되면 그 주기에 따르는 주파수와 진폭에 따르는 레벨이 생기기 마련입니다.

하지만 사람이 인식하는 음의 높낮이인 핏치[pitch]는 절대적인 주파수와는 별개인 주관적인 데이타입니다.
피아노의 C4는 262Hz로 알려져있지만 실제로 피아노의 '도'라는 pitch는 여러개의 배음으로 구성된 복합적인 현상을 우리의 뇌가 '도'라고 인식하는 것입니다.

레벨(level)과 음의 크기(loudness) 또한 비슷한 관계입니다.
컴프레서를 잘 다루고 또 연구해보신 분들이라면 이 두가지 차이가 얼마나 큰 것인지 잘 이해하고 계시리라 생각이 됩니다. 음의 절대적인-물리적인 레벨이 커도 작게 들리는 소리가 있는 가 하면 레벨이 적어도 크게 들리는 소리가 있습니다.

30Hz의 소리가 90dBu로 재생된다고 하더라고 3kHz의 소리가 80dBu로 재생되는 것보다 '크게'들리지는 않습니다.
플렛쳐-몬슨 커브가 만들어진 원리도 이러한 심리음향에 기초한 것입니다.

이러한 고전적인 심리음향의 영역에서 한걸음 더 내딛어
최근에는 Sound Reproduction시 사람이 느끼는 심리음향에 대한 연구가 활발히 진행되어 왔습니다. 이러한 영역은 소위 spatial characteristics, spatial impressions 혹은 spatial attributes등과 같은 심리음향과 관련한 변수들을 연구함으로서 보다 더 나은 Sound Reproduction시스템 혹은 환경을 구현하는데 도움을 주고자 합니다.

앞에서 언급한 플렛쳐-몬슨 커브를 통해서 어느정도 크기[loudness]와 레벨의 연결이 가능해진 것 처럼 다양한 심리음향적인 속성들을 어떻게 컨트롤 할 수 있는지를 연구하는 것이지요.

말을 쓰다보니까 어려워졌습니다만 간단한 예를 하나 들어보겠습니다.
녹음/재생되는 소리를 듣고서 우리들이 내리는 여러가지 평가가 있겠습니다만 그중에 '자연스러움[Natural]'이라는 항목이 있다고 생각해봅시다.
우리가 A라는 음악을 듣고
"음 이 음악은 약간 부자연스럽군"이라고 결론을 내렸다고 해보겠습니다.
만약 가상의 스윗치가 있어서 '자연스러움 증진기[Naturalness Enhancer]'라고 이름붙여지고 이 스윗치 혹은 페이더를 올리면 자연스러움이 증가되고 페이더를 내리면 자연스러움이 감소된다고 가정해봅시다.
생각만 해도 즐겁지 않으신가요? 만약 정말 가능만 하다면요.


이러한 장비를 구현해낼 수 있는 기반은 바로 사람이 어떻게 자연스러움을 인식하는 가를 연구하는 것입니다.
그렇기에 많은 연구소에서 이러한 분야에 인력과 자원을 투자하고 있습니다.

실제로 사운드/오디오 엔지니어로서 일한다는 것은 위와 같은 가상의 스윗치 혹은 기계를 가지지 않은채로 엔지니어 본인이 이제것의 경험과 지식을 바탕으로 해서 심리음향적으로 내리는 판단을 엔지니어가 활용할 수 있는 기계들에게 알아들을 수 있게 객관적으로 명령을 내리는 행위라고 볼 수 있습니다.
예를 들어 소리가 너무 밝다라고 인식하면 EQ를 이용해서 고주파수대역을 약간 컷트 시켜줄 수 있을 것이고 혹은 녹음단계에서 마이크를 바꾸어준다든지 등의 일정한 '대응'을 할것입니다.

B&O의 Soren Back, Nokia의 Nick Zacharov, NASA의 Durand Begault, Surrey University의 Fransis Rumsey, McGill University의 William Martens 그리고 그외에도 수많은 기관과 개인들이 이러한 분야에 관해 연구하고 있습니다. 그중 F. Rumsey가 1998년에 발표한 "Subjective Assessment of the spatial attributes of reproduced sound"는 기존의 연구와 Rumsey자신의 연구가 잘 요약된 좋은 참고 논문이라고 생각됩니다. 더 깊이 알기 원하시는 분들은 읽어보시면 크게 도움이 될것 같습니다.

서라운드 오디오 칼럼에서 이토록 긴 지면을 할애해서 심리음향에 관계된 얘기를 하게 된것은 이러한 심리음향의 attributes들을 서라운드 오디오를 통해서 보다 용이하게 컨트롤 할 수 있게 되었기 때문입니다.


다시 요약하자면, 심리음향은 물리음향이나 건축음향의 파라미터들이 사람의 귀를 거치고 나서 어떻게 인식되는가하는 것을 "관찰"하고
그 관찰된 값들안에 일정한 법칙이 있는지를 "모델화"하는 작업이라고 말할 수 있을 것 같습니다.

우리에게 가장 일반적이고 잘 알려진 것은 아마도 음의 "심리적인 크기"인 Loudness일 것 입니다.
2kHz의 중음과 80Hz저음을 스피커를 통해 재생한다고 해보겠습니다. 물리적으로 같은 레벨이라고 해도 80Hz의 음원은 그렇게 크게 들리지 않습니다.

80Hz의 음원이 2kHz와 같은 크기의 소리로 들릴려면 몇배이상의 물리적 레벨로 재생해야만 합니다.

이런식으로 관찰되는 현상에 대한 데이터들을 종합하여 가능한 모델로 만들어내어서, 관찰되는 현상에 국한 시키지 않고 예측가능한 모델로 만드는 것이
오늘날 심리음향의 연구의 대부분을 차지 하고 있습니다.

심리음향의 책의 성서라고 할 수 있는 Psychoacoustics (Zwicker and Fastl, Springer)의 부재인 Facts and Models 이 이러한 점을 잘 나타내주고 있습니다. 이 책에서도 각 챕터의 주제가 어떻게 관찰되는지 (Facts)를 설명한 후에 그 facts를 어떻게 model화할 것인지에 대해 답을 주고 있습니다.


여러분이 잘 아시는 MP3와 같은 압축기법은 심리음향에 기초하고 있습니다. 잘 아시겠지만
쉽게 얘기하자면 "인식되지 않는 소리는 잘라내어버린다"는 것이죠. 내 귀에 들리지 않으니 정보로서의 가치가 없다는 것입니다.

심리음향의 고전적인 연구는 "어떤 소리가 인식되지 않는가"에 대답하기 위해서 주로 "Masking"이라는 부분에 대해서 중점적으로 연구되어왔습니다.

현재는 이 심리음향의 연구는, 특별히 오디오와 연계되어서, unidimensional한 attribute control을 위한 모델 개발을 위해서 많이 사용되고 있습니다.

여기서 첫째 unidimensional이라 함은 모델이 변환하는 값이 여러 특성을 동시에 변화시키지 아니하고 오직 하나의 목표하는 특성만을 컨트롤하는 것을 의미합니다. 예를 들어 음원의 "밝기"를 컨트롤 하는 심리음향적 컨트롤 모델이 개발되었다고 해보겠습니다. 이 모델을 통해서 음을 밝아지게 했을 때 만약 동시에 다른 특성이 같이 변한다면, 예를 들어 소리의 심리적 크기까지 커졌다고 한다면, 이 모델은 unidimensional이라고 할 수 없으며 음원이 심리적 크기인 loudness의 증가로 인해 밝아졌는지 아니면, 밝기만이 증가되었는지를 판단할 수 없게 됨으로, 심리음향의 모델로는 부적격하게 됩니다.

그렇다면 수많은 attributes들 중에서 서라운드 오디오에 있어서 중요한 것은 무엇일까요?

아무래도 스테레오에서 보다는 음색이나 timbre 에 관련된 특징들 보다는 공간감에 관련한 spatial attribute들이 더 특징적으로 나타나는 것 같습니다. (그야말로 다 채널 오디오가 가지는 특징이라고도 할 수 있겠죠)

이러한 공간감에 관련되어서는 "건축음향"등에서 부터 고전적으로 중요하게 여겨온 두가지 특징이 있는데요, 그 두 attributes들이 서라운드 오디오에서도 중요하게 여겨지는 요소가 됩니다.

바로 음원의 넓이Auditory Source Width (ASW)와 Envelopment(LEV)입니다.

Envelopment는 번역하기가 쉽지 않아 원어를 그대로 사용하도록 하겠습니다.

앞으로 이 두가지 ASW와 LEV에 대해서 한번 더 심도있게 알아보도록 하겠습니다.

관련자료

SonicJungle님의 댓글

pitch는 음고(음의 높이)라 번역되고 음정은 interval (두 음 사이의 간격)로 번역됩니다. ^-^
서라운드 오디오 칼럼 시리즈물 잘 읽고 있어요. 덕분에 많은 도움이 되고 있습니다.
고맙습니다.
  • RSS
전체 72건 / 2페이지

+ 뉴스


+ 최근글


+ 새댓글


통계


  • 현재 접속자 244 명
  • 오늘 방문자 1,674 명
  • 어제 방문자 4,597 명
  • 최대 방문자 15,631 명
  • 전체 방문자 12,679,178 명
  • 오늘 가입자 0 명
  • 어제 가입자 0 명
  • 전체 회원수 37,533 명
  • 전체 게시물 249,732 개
  • 전체 댓글수 193,365 개