0. 들어가며
- 이 글은 이론적 배경에 관한 글로 구체적인 연습 방법은 다루지 않아.
- 최대한 수식은 배제하고 단순화했지만, 혹시 어려운 부분이 있다면 댓글로 질문 남겨줘.
- 음성학과 관련한 내용은 전공 분야가 아닌 관계로 다소 부정확할 수 있지만 너그러이 이해해주기 바래.
1. 기본 진동수
모든 물체는 가지고 있는 물리적 특성에 따라 특정한 주기로 진동을 해. 이것을 물체의 고유 진동수(Natural frequency 또는 Eigen frequency)라고 함. 예를 들어 양 끝이 고정된 줄을 생각해볼게. 양쪽 끝은 움직일 수 없기 때문에 아래 그림처럼 진동할 수 있는 모양이 제한적이야.
이때 가장 느리게 진동할 때의 진동수를 기본 진동수(Fundamental frequency)라 하고, 다음과 같은 방법으로 구할 수 있어.
여기서 L은 줄의 길이고, T는 줄의 팽팽한 정도를 나타내는 장력이야. 그리고 μ는 밀도인데, 쉽게 얘기해서 줄의 굵기를 생각하면 돼. 같은 재질일 때 굵은 줄이 얇은 줄보다 밀도가 더 높아. 따라서 고정된 줄의 경우 기본 진동수는 길이가 짧고, 팽팽하고, 굵기가 얇을 수록 더 커지게 돼. 그리고 진동수가 클수록 공기를 통해 우리 귀로 진동이 전달될 때 더 높은 소리로 들려.
기본 진동수 보다 빠른 진동을 고조파(Harmonics) 또는 배음(Overtones)이라고 해. 배음은 기본 진동수의 정수배의 크기를 가져. 예를 들어 기본 진동수가 100Hz면 배음은 200Hz, 300Hz, 400Hz가 되는 거야. 배음에 대해서는 나중에 더 자세하게 설명하도록 하고 우선은 성대의 구조에 대해서 살펴볼게.
2. 성대
성대(Vocal folds 또는 Vocal cords)는 후두(Larynx)에 위치한 점막으로 된 조직이야. 그림과 같이 평소에 숨 쉴 때는 열려있다가 말하거나 노래할 때는 닫히게 돼. 이때 마치 줄처럼 진동하는 것을 볼 수가 있어. 저 진동하는 부위가 여자는 1.25~1.75cm인데, 남자는 1.75~2.25cm로 더 길고 굵기도 더 굵어. 그래서 위에서 본 것처럼 근육의 힘으로 같은 세기만큼 성대를 팽팽하게 당겨도 남자가 여자보다 더 기본 진동수가 낮기 때문에 낮은 소리가 날 수 밖에 없어.
그래서 수술 없이 피치를 높이려면 윤상갑상근이란 근육을 이용해서 성대를 최대한 얇고 팽팽하게 펴줘야 돼. 그런데 안타깝게도 이 근육은 내 맘대로 움직일 수 없는 불수의 근이라 단련이 쉽지가 않다는게 문제야. 누구나 가수처럼 쉽게 고음을 내지 못하는 이유가 바로 여기에 있어.
수술의 경우는 성대의 길이, 굵기, 장력을 변화시켜서 기본 진동수를 높이는 원리라고 보면 돼. 길이를 줄이기 위해 1/3 정도를 실로 묶어서 고정시키고, 나머지 부분도 다듬어서 얇게 만들어. 그리고 실로 더 팽팽하게 당겨서 갑상연골에 묶어두는 거야. 그렇게 해서 편하게 발성할 때 성대의 기본 진동수가 180Hz 이상이 되도록 만들어주는게 음성여성화수술(Vocal Feminization Surgery, VFS)이야.
3. 배음
위에서 물체가 진동할 때 기본 진동수 외에도 배음이 존재한다고 얘기했지? 실제 진동에서는 기본 진동수 뿐만 아니라 그보다 높은 진동수의 배음이 함께 섞여 있어. 그래서 귀에 전달될 때도 높은 진동수의 소리가 함께 들리게 돼. 예를들어 220Hz의 진동이 있을 때 기본 진동수만 있다면 아주 단조로운 소리가 날거야.
여기에 배음이 더해지면 소리의 톤이 달라지게 돼.
들어보면 소리가 더 풍부해진 것을 느낄 수 있을거야. 그런데 혹시 오른쪽과 왼쪽 소리의 차이가 느껴져? 두 소리가 차이가 나는 이유는 배음의 강도가 다르기 때문이야. 오른쪽의 경우 왼쪽 보다 높은 진동수의 배음이 더 강하게 들어가 있어. 그래서 상대적으로 가볍고 밝은 톤의 소리가 나게 돼. 반면 왼쪽은 낮은 진동수의 배음 비중이 높기 때문에 무겁고 어두운 톤의 소리가 나게 돼.
그래프로 보면 차이가 좀 더 직관적으로 보여지지? 이처럼 소리를 여러 진동수로 분해해서 각각의 세기를 구하는 것을 어려운 말로 푸리에 변환(Fourier transform)이라고 해. 푸리에 변환을 하는 이유는 여러 진동수의 소리가 합쳐진 상태 보다 더 유용한 정보를 얻을 수 있기 때문이야. 실제로 이 경우에도 진동수 별로 나눠서 보니까 톤의 차이가 어디에서 기인하는지 직관적으로 알 수 있었어.
푸리에 변환은 어느 한 순간의 배음 구성을 보여주는 거야. 위의 경우는 기계적으로 만들어낸 소리라 배음 구성이 변하지 않고 일정하지만, 실제 말을 할 때는 성대에서 만들어 낸 기본 진동수가 같더라도 호흡의 세기나 발음에 따라 시시각각 변하게 돼. 그래서 음성 분석을 할 때는 매 순간 순간 푸리에 변환을 한 결과를 쭉 이어서 스펙트로그램(Spectrogram)이란 그래프를 그리게 돼.
스펙트로그램에서 밝기는 세기를 의미해. 그래서 위에서 만든 소리의 경우 220Hz의 기본 진동수가 가장 밝고 그 보다 진동수가 큰 배음은 점점 어두워 지는 것을 볼 수 있어. 이해가 잘 안되는 사람은 위에서 그린 푸리에 변환 그래프를 0초, 0.1초, 0.2, ..., 3초 이렇게 시간에 따라 쭉 이어 붙였다고 생각하면 돼. 이렇게 스펙트로그램을 그려보면 남목과 여목을 오갈 때 배음 구성이 어떻게 달라지는지 시각적으로 나타낼 수 있어.
TransVoiceLessons의 Zheanna님이 올리신 영상이야. 영상의 스펙트로그램을 보면 기본 진동수, 즉, 음의 높이를 일정하게 유지한 상태에서 남목과 여목을 낼 때 배음의 구성이 어떻게 달라지는지 쉽게 확인이 가능해. 위에서 기계적으로 만든 소리의 경우와 마찬가지로 어둡고 두꺼운 톤의 소리를 낼 때는 낮은 진동수의 배음만 밝게 보이다가, 밝고 얇은 톤으로 바뀔수록 점차 높은 진동수의 배음이 밝아지는 것이 보이지? 그래서 여성으로 인식되는 목소리를 내려면 기본 진동수 뿐만 아니라 배음의 구성도 바뀌어야 해.
배음의 구성은 성대를 어떻게 접촉하느냐에 따라서도 달라질 뿐만 아니라, 만들어진 소리가 후두와 입 안에서 어떻게 울리는가에 따라서도 달라져. 그리고 이건 수술을 통해 바꿀 수가 없기 때문에 타고나지 않다면 연습을 통해 극복하는 수 밖에 없어. 특히 후두와 입 안 공간은 성대에서 만들어진 소리를 증폭하는 스피커에 해당하기 때문에 중요해. 음악을 들을 때 저음을 증폭해주는 헤드셋이 있는가 하면, 고음을 증폭해주는 헤드셋도 있잖아? 마찬가지로 후두와 입 안 공간의 사이즈와 모양에 따라 낮은 진동수의 배음을 강화하기도 하고 높은 진동수의 배음을 강화하기도 해.
성대 접촉의 경우에는 위 영상을 참조하면 이해하는데 도움이 될거야. 위에서는 성대를 고정된 줄의 경우처럼 1차원적인 진동으로만 생각했는데, 실제로는 두께가 있어서 위 아래로도 움직이면서 진동을 해. 그런데 이 두께도 남여의 구조적인 차이가 있어. 그래서 성대 전체를 두껍게 접촉하지 않고 윗부분만 얇게 접촉해서 만들어지는 소리의 배음 구성 자체를 바꿔줄 필요가 있어.
4. 마치며
내용이 길어지면 인지 과부하가 올 수도 있으니 설명은 이정도로 마칠게. 이 모든 것들이 다 독립적으로 움직이는 것이 아니다 보니 이론을 안다고 해서 여목이 되는 것은 아니야. 당장 나부터도 수술 이후로 적합한 톤을 찾기 위해 연습 중인데 쉽지가 않아. 그렇지만 아무것도 모르고 무작정 연습하는 것 보다는 이론을 알고서 방향성을 가지고 연습하는 것이 조금이라도 시행착오를 줄이는데 도움이 될거라 생각해.
우리 모두 예쁜 목소리를 위해 화이팅하자! >_<