2주동안 목상태가 메롱이라 연습 대신 적어보는 뻘지식 2탄
지난 이야기 : https://arca.live/b/transgender/127544894
<Review>
1. 고유진동수 : 물체가 자연스럽게 진동 가능한 진동수
2. ( A ) : 고유진동수 중에서 가장 작은 값
3. ( B ) : A 보다 큰 고유진동수로 A의 정수배(2A, 3A, 4A, ...)
4. A는 성대가 얇고 팽팽할수록, 그리고 길이가 ( C ) 커진다.
5. 푸리에 변환 : 소리를 여러 진동수로 분해하여 각각의 세기를 구하는 것
6. 스펙트로그램 : 매 순간 푸리에 변환한 결과를 시간에 따라 이어 붙인 그래프
정답 : (A) 기본진동수 (B) 배음 (C) 짧을수록
0. 들어가며
- 이 글은 연습 방법이 아닌 이론적 배경을 다룸
- 최대한 수식은 배제하고 풀어서 설명했어
- 관련 논문이나 자료를 이해하는데 도움이 되길 바래
1. 공명
지난 번에 설명한 것처럼 모든 물체는 물리적 특성에 따라 잘 진동할 수 있는 고유진동수가 있어. 따라서 외부에서 어떤 진동이 전달됐을 때 고유진동수에 가까울수록 물체는 크게 진동하게 돼. 이것을 공명(Resonance) 이라고 함. 어렸을 때 탔던 그네를 생각하면 금방 이해될거야. 그네가 왕복하는 주기에 맞춰서 밀어주면 점점 더 높이 올라가는게 바로 공명임.
그네의 고유진동수는 줄의 길이, 무게, 그리고 탄성 등에 의해 정해지는데, 다른 특성이 동일하다면 길이가 길수록 고유진동수가 느려져. 아마 다들 그네 줄 감아서 탔을 때 경험적으로 느껴봤을 거야. 그네 줄은 1차원에 가깝긴 하지만, 납작한 물체나 부피가 있는 물체도 매커니즘은 같아. 진동이 전달되는 방향으로 물체의 길이가 길수록 고유진동수가 작아져서 더 느린 진동에 공명함. 아래 영상을 보면 진동이 빨라질수록 오른쪽의 가장 길쭉한 물체부터 순차적으로 공명이 일어나는 것을 확인할 수 있어.
악기의 경우도 마찬가지야. 현악기는 현에서 발생한 진동을 몸통에서 공명하여 소리를 내는데, 음역에 따라 악기의 사이즈에 차이가 나는 것을 알 수 있어. 음역이 높은 바이올린의 경우 고유진동수가 커야 하기 때문에, 소리를 발생시키는 현의 길이가 짧고 공명하는 몸통의 사이즈도 작아. 반면에 콘트라베이스의 경우 낮은 음역을 담당하기 때문에 현의 길이가 길고 몸통이 큼.
또한 사람의 귀는 아주 고성능의 푸리에 변환 기계인데, 이때 사용되는 매커니즘도 공명이야. 외부에서 귀로 소리가 들어가면 고막을 통해 진동이 달팽이관(Cochlea)으로 전달되거든? 그런데 이 달팽이 관을 펼쳐보면 그랜드 피아노 마냥 두께가 일정하지 않고 점점 굵어져. 그래서 얇은 곳은 높은 음에 공명하여 진동하고, 두꺼운 곳은 낮은 음에 공명하여 진동해. 그리고 이게 표면에 털처럼 나있는 섬모를 자극하여 뇌로 신호를 전달해서 소리를 인식하는 거야. 아무리 많은 화음이 섞여 있어도 달팽이관의 각각 다른 부분이 자극되어 신호를 보내기 때문에 뇌는 푸리에 변환 마냥 소리를 진동수 별로 분해하여 인식할 수 있어. 우리가 절대음감이라고 부르는 사람들은 이러한 감각이 극도로 발달한 경우에 해당 돼.
참고로 저 섬모는 한번 손상되면 회복이 불가능해. 그래서 나이가 먹어가면서 자연스럽게 들을 수 있는 소리의 영역이 줄어들게 됨. 특히 큰 소리에 오랫동안 노출됐을 때 손상이 심하게 올 수 있으니까, 이어폰 낄 땐 항상 볼륨을 줄여주자. 달팽이관 진짜 진짜 소중히 여겨야 돼.
2. 성도
악기와 비슷하게 사람의 목소리는 성대에서 발생한 소리가 공명하여 만들어지는 거야. 이때 악기의 몸통에 해당하는 공명이 일어나는 공간을 성도(Vocal tract) 라고 불러. 성도는 성대 사이의 성문(Glottis)에서 부터 입에 이르는 구부러진 파이프처럼 생긴 공간이야. 코 위쪽으로도 빈 공간이 있어서 노래할 때 사용하기도 하지만, 말을 할 때는 주로 이 공간을 사용하여 공명을 하게 돼. 2차 성징 이전까지는 남자나 여자나 성도의 길이가 비슷하지만, 성인이 되면 아래 그래프처럼 차이가 발생하게 됨. 그래프에서 세로축은 기본진동수, 가로축은 성도의 길이(Vocal Track Length, VTL)를 나타내고, 빨간색 숫자는 여성, 파란색 숫자는 남성 화자를 의미해. 여기서 성인 남자의 경우 17~18cm, 여자의 경우 14.5~15cm 정도의 성도 길이를 갖게 되는 것을 알 수 있어(Barreda & Predeck, 2024).
그래프 출처 : https://doi.org/10.1016/j.wocn.2023.101290
따라서 위에서 살펴본 것처럼 길이가 긴 남성의 성도는 고유진동수가 작기 때문에 상대적으로 낮은 소리에 공명하게 됨. 이로 인해 성대에서 똑같이 기본진동수 200Hz의 소리가 발생하더라도, 여성에 비해 상대적으로 낮은 진동수의 배음에 공명하게 되어 톤 차이가 나는거야. 이전 글에서 살펴 본 것처럼 낮은 진동수의 배음 성분이 강하면 무겁고 어두운 톤의 소리가 만들어짐.
3. 포먼트
성도는 수술이 불가능한 기관이야. 그래서 음성여성화 수술을 받더라도 성도의 사이즈는 그대로 임. 마치 첼로의 몸통은 그대로 두고 줄만 바이올린 마냥 짧고 팽팽하게 만들어 둔 상태를 생각하면 돼. 이 상태에서 아무리 줄을 켠들 바이올린 소리를 흉내 낼 순 없어. 다행인 건 첼로는 몸통을 갈아 끼우지 않는 한 공명하는 진동수를 바꾸는 게 불가능하지만, 사람은 어느 정도 범위 내에서 성도의 모양을 변화시켜 고유진동수를 바꿀 수 있다는 거야.
사실 우리는 이미 평생에 걸쳐서 그러한 훈련을 해 왔어. 말할 때 모음이라고 부르는 것이 바로 그것이야. 우리는 특정한 모음을 발음하기 위해 혀의 모양을 바꿔주게 되는데, 이때 성대 위쪽의 목 공간인 인두강과 입 안쪽 공간인 구강의 사이즈가 바뀌면서 고유진동수가 변하게 돼. 오른쪽의 스펙트로그램은 모음에 따라 성도가 어떤 진동수의 소리에 공명하는 지를 보여주고 있는데 이것을 음성학에서는 포먼트(Formant)라고 불러. 그리고 포먼트의 첫글자 F를 따서 성도의 고유진동수를 가장 낮은 것부터 F1, F2, F3, ... 이런식으로 표기함. 이와 더불어 첫글자가 동일한 기본진동수는 보통 F0 라고 표기해.
포먼트, 즉, 성도의 고유진동수가 어떤 간격으로 이루어져 있는지는 우리 귀에서 말을 인식하는 것 뿐만이 아니라 성별을 구별하는데 핵심적인 역할을 해. 위에서 살펴본 것 처럼 달팽이관은 푸리에 변환 마냥 어떤 진동수의 소리가 강하게 나는 지를 구별할 수 있기 때문이야. 아래 표는 30대 초반 한국인 화자의 모음 발음 별 포먼트를 비교한 결과야(Igeta & Arai, 2011). 한국인을 대상으로 한 연구가 많지 않고 이 연구도 여성 지원자의 경우 3명에 불과하지만 그래도 대략적인 차이는 확인할 수 있을거야. 보면 모든 발음에 있어서 여성의 포먼트는 남성의 포먼트 보다 진동수가 더 높아.
미국인을 대상으로 한 연구를 보면 좀 더 확실하게 알 수가 있어. 아래 표는 성별 및 연령대 별로 각각 10명의 화자의 포먼트 평균을 측정하여 비교한 결과야(Huber et al., 1999). 편안한(comfortable) 크기로 발성했을 때를 기준으로 12세 까지는 남녀가 거의 비슷하다가 14세 무렵부터 피치 뿐만 아니라 포먼트가 크게 차이 나기 시작하는게 보일거야. 따라서 자연스러운 여목을 하려면 피치 뿐만 아니라 포먼트를 여성 수준으로 높여줘야만 해. 그리고 이것을 달성하기 위한 방법이 바로 후두 올리기와 목 조이기 그리고 입 공간 줄이기 등이야.
출처 : http://dx.doi.org/10.1121/1.427150
문제는 성대의 경우와 마찬가지로 성도 역시 마음대로 움직여지지 않는다는 거야. 우리가 처음 말을 배울 때 귀로 듣고 그것을 입으로 발음해보면서 조금씩 튜닝해 나갔듯이, 포먼트 역시 달팽이관의 푸리에 변환 능력에 의존하여 모음 하나하나 감각을 찾아갈 수 밖에 없는 것 같아. 말을 배우는데 년 단위로 시간이 걸리듯이 이것 역시 사람에 따라 정말 오랜 시간이 소요될 수 있어. 그렇기 때문에 음성여성화 수술 계획이 있더라도 포먼트 연습은 미리미리 시작하는 것을 추천해.
비록 말할 때와 노래할 때 피치나 공명이 다르긴 하지만, 아래 영상처럼 노래하는 톤에 따라 MRI 상으로 성도가 어떻게 달라지는가를 비교해 보는 것도 연습하는데 있어 어떤 영감을 줄 수 있을 것 같아. 영상에서는 미성(light mix), 뮤지컬(forward), 성악, 락의 4가지 톤으로 노래하는데, 우리가 추구해야 할 건 미성의 경우 처럼 인두강과 구강이 자연스럽게 줄어든 성도의 모양이지 않을까. 다음 번에 기회가 된다면 음원을 따서 스펙트로그램을 비교해 보도록 할게.
4. 마치며
내용이 길어졌는데 결국 핵심은 성대에서 발생한 소리의 기본진동수 뿐만 아니라 성도의 포먼트에 의해 공명하는 배음이 음성여성화를 달성하는데 아주 중요하다는 거야. 성도의 길이에 대한 그래프를 보면 알겠지만, 생각 보다 남녀 간에 겹치는 구간이 없이 차이가 두드러지기 때문에 어쩌면 포먼트는 남녀를 구별하는데 피치 보다 더 중요한 요소일 수 있어. 실제로 인공지능이 목소리를 통해 남녀를 구별할 때도 포먼트 차이를 이용함. 마지막으로 연습 동기부여가 될 수 있는 영상을 하나 첨부할게.
트부이들 모두 빠이팅이얌!
+ 원래 성구 전환과 성대 접지 등 성대에서 만들어지는 소리에 대해 좀 더 자세하게 알아볼까 했는데, 물리적인 설명이 계속 업데이트 되고 있기도 하고, 개인적인 이해도 아직 부족해서 다음 번에 기회가 되면 3편에서 다뤄보도록 할게ㅋㅋㅋ 언제가 될진 모르겠지만..ㅠ
++ 맥의 경우에는 포먼트를 실시간으로 측정할 수 있는 것 같던데 윈도우는 그런 프로그램이 없는 것 같아. 혹시 아는 것 있으면 댓글로 추천해 줘! 아니면 능력자 트붕이가 만들어줘도 고맙고ㅋㅋㅋ 그것도 아니면 개인적으로 시간될 때 천천히 스크립트 짜볼까 해ㅎㅎ