DTM、コンピューター音楽、デジタル音楽、ミックスに関する記事です。
今回は「上下と前後の定位」の話です。
私はこの領域については「本当に真剣に興味があるならやってみれば良いんじゃないかな?」「もう無意味だという結論になりつつあるけど。」という程度のものとしてしか扱っていません。
(picture: http://people.eku.edu/ritchisong/birdbrain2.html)
(2020年3月2日更新)
- ■上下と前後の定位は半分オカルト
- ■バイノーラルの限界
- ■前後・上下定位の原理と誤解
- ■上下に操作可能な音の種類
- ■前後定位(奥行き)
- ■上下・前後定位がオカルトである理由は個人差
- ■フクロウの耳の話
- ■テレビ、ラジオにおける違和感
- ■経時変化による立体音響効果
- ■相対性
- ■個人的な感覚
- ■オーオタ某人の話
- ■独創性と先進性?
- ■リスニングポジションの違いで破綻する
- ■目的が逆になってないですか?
- ■「DTMをやっていると突き当たるちょっと難しい単語の話」シリーズの過去記事
■上下と前後の定位は半分オカルト
この記事は上下定位はこうやってミックスするよ、という話ではありません。
「ステレオ2ch再生における前後定位と上下定位は半分オカルト」ですよ、という解説です。
「上下定位」は特にオカルト度が非常に高いです。
「前後定位」、奥行きのほとんどは単なる音量差です。もしくはリバーブのある音を「奥行き」と言っているケースがほとんどです。
・そもそも人間の耳は上下認知が弱い
なぜかと言うと、狙い通りの効果を的確に認知できる人と、製作者の意図通りに認知できない人がいるからです。
なぜ上下と前後の定位が的確に作用しないのかというと、人間の頭周辺の形状に『個人差』があるからです。
この結論については昔から多くの研究報告が出ており、意図した効果を発揮できていないよね、ということが定説になっています。って言っちゃって問題無いよねもう。
個人差があるのは
- 両方の耳の距離
- 耳たぶの形状
- 耳の穴の深さ
- 上半身の体格
- (細かい要素だと髪型)
という要素です。
人はそれらの要素によって音が微妙に変化することを脳が処理して「上下」を認識しています。
また、そもそも人間の耳(脳)は上下の音の分析が苦手な生物だということを忘れてはいけません。
・多スピーカーでは明確に定位する
明確な上下定位が再現できないのは「ステレオ2ch」の「疑似立体定位」の話です。
7.1chなど、多スピーカーを使用するサラウンドの場合には誰でも定位を感じ取ることができます。実際にその方向から鳴らしてるんですから、頭の向きを変えたら、それに連動して自分が使い慣れている耳たぶなども動くので、当然その方向から聞こえていると認識できます。
・前後定位
たとえば「この処理で音が前に出てくる」と説明される時、それは相対的に音量が大きく聞こえる処理をした時ですね。EQによる被り除去処理の結果、相対的に大きくなったトラックは「前に出た」というアレです。「前に出る」は便宜的な表現でしかありません。
音が大きく知覚されれば「前に出た」となるわけですから、当然ラウドネスカーブに基づいた聞こえやすい帯域を処理した場合にも「前に出た」と認知されます。
大きくすれば手前にあるように聞こえるのは当然です。
エンジニアが「前だ」「後ろだ」と言っている場合、その多くは単に「大きい」「小さい」でしかありません。
もうちょっと繊細は前後定位はコンプ等による音量変化やハイパス・ローパスフィルターによる特性によって表現できる、と主張する人が居ます。
が、的確に、慎重に処理されていないと、違和感のある音場になってしまいます。
音量が小さければ遠くに聞こえた気がするし、ハイを落とした曇った音なら遠くのような気がします。
でも、近くても小さい音はあるし、曇っている近い音もあります。
それらを差別的に設計することで「異質な音がいろいろある」と認識させることはできますが、それを遠近感だと直結するのは早計です。
ミックスにおいて「奥行きがある」というのは、「音が差別化されている」のであって、奥行きはありません。だって2chスピーカーですから距離感は作れません。ミックスの技術を説明する際に便宜的に「奥行き」と表しているだけです。
・表現の相対性
また、遠近感は相対的なものです。
他のトラックの処理とうまくすり合わせをしないといけません。
よくあるTIPSでは単一のトラックの音での実験で、「ね?近くに聞こえるでしょ?」的なものがあります。しかし、他のトラックとの相対性が丁寧に設計できていないと違和感のほうが強くなったり、サウンド全体がいびつなものになってしまいます。
繰り返しますが「奥行き」とは便宜的な言葉でしかありません。
・音量表現の方がはるかに強力
言うまでもなく音量が大きいと、それだけで圧倒的に近くの音だと感じるものです。
もしトラックごとのサウンドを差別化したいなら、単に音量を変えたほうが良いです。
・昔の遠近法メソッド
昔はリバーブが深くかかった音を「遠い音」という言葉で表現していました。
今となっては初心者でも知っているとおり、リバーブは音が伸びて位相が重なっているだけです。センターのメロに思い切りリバーブ掛けたら遠くなるなんてありえません。
絵画における「空気遠近法では色が浅くなる」というメソッドがあるからと言って、薄い色のすべてが遠くに感じるわけではないのと同じです。
同様に、コーラスエフェクトが強く掛かっている音を「遠い」と表現する人が多かった時代もあります。これもリバーブと同様で、単に位相が悪い音を「遠い」と表現していただけです。
リバーブやコーラスでサウンドを差別化した結果を「立体的なサウンド」と呼ぶ人もいます。
--------------------
■バイノーラルの限界
バイノーラルの音響処理にはいろいろあり、「これはバイノーラル音源です!」「ダミーヘッド録音です!」と謳われていても、気持ち悪いだけの音に感じることがあったはずです。
理由は上でも述べている通り人の頭のサイズなどに大きな個人差があるからです。
eki-docomokirai.hatenablog.com
上の記事の中で書いた「位相ズレによるステレオ感の演出」でダミーヘッドの話を踏まえた上で話を進めます。
ダミーヘッドの形状に近い頭と上半身の形状をしていれば、ほぼ狙い通りのサウンドを体験できます。
しかし、ダミーヘッドの形状と大きく異なる人はその効果を快適なものとして受け止めることができません。
そうした経緯から、ダミーヘッドや胸像付きマイクで録音したとしても、録音環境と聴く人の体型差によって、バイノーラルは正確さを失い、違和感の方が強くなります。
「なんとなくステレオ感が強い」とか、「普通のステレオ音声とは違う」という印象は誰でも共通して知覚されます。しかし、それが的確な空間定位として認識されるか?となると、かなり怪しいというのが実情です。
その「違和感」の大小によって『遠くに聞こえる』『上下に聞こえる』と言う人はいるけれど、それは個人差の大きいバイアス表現です。どういう言葉で表現したら良いのか分からなくて便宜的に遠いとか上下と言っているだけです。
そりゃそう言いますよ。上下定位の話題の席ではね。
でも、もしそれが「狂った位相とはどういうサウンドか?」のワークショップの席だったら『クソ位相ですね。』とか『なんか伝説の「上下定位」っぽく聞こえねーか?(場内爆笑)』からの『それは興味深い発言なので補足しますと、上下定位は位相が狂った状態の一種ですからねぇ。』という流れになるはずです。
・なんちゃってバイノーラル
バイノーラルという言葉が独り歩きし、単一指向性のステレオ録音ですらバイノーラルだと言う人までいます。これもうわかんねーな。ハイレゾとかハイファイとかのバズワードと同じになりつつある、と言っても過言じゃない。
わりとしっかりしたマイクメーカーが出しているバイノーラルマイクですら力の入れどころがどんどんズレてきていて、ダミーヘッドを放棄しつつあります。
で、近年はVR製品向けのバイノーラル的な試みが多く見られるようになってきましたが、どれも悲惨な状態です。違和感しか無い音をありがたがる風習があり、「完璧なバイノーラルだ!」という評価の声まであり、こりゃもうダメだという感じです。ハイレゾという言葉を流行らせて強引に不要なゴミクズを売る商法は、数十年後には笑いものにされているのは間違いないでしょう。
90年代にもバイノーラルが流行した感がありましたが、おおむねひどいものでした。おっさんなら知ってるはず。
・ダミーヘッドに対する誤解
誤解が多い点なので書いておきますが、ダミーヘッドやステレオ録音というのは、
- ステレオマイクの位置(位相差)
- 距離
- マイク付近の障害物の「形状、質量、質感」
によって得られるサウンドです。
これらを通過することによって録音されたものが「臨場感」として感知されるか「違和感」として拒絶されるかは大きな個人差があります。
・将来像
身体を計測して補正して再生するようになれば、その人にマッチした音になるから、様々な定位が適切に表現できてくる可能性はあります。
--------------------
■前後・上下定位の原理と誤解
同様に、あなたが設計した前後・上下の定位が、聞き手にとって拒絶される恐れがあるということを忘れてはいけません。
前後・上下定位の原理は「頭蓋骨や耳たぶ、上半身のの形状や質感」によって生じるフィルター効果の再現です。(あと細かく言えば耳の中での反射によって生じる特性も。)
例えば、後ろから聞こえる音は耳たぶを回り込んで来るので、ある種のパスフィルター効果によってこもった音になります。耳たぶが複雑な形状なのは定位を獲得するためです。
同様に上や下の音もそれぞれ異なる性質のフィルターを経たような音になります。
スピーカーを鳴らしながら首をぐねぐね動かしてみることで上下の定位を明確に感じることができるはずです。もっと分かりやすいのは、寝転がって体の向きを変えてみる方法です。
なので上下定位は実在します。しかし、それをミックスに込めて、全ての人に同じように空間定位を感じさせることは原理的に無理があります。
(まぁメーカーは売るための文句として過剰な表現をしますが。)
とにかく個人の身体と、その身体を使い続けることによって初めて脳が認識できるのが定位判別という能力なんです。
以上のことから、人間の耳は左右にしか無いのに、上下定位は確かに存在します。
が、それをステレオ2ch再生という汎用環境で再現できるかというと、否ですよ、というお話です。
その理由は耳の周辺にある耳たぶを筆頭とする、頭や胸などの形状によるフィルタリングです。つまり巨乳の人は下から来る音が強くフィルターされるので、貧乳の人より明確に「これは下からの音」と認識できているはずです。巨乳はオーディオに適していない証拠ですので、貧乳派の人はこの点を覚えておいてください。
とは言え、耳や頭や乳の形状は個人差が大きいので、どんなに再現しようとしても万人が賛同するサウンドにはなりません。絶対に。
もしできるとしたら、耳仕込み式のバイノーラルマイクを装着し、各方向からの音響特性を記録し、それに基づいてカスタマイズされた音を鳴らすしか無いでしょう。逆に言えばこの方法を完璧に実装できれば、夢が広がる。でもコストもとんでもないことになるでしょう。
・『攻殻機動隊』の世界でサイボーグはどういう音を感じているのか?
『攻殻機動隊』というSF漫画(アニメ)があり、登場人物が「機械のボディ」を取り替える場面があります。とすると、慣れたボディで聞いた音の定位を脳が覚えているので、サイズが極端に異なるボディに乗り換えると、音の聞こえ方も変化してるはずなんです。それはボディサイズが変われば、階段を昇り降りする時の感覚も違うということと同じです。ハイヒールを履き慣れていないと強い違和感があるのと同じです。
『攻殻機動隊』の世界でボディを乗り換えることが上手な人は、そういう違和感を調節する能力が高い人だということになります。もしくは違和感を無くすプログラムがあって、どのようなボディでも脳が適切な認識をできる世界なのかもしれません。
・こういう声もある
serさんはこう言ってる。
敢えて触れなかったんだけども、左右はともかく、奥行き方向は個人差どころじゃないものがあると思ってる。音量、帯域、リバーブetcのどれが主要因になるかが人によって大きく異なるというか、同じ関係性を持つ人は二人といない。例えばFAKiE/To the Limitの録音に奥行きを感じるか、とか。
奥行きに影響を与える要素はいくつかあり、その要素について差別化することによって「差別化されたサウンド」は作れるが、それを聞いたすべての人が奥行きだと感じるとは限らないんです。
また、一連の発言トピックにあるとおり、
自分の話をすると、帯域のDIP or Decayみたいなものが奥行きの要因として比較的大きい節があって、DSP等で帯域をフラットにすると全く持って奥行きが分からなくなる。あと、オールドスタイルなスピーカーでハマると異様に奥行きを感じたりもする。録音で言うと低域の暗騒音に敏感。
特定の再生環境でのみ「ハマる」ことがある、とserさん「個人」は言ってる。が、それが他のすべての人に「ハマる」とは限らない。
ミックスにおける最悪の手法は「俺の環境では最高の音になる」「俺のミックスが良く聞こえないならお前の環境が安い」なのは言うまでもない。
・上下定位は強い左右定位で「マスキング」される?
ここまで散々述べてきたとおり、人間の身体は上下定位に鈍感です。
なので、左右定位を強くアピールする音があると、上下に対する集中力が削がれてしまう恐れがあります。
音楽制作、ミックス用語における「マスキング」は、ベースとキックの被りや、低音から生じる自然倍音による中高音域の不明瞭さとかの話になることが多いです。が、広い意味におけるマスキングはそれだけではない様々な要素に対して生じるものです。
なお、ここでは簡潔な説明だけに止めますが、アレンジ領域における音符的なマスキングも存在します。メロディが動いている時にバックが動くと、アレンジ的にボヤけるというアレもマスキングの一種です。(マスキングと呼ぶ人は皆無ですが、現象としては酷似していますよね。)
■上下に操作可能な音の種類
こんな記事に興味を持つ人なら既に御存知の通り、低音は定位がはっきりしません。逆に高音はその波の直進性が強いので定位が明確に現れます。
言い方を変えるなら、高音ほど耳たぶ等の影響を受けやすい、フィルターされやすいということです。
・回折と床の関係
人間は残念ながら飛ぶことができません。ほぼ全ての音を「床が近い状態」で経験し続けます。その経験の積み重ねから「これは下からの音」と認識している、とされています。
低音は「回折」によってはっきりしない定位となり、回折は床で常に起きます。
回折した低音が常に含まれている音響で育ったため、人間は低音を「床の音」だと認識します。
「フロアノイズ」という言葉は言い得て妙です。ルームノイズではなくフロアなのです。
・上下定位ワークショップはオカルトと同じ手法だった
上下定位ミックスのプレゼンを行っていた人がいたのですが、その場では「ではハイハットを上から聞こえるようにしてみましょう」「ベースを下から聞こえるようにしてみましょう」という操作を行っていました。なんでそのワークショップでは「ベースを上から聞こえるように、ハイハットを下から聞こえるように」しなかったのでしょうか?
もし上下定位が自由自在なものだとアピールするなら、低音を上から降ってくるように聞かせたり、高音が下から聞こえるのを明確に示すべきです。
このプレゼン自体がオカルト証明的であり、都合の良いパフォーマンスの連続であり、その方法論の耐久性を示すものではありませんでした。お察しください。
また、単にステレオを広げただけのミックスと、それをバイパスしたミックスを並べて「VRミックスでございます」というデモを行っている人さえいます。そういう安っぽい詐欺行為によってVRオーディオの未来は閉ざされていくのだと思います。なんでキャリブレーションすら行わずに画一的なサウンドを押し付けるのかねぇ。
・上下定位は周波数の高低の言い換えでしかない
この記事では下のような模式図で示しています。
箱型の模式図なので上下定位のように思い込むかもしれません。でもよく見てください。上下はFreq(周波数)だと書かれています。
この記事では「上下」とは言っていません。左右のWidth、奥行きのDepth、そして「Freq」としか書いていません。どこにもFreq=上下定位とは書いていません。わかりやすく説明するために便宜的に「三次元」と定義しているだけであって、要素を差別化する概念として「左右」「奥行き」「周波数」の3つのステージがあるよ、としているわけです。
■前後定位(奥行き)
・距離とEQ
遠くから聞こえる野球や祭りの音はこもって聞こえます。
耳の近くでささやくヒソヒソ声は高周波の成分に偏っていて、遠くの人には聞こえません。
近くの音は高周波成分が多く、遠い音はそれが失われるということが分かります。
また、近くの音の方が豊かなダイナミクスレンジを持っています。
距離が離れると遠くの小さな音は聞こえなくなり、大きな音だけが飛んできます。
以上のことから、距離定位は明確に存在します。
でも、それを再現できるかどうかは別問題なんです。
・距離とコンプ
「コンプで距離感が表現できる」というメソッドは限定的な状況でのみ可能です。
コンプをかけて音を潰せば距離感が失われるわけでもないし、アタックが明確なら近くになるわけでもありません。
いずれも単にダイナミクスが狭くなっただけで、距離が変わるわけではありません。
コンプは音量差を変えるエフェクタであって、距離感を変える魔法のエフェクタではありません。
・距離とリバーブ
「リバーブをかければ遠くなる」というメソッドも同じです。
残響音が不可されるだけであって、遠くなるわけではありません。
リバーブは残響音を作るエフェクタであって、距離を変える魔法のエフェクタではありません。
コンプやリバーブが強い音はあくまでも「コンプやリバーブが強い音」でしかありません。
ただ、それを「遠くなった」と抽象的な言語で示したがる人がいるだけのことです。
サウンドを差別化したくてダイナミクスや残響を変えているだけです。
リバーブの無いドライな野外空間で遠くの音がどう聞こえるか考えてみれば分かることです。遠いと残響がつくんですか?ということです。
■上下・前後定位がオカルトである理由は個人差
個人の身体形状と、その身体で長年行きてきたことを後天的に脳が学習してきた結果としての2つの耳が立体音響を認知できている。
身体形状に個人差があるのと同じで、その脳が後天的に学習した結果にも個人差がある。
故に、他の人や機器が作った立体音響は正しく認知できないんです。
■フクロウの耳の話
フクロウの耳は左右の高さが違います。
これによってフクロウは上下定位を明確に認識できています。
birdbrain (http://people.eku.edu/ritchisong/birdbrain2.html)
また、リンク先でも書かれているとおり、フクロウの頭部の形状と頭部付近羽毛が生えている場所にって異なるフィルター特性があるそうです。
故に人間の左右定位と同様に「到達時間差」から上下の定位をより正確に認識できていることは当然として、方向によるフィルター特性の違いによって、優れた立体定位聴力を持っているとされています。
フクロウは目が大きいですが、それだけではないんですね。
また、上の画像のとおり、左右の耳の穴の形状が大きく異なります。これによってさらに明確に全方位の音を聞き分けられている、と考えられています。
なお、他の鳥はこういう耳の構造ではありません。
「鳥目」と言われるとおり、ほぼ全ての鳥類は暗い時には活動しません。(渡り鳥が夜間に飛ぶのは全く別の能力によるものです。鳥の話ではないので割愛。)
夜間の狩りに特化したフクロウの個性的な進化だということでご理解ください。
・仮説「フクロウ耳人間」
フクロウのように上下に耳の高さが違うことと、脳が後天的に学習するということをかけ合わせてみると、人間の耳たぶの形状を大きく変更し、上下定位が分かりやすい身体にすることでテスト可能です。音感がおかしくなっても責任は取れませんが、有意義な論文を書けるかもしれません。脳科学+オーディオに興味がある人はどーぞ。
漫画(アニメ)『攻殻機動隊』のように身体能力を拡張できる時代になれば、そういう頭部を装着した「フクロウマン」が登場するのかもしれませんね。暗闇での特殊任務に強そうです。
■テレビ、ラジオにおける違和感
付随するので左右定位の危険性についても書いておきます。
映画、ドラマ、アニメなどで過剰な定位操作をしているものが頻繁にあります。
画面の右にいる人物の声がヘッドホンで聞くと右100%定位から聞こえてくるという不気味な状況になっているものを聞いたことがありませんか?
映画館の立体音響も、座席位置によっては違和感しかありません。
■経時変化による立体音響効果
停止している音源よりは移動している音源の方がより明確に定位を把握できる可能性はあります。
もし音楽制作の中で立体的な音響を使ってみたいのであれば、オートメーションで移動する方が良いかもしれません。
ただ、これについても立体音響関連の論文やエンタメ系企業の報告で「意味ねぇんじゃね」ということになりつつあります。
通常の音楽の中では一定に鳴らしている音よりも変化の起きた音に耳が引き寄せられるものです。ネコが動いているものに反応するのと同じですね。
上下・前後定位は個人によっては「あ、後ろに動いた」と感じることはあるかもしれませんが、個人差が適合しない人は「あ、何か音が変化した」とか感じません。
重ねて強調しますが、聞こえ方(脳の感じ方)には大きな個人差があります。
経時変化(オートメ)で処理したからと言って、誰しもが同様に上下定位を感じられる2chステレオミックスなるわけではありません。
■相対性
動きと同様、相対性によって「上だ」「下だ」を意識できる可能性はあるかもしれません。でもこれも個人差という大きな壁の前には誤差でしかないでしょう。
■個人的な感覚
私自信、立体音響を体験したり、知人が作った音源で立体定位を試みたものを聞いたのですが、どれもパッとしないどころか気持ち悪いものでした。
それらの音は「こもった音」「ハイが少ない音」「ダイナミクスの狭い音」として知覚されるだけで、遠くの音にも上から降ってくる音にも聞こえませんでした。
例外的に遠く・高くに聞こえた音楽作品もありましたが、それが音楽的に何か効果を発揮していたようには全く感じませんでした。
■オーオタ某人の話
新しいヘッドホンに買い替えたら上下定位が明確になった、だそうです。
聞いた曲の中には立体音響を意識せずに作った曲もあったはずですが、そういう曲では上下定位がおかしく聞こえたりはしなかったんでしょうか。不思議!
その直後から私が作っている曲に対して、やたらと「その音は上から来て欲しい」とか言い出すようになった。これが本物の上から目線。というギャグにしかならないホラー話。
聴覚ではなく、新しく高価なものを買ったことによって、あらゆる音が良くなったと感じる(思い込む)心理作用が大きく働いているのは明らかです。現在は(音楽的な)付き合いを断っています。
■独創性と先進性?
早い話が「変わったアプローチで作ってみたい。目新しさで客が呼べる。身障者へのフィードバックもある。『予算くれ!』 」というアレじゃないかなぁとしか思えない部分があります。
実際、立体音響系のエンタメはどれもキワモノ色が強く、コンテンツ内容が立体音響ありきで、全体としてつまんねーよという印象が強いです。それだったらクレーンでスピーカー吊るして振り回した方が笑えるんじゃねーの?と思う。
シュトックハウゼンの話題は禁止な。
■リスニングポジションの違いで破綻する
スピーカーを大量に使う立体音響系では当然のことながら正確に体験できるポイントは1点しか存在しません。他の位置だと違和感が生じます。
■目的が逆になってないですか?
「立体音響設備のある場所で鳴らした時に破綻しないミックス」という消極的な方向性になってるじゃないかなーと心配です。
--------------------
■「DTMをやっていると突き当たるちょっと難しい単語の話」シリーズの過去記事
eki-docomokirai.hatenablog.comeki-docomokirai.hatenablog.com