サラウンドコンテンツの一般化で音MADが楽になる 検証

以前Tumblrにこういうメモを書いていて、最近少し時間ができたので、いろいろ試していました。



結果:エルシャダイにおいては5.1chのキャプチャが大いに役立った。

そもそも、サラウンドには5.1chの場合は中央、右前と左前、右後と左後に音があり、指向性を持たない重低音だけの音(0.1ch)があります。

中央に置くセンタースピーカーからは、主に人のセリフが流れる。つまりセンターチャンネルだけ抜き出せればノイズやBGMを消す必要がないので今まで以上に有用な素材が録音できるのではないか、と思い立ったものの、

HDMIまたは光/同軸デジタルから出したAC3(Dolby Digital)で圧縮されたビットストリームをリニアPCMとして録音して、後処理でまともな音声に変換する、というのもあるらしい。非可逆圧縮された音になるが、大きな問題ではないのでこれは後で試してみたい。

ここがうまくいかずなかなかセンターチャンネルのみの抽出には至っていませんでした。
そもそもゲームのオプションとしてBGMとSEでボリュームを調整できるのですが、エルシャダイの場合このSEに人物のボイスが含まれるので、BGMではない環境音とミックスされている状態だったのです。風斬り音とか足音とかが入ってしまうので今までは音声が入るタイミングで操作を止めたりして影響を最小限にしていたワケですが、これが面倒くさい上に待機モーションに移行する際の足音が入ったりして完全ではない……。

想定していた方法として、HDMI経由でAC3ビットストリームをリニアPCMとしてビットパーフェクトにキャプチャができれば、ext_bsというツール(http://www.sakurachan.org/soft/mediatools/ )を用いて後処理としてサラウンド音声を取り出せるという目論見だったのですが、自分の環境(Xbox360→MonsterX3)だとそもそも音声が2chとしてしか入力できませんでした。(おそらくPS3でも同様だと思いますが、北米版プレイする時にまた検証してみます。)追記:同様でした。

今回センターチャンネルを取り出した方法は
Xbox360→Tendak AV-152-BK→TASCAM US-2x2 

という一度デジタルHDMIをアナログ5.1chにデコードするオーディオ分離機を経由してアナログでキャプチャするものです。現状HDMIからサラウンド音声をデジタルで入力する手段が乏しく、民生用だとBMDのIntensityシリーズの一部しか無いみたいです。(BMDって民生用なのか?)そのIntensityも安定性に欠けていてバクチなところがあるみたいで避けていました。高いし。現環境も別に安定してるわけじゃないんですけど。
それで最終手段としてアナログパラ出しのアナログキャプチャを選びました。

数ある同様の分離機の中でこれを選んだのはたまたまこれしか在庫がなかったからで、アナログ出力の品質としてはこういう単機能のものじゃなくてAVアンプなんかのアクティブスピーカー用に出力するものの方がいいとは思うんですが、それができるようなのは高いし。それ以外はまあ大差ないかな、と。

アナログを挟むことでノイズの混入等の品質劣化はおそらくデジタルでの非可逆圧縮よりも大きいのですが、ReaFirのsubtractモードで除去できる範囲でしたので十分実用的だと思います。上に貼った動画はそういう方法でノイズ除去しているものですが、素材としては全く問題無いはず。
余談ですが、この分離機は電源に5V/1AのmicroUSB端子を使っていて、付属のAC電源はDC端子をmicroUSBに変換していました。こういうスイッチング電源より手持ちのポータブルバッテリーの出力の方がノイズは少なくなるんじゃないかと思って試してみたんですが、結果は僅かにAC電源の方が無音部分のノイズレベルは小さいものでした。何十回も録音したわけじゃないんですがワザワザバッテリーに変える必要は無いどころがむしろ悪くなるくらいの結果だったので意外でした。

それと今回のハマったポイントとして、HDMIの仕様の接続のトポロジーとして一つの表示機器を頂点とするツリーを前提としているため、分配器等で2つ以上の表示機器を接続する場合、動作に一部制限がかかる。(wikipedia)というところがあります。
具体的には分離器の手前で分配機なんかを挟んでしまうと2chでコネクションされてしまうようで分離器で5.1chの出力ができませんでした。これ、アナログ出力からステレオ以外は音声出なければいいんですが、この分離器は妙にフレンドリーでセンターからはL+Rが、サブウーファー用出力からはフィルターで低音だけ出してくれていたみたいで原因究明に手間取りました。最初はそもそもコンテンツの5.1ch対応がこういう低レベルのものなのかと思って心配しました。

機材の話ばっかりになってしまったので、肝心の音声について。
センターチャンネルはボイスのみが含まれると思っていたのですが、実際は他のSEも入っていました。アザゼルの蝿(帰れ!)とか上に貼った動画だと翼の音とか右手の音とか。めっちゃ小さくBGMも入ってるみたいですがバリバリに割れるくらいゲイン上げないと聞こえない。これはステレオの信号がアナログの段階で混ざっているのかもしれません。
まだ最後まで通してキャプチャしていないのでなんとも言えませんが、今のところ非常に素材として有用なものが録れてすごく興奮しています。特に堕天使紹介の風切音とか、それともバカなのか…の滝の音とか足音とかが全く無いので、このメリットに比べたら一部SEについては無視できるレベルに感じます。
ムービーパートもキチンと5.1chで作られていて、エルシャダイってクオリティの高いゲームなんだなと改めて実感しました。
そしてセンターだけ録音して気づいたのですが、シーンによってリバーブの深さが変わっていました。おそらくリアル空間ではリバーブ深め、それ以外は浅い音声なのかも。以前公式HPで公開されていたボイスに近いドライな感じ。

音声素材すべて取り直さなきゃならないので大変ですがこれが嬉しい悲鳴ってやつかもしれません。
可逆圧縮なんでHDD増やさないとな……。


追記:たまたまハズレ個体なのか相性が悪いのかXboxはたまに走査線が部分的に欠けるようで不安定だった。PS3でも出ないことはないけどXboxよりもずっと頻度は低い。フェード部分で目立つ。キャプチャーボードが劣化してるのかも。リアルタイムムービー用として使おうと思う。音声のノイズレベルもPS3の方が低い。ここらへんは環境が大きく関わってそうなので一概には言えないと思うけど備忘録として残しておく。

この記事へのコメント

商品紹介