http://kakaku.com/bbs/Main.asp?SortID=4318180でどらチャンでさんは次のように述べた。
どらチャンでさんの 2005年7月31日 23:54 の発言からの抜粋
MP3の128Kはジョイントステレオが入りますので左右の展がり感が乏しくなります。
例えば、LAME.EXEの3.70+のDOS窓にはシンプルステレオとジョイントステレオの比率が出て来ます。
この比率具合でジョイントステレオが何れくらい入るかをある程度判るかと思います。
楽曲を例に挙げると、YMOのライディーンはジョイントステレオに弱くジョイントステレオが入ると左右の展がり感が無くなりスケールが小さくなった音になるでしょうか。
どらチャンでさんの 2005年8月1日 08:47 の発言からの抜粋
ジョイントステレオでの左右の展がり感の縮小は、LAMEだけに限った事では無いので、彼は勘違いしてるのじゃないかな。
……………中略……………
そうそう。彼は、低ビットレートでのライディーンをまだ試していないのかな?
過去にも紹介したのですが、出だしの数秒間で色々と見えて来る素材なんですがね...
「LAMEだけに限った事では無い」ということは「少なくともLAMEの場合にはジョイントステレオでの左右の展がり感の縮小が起こる」ということを意味している。
どらチャンでさんによるこの主張の真偽を確認するために試聴試験大会を行なった。もしもどらチャンでさんの主張通りにLAMEのジョイントステレオでステレオ像に明確に問題が生じるならばジョイントステレオとシンプルステレオによる圧縮結果の音を容易に区別できたはずである。試聴試験に真剣に取り組んでくれる方がいれば十分に興味深い結果が得られただろう。
どらチャンでさんの希望に沿う形で試験問題を作り直しても良いと申し出たにもかかわらず、どらチャンでさんは試聴試験から逃げてしまった。おそらくどらチャンでさんはジョイントステレオとシンプルステレオの違いをまったく聴き取ることができていないのだろう。もしもそうならば「ジョイントステレオが入ると左右の展がり感が無くなりスケールが小さくなった音になる」などとどうして言えるのか不思議である。実際にそのような問題が発生する場合をどらチャンでさんが知っているならば、その場合を指定して試聴試験を行ない、どらチャンでさんは自分の主張を証明できたはずである。
そもそもどらチャンでさんは「LAME.EXEの3.70+」などと述べている。LAMEの最新安定版は 3.96.1 であり、もうすぐベータ版に移行すると思われる最新版は 3.97 alpha 11 である。LAMEのバージョン番号に関する記述ひとつを見てもどらチャンでさんは MP3 エンコーダーについて無知であることがわかる。もちろん、そういうことに完全に無知であっても何かを聴き取っている可能性は否定できない。そこで試聴試験を行なおうとしたのだが、その試聴試験からもどらチャンでさんは逃げてしまった。これではどうしようもない。
このタイプの人による音質批評は一切参考にするべきではないと思う。少しでも参考にすると被害を受ける可能性がある。結果的に正しいことを言っている場合があったとしても、自身の主張の証拠を示そうとしなかったのだから「まぐれあたり」である可能性が高い。
追記(2005年8月10日) 今回わかったことは「○○という曲のXX:XX-XX:XXのあいだを××でエンコードすると△△となる」のようにかなり具体的な発言していても必ずしも信用してはいけないということだ。やはり私がいつも強調しているように、オーディオ圧縮の音質批評においては「圧縮前のサンプル音源」と「ABXテストのログ」 (および第三者がABXするためのヒント) の公開を常に要求するべきである。その2つを公開することを渋ったまま自由に音質評価をして構わないことにすると、いい加減な話をやり易くなってしまう。しかし、その2つを自分で手間ひまかけて公開することが当然だということになれば、いい加減なことを言うためにもかなりのコストをかける必要が生じてしまう。しかも圧縮前のサンプル音源を公開してしまうと、ブライドテストの実施によって自分の発言がいい加減であったことを暴露されてしまう危険性が増える。いずれにせよ、そんなに大きな音の変化が生じるならばどうしてブラインドテストから逃げようとするのか不思議である。大きな音の違いを本当に感じ取っているのであれば簡単に全問正解できるはずである。
問題はすでに削除してしまった。しかし、下の方で同じ問題を再現するために十分な情報を公開しておいた。
problem A 解答
A01 = joint stereo A02 = joint stereo A03 = joint stereo A04 = joint stereo A05 = simple stereo A06 = joint stereo A07 = simple stereo A08 = simple stereo A09 = joint stereo A10 = simple stereo
problem B 解答
B01 = simple stereo B02 = joint stereo B03 = joint stereo B04 = joint stereo B05 = joint stereo B06 = simple stereo B07 = simple stereo B08 = simple stereo B09 = joint stereo B10 = joint stereo
problem C 解答 (この問題は未発表)
C01 = joint stereo C02 = simple stereo C03 = joint stereo C04 = joint stereo C05 = joint stereo C06 = joint stereo C07 = joint stereo C08 = simple stereo C09 = joint stereo C10 = joint stereo
オリジナル音源は YMO のライディーンの最初の4秒〜10秒の6秒間である。この音源は確かに面白い。
オリジナル音源: rydeen0004-0010.wv [813KB] (WavPack でロスレス圧縮してある)
GENRE=Techno ARTIST=YMO DATE=1999 ALBUM=YMO GO HOME! (Disc 1) TRACKNUMBER=02 TITLE=RYDEEN LENGTH=6sec, 00:04-00:10
問題作成のために利用したバッチファイルは次のZIPファイルの中に含まれている。
problem A では LAME 3.96.1 --preset cbr 128 および --preset cbr 128 -m s を使って圧縮した。この problem A はどらチャンでさんの発言の中に含まれている「MP3」「128」「LAME」という三つの条件を満たしている。 LAME のバージョンも現時点で最もメジャーな最新安定版 3.96.1 なので文句は付けられないはずである。
problem B では LAME 3.96.1 -V5 --athaa-sensitivity 1 および -V5 --athaa-sensitivity 1 -m s を使って圧縮した。 LAME は通常 VBR で使用し、CBR は特別な場合以外には使わない。平均 130kbps 程度を目標にする場合には LAME 3.96.1 -V5 --athaa-sensitivity 1 を使うのが音質的に優れていることがわかっている (2004年5月の128kbpsでの公開試聴試験の結果)。
未発表の problem C では LAME 3.97a11 -V2 --vbr-new および -V2 --vbr-new -m s を使って圧縮した。この場合も試験をやりたかった理由はビットレートを上げた場合にどうなるかを知りたかったからである。
ただし単純なバイナリ比較によってジョイントステレオとシンプルステレオの違いを判別されてしまうことを防ぐために先頭の数サンプル〜十数サンプルを削ってからエンコードした。詳しくはバッチファイルを参照して欲しい。 Waveファイルの先頭部分を削るためには sox-win を利用した。
バッチファイルをそのまま使うためには sox.exe および LAME 3.96.1 と LAME 3.97a11 の lame.exe がそれぞれ lame3.96.1.exe と lame3.97a11.exe という名前でパスの通ったフォルダに置いてある必要がある。私は http://www.rarewares.org/mp3.html にある LAME のバイナリを使っている。
RYDEEN の最初の4秒間は典型的なプリエコーサンプルになっているので、プリエコーの強さを聴き取ることによってABXが易しくなる。また最初の4秒間は全体的に静かなので通常の試聴環境よりもボリュームを大幅に上げて背景のヒスノイズの音質の変化を聴き取ることによってもABXが易しくなってしまう。 (「ABXできる」=「ABXテストで区別できる」)
これは http://kakaku.com/bbs/Main.asp?SortID=4318180 におけるどらチャンでさんの「YMOのライディーンはジョイントステレオに弱くジョイントステレオが入ると左右の展がり感が無くなりスケールが小さくなった音になる」という発言を検証もしくは反証するための試聴試験であった。プリエコーやヒスノイズの聴き取り大会になってしまう可能性を下げるためには最初の4秒間は除いてしまう必要がある。
以上の私の主張が疑わしいと感じた人は以下を聴き比$Y$F$_$FM_$7$$!#
このサンプル音源の場合には LAME 3.96.1 -V5 --athaa-sensitivity 1 で圧縮した結果の平均ビットレートは 140kbps になっている。しかし、易しい音源や静かな音源では 120kbps 程度まで平均ビットレートが下がるので、 LAME 3.96.1 -V5 --athaa-sensitivity 1 では平均すれば 130kbps 程度のビットレートが実現されるはずである。音楽鑑賞目的で MP3 ファイルを作る場合にはビットレートが平均して 128kbps 程度以上になるようにした方が無難である。
未発表の problem C で用いた LAME 3.97a11 -V2 --vbr-new はこれから流行しそうな LAME の使い方である。この場合は平均ビットレートが 222kbps と少し高めになっている。しかし、易しい音源や静かな音源では 170kbps 程度までビットレートが下がるので、結果的に平均して190kbps程度のビットレートが実現されるはずである。
繰り返しになるが、音質が気になる人は CBR ではなく VBR を使った方が良い。 VBR は音質を保ったままの圧縮が難しい場合には自動的にビットレートを上げ、圧縮が容易な場合にはビットレートを自動的に下げる技術である。一般に圧縮された音楽ライブラリ全体のサイズが等しいならば CBR よりも VBR の方が音質が良い。 CBR は VBR が使えないもしくは使うのが相応しくない特別な場合にのみ利用し、通常は VBR を使うと覚えておけば間違いない。 (ただし 100kbps 未満のビットレートで VBR のチューニングがまだ不十分である可能性があるのでその場合には ABR も選択肢に入れておく。しかし、音質が気になるのであればビットレートをそんなに下げない方が良い。)
LAME 3.96.1 CBR 128kbps の音質はあまり良くない。 problem A を解けない人には他の場合にもジョイントステレオとシンプルステレオの違いを聴き取ることはできないだろう。
私も LAME 3.96.1 --preset cbr 128 と LAME 3.96.1 --preset cbr 128 -m s の音を聴き比べ、ジョイントステレオ側の問題を探してみた。最初に気付いたのは1.0-2.2秒におけるリズムを取るアタック音の右側から聴こえる成分の違いである。
1.0-2.2 に範囲を固定して ABX テストを行なってみると、 LAME 3.96.1 --preset cbr 128 (ジョイントステレオ) で圧縮した方では LAME 3.96.1 --preset cbr -m s (シンプルステレオ) で圧縮した方よりもリズムを取るアタック音の右側から聴こえる成分が弱くなっているように感じられた。
おそらく他にも探せば違いはたくさん見付かると思う。しかし私には「左右の広がり感が無くなりスケールが小さくなる」という基準で違いを見付けることはできなかった。
次にやってみたのが LAME 3.96.1 --preset cbr 128 で圧縮した結果と圧縮前のオリジナル音源の比較である。上と同じように 1.0-2.2 に範囲を固定してABXテストを行なってみると、 LAME 3.96.1 --preset cbr 128 で圧縮した方ではリズムを取るアタック音の右側から聴こえる成分がやはり弱くなっているように感じられた。
このアーティファクトはジョイントステレオ一般の問題なのだろうか? そこで同じジョイントステレオどうしである LAME 3.96.1 の --preset cbr 128 と -V5 --athaa-sensitivity 1 による圧縮結果を比較してみた。
やはり上と同様に範囲を 1.0-2.2 に固定して ABX テストを行なってみると、LAME 3.96.1 --preset cbr 128 で圧縮した方では LAME 3.96.1 -V5 --athaa-sensitivity 1 で圧縮した方よりもリズムを取るアタック音の右側から聴こえる成分が弱くなっているように感じられた。
LAME 3.96.1 --preset cbr 128 (ジョイントステレオ) で圧縮すると 1.0-2.2 のあいだのリズムを取るアタック音の右側から聴こえる成分が弱くなってしまう問題は LAME 3.96.1 -V5 --athaa-sensitivity 1 では大幅に緩和されている。
これ以上の音質の研究は各自が独立に行なって欲しい。
以上のようにジョイントステレオ特有の音質劣化は「左右の広がりが無くなる」のような単純なものではない。しかし、もしかしたら非常に特殊な音源ではジョイントステレオで「左右の広がりが無くなる」現象が起こるかもしれない。私もそのような音源を探し続けているのだが、まだ発見できていない。そのような音源を見付けた方は是非とも私に教えて欲しいと思う。これだけ探して見付からないのだから、そのような音源は存在したとしてもかなり珍しいはずである。
何度も繰り返し述べて来たことだが、LAME のジョイントステレオでステレオ像に全般的に問題が生じるかのような主張をする人がいるが、そのような主張は完全に間違っている。そのような主張をする人は決して自分の主張の証明しようとしない (なぜならば証拠を持っていないからである)。ただし、LAME のジョイントステレオも完璧ではないので、特別なサンプル音源ではジョイントステレオ特有の音質劣化が起こる。しかし、ジョイントステレオの使用を止めると大幅に音質が劣化する場合があるので、ジョイントステレオは使わないと損である。
WavPackで圧縮されているWVファイルの試聴および他の形式への変換には foobar2000 を使うのが便利である。foobar2000は十得ナイフのように非常に便利なソフトなのでオーディオ圧縮技術に興味がある人はインストールしておいた方が良いだろう。二つの音源を聴き比べるときには foobar2000 の ABX comparator が便利である。WavPackのバイナリは http://www.rarewares.org/lossless.html からもダウンロードできる。