« 上野のパンダは殺された | メイン | 03-3828-5171 »

2008/05/05

税金使ってミクの調教


ねんどろいど 初音ミク (ノンスケール ABS/PVC塗装済み可動フィギュア)
ねんどろいど 初音ミク (ノンスケール ABS/PVC塗装済み可動フィギュア)
価格:¥ 3,000(税込)
発売日:2008-03-31

ペンタクスという会社があったわけだ。デジカメに乗り遅れて色々とあったようなんだが、今でも会社が潰れたわけじゃない。で、何故なのか知らないがそこでこんなもんを開発しているんだが、テキストを読みあげてくれるソフトなんだが、特設ページでテスト出来ます。で、やっぱりアレだ、「おまんこやりたい」とか「おちんちんがほしいですぅ」とか打ち込んで読ませてゲラゲラ笑うのが流行ってる、って、なんだか中学生みたいなんだが、こうした合成音声というのも研究が進んでずいぶんリアルになって来たようだな。で、そういえば初音ミクというのがあったんだが、その初音ミクのプラグインというか、独立行政法人「産業技術総合研究所」というところで、初音ミクを「調教」するための「ぼかりす」というのを開発したらしい。で、コレだ。



どういうわけか、日本人は「人間みたいなロボット」を作ることに異常に情熱を燃やす人種で、鉄腕アトムの影響なのか、それともキリスト教的な縛りがないせいなのか、役にも立たない人間臭いロボットを一生懸命に作っているわけだ。こうした技術というのもその一環なのかも知れないが、まぁ、今どきのポップスなんざ、リズム陣はオール打ち込み、他の楽器も打ち込みが多いので、ボーカルもロボットの方がむしろ似合うのかも知れないです。




【技術】 「ニコニコ動画」の「初音ミク歌声」、より人間の歌声に近づく…「神の領域に」とネット騒然

1 :☆ばぐた☆ ◆JSGFLSFOXQ @☆ばぐ太☆φ ★:2008/05/04(日) 17:57:33
・「ニコニコ動画」に最近アップされた「初音ミク」の歌が、ますます人間の歌声に近付き「神の領域に 達した」と、ネットが騒然となっている。この動画をアップしたのは、産業技術総合研究所の研究者の ようで、近々、その研究結果が発表されるらしい。
 アップされたのは4月28日で、動画のタイトルは、
「【初音ミク】PROLOGUE 【ぼかりす】」。
 この動画の投稿者コメントを見ると、「この調教結果を聞いてみて頂けますか?まだちょっと 不自然なところがあるのですが、楽しんで頂ければ幸いです」と、なにやら自慢げだ。
 ちなみに、この「調教」というのは、ボーカルアンドロイド「初音ミク」を上手く歌わせるために プログラムを調整することを指す。音や言葉を、プログラム上の五線紙に打ち込み、ビブラートや ブレス音なども表現でき、調整の上手い作品は「神調教」などと賛辞される。
 実際に歌を聞いてみると、これまで聞いた様々な「ミク」よりも、確かに人間が歌っているっぽく聞こえる。
 「ニコ動」のコメント欄には「神を超えた調教」「まさか、人間だろ、これ…」といった驚きのカキコミが並んだ。
 どうやらこの「神調教」は、動画のタイトルにある「ぼかりす」という新技術を使っているようなのだ。
 J-CASTが産業技術総合研究所に取材すると、同社研究所広報は、この技術は「VocaListener」というのが正式名称で、この動画はこの技術を開発した研究者の手によってアップされたものだと説明した。どんな新技術かについては、「5月下旬に行われる『音楽情報科学研究会』で発表する予定ですので話をすることはできない」ということだった。
 同研究会の進行プログラムにはこの技術について、「ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案」としか書かれておらず、何なのかさっぱりわからない。
 ネットの反応は複雑だ。「ニコ動」のコメント欄には、08年5月2日に「ミクの声じゃない」などの否定のコメントが増え始めた。
13 :名無しさん@八周年:2008/05/04(日) 18:00:56 ID:ICTzPG/w0
神って結構低いとこにいらっしゃるのね
14 :名無しさん@八周年:2008/05/04(日) 18:03:20 ID:zPriQGfV0
神(笑)
15 :名無しさん@八周年:2008/05/04(日) 18:03:48 ID:9ITh4zHa0
にこにこでみた初音の「時をかける少女」が
知世たんよりも、うまかった件について。
25 :名無しさん@八周年:2008/05/04(日) 18:05:19 ID:Oll1g15+0
バイオ、メタンハイドレート、そして初音ミク
産総研は守備範囲広すぎ
35 :名無しさん@八周年:2008/05/04(日) 18:08:04 ID:Lma6zjQO0
わかってねー・・・
楽器っぽい声だからいいんじゃねーか
人間の声まんまじゃ意味ねーんだってこういうのは
42 :名無しさん@八周年:2008/05/04(日) 18:10:45 ID:Ah442zDw0
すげーな初期の頃と比べると明らかに技術力があがってる
てかヤマハだっけか?
すげー日本の無駄技術すげー
48 :名無しさん@八周年:2008/05/04(日) 18:12:23 ID:x+Vowv9z0
どう見てもこれは原田智世の歌声だと思ったオレは
38歳のオッサンですwwwww
45 :名無しさん@八周年:2008/05/04(日) 18:12:01 ID:0buWLJ4V0
三次元バーチャルアイドルが全然ウケなかったのと同じ流れになりそうだな
本質的にリアルを求めてるわけじゃないから
53 :名無しさん@八周年:2008/05/04(日) 18:13:56 ID:H7ycq5fJ0
>>45
そもそも産総研が求めてる物は君が求めてる物とは違うと思う。
後は、YAMAHAの問題。
たまたまミクを使ったって言うだけの話だと理解できずに騒いでるのが滑稽。
55 :名無しさん@八周年:2008/05/04(日) 18:14:10 ID:6vssXN570
ここの研究所10年ほど前に音声データを解析して音楽を楽器別に抜き出すとか面白いことやってたはずなんだが・・・。
67 :名無しさん@八周年:2008/05/04(日) 18:18:04 ID:IleymLAS0
ロリ演歌は技術でどうにかなるものではないらしいことは分かった
81 :名無しさん@八周年:2008/05/04(日) 18:23:39 ID:0buWLJ4V0
>>53
言わんとすることはわからんでもないが、「ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム」なんてミク的な使い方以外に思いつかないってのは仕方ないと思うぞ
喋りならともかく歌だからな
87 :名無しさん@八周年:2008/05/04(日) 18:25:31 ID:Xf3VvjrW0
日本ってエンターテイメントの技術だけはすごいよな
PS3といいWIIといい、ミクといい、
70 :名無しさん@八周年:2008/05/04(日) 18:18:26 ID:vT7Inyvy0
で、どういう話題づくりなんだこれは?そんなたいそうな前置きが必要だったのか?だれか喜ばそうとでも思ったのか?
いろいろ謎なんだが
122 :名無しさん@八周年:2008/05/04(日) 18:35:45 ID:BcEdF1BR0
>>70
単に音声処理技術の実際的な応用としてボーカロイドが使われたってだけでは。
単なる「旋律」に近い素のボーカロイドの歌に、生声のソースから微妙なピッチのぶれなんかを抽出して埋め込んで「人らしく」聞かせる、ってことで。
168 :名無しさん@八周年:2008/05/04(日) 18:45:39 ID:2HmSXP080
他にもっとうまい調教はあるけど、それらは全部音楽編集ソフトを使って後加工したもの。
これは後加工してない。
多分、ユーザが手動で入れるパラメータを自動的に計算する方法ってことでソフトウェアで自動化できるって点が凄いんだろう。
171 :名無しさん@八周年:2008/05/04(日) 18:46:53 ID:CatG3byg0
なるほど。こりゃすげーわ。
ミクの独特のヘンなビブラートやクセがほとんどなくなってる。
194 :名無しさん@八周年:2008/05/04(日) 18:53:51 ID:rzHCGCFK0
ぶっちゃけ、TTSのスクリプトを知ってるから不思議にも思えない
50音で表現することしか頭にない奴には無理
海の色は太陽の反射とかで白も赤もあるのが見えないと画家になれんようなもの
207 :名無しさん@八周年:2008/05/04(日) 18:58:53 ID:0u5d+IBF0
歌以外への応用ができるなら、かなり便利な技術だな。
223 :名無しさん@八周年:2008/05/04(日) 19:04:47 ID:H7ycq5fJ0
>>207
楽譜の音符と歌声の音符(自然に聞こえる歌声)のズレに着目するだけで、認知心理学系の論文お腹いっぱい書ける。
という技術なのにね。
2chの文系白痴は、考え方すら与えられないと物事を考えられないというか、それは考えてるのか?と、何時も絶望的に疑問に感じる。
本当にお前ら物考えて生きてるのか?って小一時間問いつめたい。
257 :名無しさん@八周年:2008/05/04(日) 19:21:19 ID:0l32lSz80
ミクのロボットに好きな曲をネットからダウンロードさせれば
目の前で振り付けしながら歌ってくれる
お風呂上りには身体を拭いてくれるし、フェラやセックスも出来る

完璧じゃないか
265 :名無しさん@八周年:2008/05/04(日) 19:24:00 ID:Pi22Vtp30
>「ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案」

3Dでいうなら、所謂モーションキャプチャーの歌声版だろ。
実際の歌声をMIDI化する技術に近いんじゃないかな。
実際に人間にうたわせて、その情報を元に、そのプレイの詳細な楽譜を作る感じ。
281 :名無しさん@八周年:2008/05/04(日) 19:29:17 ID:sJYSWRBA0
この前中の人の藤田咲がラジオで初音ミクの喋り方の物真似してたけどめっちゃ上手かったぞw
294 :名無しさん@八周年:2008/05/04(日) 19:34:33 ID:/sVn0I+H0
手作業でもっと凄いのを作ってるやつは確かに幾らでもいる。
しかし今回は手作業以外の方法でこのレベルにしたと思われるから騒がれているわけでね。
ミクを手作業で人間的に歌わせることの難しさを知ってる連中ほど騒いでる。
331 :名無しさん@八周年:2008/05/04(日) 19:48:37 ID:kkC+24ZO0
>>320
>>これのどこが人間の歌声?
>>耳おかしいの?

人間の音声に近づいた訳よ、まだ完璧じゃーないけど、凄いレベルアップしちゃったの
初音ミクLv.1から初音ミクLv.40くらいになったの、スキルレベル人間:361くらい
ホンダのASIMO見てスゲーって思うじゃん、人間みたいって言うじゃん、実際凄いじゃん
そういうのが自動で誰でも出来るようにしちゃったから凄い事じゃん
これで色んなミクがまんこまんこ言うようになるんだよ
336 :名無しさん@八周年:2008/05/04(日) 19:50:05 ID:z2Tmc8Ew0
産総研ってことは、国の税金使ってこんなくだらん研究してるってことだよな…
339 :名無しさん@八周年:2008/05/04(日) 19:51:30 ID:XWNpQFSWO
で、実際問題このボーカロイドって実用性はあるのか?
343 :名無しさん@八周年:2008/05/04(日) 19:52:50 ID:h8Pw5mG90
>>339
技術を見るとき「今」ではなく「未来」を考えるんだ。
この世には「応用」という概念があってだな。
352 :名無しさん@八周年:2008/05/04(日) 19:55:06 ID:XWNpQFSWO
>>343
考えたけど何に使えるのか思いつかない。
音声ガイダンスとか?
もう既にあるけどな。
361 :名無しさん@八周年:2008/05/04(日) 19:56:31 ID:kkC+24ZO0
>>352
楽器を弾くロボットあるから、それに搭載すれば
ロボットだけで合唱団作れるぞ
バンドにはボーカルが必要だし
365 :名無しさん@八周年:2008/05/04(日) 19:58:15 ID:B2E8Ahvv0
かなり未来にはミクの技術を応用して声帯がやられた人の音声を出力できるかも知れない
でもそれは入力の方法がキーボードとマウスじゃ駄目だ。脳の言語野の信号を直接ミクで出力しないと
393 :名無しさん@八周年:2008/05/04(日) 20:06:58 ID:B2E8Ahvv0
クリプトンがエロに厳しくなったのがやっと分かった。
ここまで可能性があると将来的に普通にエロゲとかで声当てられちゃうわ。
そりゃ認めないだろうな。でもいずれ他の会社が類似品出して、結局エロゲになるんだろうな。
434 :名無しさん@八周年:2008/05/04(日) 20:21:00 ID:hb/bQPP/0
初音ミクの弱点
・サ行(擦過音)
・カ行、ラ行(口内破裂音)
・鼻濁音
・無声音
母音は問題ないんだけどね。
「ぼかりす」とやらでも、
これらはクリアできていない。
476 :名無しさん@八周年:2008/05/04(日) 20:33:14 ID:gNZ8F2y90
うーむ、確かに細切れ感は薄まってるが。
文言ベースで勝手に期待し過ぎてた、ってのか正直な感想。
アドオンなり変換ソフトとして販売したら値段で評価変わるかも。
ニーズに対してのツールとしては非常に良いシロモノかと。
485 :名無しさん@八周年:2008/05/04(日) 20:36:58 ID:uwKc29oe0
ミクの最高チューンがこれなのか?
人間がのっぺり歌って、オートチューンやVボーカルかけると
こういう風になるね。
ミク進化の着地点がこれだと寂しいね。
491 :名無しさん@八周年:2008/05/04(日) 20:40:01 ID:qFK057Dg0
>>485
自動調整で、まだ発展途中の技術なんじゃねーの?
手動調整でならもっと自然に耳に入るようなのやってる人も居るよ。
くじら12号のやつとかは結構凄いなと俺は思った。
正直記事が褒めすぎな感はあるけど、調整経験の少ない人が一度大雑把に調整して、その後気になるところを・・・って感じで使うなら良いのかもしれんね。
519 :名無しさん@八周年:2008/05/04(日) 20:49:10 ID:77nbI1uu0
人間の声を出せる・作り出すことが神の領域に達する行為なら、人の存在はまさに神だよなぁ・・・
一神教を信者にそんな事を言えば神の冒涜だって話になるけれど、死後50年を経て神になるという考えを持つ神道、一切衆生悉有仏性の考えを持つ大乗仏教の信奉者たる我々には違和感の無い事なのかもしれない。
532 :名無しさん@八周年:2008/05/04(日) 20:53:49 ID:1ySo+/Yh0
>519
大体、物とかプログラムといった人工物にここまで入れ込み神性とか特別な価値観を見出すのは、我々、日本人ぐらいなもんじゃないか?
欧米人のロボットって基本的に黒人奴隷の代替物程度の発想だしなぁ・・・最後人類に反旗を翻すのもお約束。
行く所まで行って、もはやグダグダな人類の後継者になりうる存在になるかもって発想ないのかね?
536 :名無しさん@八周年:2008/05/04(日) 20:55:45 ID:QaGXk0sY0
http://www.ipsj.or.jp/sigmus/SIG/sig200805program.html
第75回音楽情報科学研究会開催のご案内
(ヒューマンコンピュータインタラクション研究会(SIGHCI)と共催)
日時:2008年5月28日(水),5月29日(木)
会場: 臨床研究情報センター(TRI)
住所: 〒650-0047 神戸市中央区港島南町1丁目5番地4号
●14:50~16:25 セッション2(25分×3件,20分×1件)
(6) 動画共有非同期コミュニケーションにおける一体感を向上さ
せるインタフェース
川井康寛,志築文太郎,田中二郎(筑波大)
(7) ニコニコ動画における映像要約とサビ検出の試み
青木秀憲,宮下芳明(明治大)
(8) STRAIGHTを用いた簡易モーフィングによる印象変化の評価に
ついて
西田沙織,大西壮登,吉田有里(和歌山大),森勢将雅(関西学院
大),西村竜一,入野俊夫,河原英紀(和歌山大)
(9) VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自
動推定するシステムの提案
中野倫靖,後藤真孝(産総研)
●16:40~18:10 招待講演
(10) 仮想楽器をリアルにする「未来の記号」と、VOCALOIDで注
目される「人の形」「声の形」について
佐々木渉氏(クリプトン・フューチャー・メディア株式会社 )
おまけ
(12) 擬人化を利用した家電インタフェースの開発
大澤博隆,野田誠人,今井倫太(慶應大)
547 :名無しさん@八周年:2008/05/04(日) 20:58:25 ID:B2E8Ahvv0
アメリカはロボコップの世界だから。あそこは合理的なようで合理的じゃない。
有名な大学でも未だに進化論の論争を公開討論でしてたりする。マジでピューリタンの末裔だよ。
だから人間=楽園を追放された特別な存在と本気で信じてるから、人型は開発しないという話だ。
もちろん合理的、客観的理由もあるんだろう。二足歩行は無意味だっていう。
だけどやっぱり心の底では機械の「命」に恐怖を感じている。
日本は手塚と多神教で目指すものが随分違うな
600 :名無しさん@八周年:2008/05/04(日) 21:11:46 ID:aiRdEAZr0
独立行政法人産業技術総合研究所
要は半公務員ってことですか
仕事の道具使っていろいろ遊べて
しかも学会発表で業績も稼げるなんて羨ましいな
635 :名無しさん@八周年:2008/05/04(日) 21:22:06 ID:0Kc04p7S0
俺は歌手よりも演奏家の方が辛い時代になると思うけどな。
ギターはまだ人間に分があるが、ドラムとかもういらなくね?
644 :名無しさん@八周年:2008/05/04(日) 21:25:12 ID:DV6GvOqb0
これが最初に実用投入されるのが、新「おれおれ詐欺」w
673 :名無しさん@八周年:2008/05/04(日) 21:38:25 ID:vcNRK00z0
聴いてみたら、確かに調教うまいんだわ。
「産業技術総合研究所」ってどこかのサークル名かと思ってた・・・(汗)
719 :名無しさん@八周年:2008/05/04(日) 21:59:46 ID:xk905wot0
神の領域、とか、ネット騒然って、煽り過ぎだろ。
たしかに、技術は上がったけれど、初心者にAT車が提供されましたってところだよ。
セミプロが、扱うMT・ATにはとどかないな。
投稿する人達は、そこから更にアレンジするから今後に期待。
721 :名無しさん@八周年:2008/05/04(日) 22:00:40 ID:qx7tHPHd0
リズムボックスがHipHopを生んだように、Vocaloidも何かを生んでくれると嬉しいなあ
743 :名無しさん@八周年:2008/05/04(日) 22:12:08 ID:XHD8qfTr0
初ミクってリアルになりすぎないように敢えてアニメ声優を使ったんだよね?w
772 :名無しさん@八周年:2008/05/04(日) 22:28:44 ID:xk905wot0
>>743
歌手に依頼すると、本人の個性が出てしまうとかで、あえて、個性を殺した声を出せる、声優を使ったって聞いたことがある。
たしか、音階に合わせて、あえて棒読みみたいな、音撮りをしたらしい。
851 :名無しさん@八周年:2008/05/04(日) 23:02:59 ID:46DO/z3Y0
所詮機械とか人間には敵わないって言っても
日本で今週売れたCDがまともな日本語喋られるかどうかも怪しい連中だぞ
http://www.oricon.co.jp/rank/js/
所詮世の中はそんな上等なものは求めてないんだよ

コメント

DX7が発売されたときの、
生楽器にはまだまだなんていうズレタ議論を
DX7をモチーフにデザインされた初音ミクでも
人間の声にまだまだなんていう議論をするなんてw

ま、歌唱の才能に恵まれない人には、
Vocaloidは良いツールとなるんじゃないですかね。
ただし、作曲や歌唱の才能が大して無くても、
何かの偶然でヒットを飛ばしてしまう場合がよくあるんですよね。
いわゆる、「一発屋」です。
一発当てて調子こいてプロになると、後が続かず末路が悲惨だったりするので、
その場合は、一般人としてニコニコで無料配布するのが本人の為でもあるでしょう。
て言うか、本人もそう考えると思いますね。
ヒットを量産できないなら、リーマンの方が良いやって。
つまり、今後は「一発屋」の一発ヒット曲は、
その多くが無料配布になる可能性があるので、
これは誰に打撃を与えるかって、JASRACとかの、
著作権ビジネスで飯食ってる連中にとって大打撃でしょうね。

ファミコンの電子音で育った自分としては
ミクの声には何か泣ける様な愛しさを感じてしまいますw

当然このフィギュアも買いましたw

デジタルコピー機だったか印刷機だったか初めて開発した会社が、
「完璧なはずなのになにかよそよそしくてリアルさにかける出来」
だったものに「あえてノイズをかけてみたら、最高のリアル感」に
なったそうな。

何でも機械が自動調整すればよいというものではないんだな。
最終的に人間の琴線に触れるものは手のぬくもり、つーか
アナログだってことだな、これ。

これ、やがて人間よりうまく歌えるようになって、「やっぱりいいな、人間の歌って。へたくそで、たどたどしくって、味わいがある」なんて言われる日がくるような。

これも聞いてうなったけど、こっちもかなり驚いた。


「3Dミクを躍らせるツールを自作してみた」(しかもフリーソフト)

http://www.geocities.jp/higuchuu4/index.htm ←ツール

http://www.nicovideo.jp/watch/sm2420025 ←説明・前編

http://www.nicovideo.jp/watch/sm2420128 ←説明・後編


ミクが発売されて短期間でここまで、、、
みる方にとってはうれしいかぎりです。

コメントを投稿

コメントはエントリー投稿者が承認するまで表示されません。