病気によって声を失った男性。
全身の筋肉が次第に動かなくなるALSという難病を患い人工呼吸器をつけているため話す事ができません。
今は口に入れたチューブをかむ事で目の前にあるパソコンに文字を入力。
意思を伝えています。
しかも…。
これは本人の声。
入力した文字を本人の声で読み上げています。
そんな思いで残した声のデータを基にどんな文章を打っても自分の声で話してくれるのです。
病気になっても声で自分らしさを表す。
そのために声のドナーを集め患者の声の再現を手伝うという取り組みも始まりました。
(英語)ALSを患うこの男性は声を失う前にドナーの協力で自分の声を合成しました。
技術の進歩が可能にした声の再現を聞いて下さい。
「リハビリ・介護を生きる」。
今日は昨日に引き続き「私の声で話したい」というテーマでタレントの荒木由美子さんとお伝えしていきます。
よろしくお願いします。
お願いします。
昨日は声帯を取ってしまっても自分の体を使って声を出せるようになる声を取り戻す。
そんな様子をお伝えしましたが今日は病気によって自分の体から声が出なくなっても機械が自分の声で話してくれるというそんな画期的な技術をご紹介したいと思います。
しかし時代はすごい進化して。
人々を困ったところをすごく補ってくれるようになったんですね。
ゲストをご紹介します。
音声合成の研究に長年携わってらっしゃいます国立情報学研究所准教授の山岸順一さんです。
よろしくお願いします。
よろしくお願いします。
音声合成というのはよく聞かれるようになりましたが。
この技術はコンピューターが与えられた文章を人間の自然な音声を使って読み上げる技術を指します。
私はこの技術を使って声に障害のある方の福祉生活の質に役立つような技術を開発しようと研究しております。
今実際に福祉の現場で使われているものをちょっとやってみましょうか荒木さん。
タブレットですけどもまず文字を入力して下さい。
「…です」と。
滑らかですね。
本当にねしゃべっているような。
もう一度いってみますね。
これが音声合成な訳ですね。
これが音声合成技術です。
ではもう一つ今度は山岸さんの方にありますそちらの機器を使ってみましょう。
では山岸さんにやってもらいますがこれ1つの動作で入力していくタイプのものですね。
ALSの方ですと手を動かすのに難があったりします。
そういった方でも簡単に入力できるようにシングルクリックで全て操作できるようにとても賢いユーザーインターフェースになっております。
「ありがとう」。
このようにただクリックするだけで文章合成する事ができます。
クリックするだけで表現できる。
言葉が出てくるんですね。
なかなか自分の声自分の体では伝えられないのである能力を少しでも引き出してそれで意思伝達するようなそんな機器がどんどん出てきているんですが今患者さん本人の声を使った音声合成技術が注目されています。
ご覧下さい。
大丈夫?ベッドに横たわる1人の男性。
2009年全身の筋肉が次第に動かなくなる難病ALS筋萎縮性側索硬化症と診断されました。
あっどうもこんにちは。
いらっしゃいどうぞお入り下さいませ。
「あああれ先生だったんですか」って池田さんがびっくりしておられましたけどね。
病気になる前はクイズ番組をはじめテレビでも活躍していた篠沢教授。
ALSになってからは気管を切開し人工呼吸器をつけているため自分の声で話す事ができません。
でも2年前患者の会で講演するこんな映像が残されていました。
教授が話すのはかつて出演していたあのクイズ番組について。
紛れもなく篠沢教授本人の声。
どういう事なのでしょうか?都内のシステム開発会社。
パソコンで使うあるソフトを開発し篠沢教授の講演を手伝いました。
しゃべらせたい文字を入力してリターンを押すとこのパソコンのソフトウエアがその文字をその人の声の音声に変えてスピーカーから音が出るようになってます。
パソコンに文字を入力。
すると…。
「今日はとても暑いですね」。
第三者の声ではなく本人の声が読み上げる。
この音声合成ソフトの特徴です。
利用者は声を失う前に4時間ほどかけて1,000余りの例文を読み上げ自分の声を収録していきます。
「三月二一日京都は朝から快晴でした」。
「不法投棄はやめましょうという看板」。
こうして収録した声のデータをパソコンに移します。
音を細かく区切り子音と母音に分解します。
この「3月」の「sa」と「ga」。
それぞれの母音の「a」の部分を聞いてみると…。
前の「a」は明るく高いのに対して…。
後ろの「a」は低くザラッとしています。
前後の音のつながりなどによって実は何種類もの「a」があるのです。
音声を合成する時っていうのは何千個もある「a」の中のうちこの入力された文章に一番適当な「a」を探してきてその周りとのつながりとかも含めて適当なものを探してきます。
こうしてどんな文章を打ち込んでも本人の声で自然に読み上げる事ができるのです。
「夏休みはどこかにいかれましたか」。
現在およそ70人が利用しているというこのシステム。
利用者の一人嶋守恵之さんです。
診断から3年後に気管を切開。
今は人工呼吸器をつけています。
手足を動かす事も難しくなりましたが口の中にチューブを入れそれをかむ事によってパソコンに文字を入力。
自分の声で意思を伝えています。
外務省に勤務し海外赴任中にALSを発症。
41歳で病気が分かった時には…。
そんな時声の保存を勧めたのは…その人の個性だしあと元気があるないとかそういうのも分かったりするのでやっぱり声が無くなるって人間にとって大きい事なのかなと思って。
それで結局こういうものがあるのであれば補える事は補えばいいし。
有子さんの勧めを受け嶋守さんは声の収録を決意しました。
「3月21日京都は朝から快晴でした」。
「弁当を持って歩きに出かけました」。
病状が進行し少しろれつが怪しくなってきていました。
今できる事それを考え録音に集中していたといいます。
「広めの林道を見ながら花を見る」。
「ヤブツバキの葉が白く輝いています」。
そして今嶋守さんは…。
自分の声によって生きる気力を取り戻した嶋守さん。
そして家族にとっても…。
声だけじゃなくてそういう言い回しとか本人の声で言うと「ああそうそう」みたいな感じはしますよね。
普通どおりの会話をしてる気分にはなりますので。
やっぱり違うんじゃないかな。
やっぱりホッとするとかなにかしらあるんだと思いますよ。
ぬくもりまでも伝える声。
嶋守さんにとって自分の声とはどんな存在なのでしょうか。
「自分の声があるから完全ではないけれど自分らしさが保てていると思います」。
しかし声って本当に個性がそれぞれあるのでね。
自分らしさを取り戻せるというかそれがとても印象的ですし家族も何か…奥様が普通に会話をしてる感じがするとおっしゃってましたしご本人にとっても生きる気力が湧いてくるってすばらしい事ですね。
何か音声にしたあとにちょっと嶋守さんの表情が柔らかくなるようなそれも印象的でしたね。
このシステムの利用者なんですがおよそ4割の方が嶋守さんのようなALS筋肉が衰えていく病気の患者さん。
ほかにも咽頭がんや喉頭がん。
いわゆる喉のがんの患者さんの利用が多いという事です。
いずれ声が出なくなるという事は分かる訳ですから早めにこういうふうに収録をしておくと。
自分の声を再現する音声合成システムがあると親しい家族例えば自分の家内や子どももしくは親しい友人と今までどおりのコミュニケーションができる事になります。
ですので自分の今までの声のアイデンティティーを保つ事ができるという事だと思います。
しかし声って本当にその人をすごく表すものなんだなという事を改めて感じました。
今の音声合成システムは音のつながりをいろいろ考慮しています。
例えば日本語には50音あります。
ですので前の音を考慮すると2,500種類のつながりを考える事になります。
しかしながらこれ故にその方々から長時間の音声収録をする必要があります。
更にその長時間の収録にかかる費用というものも現実問題としてあります。
そこでなんですけども山岸さんたちは収録時間や費用の面で利用者の選択肢を広げようとこんな活動を始めました。
都内のビル。
その一室でボランティアによる録音作業が行われていました。
入れ代わりでブースに入り画面上に表示される原稿をおよそ40分間読み上げていきます。
このボランティアの人たちを募集したのは山岸さんです。
ボランティアの方の声を多く集める事で声のデータベースを作る事ができます。
障害者の方の音声合成機を素早く容易に作る事ができます。
ボランティアの声から作る平均声。
まず多くの人から声を集めます。
それぞれの特徴をならして平均声にすると…。
「600人のお客さんの人いきれに蒸し暑くて扇子を使わずにいられない」。
個人特有の抑揚みたいなものはあらかじめ除去してもしくはちょっと正規化しておいて平均声を作るという事になります。
この平均声という声のひな型に患者本人の声を掛け合わせる事によってその人だけの声のシステムを作る事ができるのです。
患者本人の音声は10分程度あればシステムが作れます。
ボランティアの声を多く集めるためボイスバンクと名付けられたこのプロジェクト。
山岸さんは2011年イギリスのエディンバラ大学と共同で始めました。
ALSを患う…病状が悪化する前に声を収録しました。
そしてボランティアの声を収録します。
1人当たり1時間700人もの声のデータを集めました。
その声を年齢性別更に地域ごとに分けます。
方言も含めていろいろなバリエーションの平均声を作ります。
そしてその中から男性で40代など条件に合った平均声にアーノットさん本人の声を掛け合わせます。
こうして出来上がったのがアーノットさん専用の音声合成ソフト。
パソコンに話したい文章を入力すると音声合成されたアーノットさんの声が読み上げてくれるのです。
ボランティアによる声の収録は日本でも始まりました。
東京だけでなく大阪名古屋でも行われそれぞれの方言で収録されます。
これまで500人以上が声のドナーとなり例文を読みました。
声を出したからといって別に減る訳でもないし体に負担がかかる訳でもないし。
こういうのだったら自分の声が出る限りはいつでも協力できるので手軽だなと思いますけどね。
こちらの女性は以前父親の病状が悪化し人工呼吸器をつけるかどうかの判断を迫られたといいます。
でもやっぱりあれをつけると声が出なくなるし意思表示ができなくなるというとこでやっぱりつけるのをやめたんですけれども。
なのでもし技術が進んであれをつけても何か意思表示ができるようになるとか何か技術が進むといいなと思いますよね。
さまざまな思いを乗せた声。
誰もが自分らしさを失わないように。
支援の輪が広がっています。
しかし骨髄とか臓器のドナーというのは一般的に聞きますけれども声のドナーですか。
びっくりしましたね。
気軽に参加できる。
減る訳でもないという話もありましたが。
お役に立つ事あるんですね。
これだったら「私たちだって」というようなそんな声もたくさん届くと思うんですけどね。
1つの平均声を作るのに少なくとも50人必要なんですね。
例えば各性別男性女性ごとに平均声を作ってかつ3世代ごと。
若い方30歳から60歳の方60歳以上の平均声を作るとしますと合計900人のボランティアの方の声のサンプルが必要になります。
ですのでまだまだ声のドナーの収集を続ける必要があると思います。
佐賀の女性もいますよ。
そうですね。
やっぱり九州の人は九州のにおいが少し出ますよね。
そうですね。
やはり各地で母音子音あとはアクセント型等が若干異なってきます。
ですので各地で各地のボランティアの声を集める必要があります。
でもね本人の声を長時間収録ではなくて10分間と短い時間というのはこれ本当画期的だとは思うんですけども症状が進行してしまって言葉が出しにくい。
障害が出てしまうという人はどうすればいいんでしょうか?こちらは世界で利用されている母音を表している図になります。
口の前の方に舌を動かして調音すると「i」の音になって真ん中の方に舌を動かして調音すると「e」の音に。
そして口の奥の方で調音すると「o」の音になる。
そういったような母音の種類を表している図です。
これはもちろん個人差はあるんですが相対的な位置関係というのはどの人にも共通だというのが大事な事なんですね。
ではこれを日本語に置き換えてみたいと思います。
はいこちらです。
こちらが先ほどの図から日本語の母音だけを取り出して平均の調音の位置を調べた図になります。
やはり日本語で見ても「あいうえお」という母音を調音する相対的な位置関係はどの人にも共通になっています。
ここである患者Aさんが「あ」と「う」しか発音できなかったとします。
この現在発音できる「あ」と「う」の音を手がかりに失われてしまった母音「い」「え」「お」を類推したいと思います。
まずこの母音三角形を現在発音できる「あ」と「う」が合うように平行移動させます。
この母音三角形からほかの失われてしまった「い」「え」「お」の調音する位置を類推する事ができます。
一度この調音する位置が類推できますとこれからこの母音を合成する事が可能になります。
すごいですね。
頭の中というかパソコンは…機械はどうなってるのかという。
どうなってるんでしょうね。
では実際にこのようにして声を修復して構築した音声合成サンプルを再生したいと思います。
では収録音声から流したいと思います。
そうですねえ。
ちょっと聞き取りにくい分からないですね。
聞きにくいですよね。
こちらが修復した合成音声になります。
文章になってますね。
ねえ。
そうですねまだ完全ではないんですが実際のその方の音声よりも聞きやすい音声にはなってるかなと思います。
今これを更にその人らしくかつ昔の健常時の声が再現できるようにさまざまな取り組み研究を行っております。
でも日本でその検証ができる時期っていうのは大体いつぐらいになるんでしょうかね。
今いろいろ準備を進めておりまして今年の12月もしくは来年初めぐらいに数名の方に対して検証を行おうと思っております。
これまで30名の方から早く使いたいというリクエストを頂きました。
実際にその中の一名の方をこの間収録したんですがその方からは自分の娘さんが結婚やあとは就職等の人生の大事な時に自分の声で「おめでとう」を言いたいと言っておりました。
お母様がですか?そうですね。
やっぱりそこにお母様の声が生きた声があるとうれしいですよね。
そうですね。
お母さんからしたら声をこれから失っていくかもしれない。
娘たちにその時に声をかけられないかもしれないという中でいろんな思いがあって…。
本当ですね。
アイデンティティーの中にはいろんなものがありますが声もその大事な一つだと改めて感じさせられました。
その声のアイデンティティーの中にも音響的な自分らしさ方言あといろんな要因があるんですがその一つ一つをきっちり再現していかないとその人の声にならないと。
いかにその人の声を再現するのが難しいかという事も改めて実感させられました。
声って奥深いですね。
そう考えるとね。
何か普通にお話をしてましたけどやっぱり個性自分らしさというのが声にはちゃんと乗っかってるんだなと思いますね。
どんどん技術が進んでいく事を私たちも願っていますしなにかしら力になれればなという気持ちでいっぱいになりました。
今日はどうもありがとうございました。
2014/09/18(木) 20:00〜20:30
NHKEテレ1大阪
ハートネットTV リハビリ・介護を生きる「私の声で話したい」(2)[字]
2)失った声を再現する▽病気などで声を失った人の「その人の声」を再現する取り組みが進んでいます。それを助ける「声のボランティア」ボイスバンクも日本で始まりました
詳細情報
番組内容
病気などで声を失ってももともとの「自分の声」で意思を伝えたい。そんな患者の思いに応える試行が進んでいます。ALS患者やがんの手術などで声を失った人たちの「自分の声」を再現する音声合成システムです。病気が重くなる前、あるいは声帯を摘出する前に一定の文章を録音しておけば、どんな文章でも入力して「自分の声で話す」事ができます。声はその人の個性の大事な一部です。「失った声を再現する」意味と可能性を考えます
出演者
【出演】荒木由美子,国立情報学研究所准教授…山岸順一,【司会】山田賢治
ジャンル :
福祉 – その他
福祉 – 高齢者
福祉 – 障害者
映像 : 1080i(1125i)、アスペクト比16:9 パンベクトルなし
音声 : 2/0モード(ステレオ)
サンプリングレート : 48kHz
OriginalNetworkID:32721(0x7FD1)
TransportStreamID:32721(0x7FD1)
ServiceID:2056(0x0808)
EventID:30022(0x7546)