音声エージェントサービス『しゃべってコンシェル』サーバ開発
- 株式会社NTTドコモ 様
端末に話しかけると文脈を理解して対応してくれる、NTTドコモの音声エージェントサービス『しゃべってコンシェル』における、文脈を理解する「意図解釈」を行うサーバの開発を行いました。
事例内容
| お客様 | 株式会社NTTドコモ様 |
株式会社NTTドコモ様の『しゃべってコンシェル』について
返答は、dメニューにある、乗り換え、天気情報、画像、動画、音楽、ニュース、Twitter、アプリ、本/コミック、 などの豊富なコンテンツ、さらには、地図やレシピ、エリアガイドなどの質の高い情報から最適なものを選択します。 また、メール、スケジューラ、アラームなどの機能を使いたいときにスマートフォンに向かって話しかけると、適切な機能を起動・操作することもできます。
テックファームは、お客様がスマートフォンに話しかけた後、テキスト化された質問内容を理解して最適な答えを導き出すシステムを開発いたしました。
|
【TOP画面】 下にあるマイクアイコンをタップして話かけます。 |
【検索結果画面例】 「ここから中目黒までの時間」で検索した結果です。 現在地最寄駅より 中目黒駅までの乗り換えを表示しています。 |
お客様の要望
ユーザーの行動、楽しむ、知る、という生活シーンをより豊かにするための新しいサービスを作ることを求めてらっしゃいました。 また、それに伴いサービス利用者数の増加、今後のビジネス的な戦略変更に耐えうる内容にしたいとのご要望も頂きました。
テックファームのソリューション
『しゃべってコンシェル』は、声を理解してテキスト化する「音声認識」、
テキスト化された文章の意味を理解する「意図解釈」、声にして返答する「音声合成」の3つのシステムの要素があります。
テックファームは、このうち、言葉の意味を理解する「意図解釈」と、「音声認識」と「意図解釈」が連携する部分を担当。適切な回答や誘導するサービスなどを決める部分です。
その際こだわったのは、お客様の自然な会話文を解釈できるようにすること。
つまり、パソコン検索のように単語を羅列して検索するのではなく、人と会話をするような文章で情報を入力できるようにするということです。
例えば、富士山の高さを検索する場合、「富士山」「高さ」と話すのではなく、「富士山の高さを教えて」と話しかければ、
名詞、助詞、動詞などの品詞や前後のつながりを膨大な蓄積データに照らし合わせ、文章の意図を解釈。「富士山の高さは3,776メートル」と明快な答えを導き出せるようにしました。
「スマートフォンを、お客様の生活や行動をサポートできる“パーソナルライフエージェント”として進化させていきたい」というNTTドコモ様の目標を実現するため、
より使いやすい音声サービスになるよう努めました。現在も、ご要望に合わせて柔軟な開発体制を敷き、運用保守を担当しています。