2017年11月15日

いよいよ国内でも販売が始まったスマートスピーカーだが、現時点ではAlexa Skillの登録数が2万を超え、Google Homeなどの他のライバルを完全に凌駕する状況にある。Amazon Alexaは国内における投入時に250以上のスキルを発表するなど、現時点では独走状態にあると言える。

本日時点における19,963に上るAmazon.com: Alexa Skillsのカテゴリごとの内訳を見ると次のようになる(米国のみの数字。複数のカテゴリに登録されているスキルがあり合計は一致しない)。ゲームがおよそ5,000、続いてニュースが3,400、教育が2,800と続く。天気予報でさえ600近くもある。これだけあれば、きっと自分にあったスキルがあるだろうと期待するかもしれない。

Alexa_Skills


しかし数が多ければよいかというと、残念ながらそううまくはいかないのである。

利用一週間の壁


VoiceLabsによるThe 2017 Voice Reportには様々興味深いデータが掲載されている。そこで挙げられているのは次の無慈悲な数字だ。

Retention: A major issue for Voice Applications. When a voice application acquires a user, there is only a 3% chance that user will be active in the second week. There are outliers yielding greater than 20% second-week retention.

継続利用:これは音声アプリにおける主要な課題である。あるユーザが新たな音声アプリを利用開始した際に、次の週もそのアプリを使い続けている確率はわずかに3%である。一方で20%以上のユーザが次週以降も継続利用する例外的なアプリも存在する。


20,000を超えるアプリがあっても、ユーザにインストールされるアプリはその中のごく一部だ。The 2017 Voice Reportによれば、一つ以上のレビューが付いたアプリは全体の31%ということで、およそ2/3は一件もレビューのつかないゾンビスキルであるという。そして、インストールされるという極めて高いハードルをくぐり抜けたアプリでさえ、次の週まで生き残るのはその中のわずか3%なのだ。

ユーザに長く使ってもらうためには


では長くユーザに使ってもらうためには一体どのような工夫をすればよいのだろうか。5 ways popular Alexa skills keep users coming backでは、5つの方法を紹介している。

1.毎日新鮮なコンテンツを提供する


20%以上のユーザが1週間後にも使い続けているスキルは、毎日新たなコンテンツを提供するスキルであるという。やはりユーザに飽きさせないためには新鮮な情報をユーザに提供し続けることが有効なのだ。クラウドから情報を得ても良いし、自動的に生成しても良い。とにかくユーザを飽きさせないことが重要である。

ただ、単純にニュースを読み上げるだけであれば、モニタを使って画像メディアなどと一緒に見るほうがずっと早く正確に把握できる。音声インタフェースの特性を活かし、別のタスクをしているときであっても、短時間に要点だけを的確に伝える、というようなUXを追求してほしい。

2.毎日の習慣や必要性に触れる


習慣に組み込まれたり、必要があればユーザは使う。米国ではクリスチャンのための日々の聖書や祈り、有名人のゴシップ、ニュース要約などがこのカテゴリにおいて典型的な例であるという。天気予報や占いなども有用に思えるが、テレビが提供しているものはテレビで良いので、音声アプリならではの工夫が必要となるだろう。

開発者であれば自分のニーズを満たすだけに特化したスキルを実装することも可能だ。簗瀬さん(@yoh7686)のGoccoさん -声でコミュニケーションする家庭用Bot-はまさに彼の日々の様々な用事を満足するために拡張されている音声インタフェースだ。バスの時間を調べたり、家計への立替分を記録計算してくれたり、ごはんのメニューを提案してくれたり、雨が降る前に教えてくれたりと、様々な機能が日々追加されているという。こうした個人に特化した要求を個別実装なしに満たしてくれるような汎用エージェントが登場するのにはまだしばらくの時間がかかるだろうが、将来的にはこうした「スマートな」エージェントが実現すると期待したい。

3.個性を得る


音声は話者の様々な個性を表現することができる。エージェントが友達や家族のように振る舞ってくれればどうだろう? 初音ミクと会話ができるHey MIKU!はまさにこれを狙ったものであり、特に日本市場においては様々な個性をもったエージェントが登場するものと期待される。

将来的には、アニメやゲームとのタイアップも進められて、多くの萌えキャラが提供されるだろう。その場合には伺かのように外見を与え、モニタなどに連動して表示させるなどの方向性が考えられる(ゴーストとシェルを簡単に定義できるようになると良い)。この領域はおそらく日本が先行すると期待される分野だ。ただし、現時点の技術レベルでは流暢で自然な会話は望めないので、しばらくはロボホンのように年齢を幼く設定する、動物のように簡単な命令しか聞けないようにする、など不自然な会話を正当化する理由付けが必要になるだろう。

4.スマートホームデバイスを制御する


実用的な機能を有していれば利用継続率は高くなる。照明のON/OFFやエアコン調整など、日々家の中で行わざるを得ない様々なデバイス制御を肩代わりする機能を提供するならば、ユーザは継続して利用するに違いない。音声コマンドで家電を制御するユースシーンは未来予想においても常に扱われた題材であり、うまく実装すれば人の家電の使い方を一変させるだろう。

3と合わせて考えれば、大和ハウスとソニーCSLが提供した萌家電的なものもおそらく再登場することになるだろう。ただ、日本の家電メーカーの製品がスキルによって制御可能になるのか、というとしばらくは望み薄な状況だ。

5.使っていて楽しい


最後は感覚的なものとなるが、使っていて楽しい/嬉しいアプリかどうかは重要な要素だ。音声という人が普段コミュニケーションに使うインタフェースを利用しているのだから、コミュニケーション的な楽しさが含まれていてほしい。もしそれがなければ、それは単なる音声コマンドである。4のデバイス制御であれば効率優先で良いかもしれないが、それ以外はコニュニケーションによる味付けがほしいところだ。

ローンチ時に公開された100社、265種類のスキルを見てどう思うだろうか。この中で継続利用されるスキルがどれだけあるのか、確率から言えばほとんどすべてのスキルはすぐに飽きられて使われなくなってしまうだろう。望ましくは、先日のエントリ『スマートスピーカーの4つの特性とその可能性』で挙げたスマートスピーカの可能性を広げるようなスキルが数多く生まれることを期待したい。


lunarmodule7 at 07:07│Comments(0)

コメントする

名前
URL
 
  絵文字