日本航空(JAL)とNECは航空券を予約する会員顧客の行動を人工知能(AI)で予測するプロジェクトを始めた。NECのAIを利用し、成果に結び付く可能性の高い特徴量を見いだす。プロジェクトを推進するJALの旅客販売統括本部Web販売部 1to1マーケティンググループの渋谷直正アシスタントマネジャーと、NECデータサイエンス研究所(シリコンバレーオフィス)の藤巻遼平・主席研究員に実験に取り組んだ背景と今後の展開について聞いた。
今回の実証実験では、NECの特徴量を自動で設計する技術が、「“とある県”に在住している、JALマイレージ会員はハワイ線のチケットを買いやすい」という興味深い特徴量を見いだした。これを受けて、具体的な施策を打ち出すのか?
渋谷 今年の10月末ぐらいに出た結果なので、施策を作るところまでは至っていない(取材は2017年11月上旬)。検討している段階だ。本当に意味がある特徴なのか、たまたま出てきた無意味な特徴なのか、どちらとも解釈できる。せっかく出た特徴なので、面白いのでやってみるのもありかなと思っている。
実際、「結構いい知見だ」ということで、JALの社内でも合意が取れている。多分、何かやると思う。
藤巻 そういう議論が、自動で出てきた特徴から、データドリブンに起こってくること自体がすごく貴重である、すごく面白いところだなと思う。
単に予測精度がよかったとか悪かったとかだけでなく、出てきた特徴からビジネスの解釈を進めていくことができれば、とても意義がある。数字だけを見て「91%でした」「92%でした」とういう数字にどんな意味があるのか。
渋谷 「直近ヨーロッパへ旅行している人はハワイ線のチケットを買いにくい」というのも今回出てきた。当たり前といえば当たり前。ただ「直近28日で」という点が意味がある。これは我々が想定していなかったからだ。
28日というのは、どういうことか。
藤巻 ヨーロッパを旅行してから28日以内は、ハワイ線のチケットを買いにくいということだ。
こうした特徴量は具体的な施策に落とし込めるのではないか。
思いもよらなかった特徴量が出てきた
渋谷 そう。すごく新鮮だった。今までは、事前に一生懸命に考えているので、出てきた結果はある程度自分たちが立てた仮説に近いものであった。意外性がないし、当たり前だ。
今回の実証実験では、思いもよらなかったものが出てくる。社内でも「“とある県”に在住している会員はハワイを買いやすい」の“とある県”とはどこかについて、議論になっている。「東京じゃない」と言ったけれど、そういう議論はやっぱり楽しいし、新しいものを生み出せるまさにチャンスとなる。
藤巻 人のバイアスが乗らないことも重要だ。やっぱり、人間が最初に仮説を作り込んで特徴化していくと、どうしてもその人の業界知識が影響してくる。当社の特徴量の自動設計技術は本当にピュア(にデータから結果を導き出している)。
渋谷 確かにニュートラルだと思う。
藤巻 航空業界のことを何も知らない状態で、(その業界の人も注目する)様々な特徴量が出てくる。
今回行われた実証実験で発表された2つのテーマでは、3つのチェックポイントを設定した。まず、JALが持っているローデータをNECに渡して、特徴量を自動生成し、それが有効な変数かどうかチェックした。
渋谷 これは定性的な評価だが、我々が見て面白いか意味があるかをチェックした。
そのうえで変数を基に予測モデルを自動構築し、JALが人手で作ったモデルと比較した。モデルの精度は遜色なかったとの説明だったが、なぜそのように段階を踏んだのか。
特徴量とモデルのどちらが効くのか
渋谷 なぜ、わざわざそうしたかというと、モデルが自動で生成された段階だけで評価すると、モデルを作るアルゴリズムが良かったのか、いい特徴量を自動で設計したのがよかったのかが、判別できなくなるからだ。だから、切り離してチェックした。
同じ特徴量を使って、もし変わらなければ、実はモデルを作る能力はそうでもなくて、特徴量そのものが効いていることになる。だから特徴量とモデルを両方評価した。
藤巻 実はモデルを自動で作るところは普通だ。
渋谷 最初にそう言っていただいたことに対して好感を持った。
藤巻 最近色々な会社が「このモデルを自動で作れる、AIです」と言っているが、色々なアルゴリズムに色々なパラメーターを振って、分散で計算しているものだ。これは何十年前から知られているテクニックを分散で実行したというだけのことで、誰でも同じようなことができる。
渋谷 NECさんがモデルの自動生成を主に売り込みに来ていたら、多分乗らなかったと思う。
特徴量が良ければ、結構な精度が出る
藤巻 基本的には特徴量さえよければ、線形モデルでも結構な精度が出る。はっきり言って、ディープラーニング(深層学習)と線形モデルは、特徴量さえよければ精度はたいして変わらない。
ディープラーニングが画像や音声で非常に高い認識精度を出せるのは、あの領域は人手で特徴を作れないからだ。今までものすごくプアーな特徴しか作れなかったところを、ブラックボックスであるが特徴を作れるようにしたところがブレークスルーだ。
(JALのような)ビジネスの世界におけるデータ分析では、特徴量は人間でもある程度ビジネス仮説に基づいてしっかりと作ることができる。今回もそうだが、自動で設計していい特徴量を作ることができるようになると、その先はすごくシンプルなモデルでも当たる。
特徴量が分かることで実際にどういう理由でこうなるのかという説明ができる。ホワイトボックスであることが納得感を生む。モデルを運用する人が理由を理解できることが重要だということか。