コラム
2018.02.27
【異常混雑予報】データの仕組みについてご紹介ー後編
いつもYahoo!乗換案内アプリをご利用いただきありがとうございます。
先日ご紹介した、「【異常混雑予報】データの仕組みについてご紹介-前編」の続きをご紹介いたします。
予測モデルについて
今回の異常混雑予報を実現するにあたり、以下2種類のモデルを利用しています。
- 概要: 通常時において高精度に予測
- 学習期間: 最低1ヶ月分
- 学習手法: 与えられたデータの中から同じ曜日、路線、方面、駅、時間で学習を行う
- 特徴: 学習時に花火大会やコンサートなどで極端に検索数が増えたデータが含まれる場合、このモデルでは通常時とは異なる波形を描くため除外される
- 概要: 指定された日付の検索数を高精度に予測
- 学習期間: 最低1ヶ月分
- 学習手法: N日前-M日前までの検索数をそれぞれ何倍して足し合わせれば予測対象日の検索数に近づくかを学習(1日の合計数ではなく時間単位)
- 特徴: bi と異なり、イベントやコンサートなどで検索数が伸びると予測される場合は出力にそのまま反映される
より学術的な内容が知りたい方は、論文が公開されていますのでこちらを御覧ください
bilinearモデルについて
http://dl.acm.org/citation.cfm?id=2807527&CFID=839804937&CFTOKEN=54259585
ARモデルについて
http://dl.acm.org/citation.cfm?id=2971718&CFID=839804937&CFTOKEN=54259585
異常混雑の検知
上記のモデルを使って算出したbi、ARの予測値を、時間帯毎に比較し倍率を出します。
ここで算出した倍率と、bi、ARで算出した予測値があらかじめ設定した閾値以上になった場合に、異常混雑が発生すると判断しています。
異常混雑検知の具体的な事例はYahoo! JAPANのビッグデータレポートでもご紹介していますので、ぜひこちらもお読みください。
まとめ
以上が異常混雑を検知する仕組みとなりますが、いくつかの注意点があります。
- 同じ混雑レベルでも乗車人数は異なる
比較した結果の倍率が同じでも、普段の検索数が少ない駅と多い駅では、ARで算出した予測値が大きく異なります。 - 検知しにくい駅が存在する
東京ドームなど定常的にコンサートが開催されている場所の最寄り駅については、普段から人が多いため異常として検知されないこともあります。またイベント等が発生する場所への経路が複数ある場合、経路が分散するため混雑を検知しにくい傾向にあります。 - 突発的なものや天候の変化に対応できない
事前に検索されたログから算出しているため、台風やゲリラ豪雨などによる利用者の変化への対応は今後の課題となります。 - 定常的な混雑とは異なる
今回の手法では突発的に発生する異常混雑は検知できますが、通勤や帰宅時間帯の定常的な混雑は検知の対象ではありません。これについてはまた別のアプローチで実装予定ですので、サービス提供まで今しばらくお待ち下さい。
異常混雑予報を使っていただく中で、「どういう仕組みで混雑を予測しているのだろう」「異常混雑って何を指してるの?」との疑問にお答えできるよう、この記事でご紹介いたしました。今後ともYahoo!乗換案内をご利用ください。
カテゴリ一覧
アーカイブ
- 2018年2月(4)
- 2018年1月(6)
- 2017年12月(6)
- 2017年11月(7)
- 2017年10月(5)
- 2017年9月(7)
- 2017年8月(6)
- 2017年7月(1)
- 2017年5月(2)
- 2017年4月(6)
- 2017年3月(16)
- 2017年2月(7)
- 2017年1月(2)
- 2016年12月(6)
- 2016年11月(4)
- 2016年10月(3)
- 2016年9月(6)
- 2016年8月(8)
- 2016年7月(2)
- 2016年6月(1)
- 2016年5月(2)
- 2016年4月(2)
- 2016年3月(9)
- 2016年2月(3)
- 2016年1月(2)
- 2015年12月(3)
- 2015年11月(1)
- 2015年10月(2)
- 2015年9月(2)
- 2015年8月(1)
- 2015年7月(1)
- 2015年5月(1)
- 2015年4月(1)
- 2015年1月(1)