はじめに
文系の皆さんがAI人材になるためのノウハウを投稿していきます。今回はAIの作り方を学んでいきます。「そもそもAIはどんなものか」について知りたい方は「AI作成の流れ」を把握、「AI企画」をスムーズに進行させるためにをご参照ください。
予測系AIの活用例を復習する
予測系AIの活用例としては次のような内容がありました。
予測系×代行型AIの活用例
- ローンの審査 (融資後の取引状況の予測)
- ネットワーク監視
- 発電所のデータによる異常値検知
予測系×拡張型AIの活用例
- 顧客行動予測
- 需要予測
- 最適販売価格の設定
- コールセンターの呼量予測
- 離職者の予測
これらを頭に入れながら、イメージを膨らませて作り方を把握していきましょう。
予測系AIはどのように作られるのか
予測系AIは次のようなステップで作ることになります。それぞれ順に見ていきます。
企画
- AIプランニング
- 目的変数/説明変数の定義
データ作成
- 学習データ準備
- データ前処理
学習
- AIモデル構築
- AIモデル精度検証
予測
- AIモデル実行
- 運用·再学習
#1では企画について解説していきます。
「企画」の作り方を理解する
AIを作る上で、「データ作成」「学習」「予測」の3つのステップがありますが、ここではさらに前工程である「企画」を入れた4つのステップで見ていきます。「企画」ステップは文系AI人材が担う重要な工程でもあります。また「データ作成」「学習」「予測」を支える重要なファーストステップでもあります。
「企画」ステップはさらに「AIプランニング」と「目的変数/説明変数の定義」の2つに分かれます。「AIプランニング」では、AIをどんな目的でどのように活用するか等を考え、全体の計画を作ります。「目的変数/説明変数の定義」では、AIプランニングで定義されたAIを、具体的にどんなデータで作るかを計画します。
目的変数は、「予測系AIに何を予測させたいか」の値になります。また、説明変数は、目的変数を予測させるために使う値です。ここでポイントになるのは、目的変数を精度高く当てるために、関連する筋のよい説明変数をできるだけ多くピックアップしておかなければいけないという点です。
「AI作成の流れ」を把握、「AI企画」をスムーズに進行させるためにで紹介した例を考えます。
「3年後に出世するかどうか」ということを当てたい場合に、「どんなデータが予測の役に立つのか」を考えていきます。
- 出身地
- 趣味
などは出世するかにはあまり影響がないかもしれませんし
- 挨拶するか
- 明るいか
- 悪口いわないか
- 勉強家か
- 営業得意か
は出世する人に共通の傾向が見出せそうな気がします。また、その他にも
- 遅刻しない
- 報告漏れがない
- 行動が早い
などなど考えられる値をリストアップしていきます。筋のよいであろう説明変数をピックアップしたら、実際にそれらの値がデータとして確保可能かを確認します。すぐに予測系AIを作りたい場合は、ピックアップした説明変数が過去にさかのぼってデータとして残っているかも確認が必要です。
そして最後に、どの期間のデータを使うかを決めます。たとえば、次のような期間指定の差によって、予測系AIの使われ方や予測精度が変わってきます。AIを何の目的で使うかによって適切な期間の設定を行なってください。
- 1年後に出世するかを予測するために、入社後3カ月のデータを使い予測する
- 3年後に出世するかを予測するために、入社後1年のデータを使い予測する
- 10年後に出世するかを予測するために、入社後3年のデータを使い予測する
1の予測モデルの場合は、短い期間のデータでクイックに予測させ、新人として入社した後に短期的に評価を受けそうな人を予測し配属に役に立てるようなイメージです。
2の予測モデルの場合は、通年の行動データを使い、リーダー職のような重要な職位につくかどうかのイメージです。
3の予測モデルは、未来の幹部候補を予測させるような活用イメージになると思います。
まとめ
企画では以下を行うことを解説しました。
- 目的変数を決める
- 筋のよい説明変数をピックアップする
- 説明変数がデータとして確保可能かを確認する
- どの期間のデータを使うかを決める
この作業を終えて次のステップの「データ作成」に進んでいきます。「予測系AI」「識別系AI」「会話系AI」「実行系AI」については、以下の記事でより詳しく解説していきます。