「そもそも生成AIでやるべきでない問い」に、企業が挑んでしまう問題
わりと複数の企業のお悩みが、「そもそも生成AIでやるべきでない問い」にチャレンジして疲弊してる。ので説明メモ。
大企業が生成AIを導入してうまくいかないケースの多くは、ツールの性能不足というより、業務設計がズレている印象があります。
もう少し正確に言うと、「AIが苦手な問い」をそのまま投げている。で、当然苦戦しています。
ポイントは大きく2つあります。
完璧性を要求する仕事を、やってはいけない
ステップが長く連鎖する仕事も、やらせないほうがいい
順番に解説すると…
そもそも完璧性を要求する仕事を、やってはいけない
生成AIは確率分布で、未来を予測したり、答えを予測するマシーンです。つまり、「確率的に間違えが発生する」ことは仕様の一部です。
なので、以下のような「そもそも100%の正しさを前提とする業務は苦手」です。
正解が一意で厳密:数式の厳密計算、機械語や厳密仕様のコード生成(1文字違いで壊れる領域)
誤りのコストが致命的:医療・法務・安全領域の最終判断、断定的なファクトチェック
見た目の細部が品質を決める:複雑な手指・ポーズなど、局所の破綻がそのまま品質事故になる制作
この場合、AIがイケてないのではなく、我々がAIにあたえる業務設計が間違ってます。
「細部の品質が100%でなくてもいいから成果がでる」や「成功率100%を要求されない」をみつけて、AIに与えることが大事。
長く連鎖する仕事もやらせないほうがいい
もうひとつの落とし穴がこれ。
例えば精度90%の仕事を、10回連続成功する確率は34%ます。つまり、操作ステップが長すぎて、全てのステップで成功しないといけない問題も相性が悪い。
要は、各ステップの成功確率が高くても、鎖の長さが増えれば落ちる。
「単発なら正確」なのに「沢山連結すると精度がでない」という問題です。
なので、AIに仕事を渡すなら「短い単位の仕事」で、「途中で人間が介入できる」構造にしておきましょう。
冷蔵庫をあけ、食材をとりだし、カットして、火をいれて、調味料で味をととのえるようなロボットは非推奨です。レトルト食品をレンチンしてくれるロボを作りましょう。
全体感が正しければうまくいく仕事
逆に、生成AIが得意なのは「全体感が正しければ成果になる仕事」です。
適切な情報が渡されているならば、多くの場合うまくいきます。
例えば、以下のような業務。
イベントの進行案:台本たたき台、タイムテーブル案、想定Q&A、盛り上げポイント、リスク(押し・トラブル)分岐など
企画提案書へのフィードバック:論点漏れ、反論想定、構成、比較軸、刺さる言い回しの案出
金融商品のポートフォリオの運用原則の策定
共通点は「厳密さ」より「筋の良さ」「網羅性」「比較軸」「言い回し」「観点」が価値になるところ。
つまり、確率的なブレを下流のエクスキューションで吸収できる領域です。
逆にAIで「正確性」を出せる分野もある
ここまで「AIは完璧性が苦手」と書いたけど、逆に AI単体でも、運用しだいで正確性を出せる分野 もあります。
ポイントはシンプルで、「大数の法則」や「平均回帰」が効くタイプの仕事です。つまり、一発勝負じゃなくて 試行回数を増やすほどブレが相殺されて、平均が安定していく領域。
「1回の正解」ではなく「1000回の平均」が正解になる仕事
たとえば、マトを鉄砲で撃つ作業をイメージしてください。
1発だけだと、確率的に外れることがあります。でも1000発撃ったら? さらに言うなら、1000発の“平均の着弾点”を測定したら?
1000発撃った平均値は(いったんバイアスの話を置けば)実質的にマトの中心に寄っていきます。これが、AIで正確性を作れるパターンです。
AIは1発の命中率を100%にはできないけど、「何回も打って平均を取る」運用にすると強い。
具体例を挙げると、こんなタイプ。
要約の精度を「集合知」で上げる
1回の要約は抜け漏れがある。でも複数パターン出して共通点を拾うと、だいたい正しい骨子が残る。文章の改善(推敲)を反復で収束させる
1回で神稿にはならないけど、「改善→評価→改善」を繰り返すと品質が安定する。“平均回帰”が効く。分類・タグ付け・優先順位付けみたいな集計系
1件ずつの判断はブレることがある。でも大量に処理して全体傾向を見るなら誤差が相殺される。A/Bテストや広告文案など、統計で勝ちが決まる領域
一発で当てる必要がなく、数を出して勝ち筋に寄せていくタイプ。
AIにだって定規や分度器が必要
それでも、どうしてもAIで精度がほしいなら…
人間がまっすぐの直線を引くときに定規をつかったり、円を完璧にかくときにコンパスが必要です。こういった道具を治具(ジグ)といいます。
どうしてもAIに精度100%を目指す仕事をさせたい場合は、同様にAIのための定規・分度器となるようなツールをつくり、それをAIに操作させましょう。
計算が苦手 → Pythonや計算機をコールさせるようにする
完璧な時系列情報の列挙 → 資料から引っ張ってくる
このように、厳密でなければならないこと(数字計算やファクト)は、AIから100%正確さが保証できる機械にアウトソースし、AIが担当するのは「ここで計算が必要かどうか」というより曖昧性の高い問にシフトさせることで問題を解決できます。
AIに“正確に答えさせる”のではなく、AIに“正確な道具を使わせる”。
これが現実的な解法。
「AIが考えて、人間が完璧に執行する」のほうが、たいていうまくいく
イラストでいうならば、
「AIがテーマを決め必要な構成要素の素案を出し、プロがしっかり描く」ほうが、
「プロがテーマを決め必要な構成要素の素案を出し、AIがしっかり描く」よりも品質がよくなります。
そういうことを考えると、「経営者が考えてAIが完璧に執行する」よりも
「AIが経営を考えて、人間が道具を使って完璧に執行する」ほうが、多くの場合うまくいきます。
経営判断は「全体感」が求められ、執行は「細部の完璧性」が求められるからです。
あるいは、こう言もいえます。
経営は「確率論」が大事な処理であり、執行は「決定論」が要求されるからです。
皮肉な結論
つまり生成AIの特性を考えると、皮肉にも
「数字だけを見て現場をコストカットしようとする経営者」が「最もAIで代替しやすい人材」で、「最も費用対効果がよい」DX施策となります。
我々マネジメント層のほうが、あとがないんですね。ヤバい。
AIに最初にリプレイスされないためにも、経営者もマネージャーも、現場やユーザーともっとふれあって、業務ドメインの解像度を高めていきましょう。手を動かす人は、思ってるより重要なんです。リストラとかを考えてる場合じゃないのです。
1: まずは業務フローをできる限りシンプルに
2: 正確性が必要なところには、正規表現やプログラムなど生成AIでない仕組みを
3: そもそも正確性に依存しない業務で、自社をドライブするには?という問いにコミットしましょう。
…ということで、わりと今の現場で起きている「AI導入したけどつかえない」系の議論の大半は、これで説明できるのではないかと思います。
過渡期の生みの苦しみだと思うのですが、みんながぶつかる課題なのでナレッジシェアできるといいなと。
いいなと思ったら応援しよう!
いただいたサポートは、コロナでオフィスいけてないので、コロナあけにnoteチームにピザおごったり、サービス設計の参考書籍代にします。


コメント