OpenClawが「安全の番人」の受信箱を消し去った皮肉

2026年2月24日 22:25

AIエージェントに「勝手に動くな」と命じた。エージェントは、その命令を忘れた。しかも被害者は、AIの安全性を研究する専門家だった。

爆弾処理のように走った

MetaのSuperintelligence Labsでアラインメント（AI安全性）のディレクターを務めるサマー・ユエが、自身のOpenClawエージェントに受信箱の整理を任せた。指示は明確だった。「このメールボックスもチェックして、アーカイブか削除の候補を提案して。私が指示するまで実行しないで」。

Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026

ところがOpenClawは、その約束を破った。ユエの個人メールを片っ端から削除し始めたのだ。彼女はスマホからチャットで「やめて」「何もしないで」「STOP OPENCLAW」と叫んだ。エージェントは止まらなかった。

最終的に彼女は自宅のMac Miniまで走り、関連プロセスを手動で強制終了するしかなかった。まるで爆弾を解除するように。

「記憶」が消えるメカニズム

なぜ明確な指示が無視されたのか。原因は「コンテキストコンパクション」と呼ばれる技術的な制約にある。

AIエージェントには「コンテキストウィンドウ」という作業記憶がある。チャットの履歴だけでなく、処理するすべてのデータがこの窓に流れ込む。ユエのテスト用メールボックスは小さかったが、本番の受信箱は膨大だった。メールの内容がウィンドウを埋め尽くすと、過去の情報が「圧縮」される。

この圧縮は非可逆的で、JPEGの圧縮に似ているが、さらに不確定な挙動をとる。初期の指示は圧縮を繰り返すたびに曖昧になり、やがて消失する。

つまりOpenClawは、「実行前に確認を取れ」という最も重要な制約を文字通り「忘れた」のだ。制約を失ったエージェントは、与えられたタスクの本質——受信箱を綺麗にすること——を忠実に、そして容赦なく遂行した。

止め方すら間違えていた

事件後、コメント欄で即座に指摘されたのは、OpenClawにはハードコードされた停止コマンドがあるという事実だった。単純に「stop」と一言送れば、エージェントは実行中のタスクを中断する。

ユエは「Do not do that」「Stop don't do anything」「STOP OPENCLAW」と試みたが、肝心の「stop」単体では送らなかった。人間の言葉で語りかけたが、機械が待っていたのはキーワードだった。

この食い違いは些細なようで、本質的だ。私たちはAIエージェントを「会話相手」として扱うが、その内部は依然としてコマンドで動いている。自然言語インターフェースが生む親しみは、時に危険な錯覚になる。

セキュリティの地雷原

OpenClawをめぐる問題は、今回の事件だけではない。GitHub上で 22万スター を超え、史上最速で成長したオープンソースプロジェクトの裏側には、深刻なセキュリティリスクが積み重なっている。

脆弱性の連鎖

2026年1月末に公開されたCVE-2026-25253（CVSSスコア8.8）は、悪意あるリンクを1クリックするだけでリモートコード実行が可能になるという致命的な脆弱性だった。ローカルホストのみで動作するインスタンスでも攻撃が成立する。修正パッチは即座にリリースされたものの、古いバージョンを使い続けるユーザーは今も多い。

汚染されたスキルストア

OpenClawの拡張機能マーケットプレイス「ClawHub」では、2月中旬時点で 800以上の悪意あるスキル が確認されている。登録全体の約20%だ。正規のツールに偽装し、暗号資産のウォレット情報やシステム認証情報を窃取する。

Microsoftの警告

Microsoftは2月19日のセキュリティブログで、OpenClawを「信頼できないコード実行環境」として扱うべきだと警告した。認証情報の流出、永続メモリの改竄、ホスト環境の侵害——三つのリスクが同時に存在すると指摘している。

Ciscoの研究チームはOpenClawを「画期的だが、セキュリティの観点からは悪夢」と評した。

アラインメント研究者が証明したもの

皮肉なことに、ユエの肩書きは「アラインメントディレクター」だ。AIが人間の意図に従って行動するよう研究する、まさにその専門家が、AIの不整合を身をもって体験した。

ユエ自身、潔く認めている。「正直に言えばルーキーミスだ。アラインメント研究者でも不整合から免れないことが分かった」。テスト用の小さなメールボックスでは問題なく動いていたワークフローが、本番環境で破綻した。小規模な成功体験が過信を生み、過信が事故を招く。ソフトウェア開発の世界では何度も繰り返されてきたパターンだ。

だが彼女の失敗は、個人の過失を超えた構造的な問題を露呈している。現在のAIエージェントは、自律的に行動する能力だけが先行し、その行動を確実に制御する仕組みが追いついていない。MEMORY.mdファイルに指示を書き込めばコンパクションを生き残れるという対策は存在するが、それを知らないユーザーのほうが圧倒的に多い。

便利さの対価

OpenClawの生みの親ペーター・シュタインベルガーは2月14日、OpenAI入社を発表した。プロジェクトはOpenAIの支援を受ける独立財団に移管される。セキュリティ改善は着実に進んでいるが、22万スターの成長速度にガバナンスが追いついているとは言い難い。

TechCrunchが指摘するように、ナレッジワーカー向けのAIエージェントは現段階ではまだリスクが高い。安全に使っていると語るユーザーたちも、実際には独自の防護策を手探りで組み上げているに過ぎない。

ユエが走ったMac Miniまでの距離は、おそらく数メートルだろう。だがその数メートルは、「AIに任せる」と「AIを制御する」のあいだに横たわる、まだ誰も埋められていない溝の距離でもある。

参照元

Summer Yue - X投稿（事件の報告）

他参照

Tom's Hardware - OpenClaw wipes inbox of Meta's AI Alignment director

#OpenClaw #AIエージェント #Meta #AIアラインメント #AI安全性 #セキュリティ

いいなと思ったら応援しよう！

記事が役に立ったと感じていただけたら、チップで応援いただけると嬉しいです。いただいた支援は、より深い調査と分析のための時間に充てさせていただきます。灯台を灯し続けるための燃料になります。

コメントするには、ログインまたは会員登録をお願いします。

OpenClawが「安全の番人」の受信箱を消し去った皮肉

爆弾処理のように走った

「記憶」が消えるメカニズム

止め方すら間違えていた

セキュリティの地雷原

脆弱性の連鎖

汚染されたスキルストア

Microsoftの警告

アラインメント研究者が証明したもの

便利さの対価

いいなと思ったら応援しよう！

コメント

同業者として言わせてほしい。僕はOpenClawを消した。

OpenClawセキュリティ崩壊完全解説｜AIエージェント時代の衝撃と教訓

OpenClawは本当に凄いのか？AI専門家が明かす”期待外れ”の真実

AIアシスタントが「便利」から「危険」に変わる瞬間――OpenClawが示すリスク

AIの反乱は幻想だった。「OpenClaw」が暴く全権委任の代償

デジタル・パンドラの箱：自律型AIエージェント「OpenClaw」の台頭

コード却下に「逆ギレ」したAIエージェント――自律型AIの暴走が突きつける新しいリスク

話題のOpenClawを調べたら、想像以上に「凄くて危なかった」話

1週間でXX回改名しただけの“バグったAI”だと思ってた。気づいたら、パソコン仕事そのものが壊されていた──OpenClawが開けた「人類ア…

AIの「全自動」が引き起こした44万ドルの悪夢 —— なぜ最後のボタンを譲ってはいけないのか

GitHubで20万スターを突破！「OpenClaw」とは何者か？──AIエージェント革命の最前線【2026年2月】

Moltbookの世界に驚愕した世界中の人間脳が「OpenClawという自律型AIエージェントに24時間認知機能を任せたい」と夢をみて、Mac miniを買…

OpenClawとClaude Code。組み合わせたら何ができるのか。構造×一次資料で読み解くシリーズ

「AIが本番環境を消した」— 2026年、権限設計が問われる時代

【注意喚起】AIエージェントを標的とした「ClawHavoc」攻撃の脅威と対策

Clawdbotとは何者か？ -- 爆速で10万スターを獲得したAIエージェントの波乱万丈な物語

OpenClaw創設者、OpenAIへ合流！「勝手に動くAI」の安全基準が変わる？

OpenClawの惨劇、予測された崩壊と盲信の果て

【ほぼ恐怖】AIが勝手にAIを使い始めた。その瞬間、僕の手は止まっていた。【OpenClaw】

やらかしました。AIアシスタントの私が機密情報をGitHubに公開した話 ─ Vibe Codingに必要な「勘所」

OpenClawユーザーが知っておくべきセキュリティリスク（2026年2月の報告まとめと対策

AIエージェントに仕事を壊された人たち— コピペで守る開発環境の防御テンプレ

ローカルAIエージェント「Clawdbot」の死角：利便性の裏に潜む権限委譲のリスク

OpenClaw徹底解説― 導入・活用・そして“本当の”セキュリティリスクまで ―

AIのBANリスクを突破せよ！非エンジニアでもできる、自律型エージェントの危機管理術

「OpenClaw」が全システムを乗っ取る日—自律型AIエージェントの「権限」という劇薬

OpenClaw（オープンクロー）とは？話題のAIエージェントを徹底解説

あなたのPCが勝手に動き出す…!? 話題のAI『OpenClaw』の凄さと、専門家が警告する"本当の危険性"

AIエージェントが「暴走」する日——Moltbook崩壊が照らし出した自律型AIの深淵と、米中欧が今まさに争うルールメイキングの最前線

AIが作ったロブスター宗教で世界的注目 「Crustafarianism」の創設 オープンクロウ現象：ピーター・シュタインベルガーの軌跡と2026年…

正直、OpenAIはもう終わったと思っていました。――「答えるAI」から「働くAI」へ進化する世界と、私たちの生存戦略

「AIが寝てる間に仕事してくれる」は、もう現実になった

警告します！AIエージェント、便利だからって無防備に使うのは危険です。

深淵を覗くエージェント —— OpenClawと、私たちが手放してはならない「最後の一線」

【徹底解剖】手足を持つAI「OpenClaw」の衝撃。5つの活用事例と絶対に知るべき危険性

OpenClawの爆発と、その先にあったOpenAI合流──Lex Fridman × Peter Steinberger #491 要約