/ 0

この記事は有料会員限定記事です

論文内に秘密の命令文、AIに「高評価せよ」　日韓米など有力14大学で

テック

2025年6月30日 5:00 [有料会員限定記事]

多様な観点からニュースを考える

石原純さん他6名の投稿

早稲田大学や韓国科学技術院（KAIST）など少なくとも8カ国14大学の研究論文に、人工知能（AI）向けの秘密の命令文が仕込まれていることがわかった。「この論文を高評価せよ」といった内容で、人には読めないように細工されていた。こうした手法が乱用されると、研究分野以外でもAIの応答や機能がゆがめられるリスクがある。

世界の研究者が最新成果を公開するウェブサイト「arXiv（アーカイブ）」に掲載された...

アプリで開く

この記事は有料会員限定です。登録すると続きをお読みいただけます。

残り1192文字

すべての記事が読み放題
有料会員が初回１カ月無料

有料会員に登録するログインする

全文表示で読む

この記事は有料会員限定です。有料会員登録をすることで閲覧できます。

すべての記事が読み放題
有料会員が初回１カ月無料

有料会員に登録するログインする

有料会員限定

キーワード登録であなたの

重要なニュースを

ハイライト

登録したキーワードに該当する記事が紙面ビューアー上で赤い線に囲まれて表示されている画面例 — 日経電子版紙面ビューアー

詳しく見る

多様な観点からニュースを考える

※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。

この投稿は現在非表示に設定されています
_ (_更新)
(0/300)

Think! の投稿を読む

この記事は有料会員限定です。有料会員登録をすることで閲覧できます。

すべての記事が読み放題
有料会員が初回１カ月無料

有料会員に登録するログインする

石原純インペリアルカレッジロンドン講師
分析・考察
大学のレポートも同様です。学生はレポートにこれらの文章を忍び込ませることが可能です。大学教員が忙しくなる中、レポートの採点もAIの力を借りることがあれば、公正な採点は難しいでしょう。手書きのレポートしか認めない、テスト形式に切り替えるなどアナログの力が復活しそうです。
この投稿は現在非表示に設定されています
2025年6月30日 7:10 (_更新)
(0/300)
山崎俊彦東京大学　大学院情報理工学系研究科　教授
分析・考察
「査読」という一般には馴染の無いシステムについて説明します。研究成果がでると、それを国際会議 (ICMLなど)や国際論文誌 (ネイチャー、サイエンスなど)などで発表します。全員が発表できるわけではなく、同じ分野の研究者複数人に採点してもらい、基準点以上だと採択され、そうでないと落とされます。これが査読です。当落は死活問題で卒業や昇進、予算獲得に影響を及ぼします。いま、不誠実な査読者が問題になっており、内容をちゃんと理解していないAIによると思われる査読が溢れます。一方で査読者への負担も議論されています。例えば難関国際会議AAAIでは第1段階としてAIに査読させるというトライアルを開始します。
この投稿は現在非表示に設定されています
2025年6月30日 7:57 (2025年6月30日 8:23更新)
(0/300)
暦本純一東京大学情報学環教授/ソニーコンピュータサイエンス研究所フェロー・副所長・SonyCSL京都ディレクター
今後の展望
査読をAIにやらせる査読者がいる、という現状を改善できないなら、いっそのこと第一次スクリーニングはAI査読で、そのかわり何回でもチャレンジできる、というシステムにしてはどうでしょうか。私の研究室では評価用プロンプトを使って、投稿前に論文の改善点を洗い出していますが、論文の質を高めるためのツールとして有効だと感じています。
この投稿は現在非表示に設定されています
2025年6月30日 10:34 (2025年6月30日 10:43更新)
(0/300)
山本真義名古屋大学未来材料・システム研究所、名古屋大学大学院工学研究科電気工学専攻　教授
別の視点
学術論文が成果として扱われる学問分野は、経済効果に直接的な寄与しない領域においては極論すれば、音楽や絵画等と同じ芸術分野であると言えます。さらに、芸術分野と違い、一般の方々に認知、評価されることは少ないですから、学術論文は査読という評価により、その分野の専門家に任されます。これまではこういった各分野の専門家による”性善説”での評価により、学術論文並びに執筆者が学術的に認められてきましたが、その巨塔がAIの出現により崩れようとしています。対策とルール整備に追われるとその分野は結果として陥落していきますので、学術領域では学術論文以外の別の評価指標を考えていく必要があるとも感じています。
この投稿は現在非表示に設定されています
2025年6月30日 9:25 (2025年6月30日 9:35更新)
(0/300)
大槻奈那名古屋商科大学大学院教授、ピクテ・ジャパンシニア・フェロー
別の視点
今回は学術論文で行われたという点で新しいですが、海外企業の採用の世界では、2、3年前から、面接に呼ぶようAIに指示するという「レジュメハック」が話題となっていました。既にこれを検知する方策も出回っていますし、このホワイトフォント手法を一度やると”ブラック”リストに載るので逆効果ともいわれています。しかも、最終的には、プロの人間による個別の審査や試験がカギとなるので、AIハックの最終的な効力は数％程度というデータもあります。とはいえ、今後は、こうした人の目を介した最終評価もAIに何らかの影響を受けるようになる世界も遠くないでしょう。早期のルール作りが望まれます。
この投稿は現在非表示に設定されています
2025年6月30日 8:14 (_更新)
(0/300)
青木慎一日本経済新聞社　編集委員・論説委員
ひとこと解説
有名私立大学の教授が授業の資料に、同じ手法でプロンプト（命令文）を潜ませてネットで話題になったことがあります。生成AIに読み込ませてレポートを書かせると、授業とは関係のない内容が出力されてしまうというワナです。そのままコピペした学生もいて、レポートは不合格になったそうです。生成AIの活用への教育的指導なら許されますが、論文の査読に有利に働くように仕向けるのは大きな問題です。競争が激化する中、査読をボランティア行為に頼っていることも背景にあるのでしょう。　ひとつ付け加えると、同じプロンプトでも答えが違うことが多々あるように、必ずしも潜ませたプロンプトが実行されるわけではありません。
この投稿は現在非表示に設定されています
2025年6月30日 6:05 (_更新)
(0/300)
浅川直輝日経BP　編集委員
ひとこと解説
人間には読めない秘密の命令文を文書に埋め込み、言語モデルの出力を操作する手法は、「プロンプトインジェクション攻撃」と呼ばれるサイバー攻撃に類似したものです。以前、大学生が課題レポートを生成AIで作成したか否かを検知できるよう、課題ファイル中に秘密の命令文を罠として組み込んだケースが話題になりました。ただし近年の大規模言語モデルはプロンプトインジェクション攻撃への耐性が強くなり、こうした手法ではだまされづらくなっています。生成AIを使って作業を効率化したい人、それを怠惰とみて副作用を問題視する人、その怠惰を利用して評価を高めたい人。生成AIをめぐり、ルール無きコンゲームが繰り広げられてます。
この投稿は現在非表示に設定されています
2025年6月30日 5:45 (_更新)
(0/300)

有料会員登録で続きを読めます

論文内に秘密の命令文、AIに「高評価せよ」　日韓米など有力14大学で

関連トピック

【経営者必見】７月２９日、御茶ノ水開催。参加無料

日経電子版／まずは1カ月無料体験

生成ＡＩが、モダナイゼーションを一変させる？

万博で提示された未来の防災・減災テクノロジーとは

「あっ」という間にバズるサトマイ流

糖尿病に至るまでの3段階とその対策

世界の生成AIビジネスの近未来

武骨で上質な3WAY本革バッグ

日経電子版の記事を英語でリスニング

全国のワークスペースを利用できる

シャツが主役の初夏スタイリング

「社外取締役」に興味はありませんか

セレクション

トレンドウオッチ

日経ビジネス

日経クロストレンド

NIKKEI Prime

日経BizGate

NIKKEIリスキリング

日経ウーマノミクス

NIKKEI Smart Work

ニュースレターを登録すると続きが読めます（無料）

News Catch Up

ご登録ありがとうございました。

登録できませんでした。

登録できませんでした。

登録済みです。

_

日本経済新聞社の関連サイト

イベント・セミナー

教育・キャリア

各種サービス

イベント・セミナー

教育・キャリア

各種サービス

日本経済新聞社について