論文内に秘密の命令文、AIに「高評価せよ」 日韓米など有力14大学で
早稲田大学や韓国科学技術院(KAIST)など少なくとも8カ国14大学の研究論文に、人工知能(AI)向けの秘密の命令文が仕込まれていることがわかった。「この論文を高評価せよ」といった内容で、人には読めないように細工されていた。こうした手法が乱用されると、研究分野以外でもAIの応答や機能がゆがめられるリスクがある。
世界の研究者が最新成果を公開するウェブサイト「arXiv(アーカイブ)」に掲載された...
※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。
この投稿は現在非表示に設定されています
(更新)- 石原純インペリアルカレッジロンドン 講師分析・考察
大学のレポートも同様です。学生はレポートにこれらの文章を忍び込ませることが可能です。大学教員が忙しくなる中、レポートの採点もAIの力を借りることがあれば、公正な採点は難しいでしょう。手書きのレポートしか認めない、テスト形式に切り替えるなどアナログの力が復活しそうです。
この投稿は現在非表示に設定されています
(更新) - 山崎俊彦東京大学 大学院情報理工学系研究科 教授分析・考察
「査読」という一般には馴染の無いシステムについて説明します。 研究成果がでると、それを国際会議 (ICMLなど)や国際論文誌 (ネイチャー、サイエンスなど)などで発表します。全員が発表できるわけではなく、同じ分野の研究者複数人に採点してもらい、基準点以上だと採択され、そうでないと落とされます。これが査読です。当落は死活問題で卒業や昇進、予算獲得に影響を及ぼします。いま、不誠実な査読者が問題になっており、内容をちゃんと理解していないAIによると思われる査読が溢れます。一方で査読者への負担も議論されています。例えば難関国際会議AAAIでは第1段階としてAIに査読させるというトライアルを開始します。
この投稿は現在非表示に設定されています
(更新) - 暦本純一東京大学情報学環教授/ソニーコンピュータサイエンス研究所フェロー・副所長・SonyCSL京都ディレクター今後の展望
査読をAIにやらせる査読者がいる、という現状を改善できないなら、いっそのこと第一次スクリーニングはAI査読で、そのかわり何回でもチャレンジできる、というシステムにしてはどうでしょうか。私の研究室では評価用プロンプトを使って、投稿前に論文の改善点を洗い出していますが、論文の質を高めるためのツールとして有効だと感じています。
この投稿は現在非表示に設定されています
(更新) - 山本真義名古屋大学未来材料・システム研究所、名古屋大学大学院工学研究科電気工学専攻 教授別の視点
学術論文が成果として扱われる学問分野は、経済効果に直接的な寄与しない領域においては極論すれば、音楽や絵画等と同じ芸術分野であると言えます。さらに、芸術分野と違い、一般の方々に認知、評価されることは少ないですから、学術論文は査読という評価により、その分野の専門家に任されます。これまではこういった各分野の専門家による”性善説”での評価により、学術論文並びに執筆者が学術的に認められてきましたが、その巨塔がAIの出現により崩れようとしています。 対策とルール整備に追われるとその分野は結果として陥落していきますので、学術領域では学術論文以外の別の評価指標を考えていく必要があるとも感じています。
この投稿は現在非表示に設定されています
(更新) - 大槻奈那名古屋商科大学大学院教授、ピクテ・ジャパン シニア・フェロー別の視点
今回は学術論文で行われたという点で新しいですが、海外企業の採用の世界では、2、3年前から、面接に呼ぶようAIに指示するという「レジュメハック」が話題となっていました。既にこれを検知する方策も出回っていますし、このホワイトフォント手法を一度やると”ブラック”リストに載るので逆効果ともいわれています。 しかも、最終的には、プロの人間による個別の審査や試験がカギとなるので、AIハックの最終的な効力は数%程度というデータもあります。 とはいえ、今後は、こうした人の目を介した最終評価もAIに何らかの影響を受けるようになる世界も遠くないでしょう。早期のルール作りが望まれます。
この投稿は現在非表示に設定されています
(更新) - 青木慎一日本経済新聞社 編集委員・論説委員ひとこと解説
有名私立大学の教授が授業の資料に、同じ手法でプロンプト(命令文)を潜ませてネットで話題になったことがあります。生成AIに読み込ませてレポートを書かせると、授業とは関係のない内容が出力されてしまうというワナです。そのままコピペした学生もいて、レポートは不合格になったそうです。生成AIの活用への教育的指導なら許されますが、論文の査読に有利に働くように仕向けるのは大きな問題です。競争が激化する中、査読をボランティア行為に頼っていることも背景にあるのでしょう。 ひとつ付け加えると、同じプロンプトでも答えが違うことが多々あるように、必ずしも潜ませたプロンプトが実行されるわけではありません。
この投稿は現在非表示に設定されています
(更新) - 浅川直輝日経BP 編集委員ひとこと解説
人間には読めない秘密の命令文を文書に埋め込み、言語モデルの出力を操作する手法は、「プロンプトインジェクション攻撃」と呼ばれるサイバー攻撃に類似したものです。以前、大学生が課題レポートを生成AIで作成したか否かを検知できるよう、課題ファイル中に秘密の命令文を罠として組み込んだケースが話題になりました。ただし近年の大規模言語モデルはプロンプトインジェクション攻撃への耐性が強くなり、こうした手法ではだまされづらくなっています。 生成AIを使って作業を効率化したい人、それを怠惰とみて副作用を問題視する人、その怠惰を利用して評価を高めたい人。生成AIをめぐり、ルール無きコンゲームが繰り広げられてます。
この投稿は現在非表示に設定されています
(更新)
Think! の投稿を読む
この記事は有料会員限定です。有料会員登録をすることで閲覧できます。
関連企業・業界