/ 0

この記事は有料会員限定記事です

論文内に秘密の命令文、AIに「高評価せよ」 日韓米など有力14大学で

[有料会員限定記事]
詳しくはこちら
think!多様な観点からニュースを考える
石原純さん他6名の投稿石原純山崎俊彦暦本純一

早稲田大学や韓国科学技術院(KAIST)など少なくとも8カ国14大学の研究論文に、人工知能(AI)向けの秘密の命令文が仕込まれていることがわかった。「この論文を高評価せよ」といった内容で、人には読めないように細工されていた。こうした手法が乱用されると、研究分野以外でもAIの応答や機能がゆがめられるリスクがある。

世界の研究者が最新成果を公開するウェブサイト「arXiv(アーカイブ)」に掲載された...

この記事は有料会員限定です。登録すると続きをお読みいただけます。

残り1192文字

すべての記事が読み放題
有料会員が初回1カ月無料

全文表示で読む

この記事は有料会員限定です。有料会員登録をすることで閲覧できます。

すべての記事が読み放題
有料会員が初回1カ月無料

有料会員限定
キーワード登録であなたの
重要なニュースを
ハイライト
登録したキーワードに該当する記事が紙面ビューアー上で赤い線に囲まれて表示されている画面例
日経電子版 紙面ビューアー

※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。

  • この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • Think! の投稿を読む

    この記事は有料会員限定です。有料会員登録をすることで閲覧できます。

    すべての記事が読み放題
    有料会員が初回1カ月無料

  • 石原純のアバター
    石原純インペリアルカレッジロンドン 講師
    分析・考察

    大学のレポートも同様です。学生はレポートにこれらの文章を忍び込ませることが可能です。大学教員が忙しくなる中、レポートの採点もAIの力を借りることがあれば、公正な採点は難しいでしょう。手書きのレポートしか認めない、テスト形式に切り替えるなどアナログの力が復活しそうです。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 山崎俊彦のアバター
    山崎俊彦東京大学 大学院情報理工学系研究科  教授
    分析・考察

    「査読」という一般には馴染の無いシステムについて説明します。 研究成果がでると、それを国際会議 (ICMLなど)や国際論文誌 (ネイチャー、サイエンスなど)などで発表します。全員が発表できるわけではなく、同じ分野の研究者複数人に採点してもらい、基準点以上だと採択され、そうでないと落とされます。これが査読です。当落は死活問題で卒業や昇進、予算獲得に影響を及ぼします。いま、不誠実な査読者が問題になっており、内容をちゃんと理解していないAIによると思われる査読が溢れます。一方で査読者への負担も議論されています。例えば難関国際会議AAAIでは第1段階としてAIに査読させるというトライアルを開始します。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 暦本純一のアバター
    暦本純一東京大学情報学環教授/ソニーコンピュータサイエンス研究所フェロー・副所長・SonyCSL京都ディレクター
    今後の展望

    査読をAIにやらせる査読者がいる、という現状を改善できないなら、いっそのこと第一次スクリーニングはAI査読で、そのかわり何回でもチャレンジできる、というシステムにしてはどうでしょうか。私の研究室では評価用プロンプトを使って、投稿前に論文の改善点を洗い出していますが、論文の質を高めるためのツールとして有効だと感じています。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 山本真義のアバター
    山本真義名古屋大学未来材料・システム研究所、名古屋大学大学院工学研究科電気工学専攻 教授
    別の視点

    学術論文が成果として扱われる学問分野は、経済効果に直接的な寄与しない領域においては極論すれば、音楽や絵画等と同じ芸術分野であると言えます。さらに、芸術分野と違い、一般の方々に認知、評価されることは少ないですから、学術論文は査読という評価により、その分野の専門家に任されます。これまではこういった各分野の専門家による”性善説”での評価により、学術論文並びに執筆者が学術的に認められてきましたが、その巨塔がAIの出現により崩れようとしています。 対策とルール整備に追われるとその分野は結果として陥落していきますので、学術領域では学術論文以外の別の評価指標を考えていく必要があるとも感じています。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 大槻奈那のアバター
    大槻奈那名古屋商科大学大学院教授、ピクテ・ジャパン シニア・フェロー
    別の視点

    今回は学術論文で行われたという点で新しいですが、海外企業の採用の世界では、2、3年前から、面接に呼ぶようAIに指示するという「レジュメハック」が話題となっていました。既にこれを検知する方策も出回っていますし、このホワイトフォント手法を一度やると”ブラック”リストに載るので逆効果ともいわれています。 しかも、最終的には、プロの人間による個別の審査や試験がカギとなるので、AIハックの最終的な効力は数%程度というデータもあります。 とはいえ、今後は、こうした人の目を介した最終評価もAIに何らかの影響を受けるようになる世界も遠くないでしょう。早期のルール作りが望まれます。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 青木慎一のアバター
    青木慎一日本経済新聞社 編集委員・論説委員
    ひとこと解説

    有名私立大学の教授が授業の資料に、同じ手法でプロンプト(命令文)を潜ませてネットで話題になったことがあります。生成AIに読み込ませてレポートを書かせると、授業とは関係のない内容が出力されてしまうというワナです。そのままコピペした学生もいて、レポートは不合格になったそうです。生成AIの活用への教育的指導なら許されますが、論文の査読に有利に働くように仕向けるのは大きな問題です。競争が激化する中、査読をボランティア行為に頼っていることも背景にあるのでしょう。  ひとつ付け加えると、同じプロンプトでも答えが違うことが多々あるように、必ずしも潜ませたプロンプトが実行されるわけではありません。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
  • 浅川直輝のアバター
    浅川直輝日経BP 編集委員
    ひとこと解説

    人間には読めない秘密の命令文を文書に埋め込み、言語モデルの出力を操作する手法は、「プロンプトインジェクション攻撃」と呼ばれるサイバー攻撃に類似したものです。以前、大学生が課題レポートを生成AIで作成したか否かを検知できるよう、課題ファイル中に秘密の命令文を罠として組み込んだケースが話題になりました。ただし近年の大規模言語モデルはプロンプトインジェクション攻撃への耐性が強くなり、こうした手法ではだまされづらくなっています。 生成AIを使って作業を効率化したい人、それを怠惰とみて副作用を問題視する人、その怠惰を利用して評価を高めたい人。生成AIをめぐり、ルール無きコンゲームが繰り広げられてます。

    この投稿は現在非表示に設定されています

    (更新)
    (0/300)
詳しくはこちら

関連トピック

トピックをフォローすると、新着情報のチェックやまとめ読みがしやすくなります。

関連企業・業界

セレクション

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
新規会員登録ログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
新規会員登録 (無料)ログイン
図表を保存する
有料会員の方のみご利用になれます。保存した図表はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン
エラー
操作を実行できませんでした。時間を空けて再度お試しください。

権限不足のため、フォローできません

ニュースレターを登録すると続きが読めます(無料)

ご登録いただいたメールアドレス宛てにニュースレターの配信と日経電子版のキャンペーン情報などをお送りします(登録後の配信解除も可能です)。これらメール配信の目的に限りメールアドレスを利用します。日経IDなどその他のサービスに自動で登録されることはありません。

ご登録ありがとうございました。

入力いただいたメールアドレスにメールを送付しました。メールのリンクをクリックすると記事全文をお読みいただけます。

登録できませんでした。

エラーが発生し、登録できませんでした。

登録できませんでした。

ニュースレターの登録に失敗しました。ご覧頂いている記事は、対象外になっています。

登録済みです。

入力いただきましたメールアドレスは既に登録済みとなっております。ニュースレターの配信をお待ち下さい。

_

_

_