- PDF:PDF版をダウンロード
[888KB]
- DOI: https://doi.org/10.15108/stih.00428
- 公開日: 2026.03.30
- 著者: 尾﨑 翔美、小柴 等
- 雑誌情報: STI Horizon, Vol.12, No.1
- 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)
レポート
撤回論文の最新動向
-著者別分布・国際比較、撤回理由の変化と生成AIを
めぐる論点-
査読を経て出版・公表された論文について、後に内容の妥当性が再検討され、撤回に至る事例が増加している。本レポートでは、NISTEP DISCUSSION PAPER No.239「撤回論文の概況 2024」(DP239)からデータ取得期間を2025年11月まで更新して撤回論文の動向を追加分析した。特に、撤回数と著者数の関係については、DP239と同じく大多数の著者が少数の撤回にとどまる一方で、少数の著者が大量の撤回に関与するという構造が観測された。さらに、その現れ方に国・地域によって差異がみられることから、ジニ係数及び撤回数上位1%著者のシェア(Top1%シェア)を用いて、その差異を定量化して比較した。また、撤回理由として「Paper Mill(論文工場)」や、生成AIが関係している可能性もある「Computer-Aided Content or Computer-Generated Content」が近年増加していることを確認した。加えて、生成AIの利用に伴う撤回動向や、生成AI等が学術情報の流通・評価システムに与え得る影響に関する論点も紹介した。なお、撤回理由には不注意によるミスも含まれる。本稿は撤回状況の記述を目的としており、研究不正に関する議論に直接結び付けられるものではない点に留意されたい。
キーワード:撤回論文,Retraction Watch,生成AI,学術情報の流通・評価
1.はじめに
科学技術・学術政策の立案・遂行には、研究活動の実態把握が不可欠である。研究活動の過程では、不注意等に基づくミスにより偶発的に、時には不正行為などにより意図的に、論文に不正確な事実が記載され公表後に撤回されるケースも存在する。研究成果の量的拡大と流通の加速、査読・編集体制や研究過程の多様化により、妥当性が再検討される機会が増え、撤回事例も増加している。論文撤回は当該成果の内容が誤りであるだけでなく、撤回後も引用が継続することで科学コミュニティの信頼にも波及し得るため体系的な把握が求められる。さらに近年は、生成AIの普及に伴い、学術情報を取り巻く環境も大きく変化している。論文撤回の動向に生成AIの発展が何らかの形で影響しているかの把握は、政策的にも意義がある。
科学技術・学術政策研究所(NISTEP)は2025年5月にDISCUSSION PAPER No.239「撤回論文の概況 2024」(DP239)1)を公表し、撤回論文の概況を整理した。本稿ではデータ取得範囲を2025年11月まで拡張し、著者と撤回数、国・地域別の偏り、撤回理由の推移を追加分析するとともに、論文撤回と生成AIとの関係性を整理する。
2.手法
本分析では、DP239と同様の方法で撤回論文に関するデータである「Retraction Watch Data」と、研究成果全般に関する書誌情報データベース「OpenAlex」を統合したデータセットを用いている。
2.1 データソース
- ・Retraction Watch Data:2010年のブログ開設以来蓄積されてきた撤回論文データベースである。2023年のオープン化を経て、現在は約5万件以上のレコードを保有している。撤回に関する書誌分析の基盤として、国際的に活用されている。本稿では2025年11月26日更新版のデータを用いた。
- ・OpenAlex:米国の非営利団体OurResearchによって運営される大規模なオープン書誌情報データベースである。Web of ScienceやScopusといった有料データベースと比較して収録データ量が多く、かつ無料で利用可能であるため、第三者による本稿の分析結果の検証可能性が高く、再現性の確認が容易である。OpenAlexは2025年11月に大量のデータを追加する大規模改修を行ったが、本稿では互換性を重視し、改修前のLegacyバージョン2)を用いてデータ収集を行っている。本稿では2025年11月4日版スナップショットデータを用いた。
2.2 分析データの構築
DP239に準拠し、論文のDOI(Digital Object Identifier)を主キーとしてRetraction Watch DataとOpenAlexのデータを統合したデータベースを構築した。その結果、Retraction Watch Dataの「OriginalPaperDOI(撤回対象論文のDOI)」とOpenAlexのレコードを突合し約49,000件を結び付けた。本稿では最新の動向を捉えることを目的とし、分析対象は2025年11月4日までに出版された論文とした。なお、データの新規追加の影響に加え、既存データについてもOpenAlex側の更新により、発行年、著者ID、著者所属機関等が変更されている場合が一定程度存在する。そのため、同一の計算を行っても時期によって数値に変化が生じ得る。さらに、収集日が新しいほどデータベース上で把握される撤回論文数が増加する可能性があるため、DP239本体との間で数値差が生じている点に留意が必要である。
3.結果
3.1 撤回件数(撤回論文数)と著者数:著者別撤回件数分布の全体像注1
本節では、撤回論文を「論文が公開された日付」とその論文の「筆頭著者(1st author)」単位で集計し、著者別撤回件数分布の全体像を確認する。ここでは2000-2025年に至るまでの長期的な構造、及び2021-2025年の直近5年の構造を把握する。また、DP239に対応する2013-2022年、及びDP239では対象としなかった2000-2012年の構造も参照する。時系列順に2000-2012年(図表1)、2013-2022年(図表2)、2000-2025年(図表3)、2021-2025年(図表4)の各期間について、筆頭著者ごとの撤回件数(横軸)と当該撤回件数の筆頭著者数(縦軸、対数スケール)を示す。例えば、図表1からは、2000-2012年に公開された筆頭著者論文のうち、最終的に約80件が撤回に至った著者が1名存在する一方で、撤回が1件にとどまる著者が約5,000名存在することがわかる。
図表1~図表4のいずれの時間窓でも、撤回件数1件の筆頭著者が最も多く、撤回件数が増えるにつれて著者数が急速に減少するロングテール型の分布が観察される。これは、大多数の著者が少数の撤回にとどまる一方で、少数の著者が大量の撤回に関与するという構造を反映している。ただし、これが任意の時間窓において成立する普遍的な構造であるかはより詳細な検証が必要である。次節(3.2節)では、国・地域別に分布形状を考察する。
3.2 国・地域別にみた分布の偏り:ジニ係数とTop1%シェア注2
前節で確認した通り、本稿の分析期間では著者別撤回件数の分布はロングテール型の構造を示す。補足資料注3に掲載した各分布図が示すように、この構造は国・地域別を問わず概ね共通している。本節ではこの相似性を前提としつつ、国・地域ごとに尾部の厚みや撤回数の突出度にどのような差異があるかを把握する。分布形状の差異を比較・要約する補助指標として、ジニ係数と撤回数が上位1%の著者がその国の全撤回数に寄与する割合(以下、「Top1%シェア」という)を相補的に用いる。いずれも少数著者への集中度を評価する指標ではあるが、ジニ係数が分布全体の不均等さを要約するのに対し、Top1%シェアは最上位層の突出をより鋭敏に捉えるという性質の違いがある。指標は分布図と対応づけて解釈することが必須であるが、誌面の都合により国・地域別分布図は補足資料に掲載する注3。図表は原則、撤回数が上位10位の国・地域を対象とし、日本の位置づけに注目して分析する。
3.2.1 2000-2012年
2000-2012年はDP239の対象期間(2013-2022年)と重複しない。そのため、DP239において特定の著者の寄与によって特定の国・地域の値が偶発的に変動していないかを点検する上で、基準となる時間窓である。国・地域別にジニ係数及びTop1%シェアを算出した結果、日本はそれぞれ0.530、0.252であり、他の国・地域と比較して相対的に高い水準にあることが確認できる(図表5)。この結果から、この時間窓において「少数著者による大量撤回」の構造が日本に存在する可能性が示唆される。なお、この時間窓ではイランやドイツでも同様の構造が確認される。
3.2.2 2013-2022年
次に、DP239で分析対象とした2013-2022年についても再計算する。今回の分析では日本のジニ係数及びTop1%シェアはそれぞれ0.420、0.288 であった(図表6)。前述の通り、OpenAlex側のデータ更新等の影響でDP239の値とは一致しないが、DP239の表3-5の国・地域別のジニ係数ランキングとのスピアマン相関を計算すると相関係数r=0.723となり傾向は一致している。特に日本・フランスの値が相対的に高い結果は保存されている。日本のTop1%シェアが圧倒的に高い点は注目すべき点で、この期間では撤回数上位1%の著者による撤回が他国と比して突出していたことが示唆される。
3.2.3 2000-2025年
2000-2025年の長期スパンでの分析結果が図表7である。日本のジニ係数は0.494、Top1%シェアは0.321であった。この分析期間は前述の2期間を包含するため、必然的に高い値となることは予測できるが、ジニ係数、Top1%シェア共に他の国・地域よりも相対的にかなり高い値である。
3.2.4 2021-2025年
2021-2025年の直近5年では日本の撤回数は上位10か国から外れる。ジニ係数は0.196、Top1%シェアは0.091である(図表8)。相対的に高い部類のようにも観察できるが、この期間は分析の母集団の論文数も少ないため慎重な考察を必要とする。
3.2.5 小括
いずれの時間窓でも、日本のジニ係数とTop1%シェアは相対的に高い水準にある。このことは、『少数著者による大量撤回』の度合いが、日本において他の国・地域よりも高い可能性を示している。分析期間に一部の重複はあるものの、複数の時間窓で一貫して他の国・地域を上回る傾向が確認されることは、この偏りの強さが単なる一過性の現象ではなく、ある程度構造化して日本に存在している可能性を示唆している。
3.3 撤回の理由(追加分析)
Retraction Watch Dataには撤回の理由がタグ付けされている。年別推移だと、「Paper Mill(論文工場)」が2020年頃から増加傾向を示している。「Paper Mill」は「論文偽造ビジネス」と称されることもある「第三者に委託して粗製濫造された論文」といったニュアンスのものである。2016年に初出した理由タグだが、近年の事例増加に加え、出版社や学術コミュニティ内の問題意識の顕在化、検知手法の高度化等によってこの理由タグの付与が進んだ可能性が考えられる。
また、「Computer-Aided Content or Computer-Generated Content」といった既存の理由タグも近年増加している。現時点で生成AIの利用を直接示す独立した分類項目は存在しないようだが、この理由タグに生成AIの不適切な利用に起因する事例が含まれている可能性はある。ただし、タグの付与基準や運用の一貫性は外部から十分に確認できず慎重な解釈が必要である。詳細は補足資料注3を参照していただきたい。
4.関連動向:生成AIがもたらす学術情報評価の新局面
本稿執筆時点(2025年12月)では、文書作成に生成AIが広く活用されており、この傾向は論文等作成においても、今後更に加速すると見込まれる。そのため、論文査読も「生成AI利用」を前提として実施する必要性が高まる。また、論文数増加に伴い査読コストも増加するため、査読プロセス自体への生成AI活用も進みつつある。本章では生成AI利用の痕跡と関連する撤回事例(4.1節)と生成AIの学術情報の流通・評価システムへの影響(4.2節)について概説する。3.3節の通り、生成AIの普及は論文撤回動向にも影響している可能性があるため、動向の継続的把握が必要である。
4.1 生成AI利用の痕跡と撤回
生成AIを利用して作成した文書には特有の「痕跡」が残存することがあり、それが内容の精査や撤回の端緒となる可能性がある。
- ・生成AI回答の残留:「Regenerate response(回答を再生成)」といったユーザーインターフェース上の文言が論文本文に混入する事例
- ・Tortured Phrases(不自然な言い換え):生成AI等により、確立した専門用語が不自然な類義語に置換される現象。「Artificial Intelligence(人工知能)」が「Counterfeit Consciousness」に変換される事例等が報告されている注4。関連事例を収集するプラットフォーム「Problematic Paper Screener」も稼働しており、Retraction Watchの撤回情報も参照されている3)。
生成AIの使用痕跡の残置自体が必ずしも撤回に直結するわけではないが、これを端緒として内容の精査が行われ、実在しない文献の引用等が発覚し撤回に至った事例も報告されている4)。また、前述のプラットフォーム等を利用した検知ツールの導入を進める出版社も存在する5)。
4.2 学術情報の流通・評価基盤への生成AIの影響
生成AIで作成した論文をプレプリントサーバに複数投稿し、それらを相互引用したりPaper Millのような論文偽造ビジネスから「引用数を購入」したりすることで、h-indexなどの計量書誌学的指標を恣意的に膨張させ得ることが実験的に示されている6、7)。こうした動きは、論文の実質的価値とは独立に、査読や計量指標をハッキングして学術情報の流通・評価基盤を揺るがし得る事態が進行しつつあることを示唆する。
5.結論
本稿では、DP239を踏まえ、Retraction Watch DataとOpenAlexを統合したデータの分析期間を拡張し、著者別分布・国地域別の偏り・撤回理由の動向を追加検証した。その結果、大多数の著者が少数の撤回にとどまる一方で、少数の著者が大量の撤回に関与するという構造が再確認された。特に日本に関しては、分布全体の不均等さを示すジニ係数と、最上位層の突出度を示すTop1%シェアの双方が、長期・短期の複数の時間窓において他国よりも高い水準で推移している。この一貫性は、日本における『少数著者による大量撤回』という傾向が、単なる一過性の現象にとどまらず、ある程度構造化している可能性を示唆するものである。
また、撤回理由として「Paper Mill」や、生成AI関連タグ(Computer-Aided Content等)の増加を確認した。生成AIの普及は、論文作成の効率化のみならず、既存の学術情報流通・評価システムに新たな課題を突きつけている。今後も、論文発表プロセスへのAI利用と撤回動向の関係性を継続的に把握する必要がある。
注1 本文中でも一部記載した通り、新しい年ほど撤回の検知・登録が完全ではない可能性があるため、集計値は今後のデータ更新に伴って変動し得る。
注2 本稿の国・地域別集計には、国籍情報が付与されない「UNK(国籍不明)」を一定数含む。
注4 Counterfeitは「模造の」を意味し、文脈によってはartificialのパラフレーズになり得る。また、Consciousnessは「意識」であり、文脈によってはIntelligence(知能)に置換できる場合がある。このように、確立された学術用語をパラフレーズしてしまうことが2023年頃の生成AIの典型的特徴であった。
参考文献・資料
1) 尾﨑、小柴、林「撤回論文の概況2024-国・地域,分野,著者別の傾向と日本の状況-」
NISTEP, DISCUSSION PAPER 239、2025年 doi: https://doi.org/10.15108/dp239
2) https://blog.openalex.org/openalex-rewrite-walden-launch/(2025年12月23日アクセス)
3) Cabanac G, Labbé C, Magazinov A. “Tortured Phrases: A Dubious Writing Style Emerging in Science. Evidence of Critical Issues Affecting Established Journals.” arXiv 2021
doi: https://doi.org/10.48550/arXiv.2107.06751.
4) Glynn A. “Guarding against Artificial Intelligence–Hallucinated Citations: The Case for Full-Text Reference Deposit. “arXiv. 2025 doi: https://doi.org/10.48550/arXiv.2503.19848.
5) https://group.springernature.com/gp/group/media/press-releases/non-standard-phrases-tool/27793146(2025年12月23日アクセス)
6) Al-Sinani HS, Mitchell CJ. 2025. “From Content Creation to Citation Inflation: A GenAI Case Study.” arXiv. 2025 doi: https://doi.org/10.48550/arXiv.2503.23414.
7) Ibrahim H, Liu F, Zaki Y, Rahwan T. “Citation manipulation through citation mills and pre-print servers.” Sci Rep 15, 5480 (2025). doi: https://doi.org/10.1038/s41598-025-88709-7.