研究データ捏造、研究結果間違い
 2005年にソウル国立大学のファン・ウソク教授が、アメリカのサイエンス詩に、患者の皮膚から胚性幹細胞を作るのに成功したと発表し、世界にセンセーショナルを巻き起こしました。しかし、この研究結果は、捏造された結果であることが分かり、さらに大きな騒ぎになったのは、記憶に新しいところです。ファン教授グループの不正に関する記事は、サイエンス、ネイチャー誌等に数10編書かれています。
 2005年から2006年にかけて東大や阪大という日本の超一流大学でも、研究データ捏造事件がありました。いずれも生命科学系の研究で起こった事件です。
 私は、以前の記事にも書きましたが、基礎科学系の大型研究に従事していたものです。我々の分野では、研究結果に間違いがあることはまれにありますが、研究データの捏造というのは、想像もできないことだったので大いに驚きました。
 最近は、研究不正の話題もだいぶ下火になりましたが、私の個人的意見をここに記録しておきます。
 多くの研究者が共同して行う大型研究の一例として、私が参加していた研究の一端を昨日8月15日に紹介しました。ちょっとそれに補足をしておきます。観測は、トロール船のようにあらゆる信号を根こそぎコンピューターに取り込んでしまう、いわゆる多目的観測ですから、生データは1セットしかありません。装置は複雑ですので、個々の装置コンポーネントの特性を正確に測定し、補正パラメータとして記録されています。これも1セットしかありません。次に、生データは、補正データによってしかるべき補正を受け、装置の特性に依存しないデータに加工します。この補正後生データも1セットしかありません。次に、観測データには必ずノイズが含まれているので、それをある決まった条件で取り除きます。この作業は、研究テーマに依存するので、補正後生データから、複数のデータセットが作られます。ただし、データセットはグループミーティングの承認の後、各1セットずつ作られます。すなわち、各研究者が使うデータは、全員が共有していて、個人的なデータセットはない、ということです。ここが重要な点です。また、これらのデータはいずれも書込み禁止の措置が取られます。
 昨日も書きましたが、各大学の教官は、自分のグループ内の議論を通して研究テーマを選び、主に大学院生に主体的に仕事をさせます。研究テーマの選定は原則的に自由です。
 データ解析では、どのデータセットのどの年月日からどの年月日までを使ったか、ということを必ず明記します。解析結果は半年に1度のグループミーティングで全員の前で発表するわけですが、もし面白い結果が出てさらに検討が必要となると、何人かがデータセットまで戻って見直します。もう一度言いますが、全員が共通のデータセットを使っていることが重要です。このため、捏造データが入り込む余地がまったくないのです。
 グループミーティングで承認された研究結果の論文作成においても、主データ解析者に数人のメンバーが加わって論文委員会が作られ、論文のドラフトが作られます。論文ドラフトは、その後共同研究者全員に送付されてチェックが行われます。数回のコメント・修正等の往復があった後、最終ドラフトが完成されて、ジャーナルに投稿されます。研究間違いも、これらの過程でほとんど入り込む余地がないことが分かると思います。

 生命科学系の研究手法はよく知りませんが、ネイチャー、サイエンスの記事や東大の不正に関する報告書を見ると、データ取得と解析作業は、教授と1,2名の助手や大学院学生のみで行っているようです。教授の下には、何人かの大学院生やポスドク、助手、助教授もいるのですが、相互に違ったテーマの研究を行い、データも独立に取っているようです。さらに、研究テーマ間の交流はあまりなく、したがって、あるテーマの研究は、実質的に2,3人で作業と検討が行われている、というのが現状のようです。
 誤解を恐れずに言えば、我々が行っているグループ研究と比較して、この少人数というところにチェックの甘さが入り、捏造データや、検討が不十分な解析による間違いが入り込む危険性が高いと懸念されます。

 大型研究は、個人を歯車扱いして、若者の創造性を失わせるという議論を時々聞きます。しかし、上にも書いたように、データ解析はあくまでも個人的な作業で、生命科学系の研究となんら違いはありません。大型研究でも、若者の創造性は遺憾なく発揮されますし、さらに英語による発表・議論や、研究マネージメントの訓練も受けられる利点があるのです。

by FewMoreMonths | 2007-08-16 12:36 | 科学政策


<< 抗がん剤治療その4、抗がん剤の... 日本の教授、アメリカの教授、多... >>