kahoの日記: STAP細胞の非実在について#4 21
※以下のエントリは完全に間違いでした.間違いをしたことを隠さないため削除しませんが,主張は過ちであることを注記しておきます.
ここまで私はChIP-seqの”input”を元に解析を行ってきました.
このデータはまだいくつかのことを教えてくれますが,内容がほぼ学術論文のようになってしまうので,遺伝子発現について先に見たいと思います.
今回彼らが公開したNGSデータはChIP-seqとRNA-seqの実験のものです.このうち遺伝子発現を見るのはRNA-seqであり,いくつかの図を示しています.このRNA-seqデータは調べたい内容に対して不適当なほど長い配列を読んでおり,扱いづらい(計算時間がかかる)のですが,今知りたいのは大まかなアウトラインなので先頭の50塩基だけを使った解析を行いました.NGSデータに馴染みのない方には何のことかわからないと思いますが,データの一部を取り出して遺伝子発現について大まかな解析をしてみた,という意味です.
公開データを見ますと,2つの別々の試薬を使ってでRNA-seqを行っていることが分かります.一つはTruSeq,もう一つはSMARTer Ultra Lowです.論文の図に使われているのはTruSeqの方で,SMARTerのデータは公開されているものの論文中では使われていません.
これらはどちらがよいというわけではありませんが,試薬ごとに特性があるので比較する場合は同じ試薬を使った実験同士を比較することになります.TruSeqとSMARTerの違いは,後者は抽出できるmRNA量(≒細胞数)が非常に少ない場合にも対応している,とカタログ上うたっていることです.私の経験でも少量のサンプルしかとれない細胞ではSMARTerの方が適していると思います.
まず彼らの解析結果が再現できるかを確認してみました.TruSeqを使ったデータからそれぞれのサンプルの類似性(ピアソンの相関係数を用いました)を計算し,クラスタリングを行います.RNA-seqデータは細胞の種類ごとに2度ずつ行っており,原論文では細胞の種類ごとに分けていますが,ここではそれぞれ別にして調べました.その結果,同じ細胞のデータはそれぞれ非常に近く,そして論文と同じようにSTAPはCD45+と幹細胞の中間地点に配置され,STAP幹細胞はES細胞に近い位置に配置されました.最初に述べたように大まかな解析ですが,間違った結果を導くほどではないようです.
ちなみに,データベース上の表記では同じサンプルにSTAPと書かれている場合と酸で処理したCD45+細胞と書かれている場合が混在していて正確な条件が分かりません.図の見やすさも考えて,今回はSTAPに統一しています.
次に,論文で使われていないSMARTerのデータを同じく解析してみます.
結果はTruSeqのものと大きな違いがありました.STAPはどちらも桑実胚よりもESに近くなっています.
これらの類似性は驚くほどです.STAPは分裂しない細胞で,得られる細胞は何種類もの遺伝型をもったものの混合であるというのに,2度の実験の両方共がES細胞に近い(相関係数でいうと0.85程度で,STAP同士と同じか上)という結果です.
これは科学的に大きな発見ではないでしょうか.著者らはSTAP細胞からSTAP幹細胞を誘導(?選別?)してその多能性を検証していますが,STAP細胞そのものも,ほぼESのような性質を持っていたのです.酸で処理しただけでよいのだとすればよほど効率も上がりますし,論文の価値も高かったはずです.
著者らはSTAP幹細胞の詳細な作成プロトコルを提出するより,この実験の時のSTAP細胞の作成プロトコルを追求する方がよかったのではないでしょうか.少なくとも,これほどの有望なデータが得られたのに論文で触れないというのは解せません.2度のSTAPの遺伝子発現が2度ともがESに近かったのに.
なぜ彼らはこのデータを使わなかったのでしょうか.
先に述べたようにSMARTerの方が細胞が少ない場合に適しており,増殖能の低いSTAPにはこちらの方が適していると考えられます.なのに,細胞数が必要なTruSeqで別のデータをとりなおし,そちらだけを出版したのは何故でしょうか.
合理的な説明はいくつも考えられます.彼らに問いただしても答えは用意されているでしょう.
従ってこの結果は決定的な証拠にはなりません.ただし,私の仮説には合致するものでした.
※追記
AC氏からの指摘によりExtended Fig 6dで使用されていることに気が付きました.
大変申し訳ありません.再解析と修正を行います.
外部の反応 (スコア:2, 興味深い)
[ 701585 ] 名前: 名無しさん 2014/03/06(Thu) 23:46
今回の理研の公開情報でアカデミックな方々は疑問から確信に変わりつつあるようです
田口善弘 ?@Yh_Taguchi中央大学理工学部物理学科教授
STAP細胞の件、「第三者による再現」云々という人もいるけど、仮に第三者が「STAP細胞」を同じ手順で作れてももうだめなのでは。
それでは「もともとのサンプルに最初から混じっていた幹細胞類似の細胞を抽出してしまった」のを再現した「だけ」、という可能性をもはや否定できないのでは?
池田清彦 ?@IkedaKiyohiko 早稲田大学教授生物学者
twitterで説明するのは困難だけど、 T細胞以外の細胞からできたのか、 それとも、TCRの遺伝子がもとに戻ったか。 後者だとしたら免疫学のパラダイムがひっくり返ります。
野尻美保子 ?@Mihoko_Nojiri .理論物理学者
過去論文がほとんどすべて重要なミスがあるのに、なんで実験やってられるかが謎(まあSTAP もなんとかしないといけないので業務の一貫といえばそうだけど)プロトコルが先なの?みたいな。他の分野の感覚はよくわからない
@Sukuitohananika (森岡正博) 哲学者・大阪府立大学教授
STAP細胞について、とりあえず知っておいたほうがいいこと→ 本人による再現実験は再現性の追試とは言わないこと。
著者たちによる当初のSTAP細胞の「すごさ」が、本人たちの追加説明によってどんどん後退していること。
堀川大樹生物学者@horikawad
今日公開されたSTAP細胞作製の詳細プロトコルにT細胞特有のゲノム再編成が起きてなかったという記述。だとしたら、STAP細胞はT細胞がリプログラミングされたものではないということか。Nature発表時の主張と矛盾する
上 昌広@KamiMasahiro 血液・腫瘍内科学、真菌感染症学
どうやら、小保方さんは剽窃・改竄の常習犯だった可能性が高い。加藤研のケースは、不正が研究室ぐるみで行われることを示している。誰かが仕切ると言うより、先輩のやっていることを真似て広まるのだろう。
小保方さんは、どこでそれを覚えたのだろうか?ハーバードか?早大・女子医大か?
まぜもの (スコア:0)
TruSeqのほうのSTAPのdataって、単にESとT cellの混ぜ物だったりして。
STAPがあったとしてもFACSでpurifyしなきゃ混ぜ物になるんですが。
Re: (スコア:0)
これまで光の薄かったはずが急に光の強くなった細胞塊を持って来てキメラを頼んだらしいのでこれは疑わざる負えない
Re: (スコア:0)
ヒートマップはどうなってるんですかねえ。
SMARTerのデータは論文中にあり (スコア:0)
「SMARTerのデータは公開されているものの論文中では使われていません.」とありますが、実際は、Nature LetterのExtended Data Figure 6のd, e, fで使用されいます。
http://www.nature.com/nature/journal/v505/n7485/fig_tab/nature12969_SF6.html [nature.com]
Re:SMARTerのデータは論文中にあり (スコア:1)
大変失礼しました.見落としていました.
このデータでのES細胞マーカー遺伝子の発現で議論したほうが良かったですね.
近いうちに修正します.
kaho
Re: (スコア:0)
「SMARTerのデータは公開されているものの論文中では使われていません.」とありますが、実際は、Nature LetterのExtended Data Figure 6のd, e, fで使用されいます。
http://www.nature.com/nature/journal/v505/n7485/fig_tab/nature12969_SF6.html [nature.com]
確かに同様のグラフが↑の Fig.6 の d にありますが、いずれにしても
Re: (スコア:0)
Fig.6dの図の説明文のところに、「, we used pre-amplification with the SMARTer Ultra Low RNA kit for Illumina Sequencing (Clontech Laboratories).」とあります。
非STAPから (スコア:0)
非STAPのみの細胞群からスタートしなければ、何の意味も無い。
紛れ込んだものを誤認識したか、悪意で紛れ込ませたかのどちらか。
Re: (スコア:0)
非STAPのみの細胞群からスタートしなければ、何の意味も無い。
紛れ込んだものを誤認識したか、悪意で紛れ込ませたかのどちらか。
T細胞から…という証明は全くなく、元々組織中に有った多能性幹細胞を抽出しただけなんでしょうか?
もしかするとmuseと同一の細胞を別の手法でpick upしたということになるのかも。
Oct-GFP+のSTAP細胞 (スコア:0)
Nature Letterの Fig.4のChip-seq解析において、著者らはこの図でSTAP, ES, STAP-SCと、FI-SC, TSとの間のヒストンメチル化パターンの違いを主張したかったのではないでしょうか。CD45+細胞はあまり重要な対照ではなかったと著者らは弁解するかもしれません。不適切なコントロールであることにはかわりはありませんが、CD45+細胞の性やstrainが違っても、”STAP細胞の非実在”とまで言えるほどのミスではないように思えます。
Chip-seqやRNA-seq以外の実験(多能性確認実験、qPCRなど)では、Oct-GFP+のSTAP細胞を用いていますので。
一番の問題点は、Chip-seqやRNA-seqでも、Oct-GFP+のSTAP細胞だけをFACSでpurifyして、実験しなかったことですね。
Nature Letterの Fig.4 http://www.nature.com/nature/journal/v505/n7485/fig_tab/nature12969_F4.html [nature.com]
Re: (スコア:0)
小保方氏のSTAP細胞に関するNature Letter論文のExt Data Fig3のaのTranscriptome解析(RNA-seq)において、TSだけCD1 strainで、
それ以外のは、C57BL/6 x 129/sv ですね。これが問題であるかどうかについては、よくわかりません。
また、Chip-seqおよびRNA-seqのSTAP細胞、STAP幹細胞の両方とも、データベースでの説明をみると、 strain はC57BL/6 x 129/sv マウス、development stageは Oct3/4 expressing cells とあります。
kaho氏のChip-seqのinputデータの解析結果にあるようにC57BL/6 x 129/sv とは、cag-GFPマウスである可能性が高いのですが、そ
Knoepflerと連絡とれました (スコア:0)
研究不正を正していくことは、研究者の義務だと考え、kahoさんの行動を勝手に応援しているものです。
kahoさんがblogに出した指摘は非常に重要であり、外部の支援が必要だろうと考えます。
今回、カリフォルニア大学デイビス校の医学部癌センターのPaul Knoepfler博士と連絡が
とれました。Knoepfler博士の助力が得られると思いますので、御興味がありましたら、以下に
連絡ください。
renhayashix@gmail.com
確実性を (スコア:0)
生物系研究者です。
論文と改変プロトコルを読み、私自身はSTAP細胞の存在を疑っています。
このブログも興味深く読んでいます。
しかし、理研もグレー着地のためになりふり構わず、の感がありますので、些細な事象でも強調して証拠としてくるでしょう。
反論する側は、落ち着いて確実な反論をして行く必要があります。
応援していますので、踏ん張ってください。
Re: (スコア:0)
理研は基本善意の第三者姿勢じゃない?
世紀の発見だったら理研のチャレンジングな風土が生み出したと言い
そうでなければ、善意の第三者。
でも予算はがっぽりもらいますよって感じだろ。腐ってるな。
もと基礎特研より。
ES細胞の系統C57BL/6 x 129/svへの疑問 (スコア:0)
NCBIのデータにもあるそうですが、kahoさんが指摘されていたように、CHIP-seqで使用している細胞のマウス系統がばらばらのようなので、
CD45+cell(derived from Oct3/4::gfp C57BL/6)
http://www.ncbi.nlm.nih.gov/biosample/2393440 [nih.gov] [nih.gov]
ESCell(derived from C57BL/6 x 129/sv )
http://www.ncbi.nlm.nih.gov/biosample/2393446 [nih.gov] [nih.gov]
STAP Cell(derived from C57BL/6 x 129/sv)
http://www.ncbi.nlm.nih.gov/biosample/2393449 [nih.gov] [nih.gov]
STAP Stem Cell (derived from C57BL/6 x 129/sv)
http://www.ncbi.nlm.nih.gov/biosample/2393452 [nih.gov] [nih.gov]
RNA-seqの方もばらばらなのかと思いきや、
こちらは、C57BL/6 x 129/svでそろっているようですね(もしかしてTruSeqとSMARTerとでバックグラウンドがちがうのかと思いました)。
ところでChip-seqでもRNA-seqでも利用しているES細胞はC57BL/6 x 129/svマウス由来なのですが、彼らのマニュアルの一文「C57BL/6 carrying Oct4-gfp (29 of 29), 129/Sv carrying Rosa26-gfp (2 of 2), and 129/Sv × C57BL/6 carrying cag-gfp (12 of 16)」からすると、cfg-gfpマウスに関連したものではないかと思われます。
この辺あまり詳しくないのですが(ちがっていたらごめんなさい)、ES細胞って普通B6、とか129とか純粋な系統のものを利用することが多い気がします。従来はcag-gfpのようなCAGのトランスジェニックマウスを作る場合、129系統のESに入れてキメラマウスを作ったのち、B6にバッククロスしていく気がします。
もしそうならcag-gfpのESはもともと129バッククラウンドのはず。このES細胞は、バッククロスした後(例えばF1マウス)、再度ES細胞を取り直したということなのでしょうか?
何のために?遺伝的バックグラウンドをそろえるため?そこまでやってなんでChip-seqのCD45+細胞だけが、Oct4-gfpなのか?という疑問が残ります。
RNA-seq解析の疑問 (スコア:0)
kahoさんが、
>このRNA-seqデータは調べたい内容に対して不適当なほど長い配列を読んでおり,扱いづらい(計算時間がかかる)のですが,今知りたいのは大まかなアウトラインなので先頭の50塩基だけを使った解析を行いました.
と述べられております。
実は私はまだまだ初級者なのですが、何か面白いことがわからないかと、以前RNA-seqのデーター解析にトライしておりました。
もともとのデーターがペアエンドのRNA-seqデーターなのですが、元データーが(fastqファイル片側のリードで6GBくらい)がそんなに大きくなさそうなのに、BowtieをかけるとすぐWarning: Exhausted best-first chunk memory for read (中略); skipping read
というエラーが出て困っておりました(片側だけならBowtieは何とかかかりました)。
もしかするとkahoさんがいわれている「調べたい内容に対して不適当なほど長い配列」のせいなんでしょうか?
「不適当なほど長い配列」って何を意味するのでしょうか?ゲノムDNAのコンタミとかなのでしょうか?
ビギナーのナィーブな疑問でごめんなさい。ただ「不適当なほど長い配列」の存在が、サンプルのクォリティに関するものであるなら、RNA-seqのデータに基づいた議論に影響を与えるものではないでしょうか?
胎盤 (スコア:0)
ES細胞だとキメラを作成した時に胎盤になれないけど、stap細胞だと胎盤にもなれたことに関しては、どのような意見をお持ちでしょうか?
Re: (スコア:0)
光ったのは胎盤に入り込んだ血管、という指摘が出ています。
Re: (スコア:0)
Tgで胎盤光らせるのなんか簡単ですよ。それと組み合わせたんじゃないかな。
その辺は胎盤組織を調べたら分かると思うけど、マウスもういなさそう…
Re: (スコア:0)
にこにこで西川さんが胎盤になるES細胞をNIW○さん持ってると明言してました。確認すればわかること。そのESを外から一人援護射撃をしてくれている正直な研究者に渡してキメラマウス作らせた事件でしょ。コントロールとしてESは絶えず隣にあるわけだし。Kahoさんの告発をみて、合点がいった。論文に書いてあるコントロールのES細胞をNatureの調査団に提供できるかどうか。プロトコールの著者3名「何らかの秘密」を共有していて、必死に防御している状態。西川さんは、投稿前のNature論文を読んでいる人(アクノレッジに書いてある)だからね。彼にも責任の一端はある。