kahoの日記: STAP細胞の非実在について#5 74
とりあえず論文が撤回の方向に進んでいるようでいくらか安心しました.
真相の解明までいくか分かりませんので,10%程度の安心ですが.
誤解を受けないように明記しておきますと,今日までこの解析を行うにあたって私は一切の圧力も感じませんでしたし,協力してくださった皆さんのおかげで大変助けられました.頭に血が上った上に何の制限もなかったおかげで,周りが見えなくなって大失敗もしましたが.
一段落したことで今回がSTAPについて書く最後になるかと思います.今回の大本のメディアからも問い合わせを受け,本名を出しても構わないと返答しましたので,これからはコメントをするとしても公式な手続きを踏んだものになるかと思います.
”input”の解析でまだここに書いていなかったものとして,CNV(copy number variation)解析を最後に書き留めます.
これはChIP-seqの”input”データという限られた配列でどこまでできるか自信がなかったので,様々な計算方法を試し,基準となりそうなデータを探したりその著者に問い合わせたりして時間がかかる作業でした.
CNVというのは,ゲノム中で生じるコピー数の変化のことで,単純な繰り返し配列が細胞分裂の際に伸びたり縮んだりする現象のことを言います.個体間の差を見る方法として,SNP (single nucleotide polymorphism)がよく知られていますが,それよりもはるかに変化しやすく,同じ個体の細胞でも違いがみられます.
STAP細胞の由来を調べるために,当初私はSNPの違いを見ようとしたのですが,変異が少ないために定量的な評価はできませんでした.SNPがあるように見えてもその配列が正しいかを確定させるためには同じ場所を何回も読んでいる必要があるのですが,”input”はそこまでの量の配列はないので,個々の細胞の配列を決めることも難しいのです.
しかし,ゲノム上に配置された配列をよく見ていくと,多くの場所で配列が多数積み重なっている場所があります.また,CD45+細胞(Oct4-GFP)とSTAP/STAP-SC/ESで違いがあることが分かり,これはCNVを観察しているのだろうと予想しました.ChIP-seqのリード数でもCNVが評価できるのだとしたら,個々の細胞の近縁関係が分かるかもしれないと考え,ここから情報を得るためにいくつかの試行錯誤を行いました.
結果として,以下の単純(≒ロバスト)な方法でうまく行きそうだという感触を得ましたので,非常にテクニカルになりますが,再現実験を試みる人のために記します.
・染色体を50, 100, あるいは250塩基ごとのウィンドウに分割する.
・2つのゲノム間で,同じウィンドウ間のリード数を数える.
・ウィンドウ内のリード数をカウントし,性別が異なってもよいよう,各染色体ごとの総リード数を用いてオッズ比を算出する.また,性染色体は計算から除外する.
・オッズ比の95%信頼区間を計算する.
・オッズ比が1より大きい場合は信頼区間の下限値が2より大きいもの,オッズ比が1未満の場合は信頼区間の上限値が0.5未満のものを「CNVの差がある」区間としてカウントする.
・ただし近接している領域は結合させて1つと数える.
・このCNVの違いを2つの細胞の距離として評価する.
この計算で一定の数字が得られることは分かりますが,そこで得られた距離をどう解釈するかは,別の基準がなければなりません.今回,おおよそリード数が同じ(数割少ない)で,世代をまたいだり同一個体から別組織を得たりしたデータを取得しているXiao(3/11 10:13訂正)らの論文(Cell, 2012, GSE36114)GSE36294(Chang et al., Cell Res. 2014)(3/11 13:11再訂正)のデータを用いました.著者らにコンタクトを取り(ついでにデータベースから論文へのリンクが貼られていないことを修正してもらい),個々の細胞の由来を聞いた所,1-MEF-iPSからマウスを作成し,2-APC, 2-HPCという細胞をそのマウスから得たことを確認しました.
このデータを使うことで,最初の幹細胞と分化した細胞の変異,体細胞ごとのCNVの違いが分かります.
今回,目立ったCNVが100塩基未満だったこと,50塩基では統計上サンプルが少なくて評価ができにくかったことから,ウィンドウサイズが100塩基の時の計算結果を示します.
結果を示しますと,以下のようになります.どの細胞の組み合わせでもCNVが観察出来ました.
2-HPC* 2-HPC 2-APC
1-MEF_iPS 76 141 255
2-APC 151 160
2-HPC 16
2-HPC*
次に,この手法をSTAP論文のために公開されたデータに使います.この結果は以下の通りになりました.
ESC STAP-SC STAP FI-SC TSC
CD45+ 245 270 277 182 669
TSC 420 459 360 371
FI-SC 17 6 17
STAP 0 2
STAP-SC 6
ESC
これまで見てきた通り,CD45+細胞はSTAP/STAP幹細胞/ES細胞とは由来が異なることがこの解析でも分かります.
また,ES細胞とSTAP細胞はCNVに差がなく,ほぼ同一であることが示されました.この近さは慎重な実験をするために,STAPを抽出したマウスからES細胞を作成したとしても説明がつかないように思われます.
どのような原因でこういった結果になったかは特に論評しません.
ChIP-seq実験をするときにサンプルを間違えて,同じ細胞を4回使ってしまったのかもしれません.
著者らが再現実験をするときは,慎重に実験をしていただきたいと思います.