第1回 遺伝子解析 
遺伝子でいま、何がわかる?

古代ギリシャからヒトゲノム計画まで 「生命の設計図」をめぐる探索の歴史

世紀をまたいだ挑戦 30億文字の巨大暗号解読

 ワトソン、クリックが開いた分子生物学の扉

ジェームズ・ワトソン氏=2013年12月、青野由利撮影
フランシス・クリック氏=Photo: Marc Lieberman - Siegel RM, Callaway EM: Francis Crick's Legacy for Neuroscience: Between the α and the Ω. PLoS Biol 2/12/2004: e419.

 DNAはヒストンというたんぱく質に巻き付いて複雑に折りたたまれ、棒状の染色体となる。ヒトの場合、1個の細胞の核の中に23対46本の染色体が入っており、人体を作る約60兆個の細胞ほとんどすべてに同じ染色体が格納されている。例外はそもそも核がない赤血球や、「減数分裂」によって染色体の数が半分しかない卵子や精子(生殖細胞)などだけだ。細胞1個のDNAを構成する塩基は約30億対、長さは2メートル。つまり30億文字の暗号文が2メートルの極細のひもに書き込まれたようなものだ。

 ではDNAの暗号から、どのようにして生物の体が作られるのか。生物の細胞は簡単に言うとたんぱく質と水でできている。たんぱく質は20種類のアミノ酸が結合して作られるが、ヒトの体内にあるたんぱく質は10万種以上とも言われ、必要な栄養素を細胞内に取り込んだり、体内で働く酵素となったり、あらゆる生命活動の担い手となる。

 それらたんぱく質を、いつ、どこでどの種類を作って働かせるか?という指令こそ、DNAに書き込まれた暗号だ。DNAの暗号のうち遺伝情報が書き込まれた部分のみを遺伝子と呼ぶのは前述の通りだが、言い換えれば「DNAのうち、たんぱく質(やそのもととなるアミノ酸)を作る暗号が書き込まれている部分が遺伝子」ということになる。たとえば塩基がTAG(チミン、アデニン、グアニン)と並ぶとアミノ酸のイソロイシンが、AAAならフェニルアラニンが作られる。それだけでなくさまざまな種類の細胞で、必要な時に必要なたんぱく質を作る精密なコントロールもたんぱく質自身が行っており、さかのぼればDNAの暗号に基づいている。

 ワトソン、クリックの発見は、これらDNAの構造と機能の研究を飛躍的に加速させ、「分子生物学」という新しい学問の扉を開いた。DNAの塩基配列からたんぱく質が作られていく詳しい仕組みも精密に分かってきた。また70年代から80年代にかけ、遺伝子を操作する技術も大幅に進展し、特定の遺伝子に狙いを定めてそれを取り去ったり、別の遺伝子に置き換えたりする「遺伝子ターゲティング」や、DNAを短時間で増幅する「ポリメラーゼ連鎖反応(PCR)法」など画期的な技術が次々と発明された。これらの技術で「特定の遺伝子がどんな働きをするか」を実験で突き止めていくことが可能になった。

 世界が挑んだ「ヒトゲノム計画」

 そして20世紀末から21世紀にかけて起きたもう一つの大きな変革が、90年に発足した「ヒトゲノム計画」から始まる「全ゲノム解析」の流れだ。これは文字通り、ヒトのゲノム、つまり30億文字の暗号全体を網羅的に読み取るプロジェクトで、米国を中心に英国、ドイツ、フランス、日本の国際研究チームが参加した。当初は15年間かかる予定だったが、関連技術の進歩に加え、独自のゲノム解読技術を開発した米国のベンチャー企業「セレラ・ジェノミクス」との間で激しい競争が起き、2000年には「概要版」が、2003年4月には「完全版」の完成が発表された。概要版発表時には、米のクリントン大統領と英・ブレア首相による共同会見が華々しく行われたので、記憶に残っている人も多いだろう。クリントン大統領はこのセレモニーで「私たちは神が生命を創造するのに使った言語を解明しつつある」と宣言した。

ヒトゲノム解読完了を小泉純一郎首相に報告し、記念品のCD-ROMを手渡す理化学研究所ゲノム科学総合研究センターの榊佳之プロジェクトディレクター(肩書きはいずれも当時)=首相官邸で2003年4月14日、宮本明登撮影

 しかしヒトゲノム計画は30億文字の暗号を端から順に読み取ってコンピューターに保存しただけだ。重要な成果だが「暗号を解読した」とは言えない。事実、解読以後新たな謎はどんどん増えている。この謎に挑むのが「ポストゲノム(ゲノム計画以降)」と呼ばれる研究で、遺伝子と病気との関係や、特定の細胞で特定のたんぱく質が作られるよう制御する仕組みなどの研究はポストゲノム時代の中核を担っている。

 生物の個性はSNPから?

 ところで30億文字の遺伝暗号の中に、たんぱく質を作り出す遺伝子、意味のある暗号はいくつあるのだろうか。ヒトゲノムの解析以前、線虫やショウジョウバエなど小さな虫の遺伝子は1万数千から2万あることが分かっていた。翻って高等生物のヒトは10万くらいか?と予測されたが、ヒトゲノム計画終了時で3万数千しかないという驚きの報告が出た。さらにその後の研究で2万数千しかないことが判明した。関連するDNAは30億塩基対のわずか数%と言われ、残りのDNAは意味のない「ジャンクDNA」とも呼ばれた。しかし最新の研究では実はこの部分に未解明の機能があるという推測がある。

 もう一つ、ポストゲノム時代になって注目されたのが「SNP(スニップ)」だ。日本語では「一塩基多型」という。ヒトのゲノムは99%以上が人類共通だが、ほんのわずかだけ配列の「個人差」がある。この個人差の一つがSNPで、遺伝暗号の1文字だけ、つまり一つの塩基だけが他の人と異なっているというもの。1000塩基に一つ、30億塩基全体で300万ほどのSNPがあると見られている。ゲノムの中でSNPがある場所はかなりの割合で決まっているため、「SNPの地図」作りも行われ、SNPから病気のかかりやすさや薬の効きやすさ、副作用の出やすさなど個人の体質を探る研究は世界中で花盛りだ。しかしこれも最近、多くのSNPには機能的な意味がないのでは?という指摘も出始めた。遺伝子研究では一昔前の常識が一気にひっくり返る事態が、まだまだ起きつつある。