★バイオインフォマティクスを用いて何かをしたいとお考えの方必聴!
目的別に「何を」「どうしたらいいのか」詳しく解説いたします。
★バイオインフォマティクスの入門的なセミナーを受けたい、基礎知識を身につけたい、とりあえず自分でバイオインフォマティクスをできるようになりたい、今後の勉強の指針が欲しい・・そんな方にお勧めです!
目的から遡るバイオインフォマティクス
講師
中央大学 理工学部 物理学科 教授 田口 善弘 先生
* 希望者は講師との名刺交換が可能です
講師紹介
■ご略歴:
1980年:東京工業大学第一類入学
1984年:同理学部応用物理学科卒業
1986年:同理工学研究科物理学専攻修士課程修了
1988年:同理工学研究科物理学専攻博士後期課程修了・理学博士取得
同理学部物理学科助手
1997年:中央大学理工学部物理学科助教授
2006年:同教授
(途中、2009年―2010年欧州バイオインフォマティクス研究所(EBI)訪問教授)
現在に至る。
■専門および得意な分野・研究:
マルチオミックスデータ解析・変数選択
■本テーマ関連学協会での活動:
情報処理学会バイオ情報学研究会運営委員
情報処理学会英文原著論文誌TBIO編集委員
英文原著論文誌Medicine(IF=1.8),PLoS ONE(IF=2.8)Academic Editor
国際会議International Conference of Bioinformatics 2014,2017最優秀論文賞(責任著者・単著)
大川情報通信基金研究助成(テンソル分解を用いた教師なし学習による変数選択に基づくAI創薬)
→このセミナーを知人に紹介する
日時・会場・受講料
●日時 2018年2月7日(水) 10:30-16:30
●会場 [東京・大井町]きゅりあん4階第2特別講習室 →「セミナー会場へのアクセス」
●受講料 1名46,440円(税込(消費税8%)、資料・昼食付)
*1社2名以上同時申込の場合、1名につき35,640円
*学校法人割引;学生、教員のご参加は受講料50%割引→「セミナー申込要領・手順」を確認下さい。
●録音・撮影行為は固くお断り致します。
●講義中の携帯電話の使用はご遠慮下さい。
●講義中のパソコン使用は、講義の支障や他の方の迷惑となる場合がありますので、極力お控え下さい。
場合により、使用をお断りすることがございますので、予めご了承下さい。
*PC実習講座を除きます。
■ セミナーお申込手順からセミナー当日の主な流れ →
セミナーポイント
■はじめに:
バイオインフォマティクスは生物学と情報学の知識が必要な分野であり、非常にハードルが高い。一方でゲノム科学を駆使した実験データ(大規模データ)の量は膨大になり、解析が追い付かない現状になっている。世の中にはツールがあふれているがどう使っていいのかわからない場合が多い。
本講義ではとりあえず「フリーのツールでなんかできるようになることを目指す」。実際にどう使うか、あるいは、正しく使うのかは最近は多くの書籍が出版されたり、インターネットに動画が公開されたりしているのであとでそちらで練習して頂く。
■ご講演中のキーワード:
インシリコ創薬、バイオマーカー探索、疾患原因遺伝子推定、マルチオミックス解析
■受講対象者:
ゲノムデータを持っていてとある「目的」にバイオインフォを使って到達したいが、何をどうすればいいかよくわからない人。
■必要な予備知識:
・インターネットにアクセスしてブラウザを起動し、データをアップロード/ダウンロードできる。
・ゲノム科学の基本的な知識(例:DNAとRNAの違いが判る。DNAからRNAへの転写は細胞核で行われる、と言われて意味が解る、など)。
■本セミナーで習得できること:
とりあえず手元にデータがある、または、これからデータをとりたい、と思っており、なんとかして「目的」にバイオインフォマティクスを使って到達したいと思っているが何をどうしたらいいかわからないという場合に、何をどうすればいいかはわかる(「正しく」使えるようにはなりません。とりあえず、「例」が実行できることと、その後、何に習熟すればいいかがわかる程度です)ようになる。
セミナー内容
1.なぜインフォマティクスなのか?
1)ゲノム科学は量子力学だが
物理学は量子力学を使ってゲノム科学を議論できるほど量子力学をわかっていない。
2)すべてのゲノム科学の基礎は化学反応であり、化学反応は量子力学である。
3)量子力学が使えないので機械学習・統計学習でおきかえることの利点と欠点
※ 以下、計算機の環境については極力、WEBページで実行できるようなものにかぎります。
一部、統計計算言語Rを使用します。共にクロスプラットフォームでOSの制限はありません。
2.目的1:疾患原因遺伝子を推定したい
1)方法1:変異解析から行う場合
a) 変異解析に使えるデータ:
スニップ(1塩基変異)アレイ
次世代シーケンサ(NGS:Next generation sequencing)
b) 変異解析に使えるデータを処理する方法:
スニップアレイ
有意差解析
NGS
ゲノムへのマッピング
GWAS(genome-wide association study,全ゲノム変異解析)
2)方法2:発現差解析から行う場合
a) 発現差解析に使えるデータ:
遺伝子発現量(マイクロアレイ・NGS)
プロテオーム(タンパクの発現量)
メタボローム(化合物発現量)
b) 発現差解析に使えるデータを処理する方法:
発現差解析
3)特定した遺伝子の機能推定
a) エンリッチメント(有意に重なりが多いこと)解析(パスウェイ・GOターム)
b) 塩基配列からのたんぱく質機能予測
c) 塩基配列からの相同遺伝子解析
3.目的2:バイオマーカーを見つけたい
1)方法1:目的1で見つけた遺伝子・タンパク・化合物をつかう
2)バイオマーカーの評価
a) 機械学習による判別機による性能評価
b) 生存時間解析による性能評価
3)方法2:判別性能のよいバイオマーカーを機械学習・統計学習で見つける
a) 疎性モデリング(少ない変数で説明することを目指す解析)
b) ベイズ統計
4.目的3:インシリコ(=コンピュータの中の)創薬を行いたい
1)方法1:目的1で見つけた遺伝子・タンパクをつかう
a) 遺伝子・タンパクに結合する低分子化合物をデータベースから探す
b) タンパクの構造をプロテインデータバンク(PDB)からダウンロードする
c) タンパクの立体構造をコンピュータで予測する(ホモロジー(相同性)モデリング)
d) 予測した構造に結合する低分子化合物をコンピュータでテストする
2)方法2:既知の化合物から類似化合物を探す
a) 既知の化合物から類似化合物をデータベースで検索する
5.目的4:マルチオミックスデータを解析したい
1)マルチオミックスデータに使えるデータ:マイクロアレイ、NGS
a) マイクロアレイ:
メチル化アレイ
ChIP(DNAへの結合タンパクの検出)-on-chip
b) NGS:
バイサルファイト(亜硫酸水素塩処理=塩基をCからUに変換)シーケンシング
ChIP-seq
2)方法1:マルチ(複数)オミックスデータを別々に解析してから統合する
3)方法2:マルチオミックスデータセットを統合的に解析する
a) 混合線形モデル
b) テンソル分解を用いる
6.さらなる情報を得る方法
1)TogoTV(togotv.dbcls.jp)
2)書籍