UC Davis Bioinformatics Training Program: 4日目
この記事はUC Davis Bioinformatics Training Programに参加してきたの4日目の参加記になります。
本日の講義資料はこちらからダウンロードできる。
6/19(木)6時起床。8:30発。8:45着。
- 本日はRNA-Seq
- mRNAは全RNAの2%ほど
- 発現差異を見るだけならSEでも大丈夫だが、新たなアイソフォームの発見が目的ならPEで
- ゲノムが参照配列なのであればsplice awareなソフトウェアであるTopHat、GSNAP、STARなど
- トランスクリプトームが参照配列の場合はDNA-Seqと同じくBWAやBowtieで
- multiplexingとはサンブルをbarcodingしてまとめて同一のレーンに流すこと。レーンxレーンの効果をなくす
- 実習はヒトのデータを用いてRNA-Seq
- ますはSEのリード。続いてPEのリードをTopHatでマッピング
- さらにcuffdiff。有意な遺伝子をDAVIDにアップロードしてみたり
- housekeeping genesは通常RNA-SeqではなくRT-PCRで用いられる
- 午前中の最後は分子・細胞生物学科に所属のWalter Leal教授によるゲスト講演。蚊の嗅覚器官に対してRNA-Seqの応用話
- 昼食は昨日と同じ場所でブッフェ
- 運良くLeal教授と同席できたので色々お話を伺う。何と学位は筑波大学! Davisでfaculty positionを得る前は日本に15年程住んでいたらしい。名刺を頂く。日本時代はカイコに関する研究をしていたそうだ
- 日本食の好物はコンビニの鮭おにぎりだと教えてくれる
- Leal教授に新しいfacultyとして着任するに当たりアドバイスを頂く
- 午後の実習は同じ遺伝子発現差異分析を今度はcuffdiffではなくedgeRにて
- UC Davis Bioinforatics Coreが提供するGalaxy AMIのスクリーンショット
- まずはHTSeq-CountにてTopHatで得られた結果をカウントデータに変更した後にedgeRを実行
- 続いてはGene Construction 。TopHat -> cufflinks -> cuffmerge -> cuffcompareの流れ
- cuffdiffではユーザがGTFファイルを指定する。cufflinksでは新たなGTFファイルを生成する(新たなトランスクリプト・遺伝子の探索)
- 中途、Bioinformatics Core・生物統計学科に所属の統計学者による簡単な統計学の講義。p値、検出力とは?発現差異分析手法の裏にある統計理論など