リンカーン日誌

或る量的遺伝学者のテニュア取得までへの道

UC Davis Bioinformatics Training Program: 1日目

この記事はUC Davis Bioinformatics Training Programに参加してきたの1日目の参加記になります。

6/16(月)6時起床。温かいシャワーが出るので一安心。ホテルが提供する朝食ブッフェは、コーヒー、牛乳、コーンフレーク、ベーグル、菓子パン、果物、ヨーグルトが並ぶ。ただブッフェ部屋は、とてもせまく座席が3席しかないため空席がなく自分の部屋に持ち帰って食べる。Workshopが行われるScience Laboratory Buildingまで徒歩へ。2nd St.を西に向かいキャンパスに進入。

f:id:chikudaisei:20140617082353j:plain

15分程でScience Laboratory Buildingに到着。UC Davisでは卒業式が開催されたばかりな上、夏季講義も始まっていないらしくキャンパスは静寂としている。。

f:id:chikudaisei:20140616083122j:plain

そのままComputer Labである2060号室へ。9時から開始。本日の講義資料はこちらからダウンロードできる。講義については以下に箇条書きにて。

  • UC Davis Genome CenterのAssociate Director、及びBioinformatics Core ManagerであるIan Korf准教授の挨拶で開講
  • Galaxyの他にiPlant (iAnimal)も注目すべきGUI版バイオインフォツールと紹介される。ちなみにiPlantにはゲノミック選抜で用いられる回帰モデルがすでに実装されている
  • iPlantはNSFを中心に手厚く金銭面でバックアップされているが、GalaxyがiPlantと同様に今後もグラントによりサポートされていくかは不透明らしい
  • 続いて様々なシーケンサーの紹介。
  • PacBio RSの写真を見たが大きい!PacBioに関する質問がたくさん挙がる。みんな興味津々
  • PacBio RSの通常のContinuous Long Reads (CLR)では正確度は約87%。Circular Consensus Sequencing(CCS)にすると正確度が99%まで上昇するがインサート長が短くなってしまう。これではIlluminaマシンと競合する
  • バイオインフォと言ってもassembly以外では特に大きなRAMは必要ない
  • ここではトイレ休憩のことをbio breakと呼ぶ(初めて聞いた)
  • デイビス校はHiSeqを1台、バークレー校はHiSeqを4台持ってるそうだ
  • Amazon Web Services EC2の紹介。クラウド・コンピューティングインスタンス、AMIとは何かについて
  • AWS EC2は1年ほど前に試してみたことがある
  • UC Davis Bioinformatics Coreが提供するGalaxy AMIを使用
  • 昼食は外でサンドイッチ
  • 公共Galaxyは便利だが、みなが使うのでとても遅い。自分のサーバにインストールするのも手
  • サンプルデータ(イルミナ)を用いてFastQC、adapter trimmingはScytheで、quality trimmingはSickleをAWS EC2上のGalaxyで走らせる
  • PE、SE、フラグメント、リード、インサート長、ライブラリー、プライマー、アダプターといった用語の整理
  • プライマーとアダプターの違いが頭の中で曖昧だったので講義中にググる
  • 休憩時間は他の参加者と談笑。
  • カルフォルニア大学サンフランシスコ校の分子生物学者とサウジアラビアキング・アブドゥッラー科学技術大学 (アブドラ国王科学技術大学)に付属するバイオインフォマティクスセンターで働く生化学者と話す。どうやら後者の大学ではHiSeq2台とMiSeq2台を備えているらしい。このサウジアラビアの大学は遺伝研@三島の五條堀さんが所属している大学ですね。生化学者だけあってライブラリ調整に詳しい