2010年の超高速シーケンス
PRISM 3100が子供の玩具に見える。454 life scienceのシーケンサーや、solexa までもが既に旧式のDNAシーケンサーになる。
そんなシーケンサーをアメリカのPacific bio社が2010年発売を目指して開発中とのこと。
1時間で1,000億塩基(100Gbp)、しかも1分子由来のシグナルが数キロベースから25キロベースに渡って出力される (論文はこちら)。 速度も長さも現在あるシーケンサーの能力を遙かに凌駕している。SolexaやSOLiDは25bp程度、 454でも100bp程度の能力なので、長さでも桁違いだ。
CAGEやSAGEと組み合わせると、Microarrayが要らなくなる日はそう遠くないかもしれない。
しかし、データの保存はどうするんだろう?理研に入る予定のHelicosでさえ、1回の運転で2Gbp /day、14TB(!)ものデータ量になるが、1時間でその50倍(700TB !!)ものデータが出ることになる。
もう、研究所にstorage farmを併設しないと埒があかない事態だ。こうなると、 光ファイバーなんかでとろとろデータを送ってる場合ではない。Googleに大量のデータを送る際には、 専用のトランク型のハードディスクにデータを詰めてFedexかDHLで送るらしいが、700TBのデータって・・・ 市販のハードディスクドライブ1個の容量が漸く1TBに達したところなのだが。
CCDの電圧出力としての生データが出る端から圧縮するか、それとも結局はATGCとNの3ビットで1塩基を表せるのだから、 生データをリアルタイムで処理して塩基情報に変換するか、何らかの方法でデータを圧縮しないと大変な有様になりそうです。
人気blogランキングへ←クリックしていただけますと筆者が喜びます!
| 固定リンク
この記事へのコメントは終了しました。
コメント