« Ark of the Arctic | トップページ | 高速アガロースゲル電気泳動 »

2008/02/22

2010年の超高速シーケンス

PRISM 3100が子供の玩具に見える。454 life scienceのシーケンサーや、solexa までもが既に旧式のDNAシーケンサーになる。

そんなシーケンサーをアメリカのPacific bio社が2010年発売を目指して開発中とのこと

1時間で1,000億塩基(100Gbp)、しかも1分子由来のシグナルが数キロベースから25キロベースに渡って出力される (論文はこちら)。 速度も長さも現在あるシーケンサーの能力を遙かに凌駕している。SolexaやSOLiDは25bp程度、 454でも100bp程度の能力なので、長さでも桁違いだ。

CAGEやSAGEと組み合わせると、Microarrayが要らなくなる日はそう遠くないかもしれない。

しかし、データの保存はどうするんだろう?理研に入る予定のHelicosでさえ、1回の運転で2Gbp /day、14TB(!)ものデータ量になるが、1時間でその50倍(700TB !!)ものデータが出ることになる。

もう、研究所にstorage farmを併設しないと埒があかない事態だ。こうなると、 光ファイバーなんかでとろとろデータを送ってる場合ではない。Googleに大量のデータを送る際には、 専用のトランク型のハードディスクにデータを詰めてFedexかDHLで送るらしいが、700TBのデータって・・・ 市販のハードディスクドライブ1個の容量が漸く1TBに達したところなのだが。

CCDの電圧出力としての生データが出る端から圧縮するか、それとも結局はATGCとNの3ビットで1塩基を表せるのだから、 生データをリアルタイムで処理して塩基情報に変換するか、何らかの方法でデータを圧縮しないと大変な有様になりそうです。

人気blogランキングへ←クリックしていただけますと筆者が喜びます!

|

« Ark of the Arctic | トップページ | 高速アガロースゲル電気泳動 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 2010年の超高速シーケンス:

« Ark of the Arctic | トップページ | 高速アガロースゲル電気泳動 »