« 分取用マイクロチップ電気泳動装置 | トップページ | ○○は実在しない -構造構成的毒劇物考- »

2010/04/29

早くないよ。あれっ早かったか。

生物研QTLセンターで解析したコシヒカリのゲノム情報がDDBJから公開されています。
# 4/5から公開されています。
http://www.ddbj.nig.ac.jp/whatsnew/whatsnew2010-j.html#10040502

で、論文はこちら。

Toshio Yamamoto et al., “Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide polymorphisms,” BMC Genomics 11, no. 1 (2010): 267.   

4/27付け(現地時間)でパブリッシュ。私は、さっき知りました。

昨日(28日)、QTLセンターの某君に電話して

「DDBJからコシヒカリのゲノム情報が公開されているのだけど・・・」

と聞いたら、

「おぉ、早いね」

と、ちょっと喜んだレスポンスだった。そりゃぁパブリッシュされた当日に論文についての問い合わせがあれば誰だって喜びます。でも、私はその時点では論文が出たことは知らず、データが4/5公表で今日の問い合わせなら、そんなに早くもないと・・・知らなかったとはいえ、いや申し訳ない。

ともあれ、主要部分をサマライズすると、

シーケンスしたデータ量は5.89 Gb(イネゲノムの15.7倍) これを日本晴のシュードモレキュル4.0にマッピングした。対応した領域は日本晴の80.1%相当。同定されたSNPsは67,051個。過去150年間に日本で育成されてきた代表的な151系統の在来品種を識別できる、全ゲノムをカバーする1917 SNPsサイトに対応したアレイを作成。 コシヒカリのハプロタイプ60.9%の起源が同定され、18個の保存されたハプロタイプブロックは、伝統的な在来品種から育成品種に引き継がれていた。さらに、現代の育種の過程では遺伝的多様性が喪失してきたことが予測された。

概ねこんな感じです。

アレイで決められるハプロタイプの数にもよるけれど、特製のタイピング・アレイのコストが今後もあまり下がらなければ、シーケンスした方が安くなるだろう。数年内にはヒト・ゲノム1人10万円台に突入するだろうし、ヒトのタイリングアレイの価格は30万円台なので、これが高止まりするようだと、アレイによるタイピングのコスト優位性は急速に失われていくだろう(リシーケンスのアセンブルの所用時間がどのくらいかにもよる)。

IRRIでは109,000系統のタイピングをするというし(手法は謎)、いかに精密であっても数百系統のデータで勝負できる時期は、もうそう長くはない。恐ろしい時代になったものです。

人気blogランキングへ←クリックして いただけますと筆者が喜びます!

|

« 分取用マイクロチップ電気泳動装置 | トップページ | ○○は実在しない -構造構成的毒劇物考- »

コメント

最近のゲノムシークエンス、そして植物については疎いのですが・・・
「イネゲノムの15.7倍もシークエンスして、対応した領域は日本晴の80.1%相当」
というのは、かなり一致率が低いですよね?
コシヒカリには、日本晴にはない配列がたくさんあるということですか?

投稿: 三浦 | 2010/04/30 17:58

日本晴は階層化ショットガンで読んでるのでレトロポゾンが集中している領域も長いコンティグの中に落とし込めましたが、論文によると、コシヒカリは34塩基程度のショートリードの集積なので反復配列には滅法弱いのですね。それと、コシヒカリのリードの母数には葉緑体やミトコンドリアの配列も入ってしまっていて、これもクロモソームにはマップできません(イネのmtDNAは300kbp以上あって、ほ乳類のmtDNAの20倍程度)。あとは、日本晴でもNだった配列と、SNPやInDelの集中しているらしい領域だそうです。

投稿: 土門 英司 | 2010/04/30 20:30

共著者の一人です。
 土門さんが書かれているように、今回の方法では2bpのミスマッチを許容しませんので、それも影響しているとは思います。ただ、実際に日本晴のshort readを日本晴ゲノムにあてた場合でも、あまり高くなかったと聞いています。リシーケンスの限界でしょうか。
アセンブルについては、利用可能なpipelineがどんどん出てくるかと思います。例えば、DDBJでサービスされる日もそう遠くはないような気がします。
 ただのタイピングなら少しの誤差は許容されるかもしれませんが、非同義置換など機能解明につながる研究については、リシーケンスの誤差を制御する方法論が重要になってくるかと思います。いまのところ、カバー率を増やすより、多数品種のreadを合わせることでSNPの誤差を減らす方向の研究が多いようです。

投稿: 米丸淳一 | 2010/05/01 11:34

米丸様
 コメントありがとうございます。
 「実際に日本晴のshort readを日本晴ゲノムにあてた場合でも、あまり高くなかったと聞いています。」
 確かに、読むのが難しい領域もありますからshort readの限界といえばそうでしょう。でもリシーケンス自体の限界かといえば、技術的にはこれからまだまだ良くなるでしょうから(たとえば一分子シーケンスとか)、今後に期待です。
 「多数品種のreadを合わせることでSNPの誤差を減らす方向」・・・なるほど。「基本的にはSNPは存在しない」と言う作業仮説の下、多数品種を反復と見なすわけですか。勉強になります。
 実は、私の想定しているのは組換えイネの全ゲノムシーケンスなのですが、その場合はshort readでは組換えDNAとゲノムのジャンクションが上手くマッピングできない可能性が高いように思います。コストパフォーマンスを考えると、もう少し待ちでしょうね。

投稿: 土門 英司 | 2010/05/05 19:31

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 早くないよ。あれっ早かったか。:

« 分取用マイクロチップ電気泳動装置 | トップページ | ○○は実在しない -構造構成的毒劇物考- »