« 中国産オオムギ遺伝資源のWaxy遺伝子の多型解析 | トップページ | blog中断します »

2010/07/06

コア・コレクションのPooled DNAからSNPsをさがす

 先週の金曜、土曜とイネ遺伝学・分子生物学ワークショップ2010に参加した。最近、アカデミックな集会にはご無沙汰しているのでやけに新鮮だった。
 ともあれ、この分野では、次世代シーケンサーの利用はまだ”はしり”なので、生物研関係の発表に限られていたけれど、そこからあれこれ見え始めたものがある。

 測定器の感度、分解能が向上するとこれまで問題にならなかった微細な違いが見えてくる。たとえば、品種内のSNPs。変異体の全ゲノム解析をする場合、リファレンス・シーケンスにないSNPを見つけたと思ったら、リファレンスシーケンスを作成した際の元の品種内にすでに多型が生じていることがあるらしい。特に、集団育種で育成した品種の場合は要注意。単なるシーケンスの読み取りエラーと区別するノウハウの確立も今後の課題。

 ・・・という事実から推論して、イネやムギの様に表現型で選抜を受けながら比較的純粋に維持されている作物でも、在来品種のような遺伝資源は、一つのアクセションは遺伝的な多様性を維持した集団であると仮定して、コアコレクションを作成する際も、ある程度の遺伝的多様性を許容したほうが現実的なのだろう。

 でもそういう場合、多型的な塩基をデータベース上に上手くアノーテーションとして記録するためのシステマティックな方法は開発されていないようなので、どう記録して、知的基盤としてどのように共有するのかは今後の課題だろう。多分、ヒトのパーソナル・ゲノミクスが進展した際にも同じ壁にぶつかる。個人のゲノム情報を疫学的データと結合させるための記述方法についてのコンセンサス会議みたいなものはまだ行われていないのだろうか。

 次のテーマ、われわれはQTLの本体を単離するために、いつまでchromosome walkingをしなくてはいけないのか?とある情報では、早くも北京ではイネの分離世代の複数の個体の全ゲノムシーケンスをしてQTLの本体を単離しているとか。いちいち分離世代のマーカー遺伝子型を決めたりBACのスクリーニングをするよりも、全ゲノムの配列を決めるほうが手っ取り早い時代に既になっている。あとはお金次第。いずれ、もうすこし次世代シーケンスの単価が下がれば、現実的なプロジェクト予算の金額で解決できるようになって、これまで研究者が何年もかけてchromosome walkingをしていた部分の仕事が、数週間で、しかも外注でできてしまうようになるだろう(研究者の人件費を考えると既に・・・)。

 今のところ、分離世代の個体ごとに全ゲノムのシーケンスをしているようだが、今年に入って以下のような論文や、類似の研究が続いている。

Andreas Futschik and Christian Schlotterer, “Massively Parallel Sequencing of Pooled DNA Samples--The Next Generation of Molecular Markers,” Genetics (May 10, 2010): genetics.110.114397.   

 ヒトの集団遺伝学的なサーベイを目的に、多数の個体由来のDNAをpoolし次世代シーケンサーでまとめてシーケンスすることで集団内の全SNPsの種類と頻度を一気に決めるとする。この論文は、その場合に検出可能な低頻度のalleleの検出限界や集団内の遺伝子頻度(と誤差)の推定、どの程度のリードの厚さがあれば個体別に全ゲノムを決めるよりも経済的に問題を解決できるのか、という数学的フレームワークに関する研究。正直なところ、難しかったのでMethodsを飛ばしてResultsに飛びついてしまったけれど、オチはわかった。pool DNAの方にもそれなりの利点はある。
 極低頻度のalleleであればエラーに埋もれる危険性があるけれど、厚く読めばそれは回避できる。では、その厚さと集団の個体数はどのくらいが妥当かという問題には今のところクリアカットな解はない。・・・というか、エラーの特性はシーケンスをするプラットホームにも依存するので、実験的な側面からの検討も併用しないと、シミュレーションだけで答えは出せない。上記の論文のように理論面からアプローチするグループだけでなく、ウエットな方面から攻めるグループも出始めている。
 このあたりの検討を済ませた上で、F2集団やBIL, RILのPooled DNAの全ゲノムの塩基配列を決めれば、いちいちwalkingする必要はなくなるはずだ。分離集団の場合は、pool内のalleleは基本的に2種類で、レアなSNPsなど存在しないので話はもっと単純だ。
 ついでに言うと、この種のPooled DNAでの全ゲノム配列の決定はイネのコア・コレクションのGWASにも影響する可能性が高い。現実的なコストの範囲で、系統数 x 数倍の厚さでPooled DNAのゲノム読めるのであれば、全系統のゲノムを決めるよりも経済的だ。ただし、この方法では、系統ごとのハプロタイプを決めることはできない点が大きな欠点なので、集団構造の推定もできない。したがって、集団構造を推定するためには、改めて測定したいSNPsを絞り込んでタイピング・アレイを使ってハプロタイプを決める必要があるだろう。

 遺伝・育種方面への次世代シーケンサーの使い方を今のうちに考えておこう。

人気blogランキングへ←クリックして いただけますと筆者が喜びます!

|

« 中国産オオムギ遺伝資源のWaxy遺伝子の多型解析 | トップページ | blog中断します »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: コア・コレクションのPooled DNAからSNPsをさがす:

« 中国産オオムギ遺伝資源のWaxy遺伝子の多型解析 | トップページ | blog中断します »