データがランダムに選ばれていない場合、統計学的手法を用いることが困難。
統計的に、ある程度の(たとえばタイタープレート1枚ぶんの)データ数があり、
それらが恣意的に選ばれたものでないのなら、
パラメトリック法が使える。
そのために100個ほどの遺伝子をランダムに選択して、
計ることができるのなら、大丈夫。パラメータをそこから測定できるから。
(とは言うものの、もしチップが入手可能であるのなら、
マイクロアレイを使う方が、コストの面でも労力の面でも、有利ではないか。)
データが数個しかないときには、
パラメトリック法の精度は低くなる。
たとえば、測定のエラーの期待値 v は、そのトランスクリプトームの
対数の分布のスケールをs、データ数をnとするとき、
v= s/ (n^0.5)
となる。sが0.7のとき、nが100ならvは0.07で、これは倍率にすると1.1倍くらいにあたる。
普通のマイクロアレイよりも10倍高いエラーが期待されることになるが、
まあ許容範囲ではないか。
そこで基準として サンプルの全量や、アクチン遺伝子や、rRNAなどを用いる。
しかし、別項に述べる
知見の統合に必要な精度を得るのはかなり難しい。
全ての発現レベルは動くし、mRNAの全量は、対数正規分布するところの
各遺伝子の分布のいい代表値にならないからだ。
Go Back | home | top | トランスクリプトーム研究の目次 |