網羅的でないデータの標準化

データがランダムに選ばれていない場合、統計学的手法を用いることが困難。



パラメトリック法の適用

統計的に、ある程度の(たとえばタイタープレート1枚ぶんの)データ数があり、
それらが恣意的に選ばれたものでないのなら、
パラメトリック法が使える。

そのために100個ほどの遺伝子をランダムに選択して、
計ることができるのなら、大丈夫。パラメータをそこから測定できるから。
(とは言うものの、もしチップが入手可能であるのなら、
マイクロアレイを使う方が、コストの面でも労力の面でも、有利ではないか。)


パラメトリックでない方法の適用

データが数個しかないときには、
パラメトリック法の精度は低くなる。

たとえば、測定のエラーの期待値 v は、そのトランスクリプトームの
対数の分布のスケールをs、データ数をnとするとき、
v= s/ (n^0.5)
となる。sが0.7のとき、nが100ならvは0.07で、これは倍率にすると1.1倍くらいにあたる。
普通のマイクロアレイよりも10倍高いエラーが期待されることになるが、
まあ許容範囲ではないか。


そこで基準として サンプルの全量や、アクチン遺伝子や、rRNAなどを用いる。
しかし、別項に述べる 知見の統合に必要な精度を得るのはかなり難しい。
全ての発現レベルは動くし、mRNAの全量は、対数正規分布するところの
各遺伝子の分布のいい代表値にならないからだ。

Go Back home top トランスクリプトーム研究の目次


original:04 Jan 2005, modified:05 Feb 2005
小西智一

秋田県立大学
生物資源科学部/地域共同研究センター