網羅的でないデータの標準化

データがランダムに選ばれていない場合、統計学的手法を用いることが困難。

パラメトリック法の適用

統計的に、ある程度の（たとえばタイタープレート１枚ぶんの）データ数があり、
それらが恣意的に選ばれたものでないのなら、
パラメトリック法が使える。

そのために１００個ほどの遺伝子をランダムに選択して、
計ることができるのなら、大丈夫。パラメータをそこから測定できるから。
（とは言うものの、もしチップが入手可能であるのなら、
マイクロアレイを使う方が、コストの面でも労力の面でも、有利ではないか。）

パラメトリックでない方法の適用

データが数個しかないときには、
パラメトリック法の精度は低くなる。

たとえば、測定のエラーの期待値 v は、そのトランスクリプトームの
対数の分布のスケールをs、データ数をnとするとき、
v= s/ (n^0.5)
となる。sが0.7のとき、nが100ならvは0.07で、これは倍率にすると1.1倍くらいにあたる。
普通のマイクロアレイよりも１０倍高いエラーが期待されることになるが、
まあ許容範囲ではないか。

そこで基準として　サンプルの全量や、アクチン遺伝子や、rRNAなどを用いる。
しかし、別項に述べる知見の統合に必要な精度を得るのはかなり難しい。
全ての発現レベルは動くし、mRNAの全量は、対数正規分布するところの
各遺伝子の分布のいい代表値にならないからだ。

Go Back home top トランスクリプトーム研究の目次

original:04 Jan 2005, modified:05 Feb 2005
小西智一

秋田県立大学
生物資源科学部/地域共同研究センター