マイクロアレイデータの標準化

データが網羅的なので、統計学的手法を用いることができる。



標準化の方法を分類する

じつにたくさんの方法が考案されて、論文に編まれ、
インターネットで紹介されている。
ここでそれらをレビューするのは困難だが、
原理によって2つに分類しよう。

そのメルクマールは、「比較の基準として何を使うか」である。

分類の1
パラメトリック法の原理と特徴 short version

なんらかの数理モデルを定義して、そのモデルを標準として使う方法である。
多くの場合、データの分布様式を表わす数理モデルを用いる。

どの測定結果でも、データ分布がその基準と一致するように、
一定の方法で測定結果を処理して標準化する。

基準はいつでも再現できるから、データとデータを個別にすりあわせる必要がない。
その反面、データ分布と数理モデルが一致しないと、いい精度が得られない。


分類の2
パラメトリックでない方法と問題点

数理モデル以外のものを基準に用いる方法である。
マイクロアレイの場合、なにか特定のRNAサンプルを基準にすることが多い。

基準とデータをすりあわせるために、定量的な数値取り扱いをやめて
もっとしなやかな方法を使うことが多い(たとえばノンリニア法)。
そのために様々な計算方法が提案されている。

問題点は二つ。
一つは、基準のRNAを再現・保存・配布することが困難なこと。
基準がないと比較できないので、比較可能な範囲が狭くなってしまう。
もう一つは、定量性を放棄したために、使われている計算方法の多くが
妥当性を検証できない
ために 科学的な検証を困難にしていること。


Go Back home top トランスクリプトーム研究の目次


04 Jan 2005
小西智一

秋田県立大学
生物資源科学部/地域共同研究センター