そのとき細胞に何が起きていたのかを理解する

網羅性のある測定が最も威力を発揮するのはこうした使い方だろう。
なにしろ、これまでは感心のある遺伝子しか調べていなかったのだから、
予想していなかったような現象を発見できる可能性は高い。


作業内容

既知の問題と解決法

このページの補足説明


プロトコール

紛らわしい遺伝子のリストアップ

まず、同質のサンプルのデータを集める。処理をしていない、または同じ処理をしたサンプルのことだ。
これらサンプルはナマモノとして独立したものを用意する。 同じバッチの組織を2つにわけてRNAをとりました、は不可。
ここで集められたサンプルの数で、この作業の確からしさが決まる。
だから多い方がいいが、最低2サンプルから計算できる。

zスコアを横並びでおさめたシートを作る(サンプル)。
遺伝子ごとのzスコアについて、標準偏差を求める。ロバストでない出し方をしたほうが合目的だろう。

得られた数値は、ウエット実験の管理能力下で、
その遺伝子がどれだけ振れやすいかを表す指標である。

指標は次のように使える。
1. 振れやすい遺伝子をシンプルにリストアップする
たとえば振れやすいトップ1000くらいの遺伝子は、
最初から解析の対象にしないでおく。そのリストつくりに使う。

2. 遺伝子の触れ巾を補正する重みとして使う。ちょっとややこしい
熱力学モデルによると、振れやすさは遺伝子ごとに違うことが予想される。
(たくさん集まった触れ巾は実際に概略で正規分布したが、
それを遺伝子ごとに集計すると、遺伝子のσもまた正規分布するだろう)。
遺伝子ごとの振れを比較するときにz標準化が使えるはずで、
その標準化のための巾(σ)の値として使う。
ちなみに(モデルによると)中心(μ)はゼロになり、補正不要。

そのとき細胞に何が起きていたのか、の仮説を得る

簡単に説明するために、ここでは1つの実験と1つの対照を考える。
タイムコースでも、同じことを繰り返すことで対応できる。


データをレシオベースで比較する (対照とのログレシオを求める)
発現が変化した遺伝子をリストアップする(数百程度が手頃)(サンプル)。
そのなかから、なにか共通の機能が連想されるものを発見する

得た仮説を検証する

その共通の機能に関して、それを誘起させた実験例を既存のデータベースに探す。
または手持ちのデータの中で探す。
そのデータを用いて、レシオベースでおなじシートをこしらえる。

自分のシートと、既存のシートとの間で、
発現が変化した遺伝子群について、同じような変化がおきているか否かを調べる。
偶然の測定の振れでは説明しにくい、という形で検定できるだろう。
ログレシオの差が概略で正規分布することを使える。
ただし、刺激の強さによって、触れ巾が実験間で異なっていることを考慮する必要はある。

新しい仮説を探す(繰り返し)

新しい発見がなくなるまで続ける。
この作業を繰り返すことで、
既存の知識と一致する要素を見つけ出していくことができる。

新しいパターンを見つける

機能不明な遺伝子群や、つながりが見えてこない遺伝子群が
タイムコースや、異なる刺激をみた実験間で特定のパターンを見せるようなら、
それは新しい発見である。
ひとまとめにできないときは、ひとつひとつ遺伝子の働きを絞って
調べるのが、結局は近道ではないだろうか。

ところで、アレイチップで提供されているアノテーションは、往々にして
いいかげんだったり間違っていたりするので要注意。つながりが見えないときは
まずここを疑うこと。

機能不明な遺伝子の働きを探すのは別項を参照のこと。


Go Back Home 解析方法のインデックスへ


original:08 Feb 2006
小西智一

秋田県立大学
生物資源科学部/地域共同研究センター