学会やセミナー、そして取材等での質問のなかから、
よく聞かれた内容についての解答です(20051212更新)。
回答はページの下のほうに...
細胞内で、各遺伝子から転写されて蓄積しているメッセンジャーRNAの量が、 核酸の塩基配列と調節因子との相互作用で決定されている。 その相互作用を、熱力学に則したエネルギーによって記述できる。 塩基配列と調節因子とは定数で表すことができる固有の関係を持ち、 これが遺伝情報そのものである。
いくつかの(アナロジーを用いる)説明を用意しています。アナロジーに頼りすぎると、間違えますが...。
このモデルはゲノムの文法を説明する。
ゲノムという暗号を、人間の知性が解読するために必要な
法則性を表したものなので、文法です。
もともと、この領域は暗号やら転写・翻訳など、
言語に関連するたとえが多いのです。
だから、落ち着きがいいかなと思って使っております。
しかしもちろん、翻訳ということばが持つ本来の意味と、
リボゾームがやるあの工程とはまったく異なるように、
この文法も、人間の言語の文法とは異質なものです。
主語とか動詞とかは出てきません。
このモデルは、手品の種あかしである。
複雑な遺伝情報と、
それが4文字のコードで記録されていることの間には、
たいへん大きな隔たりがあります。まるで魔法のようです。
しかし、それを可能にしている原理は、ありふれたものでした
(オーケストラの美しく複雑な旋律もハーモニーも
CDにおさめられてしまうのと同じような事情かもしれません)。
即物的で、神秘性がまるでなくて、がっかりされるかもしれませんが、
まあしかし手品の種ってそういうものですよね?
ということで、手品の種です。
細胞が持っている性質は遺伝します。構造体としての細胞のことです。それらが形作る、個体としての多くの性質が遺伝します。血液型は遺伝するし、多くの疾病が遺伝します。いくつかの実験動物では、性行動などの行動様式が遺伝することがわかっています。身近な子供たちとその親たちを見ると、(生活様式からの刷り込みはあるのでしょうが)性格や気質も遺伝するだろうと思わざるを得ません(微妙な表現ですが)。
最も単純なレベルではよく解明されています。ゲノムDNAが情報を保持し、その分子が複製されることで新しい細胞に情報を伝えます。細胞のなかでゲノムDNAの情報はメッセンジャーRNAへと転写されます。そのRNAが鋳型になって、タンパク質が合成されます。生化学か、分子生物学か、あるいは細胞学の教科書を読むと、このへんの情報がわかりやすく解説されています。
基本的には、ある生物のゲノムDNAが、どんな塩基配列をもっているのかを明らかにする研究のことです。かなり多くの労力を必要とする作業なのですが、国際的なプロジェクト研究によってヒトなどの高等生物でも成し遂げられています。
ゲノムに書かれているのは情報です。この情報は、「タンパク質がどんな構造を持つか」という質的な部分と、「そのタンパク質がどのくらい存在すべきなのか」という量的な部分を持っています。メッセンジャーRNAはこの質的な情報のコピーなのですが、物質なので、量をもっています。この量は、情報の量的な部分が実体化する、最初の段階になります。そこで重要なのです。これは現時点で「網羅的に実測」できる、唯一の量的な情報でもあります。
熱量を扱いながら、たとえばエンジンなどの機関のはたらきを説明するための理論体系として
熱力学という分野があります。これを「分子」にあてはめるにあたって、一つの分子の挙動を
記述するのは困難だけど、それが集団としてあるときに、最も普通におきることがらを記述
することはできるということで考えられたのがこの統計熱力学です。かなりクラシックな分野で、
たとえば私の論文に使った式はそれぞれ100年くらいの歴史があります。ここで扱っている
程度のことでしたら、物理化学の教科書を読むとちょうどいい解説があります。私のおすすめは
McQuarrie & Simon, Physical Chemistry: a molecular approach
です。
もっと複雑なできごとを扱うときにはずっと解きにくい式を使わねばなりません、
それは非線形の熱力学と呼ばれています。
しません。それは今後の課題ですが、まずタンパクの分離と定量方法を確立しないことには、手がつけにくいです....2dPAGEなら2dのスポット、もっと精度よく定量できないもんでしょうかねぇ。質量分析のダイナミックレンジも不満。
いまのところ、これを基にした専用のソフトウエアはありません。がまあ、式も単純ですし、Excelのような表計算ソフトで答えを出すことはできます。個別の御質問は私までお願いします、いま共同研究の相手を広く求めています。理論は、使ってもらわないことには意味がないですからね。
トランスクリプトームを記述するにあたり、染色体の構造の変化にともなう変数をモデルに入れていません(定数を書き換えることで対応:具体的には、Aiという、染色体のその部分の活性として理解しています)。あまり頻繁には変化しないのだろうと思っているのですが、ホットな研究領域でもあり、今後の展開が期待されます。もうひとつ、転写はよく研究されているのですが、分解が手薄な印象があります。新しいエネルギー項をいれる必要が生じるとしたら、こちらからだろうなあと思っています。
トランスクリプトームもまた移ろい行くものですが、その時間変化を直接に記述するモデルではありません。その意味で、これはスナップショット的です。おそらく時間経過を扱うと、線形の式にならないだろうなと考えています(いまのところ個人的には必要性に迫られていませんが)。
(追記)2005年の分子生物学会(福岡)から帰ってきての印象ですが、やはりエピジェネティックな調節がたいへんホットな領域でした。これが染色体の構造変化による影響であろうこと、そしてそれはDNAの修飾が引き金となり、ヒストンの修飾がその基になっているだろうことはたぶん動きがたいので、もうちょっと詳細が明らかになった時点で、Aiを定数から(格下げして?)変数に組み込んだほうが式がすっきりするかとも思いました。これも今後の課題です。DNAの修飾がどの程度塩基配列によって制御されているのかがわかると、モデルを組み易いです。このへんのウエットなデータ、だれか提供してくれないかな。自前で用意できるかな。
オシレーションも時間経過にともなうものなので、あまり詳細に考えたことがないのですが──因子そのものが、ゲノムに書かれた存在であることが、これを生んでいるのでしょう。因子の量にもフィードバックがかかっています。出力を入力すると発振するのは、またありふれた現象です(マイクをスピーカーに近づけるとか)。
それは見る人の心のなかにあります(笑)。
たとえば、論文のなかだけで、私は3つ仮説を引き出しています。
いずれも的中しています。理論があれば、いまあるデータを解釈
することにも使えるし、そこから演繹することもできます。
もちろん、これはマイクロアレイデータの解析のための
磐石な価値基準として機能します。
もし原子力を使えていなかったとしても、相対性理論は
尊い。それはものごとを理解する上で重要な基盤を
提供しているからです。
そしてまあ、いつかは定数が読めるだろうと思います。
ゲノムが読めちゃったからなあ。ゲルを苦労して作っていた
経験から考えて、まあまず無理だろうと思ってたんですが。
──方法論の確立と、その自動化が鍵でしょうね。
仮定しているのは、タンパクと核酸についての閉じた系です。どちらも、あまり出入りがない物質です(大きいですしね)。特にメッセンジャーRNAは、細胞のなかでつくられ、壊されます。そこで擬似平衡を仮定できたのです。熱は、外界の熱容量がとても大きくて、細胞の寄与は小さいと考えています(実際もそうでしょう)。
これは熱力学に対する誤解ではないかと思われます。たしかに平衡状態を仮定するのが常法ですが、その平衡が移動することもまた、熱力学の守備範囲です(そもそも、エンジンを記述するものですしね)。この10年くらいの間に、ずいぶんと(特に米国で出版された)教科書がわかりやすくなっていました。馬鹿にせずに、再読されてはいかがでしょう?
たしかにゲノムは1分子しかないのですが、ここに時間というファクターがあります。タンパクや核酸の相互作用は、ものすごく短い時間のなかでおきる現象です。一方、トランスクリプトームは、たとえば分のオーダーでの現象です。そこで、一つのトランスクリプトームを指定するために、タンパクや核酸は何度も、何億回も何兆回も試行をすると考えることができます。あるいは、とても極端な状態は長続きせず、その時間を占める標準的な状態は自ずと明らかになり、トランスクリプトームはそれに従うとも表現できます。
サイトゾルにあるタンパクは、よく固定されているものと、可動性のあるものがあります。前者は、それこそ動かないのですが、後者はほとんど自由に運動しています。これは、タンパク質に蛍光標識して、その拡散係数を求めた実験結果からわかっていることです。
おそらく調節因子は自由運動する後者に属します(そうでないと調節因子として働けないからです)。その意味で、細胞の中身は「ゲノムからみたときに」均一であるとして、大きな間違いは生じないものと考えています。逆に、なんらかの不均一が保たれているのだとすると、その不均一を維持するためのエネルギー消費が必要になります。そうした現象をおこすための機関について、現時点での知見はないのではないでしょうか。
細胞のなかで起きていることは、閉じた系のなかでおきる物質と物質の相互作用です。その意味において、物理学的な知識から乖離した現象は起きないだろうと思います。このモデルに誤りがなければ、現実との乖離もまた小さいでしょう。
擬似平衡の仮定は、現実との間に小さな差が生じますが、その差はRNAの半減期と等しい時間で減衰します。おそらく、実際の研究の場面では、むしろ実験材料に起因するノイズのほうが、ずっと大きな問題になります。
もちろん、そんなことはありません。ゲノムに書かれているのは、配列と因子との変わらない関係です。
ゲノムは一つしかありませんが、トランスクリプトームは多様です。ゲノムにはそのトランスクリプトームの全パターンを記録しておくスペースがありません。細胞のなかには、トランスクリプトームを調節している因子があります。これらの活性量の違いが、多様性を作り出しています。
合目的という経験則は、そんなにリジッドなものでしょうか? なにかの現象の意味を考えるときに、説明しやすい理屈をつけるので、合目的というところに意見が集約していった可能性はないでしょうか?
とはいえ、この無駄は合目的なのです。穴の開いたバケツに水を注ぎ続けるのですから、これはたいそうな無駄です。実際には分解されたRNAはリサイクル(サルベージ)されますが、また重合させるためにエネルギーを使います。たしかにゲノムに「あるべきトランスクリプトーム」が書かれていて、各mRNAごとにその理想との差をチェックできれば、こんな無駄はしなくてもいいはずです。しかし、ゲノムはそんな情報量を持っていませんし、細胞内にmRNAの量をモニターする機構も知られていません。いまある細胞の道具立てで、この機能を実現しようとしたら、この方法しかないのではないでしょうか?
(印象論にお答えするのは苦手です。印象は主観によるものだから、多くの印象を客観的に統合するのは困難で、本質に迫りません。それは時間の浪費ではないかと思うのです。)
このモデルは細胞のトランスクリプトームを記述するものです。もっと高度な形質は、そのトランスクリプトームの相互作用で決定されるのでしょう。このモデルは、それを記述するための基盤になります。残念ながら、現時点で高度な形質が記述できるようにはなっていません。それはむしろ今後の課題です。
もちろん、全てのモデルと同じように、このモデルも現実を簡略化して考えるものです。
たとえば図1の絵にあるような山や、その斜面を持ち上げられているボールが細胞内にあるわけでは
ありません。あれは「たとえ」です。ずっと複雑で、いくつものタンパクがRNA polymerase IIのいろんなサイトをエネルギーをつかって修飾するというのが現実です。それを一歩ひいて俯瞰したのがモデルです。修飾の意味合い、その影響を間違わずに記述できれば、それは役立つものになるのです。
それは今後の、オープンな課題です。私は次のように考えています。
細胞の中でおきることがらは、かなり統計熱力学で表すことができると思われます。細胞と細胞が連携して働くこと、そしてそれが一つの生物をつくり、知能を有し、社会関係を築き、経済活動をするにあたって、シンプルな統計熱力学のリニアな数式ではカバーしかねるようになるでしょう。非線形の熱力学になると、モデルのたてかた、検証の方法、そして式の解き方が格段に難しくなります。ただし、少なくとも生物はカオスではないし、気質や性格のような(複雑そうに見える)形質も遺伝するのですから、手がかりが得られないほど複雑な課題ではないでしょう。
Go Back | home | 秋田県立大 ホーム |
インフォマティクス研究の目次 |