mRNA合成速度の決定

RNA polymeraseのTBPへの結合と、反応開始の頻度が決定する

律速は、プロモーター上にTBPと会合したRNApolymeraseのC末端部のリン酸化であろう。
これはエネルギーを必要とする反応で、
基質が限られているためもあって、きわめて遅い。

fast very slow fast fast fast-mediate
NTPの供給会合RNA伸張splicing/editingmRNA輸送

転写開始の頻度は、基質(プロモーター上にTBPと会合したRNApolymerase)の量と、
そこに存在しているkinaseの活性に依存する。
kinaseは周辺DNAの配列によって集められたmediatorからの刺激によって活性化される。
そこで、基質の量と、その刺激とが、速度の決定要因である。

ゲノムの特定の配列(プロモーター)を認識して結合するタンパク質群がある。これらのタンパク質は時に大きな複合体を形成する。 たとえばTATA配列に結合するTBPを中心としたタンパク質複合体である。 これらはRNApolymeraseとさらに結合する。

しばしば分子生物学の教科書では、とても静的な漫画でこの状態が描かれている。まずTBPがやってきて結合して、次に○○がやってきて結合して、そして二重鎖が乖離して....というように。
しかし実際にはここではDNAもそれらタンパクも激しくブラウン運動をしているはずで、くっついたり離れたりの平衡状態にあるはずだ(近年の一分子を観る技術は、こうした実際を見せてくれるようになってきている!)。

この平衡状態(のもつ平均的な様子)は次のような化学平衡で表すことができる。

RNApolymerase + promoter ↔ complex
これらの量的な関係は
Eq. 3 Kpgene, cell = [complexgene, cell]/[RNApolymerase]/[promotergene, cell]
ただしKpは平衡定数(promoterのK)、[complexgene, cell]はそのプロモーターでの複合体の濃度(または形成頻度と考えるべきかも)、[RNApolymerase]は核内で自由にしている酵素の濃度(たぶん一定だろう)、[promotergene, cell]は結合していないプロモーターの濃度。

この式はさらに次のように近似できる。
Eq. 4 [complexgene, cell] ≈ agene, cell×P0×Kpgene, cell[RNApolymerase]
ただしaはその領域でのDNAの活性を表すファクター。(epigeneticな調節の項を参照)。近似は[complex]/[promoter]がゼロに近いだろうことに由来。この仮定はKimura et. al. 1999などの測定からの推定。
タンパク因子とポリメラーゼの会合

Kpは、原核細胞であるなら、プロモーター部位の塩基配列でかなりの部分が決定される(DNAとRNApolymeraseが直接に会合するからだ)。真核細胞では、RNApolymeraseはTBPをはじめとしたタンパク性の因子ごしにpromoterと会合する。
こうやってDNAに(やや不安定ながら)結合しているタンパク質群が、その場所とRNApolymeraseとの親和性を決定する。これらとRNApolymeraseの会合はもっとずっと弱い力でおきているらしい。というのも、核内のRNApolymeraseのほとんどは、何かに結合するのではなくて単独で存在しているからだ(Kimura et. al. 1999)。もし強い力で結合するのなら、むしろそれらタンパクとRNApolymerase はもっと大きなコンプレックスを形成してDNAとの結合部位を探すようなことになるだろう(それは事実とは異なるようだ)。

こうしたDNAと、DNA結合性タンパク質の平衡定数は少しずつ測定されるようになってきていて、
九州工業大学の皿井先生がデータベース化されている。
http://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/recognition.html
このデータべースは統合データベースプロジェクトのポータルからもたどることができる。
http://lifesciencedb.jp/

DNAに結合したそれらタンパクはRNApolymeraseとTBPとの会合に影響する。あるものはよりこの会合を安定させるだろうし、あるものはむしろ阻害するだろう。それはつまり、何がどこに(どんな向きで)結合するのかによる現象であろう。この平衡状態を決定するのはとりもなおさず(TBPを含む)DNAタンパク質複合体である。それらの個々の、polymeraseと接する(あるいは電気的に影響する)成分の、その影響の一つ一つを、RNApolymeraseが会合することによって放出される自由エネルギー変化ΔGのひとつの成分ΔΔGとして表すことができる。

ここでは単純にするために、因子Aと因子BがそれぞれRNApolymerase に与える影響を独立したものと考えている。もしかしたら因子Aは因子Bと隣り合うと立体構造が変化して、別の働きを持つことになるのかもしれないけれど、現在のところそうした事例は知られていないと思う(のでモデルを不必要に複雑化させていない)。

ここでこのΔΔGを決めているのは、だから、以下の2つである。
ひとつは、何がそこにある(ない)のかである。
因子Aが核内に[因子A]なるモル濃度で存在するとき、その因子はどのくらいの確率でそのプロモーターに結合しているか? これは時間的な確率としても、あるいは細胞の集団で構成される組織に関して、ある瞬間にどのくらいの割合の細胞でそれが結合しているのかとしても考えられる。つまり、結合している・していないことそのものは二値的だけど、 トランスクリプトームとして考えるときはこれは連続する分布をもつ値である。

Eq. 5 [cis-regulatorcis, gene, cell] ≈ agene, cell×P0×Kccis, gene[regulatorcis]cell
[cis-regulator]は、ある遺伝子のある塩基配列に、タンパク性因子が結合している状態を濃度で表した値。[regulatorcis]はそのcis因子に結合するタンパク性因子の核内の活性濃度。近似は[complex]/[regulator]がゼロに近いだろうことに由来---はるかに多い分子がブラウン運動しながら核内にある、これは一分子観察で観察される。Kcは平衡定数。

もうひとつは、その因子Aの形状(そして荷電)と、プロモーター内の位置である。 これらはつまり、RNApolymeraseと「何がどういった位置で」関係するのかを決定する。基本的にひとつの生物において、因子の性質はあまり変化しないだろう。またもちろんプロモーター内の配列は不変である。そこで、この性質(因子の形状と因子の結合位置)は不変であろう。 これをkr(regulator のk)という比例定数で表すことにする。

Eq. 6 ΔΔGpcis, gene, cell = Krcis, gene ×[cis-regulatorcis, gene, cell]
これで、ある遺伝子のある配列に結合する、ひとつのregulatorの、RNApolymeraseに対する働きが記述できたことになる。

もちろんこうしたcis因子が遺伝子ごとに複数存在するはずである。それぞれの因子の働きが独立である、ないし、それらの働きを因子ごとに分解して考えることができると考えると(後述)、 それらの因子の働きは結局、これら自由エネルギーの総和として表される。Eq.5と6からΔGp (promoter のΔG)を求めると、

Eq. 7 ΔGpgene, cell = Σ agene, cell×P0×krcis, gene×Kccis, gene[regulatorcis]cell

このGibbs 自由エネルギー変化量をつかって、Eq. 3の平衡定数を求めることができる。すなわち、

Eq. 8 Kpgene, cell = exp(-ΔGpgene, cell/R/T)

これとEq.4を使うと、プロモーターとRNApolymeraseとの会合を、ΔGpの関数として表すことができる。

Eq. 9 [complexgene, cell] ≈ agene, cell P0 [RNApolymerase]× exp(-ΔGpgene, cell/R/T)
aはその領域のDNAの活性定数、P0は核内のDNA濃度、[RNApolymerase]は核内でフリーなポリメラーゼ濃度、Rは気体定数、Tは絶対温度。これらは定数か、あまり変化しない性質を持つと考えられる。そこで変化しうるのはΔGpだけである。enhanceosomeと呼ばれるような巨大なコンプレックスは、おそらくとても低い値を持つのだろう。

プロモーター部位でTBPと会合しているRNApolymeraseは、特定の(時間的)確率でリン酸化をうける。 これによって、電気的にTBPにアンカリングされていたRNApolymeraseは、 実際に転写を始めることができるようになる(または、活性化されることで二重鎖を少しほどくことができて、転写が始められるようになる)。細胞内に単独で存在しているRNApolymerase分子はリン酸化されておらず (Kimura et. al. 1999)、またkinaseはフリーのpolymeraseを基質にしない。転写がおわるとDNAと乖離する際に脱リン酸化がおきる(このへんの最新の研究成果はHirose and Ohkuma, J. Biochem 141: 601-608 (2007)にわかりやすくまとめられている)。リン酸化は、まさに働いている最中のpolymeraseの特徴であるらしい;プロモーター上でいったんリン酸化されたpolymeraseは転写を開始し、そして転写開始以後は反応は逆行しない。というわけで、転写反応の律速段階はこのリン酸化にある。

fast slow
promoter + RNApolymerasecomplex transcription start

RNApolymeraseのリン酸化は、enhancerに結合するタイプのregulatorが、mediatorという巨大なタンパク質複合体を通じて触媒ないし促進する反応である(このへんの用語はKornberg RD, PNAS 104:12955- (2007)を参考にしている、このレビューもなんというか静的なマンガみたいではあるけれど)。この複合体の形成と機能には特定の配列が必要で、それは結局、遺伝子のもつ性質として表される。リン酸化というイベントを一分子で考えると「1か所・2か所」と離散的だが、これをある程度の時間枠のなかで平均すると、これは酵素反応の速度として連続な値としてとらえることができる。この反応速度を、基質による一次反応と考えることができるだろう。基質はプロモーター部位でTBPと会合しているRNApolymerase([complexgene, cell])であるので、反応定数をks(synthesis のk)とおくと、合成速度vsは以下のように表される。

Eq. 10 vsgene, cell = ksgene, cell × [complexgene, cell]

さて、プロモーターと会合したRNApolymeraseは、エネルギー障壁を越えて反応を開始することになる。 この障壁を超えるためのエネルギーは、基本的にはkinaseによるリン酸化によって供給されるのだろう。 ksをアレニウス式によって、そのエネルギーの関数で表すことができる。

Eq. 11 ksgene, cell = Ap × exp (-Σ ΔEpcis, gene, cell/R/T)
ここでApはkinationに関するprefactor(頻度定数)、Epはそのプロモーターで供給される活性化エネルギー、ΔEpcisはひとつのenhancerに結合するregulatorが与える活性化エネルギーである。

ある教科書ではmRNAのプロセシングや、あるいはサイトゾルの「適切な」部位への輸送が調節の対象になり得るということを紹介している。もしプロセシングやeditingが律速になるなら、プロセシング待ちの分子が大量に蓄積するはずだが、聞いたことがない。また「特定のmRNA」だけが特定の部位に局在しているというevidenceは得られていないのではないか(その逆を示唆する報告ならある)。これは(もしあったとしても)発生の際などに限っておきる現象なのではないか。

このエネルギー障壁を越えるためのエネルギーを、それぞれのregulatorの働きとして考えると、以下のようになる。

Eq. 12 Epgene, cell = Σ agene, cell P0× kmgene, cell ×Kegene, cell ×[regulatorcis]cell
ここでkmはregulatorの活性(mediatorのk)で、どのくらいの頻度でmediatorごしにkinaseを活性化するかを表す(当然これは、なにがどこに結合するかで変化する)。Ke(enhancerのK)はそのregulatorのcis因子への結合の平衡定数である。

Eqs.9, 10, 11をまとめると、合成速度vsは次のようにregulatorの与えるエネルギーΔGpとEpで表すことができる。

Eq. 13 vsgene, cell ≈ Ap × agene, cell P0 × [RNApolymerase]×exp{(-Epgene, cell - ΔGpgene, cell) /R/T}