转录因子(transcription factor)是起调控作用的
反式作用因子。转录因子是
转录起始过程中RNA聚合酶所需的辅助因子。
真核生物基因在无转录因子时处于不表达状态,
RNA聚合酶自身无法启动基因转录,只有当转录因子(蛋白质)结合在其识别的
DNA序列上后,基因才开始表达。转录因子的
结合位点(transcription factor binding site,TFBS)是转录因子调节
基因表达时,与mRNA结合的区域。按照常识,转录因子(transcription factor,TF)的结合位点一般应该分布在基因的前端,但是,新的研究发现,人21和22号染色体上,只有22%的
转录因子结合位点分布在蛋白编码基因的5'端。
这篇文章的试验方法是,通过
高密度的
寡核苷酸芯片,反映出人21和22号染色体的几乎所有的非重复序列,通过这种芯片,检测三种
转录因子,Sp1、 cMyc、和
p53的结合位点。结果表明,每种转录因子都有大量的TFBS与之结合。然而,只有22%的转录因子结合位点分布在蛋白编码基因的5'端, 36%的TFBS分布在蛋白编码基因的中部或3'端,并且这36%的TFBS常常和
基因组中的非蛋白编码RNA分布在一起。这暗示,在人的基因组中,不仅包含蛋白编码基因,也包含数量相当的非编码基因(noncoding genes),他们都受常见的转录因子所调控。
真核生物在转录时往往需要多种蛋白质因子的协助。一种蛋白质是不是转录机构的一部分往往是通过体外系统看它是否是
转录起始所必须的。一般可将这些转录所需的蛋白质分为三大类:
(2)某些
转录因子能与
RNA聚合酶结合形成
起始复合物,但不组成游离聚合酶的成分。这些因子可能是所有启动子起始转录所必须的。但亦可能仅是譬如说
转录终止所必须的。但是,在这一类因子中,要严格区分开哪些是RNA聚合酶的亚基,哪些仅是
辅助因子,是很困难的。
(3)某些转录因子仅与其靶启动子中的特异顺序结合。如果这些顺序存在于启动子中,则这些顺序因子是一般转录机构的一部分。如果这些顺序仅存在于某些种类的启动子中,则识别这些顺序的因子也只是在这些特异启动子上起始转录必须的。
黑腹果蝇的RNA聚合酶需要至少两个转录因子方能在体外起始转录。其中一个是
B因子,它与含
TATA盒的部位结合。人的因子
TFⅡD亦和类似的部位结合。同样,CTF(CAAT结合因子)则与
腺病毒的主要晚期启动子中与
CAAT盒同源的部位相结合。结合在上游区的另一个转录因子是USF(亦称MLTF),则可以识别腺病毒晚期启动子中靠近-55的顺序。
转录因子Sp1则能和GC盒相结合。在SC40启动子中有多个GC盒,位于-70到-110之间。它们均能和Sp1相结合。然而含有GC盒的不同的DNA顺序与Sp1的亲和力却各不相同。可见GC盒两侧的顺序对Sp1-GC盒的结合究竟如何能影响转录。有时候需要几个转录因子才能起始转录。例如
胞苷激酶的启动子需要Sp1与GC盒结合和CTF与CAAT盒结合;腺病毒晚期启动子需要TFⅡD与TATA盒结合和USF与其邻近部位相结合。以上所述的因子是一般转录都需要的,似乎并没有什么调节功能。另一些转录因子则可以调控一组特殊基因的转录。
热休克基因就是一个很好的例子。真核生物的热休克基因在
转录起始点的上游15bp处有一个共同顺序。HSTF因子仅在热休克细胞中有活性。它与包括热休克共同顺序在内的一段DNA相结合,所以这个因子的激活可以引起约包括20个基因的一组基因起始转录。在这里,转录因子和
RNA聚合酶Ⅱ之间关系很类似细菌的
σ因子与
核心酶之间的关系。
对于整个DNA
双链,每条链上有的区段用作有义链,有的区段用作反义链。
3. 原核生物参与转录的酶
当
聚合酶结合到启动子上后,在启动子附近将DNA局部解链,约解开17个
碱基对。(酶与启动子结合的部位是AT富集区,有利于解链)
第二个
核苷酸参入,连结到第一个核苷酸的3'羟基上,形成了第一个磷酸二酯键。
当s因子从核心酶上脱落后,核心酶与DNA链的结合变得疏松(依靠其
蛋白质的碱性与酸性
核酸之间的非
特异性的
静电引力),可以在
模板链上滑动,方向为DNA模板链的 3′→ 5′,同时将核苷酸逐个加到生长的RNA链的3'-OH端,使RNA链以 5′→ 3′方向延伸。
在RNA
链延伸的同时,RNA聚合酶继续解开它前方的DNA双螺旋,暴露出新的
模板链,而后面被解开的两条DNA单链又重新形成双螺旋,DNA双螺旋的解开区保持约17个碱基对的长度。
新合成的RNA链能与模板形成RNA-
DNA杂交区,这个杂交区也在随着RNA聚合酶的移动而不断地移动着。