启动子
具有转录起始特异性的DNA序列
启动子是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,它含有RNA 聚合酶特异性结合转录起始所需的保守序列,多数位于结构基因转录起始点的上游,启动子本身不被转录。但有一些启动子(如tRNA启动子)位于转录起始点的下游,这些DNA序列可以被转录。启动子的特性最初是通过能增加或降低基因转录速率的突变而鉴定的。启动子一般位于转录起始位点的上游。
名词介绍
启动子是位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确的结合并具有转录起始特异性
起始时间和表达的程度。启动子(Promoters)就像“开关”,决定基因的活动。既然基因是成序列的核苷酸(nucleotides),那么启动子也应由DNA组成。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶polymerases)的活动。这种酶制造着基因的RNA复制本。一般分为广谱表达型启动子、组织特异性启动子、肿瘤特异性启动子等多种形式。基因的启动子部分发生改变(突变),则导致基因表达的调节障碍。这种变化常见于恶性肿瘤
真核细胞含有3类不同的RNA聚合酶,根据其对α-鹅膏蕈碱敏感性不同,分为RNA聚合酶Ⅰ(A)、RNA聚合酶Ⅱ(B)、RNA聚合酶Ⅲ(C),如下:
[1]真核细胞还具有线粒体RNA聚合酶,存在于线粒体,能产生线粒体RNA;叶绿体RNA聚合酶,存在于叶绿体,能产生叶绿体RNA。
如RNA聚合酶Ⅱ识别Ⅱ类启动子,催化mRNA和大多数核内小RNAsnRNA)合成,它的启动子很复杂,主要包括4个部位:第一个部位为转录的起始部位其碱基大多为A;第二个部位是TATA框(TATA box),其共有序列为TATA(A/T)A(A/T),是富含AT的7个核苷酸。TATA框是类似于原核启动子的Pribnow框,位于-25;第三个部位为CAAT框(CAAT box),其共有序列为GGNCAATCT(其中N为C或T),位于-75附近;第四部分为增强子(enhancer),增加转录的速率。
基本结构
启动子是一段位于结构基因5'端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地相结合并具有转录起始的特异性。因为基因的特异性转录取决于酶与启动子能否有效地形成二元复合物,故RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布朗运动中的随机碰撞高100倍。
转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用:启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。
为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在原核生物RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“TTGACA”,-10区“TATAAT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。
转录单元
转录单元(transcription unit)是一段从启动子开始至终止子(terminator)结束的DNA序列,RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细胞中,一个转录单元可以是一个基因,也可以是几个基因。
转录起点
转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即5’末端的序列称为上游(upstream),而把其后而即3’末端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-1、-2、-3……。
启动子区
启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。关于其结构特点,Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNase l水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段,约有41~44个核苷酸对。他先后分离了fd噬菌体、T7噬菌体的A2及A3启动子、h噬σ菌体的PR启动子及大肠杆菌乳糖操纵子的UV5启动子等5段被酶保护的区域,并进行了序列分析,以后又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核苷酸组成的共同序列,是RNA聚合酶的紧密结合点,称为Pribnow区(Pribnow box),这个区的中央大约位于起点上游10bp处,所以又称为-10区。
许多原核生物都含有这两个重要的启动子区:RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RNA聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnow box),这个框的中央位于起点上游10bp处,所以又称-10序列(-10 sequence),后来在-35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于-25~-30 bp处的TATAAAAG,也称TATA框(TATA box)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptream activating sequence,UAS)。另外在-70~-78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)。
真核生物基因中,Hogness等先在珠蛋白基因中发现了类似Pribrow区的Hogness区(Hogness box),这是位于转录起始点上游-25~-30 bp处的共同序列似TAAA,也称为TATA区。另外,在起始位点上游-70~-78 bp处还育另一段共同序列CCAAT,这是与原核生物中-35bp区相对应的序列.称为CAAT区(CAAT box)。
-10位区和-35位区
提纯被保护的片段后却发现,RNA聚合酶并不能重新结合或并不能选择正确的起始点,表明在保护区外可能还存在与RNA聚合酶对启动子的识别有关的序列。果然,科学家不久就从噬菌体的左、右启动子PL及PR和SY40启动子的-35 bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个大肠杆菌启动子的序列以后.确证绝大部分启动子都存在这两段共同序列,即位于-10bp处(……T89A89T50A65A100……)的TATA区和-35 bp处(……T85T83G81A61C69A52……)的TTGACA区。现已查明,-10位的TATA区和-35位的TTGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力。
原核生物中-10区同-35区之间核苷酸数目的变动会影响基因转录活性的高低,强启动子一般为17±1 bp,当间距小于15 bp或大于20 bp时都会降低启动子的活性。
以下是核苷出现的概率:
真核基因中,有少数基因没有TATA框。没有TATA框的真核基因启动子序列中,有的富集GC,即有GC框;有的则没有GC框。GC框位于-80~-110bp处的GCCACACCC或GGGCGGG序列。
TATA框的主要作用是使转录精确地起始;CAAT框和GC框则主要是控制转录起始的频率,特别是CAAT框对转录起始频率的作用更大。如在TATA框同相邻的UPE之间插入核苷酸,也会影响转录使之减弱。
-10序列(原核生物)也称为Pribnow box,在真核生物中相应的序列称为TATA盒,又称为Goldberg-Hogness box,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:【1】RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;【2】离开共同顺序较远的启动子的活性亦较弱;【3】最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子
原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。
真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。
启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始激活蛋白拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。
相关疾病
以下是从人类孟德尔遗传学(OMIM)证实与启动子故障有关,不论是因启动子序列直接突变或是转录因子或转录共激发因子的突变。而多种癌症都没有列下是因为从染色体易位产生嵌合基因
哮喘 β地中海贫血 鲁宾斯坦泰比综合症
要留意的是在病原学上大部份的疾病都是异质的,而在分子层面上一种疾病往往是指多种疾病,纵然它们的病征及治疗方法一致。疾病对治疗有不同的反应,是因背后分子源头的差异,这会是药物遗传学的范畴。
参考资料
启动子.医学百科.
最新修订时间:2023-12-31 15:05
目录
概述
名词介绍
参考资料