位点
特异性重组(site-specific recombination)是
遗传重组的一类。这类重组依赖于小范围同源序列的
联会,重组也只发生在同源的短序列的范围之内,需要位点特异性的
蛋白质分子参与催化,重组的蛋白不是rec 系统而是int 等,如
噬菌体l 的定点插入。重组时发生精确的切割、
连接反应,DNA不失去、不合成。两个
DNA分子并不进行对等的交换,有时是一个DNA分子整合到另一个DNA分子上(插入重组)。
同源重组
我们可以看到,
同源重组一般都在染色体内仍按
DNA序列的原来排列次序。但是在所谓位点特异性重组(site-specific recombination)中,DNA节段的
相对位置发生了移动,从而得到不同的结果─DNA序列发生重排。位点特异性重组不依赖于DNA顺序的
同源性(虽然亦可有很短的同源序列),而依赖于能与某些酶相结合的DNA序列的存在。这些特异的酶能催化DNA链的断裂和重新连接,它们能发动位点特异性
重组作用.而在同源重组中,DNA链的切断完全是随机的,结果暴露出一些能与
RecA这样的
蛋白质相结合的顺序,从而发动交叉重组。
λ噬菌体DNA能通过重组作用整合进E.coli染色体的特异位点,成为
前病毒(provirus,或称
前噬菌体,prophage)。
两个特点
①这种交换是可逆的,原先存在的DNA顺序全部被保存下来,并无丢失;②噬菌体和细菌的DNA之间有一段很短的同源序列,重组交换必须通过其中的一个特定的核苷酸。这两个特点也就是位点特异性重组的共同特点。
整合
λ噬菌体编码λ
整合酶(integrase)。这个酶能指导
噬菌体DNA插入
E.coli染色体中。这种插入作用是通过两个
DNA分子的特异位点进行重组,将两个
环状DNA分子变成一个
大环。在噬菌体感染的早期即有大量整合酶产生,故几乎所有被感染的细胞都发生
整合作用。这种作用可用体外模型来进行实验。用四种成份混合起来组成反应系统:纯的整合酶;来自E.coli的一种
辅助蛋白,称为整合作用宿主因子(IHF,integration host factor);
镁离子;和含有噬菌体和细菌DNA发生重组交叉的特异位点(称为attP和attB,att源自attachment)的DNA片段。对于这个DNA片段,一个简单的制备方法就是人工构建含attP和attB两者质粒。当整合反应发生时,即在attP和attB处发生交叉重组,产生两个较小的环状DNA。整合反应由
整合酶催化,其步骤是彼此
偶联的:四条链同时被切断、交叉和重新连接起来,其间没有发现任何稳定的
中间产物。这种前文提到的
拓扑异构酶Ⅱ的反应很相似,即DNA
双链同时被切断,然后
磷酸二酯键又重新连接起来,并不需要
ATP供应能量。故整合酶实际上能起拓扑异构酶的作用,可使带有att位点(或类似序列)的
超螺旋松弛。并且和拓扑异构酶一样,整合酶也产生交错的断裂(staggeredcut):有七个
核苷酸的
单键尾端,形成所谓
粘性末端。
整合酶和IHF
在att上都有特定的
结合位点,
体外实验也证明这两种蛋白质结合在attDNA的特
定位点上。每一次
重组过程需要20-40个
整合酶分子及约70个IHF分子。故可能这两种蛋白质不仅是作为酶(发挥
催化作用),而且在每次重组中都要形成某种复合物结构。通过缺失实验,证明attP至少要约250bp长,太短将使其功能丧失,而attB则较短,包括核心(core)在内约23bp长即有功能。长250bp的整个attP可绕在整合酶分子的周围,类似
核小体的结构,其中含有约8个整合酶的单体,每个的分子量约为40000。attB和attP中有相同的15bp的
核心序列。整合酶与两个核心都相结合。如果两个核心中有一个的顺序有所改变,则重组的效率将大为降低。但是如果两个核心序列发生了相同的改变,则顺序交换仍能进行。可见
整合酶不但要求特异的序列,而且要求两个核心序列有
同源性。
然而,如果λ
前病毒受到诱导(induction),则整合作用将被逆转。此过程称为切出(excision)。切出后,细菌和噬菌体DNA恢复至原来完整状态。前病毒受到诱导时即产生又一种蛋白质,称为切出酶(excisionase)。切出酶和整合酶一起催化前病毒DNA两端的杂种att位点之间的重组。这时,整合酶和切出酶一同紧密结合在细菌前病毒杂种att位点上,显然这样就能促使反应向反方向进行。
整合和切出
attB由称为BOB’的序列组成,而attP由POP'组成。O是核心序列,是attB和attP所共同的。而其两侧的序列是B,B’和P,P’,被称为臂。噬菌体DNA是
环状的,重组时被整合入
细菌染色体中,成为
线性序列。
前病毒的两侧是两个新的杂种att位点,左侧称为attL,由BOP’组成,而右侧为attR,由POB’组成。可见,整合和切出并不涉及相同的一对序列:整合需要识别attP和attB,而切出要求识别attL和attR。因此,重组位点的识别就决定了
位点专一性重组的方向──整合或切出。虽然
位点专一重组是可逆的,但反应的方向取决于不同
环境条件,这对决定噬菌体的生命力周期是非常重要的。
整合酶和IHF对整合和切出都是是必需的,而切出酶在控制反应方向上起重要作用──它对切出是必须的,但能抑制整合。在切除的环化过程中如果发生错误,
前噬菌体可能失去某些基因而代之以其相邻的细菌基因。因为整合位点处于
细菌染色体的gal和bio基因之间,切除过程中噬菌体DNA偶尔会带走gal基因,生成λgal(或称λdb)。λgal或λbio转导(感染)新的宿主时常常把gal或bio
基因带到新的宿主中去,所以把λgal或λbio这些带有某些宿主基因的噬菌体称为
转导噬菌体(transducing phage)。
基因的表达调控
如果一个DNA分子上两个特异位点之间发生重组,其后果有两种可能性:两个位点之间的节段或被丢失,或被颠倒。有些生物能够利用这种重组倒置来控制基因的表达。因为DNA的一正一倒两种排列法可以相应地表达两种不同的蛋白质,细胞就可根据需要作出选择。奇怪的是,利用这种机制所调节的蛋白质往往都位于生物的体表。例如噬菌体Mu的尾蛋白即由其可倒置的DNA节段gin所控制。最著名的例子是
沙门氏菌(如
鼠伤寒沙门氏菌,Salmonellatyphimurium)的
鞭毛抗原。而
锥虫(trypanosomes)的
表面抗原更是千变万化,用以逃脱宿主
免疫系统的攻击,这也是通过一系列
DNA重排达到的,其复杂程度有点类似于抗体基因的结构。沙门氏菌的
位相是由于它的两种
鞭毛蛋白质H1和H2的交迭表达。在某一时期,菌体表达其中的一种,但从不两种均表达。
H2基因的
启动子位于此基因近旁的一个970bp长的DNA节段(称为hin基因)上,在启动子两端各有一个14bp的
反向重复序列(IRL和IRR)。当两个反向位点之间进行重组
交叉时,位点之间的节段将被颠倒。
这两个14bp的
反向重复即可用作为
核心序列进行位点特异性重组。当此970bp节段朝向某一方向时,启动子即在H2基因的旁边,故H2基因即被转录。同时,邻近一编码
阻抑蛋白的基因亦被转录,产生的阻抑蛋白可抑制远方H1基因的表达。因而结果是H2表达而H1不表达。相反,如此970bp节段朝向另一方向,
H2基因即不被表达,因为没有了
启动子。但同时H1的阻抑蛋白也不再表达,故H1遂得以表达。这个hin基因编码的蛋白质称为Hin酶,此酶就是用以催化倒置(位点特异性重组)的。有人认为,当细胞的生长受到阻碍时,Hin酶的表达就会增高,以便更换一种新的表面抗原。
噬菌体Mu中的类似系统位于其
基因组的右端,这个可倒置的G节段长约3kb,在不同的MuDNA中有不同的方向。当噬菌体生长在E.coliK12中的,感染是
溶菌体的。此时G节段的方向称为G(+)。在节段前方的gin基因对G节段的反向反应是必须的。在噬菌体P1中也有一个类似的cin基因,对其C节段的反向反应是必须的。G节段中的基因编码噬菌体吸附在
菌细胞表面上所必须的蛋白质。而G节段的方面控制着这些基因的表达。
最终结果
其结果是G(+)和G(-)噬菌体对不同株E.coli有不同的
特异性。在G(+)方向,基因S和U表达,其产物使噬菌体可吸附在E.coliK12上,但不能吸附在E.coliC上,反之,在G(-)方向,基因S’和U’表达,噬菌体可吸附在E.coliC上,而不能吸附在E.coliK12上。各蛋白质的分子量为:S56000,U21000,S’48000,和U’26000。一个特殊的发现是它们的综合长度(S+U或S’+U’)所需的
编码序列大约要4kb长,要比G节段长得多。
这两套基因编码在DNA的两条
互补链上而它们的共同
启动子则位于则位于反向区的左侧。后者长度过短的解释是S和S’蛋白有一个共同的
N端序列(Sc),Sc序列不由反向区编码。而两者不同的
C端序列Sv和S'v的表达则决定于反向区的方向。U和U’基因则是
独立编码的。
Mu噬菌体的gin和沙门氏菌的hin的
功能相似,它们在体外实验中甚至可互相替代。在E.coli中也有一类基因,称为pin。它能促使其邻接的约7800bp长的DNA节段倒置。在这个可倒置节段的两端有29bp长的反向重复。尚不了解这个反应有何功能。
在体外亦可进行Gin或Hin介导的倒置反应,但还额外需要:①一个宿主编码的未知蛋白质和②底物DNA必须具有
超螺旋。另外,底物DNA上除重组位点外还要一段约60bp的DNA序列,这个序列可位于底物分子上任何部位(除了十分靠近重组位点外)。此序列位置的
任意性似乎与转录作用中的
增强子类似,故有人称之谓重组增强子。