小干扰RNA(Small interfering RNA;
siRNA)有时称为短干扰RNA(short interfering RNA)或沉默RNA(silencing RNA),是一个长20到25个
核苷酸的双链RNA,在生物学上有许多不同的用途。已知siRNA主要参与
RNA干扰(RNAi)现象,以带有专一性的方式调节
基因的表达。此外,也参与一些与RNAi相关的反应途径,例如抗病毒机制或是
染色质结构的改变。不过这些复杂机制的反应途径尚未明了。
简介
小干扰RNA(siRNA),有时称为短干扰RNA或沉默RNA,是一类双链RNA分子,长度为20-25个碱基对,类似于miRNA,并且在
RNA干扰(RNAi)途径内操作。它干扰了表达与互补的核苷酸序列的特定基因的转录后降解的mRNA,从而防止翻译。
siRNA由双链RNA (double strand RNA,dsRNA) 在细胞内被RNase III (如Dicer) 切割成21~25bp大小的双链RNA。dsRNA可以是外源的,如病毒RNA复制中间体或人工导入的dsRNA;也可以是内源的,如细胞中单链RNA在RNA依赖的
RNA聚合酶的作用下形成的dsRNA 。
发现
siRNA最早是由英国的大卫·包孔博(David Baulcombe)团队发现,是植物中的
转录后
基因沉默(post-transcriptional gene silencing;PTGS)现象的一部分,其研究结果发表于《科学》。2001年,汤玛士·涂许尔(Thomas Tuschl)团队发现合成的siRNA,可诱导哺乳动物体内的RNAi作用,结果发表于《自然》。这项发现引发了利用可控制的RNAi,来进行生物医学研究与
药物开发的方法。
结构
siRNA具有明确定义的结构:具有磷酸化5'末端的短(通常20至24bp)双链RNA(dsRNA)和具有两个突出核苷酸的羟基化3'末端。该切酶酶催化生产的siRNA由长的dsRNA和
小发夹RNA。siRNA也可以通过转染引入细胞。由于原则上任何基因都可以被具有互补序列的合成siRNA敲低,因此siRNA是在后基因组时代验证基因功能和药物靶向的重要工具。
siRNA通常是一段长21个核苷酸的双链RNA(dsRNA),其两股分别在RNA的两端超出另一端2个核苷酸,图示如下:
每一股各有一个5'磷酸基末端与一个3'
羟基末端。此结构是利用一种称为
dicer的酶处理而得,这种酶可以将较长的双链RNA或
小发夹RNA(small hairpin RNA)切成
siRNA。此外,siRNA也可经由多种不同
转染(transfection)技术导入细胞内,并对特定基因产生具专一性的敲弱(knockdown)效果。因此可利用经过适当剪裁的siRNA之互补性,来对已知序列的基因进行标定,这种现象使siRNA成为研究基因功能与药物目标的一项重要工具。
siRNA机制
1.长dsRNA(可来自发夹,互补RNA和RNA依赖性
RNA聚合酶)被称为Dicer的内切核糖核酸酶切割。Dicer切割长dsRNA以形成短干扰RNA或siRNA;这使得分子能够形成RNA诱导的沉默复合物(RISC)。
2.一旦siRNA进入细胞,它就会被整合到其他蛋白质中以形成RISC。
3.一旦siRNA是RISC复合物的一部分,siRNA就展开以形成单链siRNA。
4.由于其在5'末端的碱基配对而在热力学上较不稳定的链被选择作为RISC复合物的一部分。
5.作为RISC复合物一部分的单链siRNA现在可以扫描并找到互补的mRNA。
6.一旦单链siRNA(RISC复合物的一部分)与其靶mRNA结合,它就会诱导mRNA切割。
7.现在切割mRNA并被
细胞识别为异常。这导致mRNA的降解,并且反过来不将mRNA翻译成氨基酸然后转化为蛋白质。从而沉默编码该mRNA的基因。
siRNA也类似于miRNA,然而,miRNA来自较短的茎环RNA产物,通常通过抑制翻译来沉默基因,并且具有更广泛的作用特异性,而siRNA通常通过在翻译前切割mRNA而起作用,并且具有100%的互补性,因此目标特异性非常严格。
用siRNA或其生物合成前体RNAi诱导
通过转染外源siRNA进行的基因敲低通常是不令人满意的,因为该效应仅是短暂的,特别是在快速分裂的细胞中。这可以通过产生siRNA的表达载体来克服。修饰siRNA序列以在两条链之间引入短环。得到的转录物是短发夹RNA(shRNA),其可以通过Dicer以其通常的方式加工成功能性siRNA。典型的转录盒使用RNA聚合酶III启动子(例如,U6或H1)来指导小核RNA(snRNA)的转录(U6参与基因剪接;H1是RNase)人RNase P)的成分。理论上,所得的siRNA转录物然后由Dicer处理。
通过使用细胞挤压也可以提高基因敲低效率。
RNAi中siRNA的活性很大程度上取决于其与RNA诱导的沉默复合物(RISC)的结合能力。双链体siRNA与RISC的结合之后是用内切核酸酶解开和切割有义链。然后剩余的反义链-RISC复合物可以与靶mRNA结合以启动转录沉默。
RNA激活
已经发现dsRNA还可以激活
基因表达,这种机制被称为“小RNA诱导的基因激活”或RNAa。已经显示靶向基因启动子的dsRNA诱导相关基因的有效转录激活。使用合成的dsRNA在人细胞中证明RNAa,称为“小活化RNA”(saRNA)。尚不清楚RNAa是否在其他生物体中是保守的。
转录后基因沉默
siRNA诱导的转录后基因沉默始于RNA诱导的沉默复合物(RISC)的组装。该复合物通过切割编码靶基因的mRNA分子来沉默某些基因表达。为了开始该过程,两条siRNA链中的一条(引导链)将被装载到RISC中,而另一条链即过客链被降解。某些Dicer酶可能负责将引导链加载到RISC中。然后,siRNA扫描并指导RISC到mRNA分子上完全互补的序列。认为mRNA分子的切割由RISC的Argonaute蛋白的Piwi结构域催化。然后通过切割与siRNA残基10和11配对的靶核苷酸之间的磷酸二酯键精确切割mRNA分子,从5'端开始计数。这种切割导致mRNA片段被细胞
核酸外切酶进一步降解。5'片段通过外来体从其3'末端降解,而3'片段从其5'末端通过5'-3'外切核糖核酸酶1(XRN1)降解。切割后靶mRNA链与RISC的解离允许更多的mRNA被沉默。这种解离过程很可能是由
ATP水解驱动的外在因素促进的。
有时不会发生靶mRNA分子的切割。在一些情况下,磷酸二酯骨架的核酸内切裂解可以通过切割位点附近的siRNA和靶mRNA的错配来抑制。其他时候,即使靶mRNA和siRNA完全配对,RISC的Argonaute蛋白也缺乏内切核酸酶活性。在这种情况下,
基因表达将被miRNA诱导机制沉默。
Ping-Pong方法的简化版本,涉及蛋白质Aubergine(Aub)和Argonaute-3(Ago3)切割piRNA的3'和5'末端。
Piwi相互作用的RNA负责转座子的沉默,而不是siRNAs。
siRNA设计
最初,siRNA序列的选择是基于实验经验而获得的(Elbashir et al. 2001,2002)。最近,生物信息学工具被用来设计siRNA(表18-1),目前多个数据库收录了经过实验确证的siRNA和shRNA。值得推荐的是,在设计新的siRNA之前可以通过搜索已有的siRNA数据库和科研文献来寻找已确证的siRNA。如果不能获得已确证的siRNA,则应该为每个靶基因设计3~5条候选siRNA(Pei and Tuschl 2006)。以下将介绍如何挑选有效和特异性强的siRNA。有关siRNA设计的详细过程请参考Birmingham等(2007)的研究。
1、目标区域。siRNA通常以mRNA的CDS序列为靶点,因为一般认为,相对非编码序列而言,CDS序列容易成为RNA干扰的靶点且多态性更低。然而,当CDS不容易找到合适的siRNA结合位点,或者为了区分两个编码区相同但3'非翻译区(UTR)不同的基因时,3'端UTR也可以利用。5'端UTR和剪接点通常不被考虑,因为它们可能会被细胞内蛋白质复合体(如翻译起始机器或者外显子连接复合体)所包裹。
2、长度和非配对结构。尽管20~25个核苷酸长度、包含2个非配对碱基形成的3'端突出“尾巴”的双链siRNA显示出了与常规siRNA相当的效率,但常规的双链siRNA依然是长度为21个核苷酸、两端包含2个非配对碱基形成的3'端突出“尾巴”,模拟了Dicer酶体内切割的主要产物。长度超过30个碱基的双链RNA能够在哺乳动物体细胞中诱导干扰素反应。一些长度超过23个碱基的RNA双链体能够诱导细胞特异性的干扰素反应(Reynolds et al. 2006)。
3、热力学不对称性。进入RISC的siRNA链被称为“向导链”(图18-2)。这一siRNA链的5'端碱基配对较为松弛(动力学稳定性稍差),被RNA干扰机器识别为向导(Khvorova et al. 2003;Schwarz et al. 2003)。向导链进入RISC,两者之间的这种结合会通过5'端的G∶U错配得到加强。反之,也可以通过化学修饰减弱信使链(向导链的反义链,目标mRNA的同义链)与RISC的结合(Nykanen et al.2001;Chen et al. 2008)。
4、GC含量和核苷酸偏好。有关siRNA设计的大量分析显示:具有生物学功能的siRNA不能含有回文(palindromic)序列和内在重复序列,并且GC含量达到30%~52%。回文序列或者内在重复序列会形成二级结构,干扰与RISC以及目标mRNA的结合(Patzel et al. 2005)。GC含量过高或者过低会干扰两条siRNA链的分离,减慢与RISC的结合。此外,成熟RISC与目标mRNA的强烈结合会妨碍切割产物的释放,使酶的转换效率降低(Haley and Zamore2004;Tang and Zamore2004)。有关高效siRNA性质的多因素分析显示:向导链的第1~第7个碱基应该是U或者A,第10个碱基应为A或者U,第19个碱基应为G或者C(Pei and Tuschl 2006)。这些“规律”预示了向导链的结合喜好,使其与靶标保持适当的亲和力,促进对靶标的多轮切割。
5、RNA干扰介导的脱靶效应。RNA干扰介导的脱靶效应是指双链siRNA的向导链或信使链介导的对基因表达的非特异性抑制,具有浓度依赖性(图18-3)(Jackson et al. 2006a)。RNA干扰介导的脱靶效应通常会在siRNA发挥类似内源性miRNA的作用时发生,即通过小RNA向导链的“种子序列”(2~7位或2~8位核苷酸)与其目标mRNA结合(Lim et al. 2005;Lin et al. 2005;Birmingham et al. 2006)。目前已经有多种消除这种脱靶效应的方法。尽管通过同源性搜索(如BLASTn或者Smith-Waterman算法)来减少可能存在脱靶效应的siRNA的方法应用比较广泛,但这一方法仍不能消除大多数的脱靶效应,这是因为无法避免第6位和第7位核苷酸与细胞内mRNA匹配的偶然情况。通过将针对同一mRNA的多个无相关性siRNA混合使用以降低每一种siRNA浓度的方法可提高RNA干扰的特异性(Kittler et al. 2007),但是这种方法有着严格的适用要求。对siRNA向导链的第2位核苷酸进行不依赖于序列的化学修饰同样可以提高效率,这一方法减少了siRNA对既定靶标以及靶标之外mRNA的亲和力(Jackson et al. 2006b)。唯一被证实的可提高RNA干扰特异性的方法是设计siRNA分子,使其正确的RNA链进入有功能的RNAi酶复合体,或者可以对信使链进行化学修饰,以阻止其通过RNA干扰途径发挥作用(Elménet al. 2005)。
6、天然免疫反应和毒性。在哺乳动物中,如果siRNA包含富含G和U的序列基序,如GUCCUUCAA或者UGUGU,那么此siRNA有可能通过Toll样受体激活细胞内的天然免疫通路(Hornung et al. 2005;Judge et al. 2005;Marques and Williams 2005;Sioud 2005)。然而,其他的免疫刺激因素仍然有待鉴定,因为有一些siRNA虽富含G和U却不能激活免疫受体,而另一些缺少GUCCUUCAA或者UGUGU基序的siRNA反而具有免疫刺激活性。针对176个随机挑选的siRNA进行比较研究,鉴定出UGGC是一个毒性基序,能引发细胞死亡(Fedorov et al. 2006)。已知的免疫刺激活性和毒性基序可以通过计算预测而避免。另外,化学修饰,如锁状核酸(locked nucleic acid,LNA)(图18-4)和对免疫刺激活性和毒性基序进行2'-O-甲基化核酸修饰可以用于抑制其天然免疫刺激活性(Judge et al. 2006)。
siRNA的体外制备
化学合成siRNA
合成siRNA应用广泛,这种方法的得率和纯度都比较高。对合成siRNA还可以进行一系列化学修饰以提高siRNA的稳定性、降低脱靶效应,以及(或者)阻止激活天然免疫反应。多家公司,包括Ambion、Thermo Scientific Dharmacon、QIAGEN和Sigma-Aldrich Proligo等都能提供高质量的合成siRNA。在用于细胞之前,合成的正义和反义siRNA需在体外复性形成双链siRNA(方案1)。
利用酶学反应从长链dsRNA生成siRNA
利用重组Dicer酶或者细菌RNase Ⅲ对体外转录获得的长链dsRNA进行酶学消化也可以获得双链siRNA(Yang et al. 2002)。与合成siRNA相比,对长链dsRNA酶消化可以生成不同种类的siRNA,提高了生成功能性siRNA的可能性。然而,体外酶学反应生成siRNA的主要不足之处在于:这些siRNA在使用时不易选择对照。理论上,对照siRNA不应该与实验siRNA具备相同的种子序列。由于体外酶切生成的确切siRNA无从得知,那么也就无法选择精确的对照,因此,无法区分究竟是既定靶标mRNA还是脱靶基因的特定表型表达发生下调。
体外转录
利用合成的、含有噬菌体启动子的DNA寡核苷酸模板,经体外转录可以生成siRNA。通常,这一方法通过核酸酶或者核酶消化,确保产物拥有确定的末端以及(或者)5’端单磷酸或者羟基末端。这一方式能够以较低成本快速生成多个不同siRNA,但是风险主要存在于污染的三磷酸RNA会触发天然免疫反应(Kimet al. 2004)。
siRNA的抗病毒治疗应用
近年来,RNAi技术在病毒感染性疾病治疗方面的应用已受到极大关注,尤其在AIDS、乙型肝炎和丙型肝炎等治疗中的应用研究最为活跃。,在siRNA抗AIDS的研究中,针对HIV结构蛋白基因及长末端重复序列(longterminal repeat,LTR)的SiRNA可以控制病毒复制;针对
宿主细胞HIV受体CD4基因的siRNA可有效控制病毒进入宿主细胞,抑制病毒的感染过程。但CD4是人体正常免疫功能不可缺少的分子,它的表达抑制势必影响正常的免疫功能,由此设想针对CCR5、CCR4等共同受体设计siRNA,并正在试验中。另外在抗病毒治疗中,分别以
丙型肝炎病毒、
呼吸道合胞病毒、流感病毒、
脊髓灰质炎病毒等基因组的编码区或非编码区为靶点设计的siRNA均取得了令人欣喜的体外抑制作用,但利用动物实验模型验证siRNA体内清除病毒的效果需进一步研究。
虽然RNAi有望成为抗病毒治疗的有效工具,但病毒株靶基因的高度突变或碱基丢失,如HIV和流感病毒,成为设计siRNA时必须考虑的问题。另外一种称为病毒抑制子蛋白的发现使研究人员对RNAi的抗病毒效应有了更深的认识,研究发现这种病毒抑制子由
病毒基因组编码产生,最初在植物中发现,有报道别的真核生物中也存在,其与
RNA干扰装置竞争性的结合,通过阻断siRNA的加工或干扰信号的传递等途径抑制RNA干扰,从而降低其抗病毒的效应。
针对上述影响因素,在RNAi抗病毒的治疗应用中,(1)靶序列的选择最好是针对病毒的保守序列,以减少病毒变异的影响。(2)设计针对不同靶序列的多种SiRNA并联合作用,以减少病毒逃逸的产生。(3)针对病毒进入细胞或病毒复制相关的宿主基因设计siRNA,如HIV受体CD4、CCR5等,这样即使病毒高度变异,其逃逸RNA干扰的几率也会大大降低。(4)针对病毒抑制子设计siRNA,可在一定程度上减少或避免病毒抑制子的产生,并且随着对RNA干扰的深入研究,将会有越来越多的相关报道。综上所述,RNAi在抗病毒治疗应用方面虽取得很大的突破,但其应用于临床还有待更深的研究。
医药研发
2024年5月,蔡磊与中美瑞康合作开发的RAG-17正式在中国获批临床,成为临床渐冻症RNAi疗法。
2024年11月消息,中美瑞康自主研发的FUS基因靶向小干扰RNA(siRNA)疗法RAG-21,成功获得美国食品药品监督管理局(FDA)授予的孤儿药资格,用于治疗肌萎缩侧索硬化症(ALS),俗称“渐冻症”。RAG-21是一种专门针对FUS基因突变的siRNA疗法,可有效降低FUS蛋白的水平,靶向运动神经元退化的根源。该药物通过RNA干扰(RNAi)机制发挥作用,通过降低FUS蛋白水平而减轻FUS蛋白的错误定位和异常聚集。临床前研究显示,RAG-21具有显著的敲低效果和良好的安全性。