短散在元件又叫做短散在序列,简称SINE。广布于真核生物。Alu家族的重复单位为300bp,由两段130bp的重复序列与一段31bp的间隔序列构成,两侧各有一段6~20bp的正向重复序列,不含
反转录酶的编码序列。
短散在元件 (SINE)广布于真核
生物 ,是基因组中的可转移成分 ,长约 10 0~ 5 0 0bp ,拷贝数可达数百至数十万以上 ,根据序列变异和鉴别位点常可分为若干家族和亚家族 ,对基因组的复杂化、基因的钝化、新基因的产生、尤其是
基因表达的调控都具有重要意义 .除了灵长类Alu和小鼠B1家族等少数来源于 7SLRNA ,大多为tRNA的衍生物 ,由tRNA同源区、tRNA无关区和富含AT区等组成 .在tRNA同源区含有RNA聚合酶Ⅲ内部启动子成分 .其起源和进化有“主源基因模型”、“多源基因模型”、“寄生假说 (转座子模型 )”和“平行转移假说”等 .以鲑科鱼类、鲸类及偶蹄类、
高等灵长类和蛙类为例 ,介绍了近年来短散在元件在分子系统发生研究以及在
遗传作图和抗癌治疗上的应用。
同一物种不同的个体之间,某一特定SINE元件的序列一致性可高达80%;而在不同的物种之间,某一特定SINE元件的序列一致性仅有50%。SINE元件一般是存在于间隔子和非转译区段内,除了某些个别的情况外,在基因的编码区内是不存在SINE元件的。通常所说的Alu序列,是人类基因组DNA中最为常见的SINE元件,其长度为300bp,可形成一种不完整的二聚体。
长散在元件亦称
长散在重复序列,意为散在分布的长细胞核因子,是散在分布在哺乳动物基因中的一类重复序列,这种重复序列较长;LINE是可以自主转座的一类
反转录转座子,来源于
RNA聚合酶Ⅱ的转录产物;L1是LINE中的一种重复序列,长约6 500bp,哺乳动物基因组中的拷贝数可多达10万份,主要集中在AT富集区。L1以及由L1编码的反转录酶作用于其他非自主反转录转座子以后所生成的DNA序列,加起来至少占人类基因组全长的四分之一。LINE不同成员之间的序列有较大差别,但是同一物种中的LINE的不同成员仍有较大的同源性。
LINE有分别长1137bp和3 900bp的可读框,这两种可读框有14bp的重叠序列。从LINE的结构分析,它并不具有
反转录病毒特有的LTR,因此曾把LINE归于非病毒超家族。测序的结果发现LINE L1的一个可读框同反转录酶是同源的,这提示LINE可能来源于能够编码转座所需的酶进行自主转座的可动元件,所以现在在分类时被归人病毒超家族。
1988年,人们第一次认识到可动元件可能是人类疾病的一种致病因素。当时在血友病A的凝血因子Ⅷ基因中发现了两个截短的L1,后来在凝血因子Ⅷ的基因中又发现了一个反转座的L1插入片段。进行性假肥大性—肌营养不良(Duchenne’smuscular dystrophy,DMD)基因中有三个L1,肠道癌的致病基因APC以及夕—珠蛋白基因中也都发现了L1。已发现的致病的L1插入片段绝大多数出现在生殖细胞或早期胚胎中。APC基因中的11插入片段则是在结肠癌中发现的。这表明L1的反转座作用也可以发生在体细胞中。
L1的插入有以下两个,结构特征:①已发现的每一个插入片段的序列都各不相同,这表明它们是分别来自不同的原初元件(progenitor elements);②上面提到的已发现的8个L1插入片段中,有7个是5,端截短的,其长度变化很大,从538bp到3.8 kb,但是所有这些L1插入片段的蛋白质编码区都保持完整;插人口—
珠蛋白基因的L1是全长的。这些数据提示,并非所有具诱变作用的L1片段在插入后都不再移动了,有些片段很有可能仍保持再次反转录转座的能力。例如,小鼠的全长L1插入片段,确实能再经历几轮的
反转录转座。
L1插入片段的全长原初元件可能是哺乳动物中有活性的反转录转座子的来源。L1被认为是人类基因组中主要的可动因子,它不仅能自主转座,而且它的蛋白质产物可促使非自主转座因子的反转录转座。同时L1还能十分有效地将位于L1 3’端的侧序一起转座到新的位置,这种作用称为3'转导(3'transduction),其结果是将宿主基因组中原先不连锁的两个
DNA片段排列在一起。
许多
真核细胞中都发生3'转导作用。当L1本身的转录终止信号较弱而3'侧序中有很强的转录终止信号时,RNA聚合酶进行L1转录时就会发生“连读”(read-through),而将11’和3'侧序一起转录,其结果是包含L1和3'侧序的嵌合片段一起插入染色体新的位置,这对新
基因的形成和
基因组的进化都有重要作用。