分子标记的概念有广义和狭义之分。广义的分子标记是指可
遗传的并可检测的DNA序列或蛋白质。狭义分子标记是指能反映生物个体或
种群间基因组中某种差异的特异性DNA片段。
概念
分子标记(Molecular Markers),是以个体间遗传物质内
核苷酸序列变异为基础的遗传标记,是
DNA水平遗传多态性的直接的反映。与其他几种
遗传标记——
形态学标记、
生物化学标记、
细胞学标记相比,DNA分子标记具有的优越性有:大多数分子标记为
共显性,对
隐性的性状的选择十分便利;基因组变异极其丰富,分子标记的数量几乎是无限的;在
生物发育的不同阶段,不同组织的DNA都可用于标记分析;分子标记揭示来自DNA的变异;表现为中性,不影响目标性状的表达,与不良性状无连锁;
检测手段简单、迅速。随着
分子生物学技术的发展,DNA分子标记技术已有数十种,广泛应用于遗传育种、
基因组作图、
基因定位、物种亲缘关系鉴别、基因库构建、基因
克隆等方面。
理想要求
理想的分子标记必须达以下几个要求:⑴ 具有高的多态性;⑵ 共显性遗传,即利用分子标记可鉴别二倍体中杂合和纯合基因型;⑶ 能明确辨别等位基因;⑷ 遍布整个基因组;⑸ 除特殊位点的标记外,要求分子标记均匀分布于整个基因组;⑹ 选择中性(即无基因多效性);⑺ 检测手段简单、快速(如实验程序易自动化);⑻ 开发成本和使用成本尽量低廉;⑼ 在实验室内和实验室间重复性好(便于数据交换)。但是,发现的任何一种分子标记均通过电泳分离不同的生物 DNA 分子,然后用经标记的特异 DNA 探针与之进行杂交,通过
放射自显影或非同位素显色技术来揭示 DNA 的多态性。
① 限制性片段长度多态性
(Restriction Fragment Length Polymorphism,
RFLP)
1974年Grodzicker等创立了限制性片段长度多态性(RFLP)技术,它是一种以DNA—DNA杂交为基础的第一代遗传标记。RFLP基本原理:利用特定的限制性内切酶识别并切割不同生物个体的基因组DNA,得到大小不等的DNA片段,所产生的DNA数目和各个片段的长度反映了DNA分子上不同酶切位点的分布情况。通过凝胶电泳分析这些片段,就形成不同带,然后与克隆DNA探针进行
Southern杂交和放射显影,即获得反映个体特异性的RFLP图谱。它所代表的是基因组DNA在
限制性内切酶消化后产生片段在长度上差异。由于不同个体的等位基因之间
碱基的替换、重排、缺失等变化导致限制
内切酶识别和酶切发生改变从而造成基因型间限制性片段长度的差异。
RFLP的
等位基因其有共显性特点。RFLP标记位点数量不受限制,通常可检测到的
基因座位数为1—4个。RFLP技术也存在一些
缺陷,主要是克隆可表现基因组
DNA多态性的探针较为困难;另外,实验操作较繁锁,检测周期长,成本费用也很高。自RFLP问世以来,已经在基因定位及分型、
遗传连锁图谱的构建、疾病的
基因诊断等研究中仍得到了广泛的应用。
② 数目可变串联重复多态性
(Variable Number of Tandem Repeats,
VNTR)
数目可变串联重复序列又称
小卫星DNA(Minisatellite DNA),是一种重复DNA小序列,为10到几百核苷酸,拷贝数10一10001不等。VNTR基本原理与RFLP大致相同,只是对限制性内切酶和DNA探针有特殊要求:⑴限制性内切酶的酶切位点必须不在重复序列中,以保证小卫星或
微卫星序列的完整性。⑵内切酶在基因组的其他部位有较多酶切位点,则可使卫星序列所在片段含有较少无关序列,通过电泳可充分显示不同长度重复序列片段的多态性。⑶分子杂交所用DNA探针核苷酸序列必须是小卫星序列或微卫星序列,通过分子杂交和放射自显影后,就可一次性检测到众多小卫星或微卫星位点,得到个体特异性的DNA
指纹图谱。
小卫星标记的
多态信息含量较高,在17一19之间。缺点是数量有限,而且在基因组上分布不均匀,这就极大限制其在基因定位中的应用。VNTR也存在实验操作繁琐、检测时间长、成本高的缺点。
标记技术
随机引物的PCR标记
所用引物的
核苷酸序列是随机的,其扩增的 DNA 区域事先未知。随机引物PCR扩增的 DNA 区段产生
多态性的分子基础是模板 DNA 扩增区段上引物结合位点的
碱基序列的突变,不同来源的基因组在该区段上表现为扩增产物有无差异或扩增片段大小的差异。随机引物PCR标记表现为显性或共显性。
① 随机扩增多态性DNA
(Random Amplified Polymorphism DNA,
RAPD)
RAPD技术是1990年由Wiliam和Welsh等人利用PCR技术发展的检测DNA多态性的方法。基本原理:它是利用
随机引物(一般为8—10bp)通过PCR反应非定点扩增DNA片段,然后用凝胶电泳分析扩增产物DNA片段的
多态性。扩增片段
多态性便反映了基因组相应区域的DNA多态性。RAPD所使用的
引物各不相同,但对任一特定引物,它在基因组DNA序列上有其特定的结合位点,一旦基因组在这些区域发生DNA片段插人、缺失或碱基突变,就可能导致这些特定结合位点的分布发生变化,从而导致扩增产物数量和大小发生改变,表现出多态性。就单一引物而言,其只能检测基因组特定区域DNA多态性,但利用一系列引物则可使检测区域扩大到整个基因组,因此,RAPD可用于对整个基因组DNA进行多态性检测,也可用于构建基因组
指纹图谱。
与RFLP相比,RAPD具有以下优点:⑴技术简单,检测速度快;⑵ RAPD分析只需少量DNA样品;⑶不依赖于种属特异性和基因组结构,一套引物可用于不同生物基因组分析;⑷成本较低。但RAPD也存在一些缺点:⑴ RAPD标记是一个显性标记,不能鉴别杂合子和纯合子;⑵存在共迁移问题,凝胶电泳只能分开不同长度DNA片段,而不能分开那些分子量相同但碱基序列组成不同的DNA片段;⑶ RAPD技术中影响因素很多,所以实验的稳定性和重复性差。
② 任意引物PCR
(Arbitrarily Primed Polymerase Chain Reaction,AP—PCR)
在AP—PCR分析中,所使用的引物较长(10-50 bp) , PCR反应分为两个阶段,首先寡核苷酸引物在低严谨条件下与模板DNA退火,此时发生了一些合成,以便稳定模板与引物之间相互作用。然后进行高严谨退火条件的循环,两个位点间那些序列在低严谨度退火条件下发生的
引物延伸可继续在高严谨条件下扩增。采用变性聚丙烯酞胺凝胶电泳分析PCR产物,最终反应结果与RAPD类似。只要设计的引物在低严谨退火条件下能减少引物产生人为产物,应用成对组合的引物可以产生新的AP—PC
R谱带,但引物配对组合使用时,得到的图谱与单引物单独使用时产生的图谱之和很不相同,这样,50个引物能产生1250种不同
指纹图谱。
AP—PCR方法不需预知序列资料,而且检测的基因组样本是任意的,还能够用于检测近等基因系(或同类系)中的多态性。AP—PCR的缺点是每个新的多态性都必须经纯化才能进一步使用。另外,此方法在
杂合体中仅可辨别长度多态性。
③ DNA扩增指纹印迹
(DNA Amplification Fingerprinting,
DAF)
DAF是一种改进的RAPD分析技术,与RAPD技术不同的是,DAF分析中所使用的引物浓度更高,长度更短(一般为5一8 bp),因此它所提供的谱带信息比RAPD大得多,如当使用5个核昔酸的引物时,引物和模板的组合大约可扩增出10一100个DNA片段。PCR扩增产物是在凝胶上进行分离,通过
银染即可产生非常复杂
带型。
特异引物的PCR标记
特异引物的PCR标记所用引物是针对已知序列的 DNA 区段而设计的,具有特定
核苷酸序列(通常为 18—24 bp),可在常规PCR
复性温度下进行扩增,对基因组 DNA 的特定区域进行多态性分析。
① 序列标志位点
(Sequence Tagged Sites,
STS)
STS是对以特定对
引物序进行PCR特异扩增的一类分子标记的统称。通过设计特定的
引物,使其与基因组DNA序列中特定结合位点结合,从而可用来扩增基因组中特定
区域,分析其
多态性。利用特异PCR技术的最大优点是它产生信息非常可靠,而不像RFLP和RAPD那样存在某种模糊性。
② 简单重复序列
(Simple Sequence Repeat,
SSR)
简单重复序(SSR)也称
微卫星DNA,其串联重复的核心序列为1一6 bp,其中最常见是双核苷酸重复,即(CA) n和(TG) n每个微卫星DNA的核心序列结构相同,重复单位数目10一60个,其高度多态性主要来源于串联数目的不同。
SSR标记的基本原理:根据微卫星序列两端
互补序列设计引物,通过PCR反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用PCR的方法扩增出不同长度的PCR产物,将扩增产物进行凝胶电泳,根据分离片段的大小决定基因型并计算
等位基因频率。
SSR具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点;⑵微卫星呈共显性遗传,故可鉴别杂合子和纯合子;⑶所需DNA量少。显然,在采用SSR技术分析微卫星DNA多态性时必须知道
重复序列两端的DNA序列的信息。如不能直接从DNA数据库查寻则首先必须对其进行测序。
③ 序列特异性扩增区
(Sequence—characterized Amplified Region,
SCAR)
SCAR标记是在RAPD技术基础上发展起来的。SCAR标记是将目标 RAPD 片段进行克隆并对其末端测序,根据 RAPD 片段两端序列设计特异
引物,对
基因DNA 片段再进行PCR特异扩增,把与原RAPD片段相对应的单一位点鉴别出来。SCAR标记是
显性遗传,待检 DNA 间的差异可直接通过有无扩增产物来显示。SCAR标记方便、快捷、可靠,可以快速检测大量个体,结果稳定性好,重现性高。
④ 单引物扩增反应
(Single Primer Amplification Reaction,
SPAR)
SPAR技术是与RAPD技术相似的一种标记技术,SPAR也只用一个
引物,但所用的引物是在SSR的基础上设计的。这些引物能与SSR之间的间隔序列进行
特异性结合,然后通过PCR技术扩增SSR之间的DNA序列,凝胶电泳分离扩增产物,分析其多态性。另外,还有一种与SPAR技术非常相似的标记技术,即ISTR (Inverse Sequence—tagged Repeat)技术,ISTR所用的引物是在反向重复序列基础上设计的,PCR扩增的是反向重复序列之间的DⅣA序列。
⑤ DNA单链构象多态性
(Single Strand Conformation Polymorphism,
SSCP)
SSCP是指等长的单链DNA因核昔酸序列的差异而产生
构象变异,在非变性聚丙烯酞胺中的表现为
电泳迁移率的差别。单链DNA
构象分析对DNA序列的改变非常敏感,常常一个碱基差别都能显示出来。在SSCP分析中,利用PCR技术定点扩增基因组DNA中某一目的片段,将扩增产物进行变性处理,双链DNA分开成单链,再用非变性聚丙烯酞胺
凝胶电泳分离,根据条带位置变化来判断目的片段中是否存在突变。SSCP结果判定是通过多个样品之间对比,观察条带之间位置改变,从而显示出不同生物个体的DNA特异性,达到指纹分析目的。为了进一步提高SSCP的检出率,可将SSCP分析与其它突变检测方法相结合。其中与杂交双链分析(Heterocluplex analysis,Het)法结合可以大大提高检出率。Het法是用探针与要检测的单链DNA或RNA进行
杂交,含有一对碱基对
错配的杂交链可以和完全互补的杂交链在非变性PAG凝胶上通过电泳被分离开。对同一靶序列分别进行SSCP和Het分析可以使
点突变的检出率接近100%,而且实验简便。
⑥ 双脱氧化指纹法
(Dideoxy Fingerprints,
ddF)
ddF是将
双脱氧末端终止
测序法与SSCP结合起来的分析技术,对由双脱氧末端终止的长短不一的单链DNA进行SSCP分析。如果目的片段存在一个突变,则所有大于某一大小对应于突主变位置的双脱氧终止片段无野生型系统,对于每一个突有多次机会检测其迁移率改变,提高了检测突变的效率。ddF方法克服了SSCP分析时因DNA长度影响SSCP显示的困难,通过一种双脱氧核昔酸生产特异性的单链DNA,使其中长度合适的DNA片段显示SSCP改变。
DNA标记
① 扩增片段长度多态性
(Amplified Fragment Length Polymorphism,
AFLP)
AFLP是1995年荷兰科学家Zabeau和Vos等发展起来的一种检测DNA多态性的新方法,文章发表于Nucleic Acids Research。AFLP 是 RFLP 与PCR相结合的产物,其基本原理是先利用限制性内切酶水解
基因组 DNA 产生不同大小的 DNA 片段,再使
双链人工接头的酶切片段相边接,作为扩增反应的模板 DNA,然后以人工接头的
互补链为
引物进行预扩增,最后在接头互补链的基础上添加 1—3个选择性核苷酸作引物对模板 DNA 基因再进行选择性扩增,通过
聚丙烯酰胺凝胶电泳分离检测获得的DNA扩增片段,根据扩增片段长度的不同检测出多态性。
引物由三部分组成:与人工接头互补的核心
碱基序列、限制性内切酶
识别序列、引物3’端的选择碱基序列(1—10 bp)。接头与接头相邻的酶切片段的几个碱基序列为结合位点。该技术的独特之处在于所用的专用引物可在知道 DNA 信息的前提下就可对酶切片段进行PCR 扩增。为使酶切浓度大小分布均匀,一般采用两个限制性内切酶,一个酶为多
切点,另一个酶切点数较少,因而 AFLP 分析产生的主要是由两个酶共同酶切的片段。AFLP 结合了 RFLP 和 RAPD两种技术的优点,具有分辨率高、稳定性好、效率高的优点。但它的技术费用昂贵,对 DNA 的纯度和
内切酶的质量要求很高。尽管 AFLP 技术诞生时间较短,但可称之为分子标记技术的又一次重大突破,被认为是一种十分理想、有效的分子标记。
② 酶切扩增多态性序列
(Cleaved Amplified Polymorphism Sequences,
CAPS)
CAPS技术又称为PCR—RFLP,它实质上是PCR技术与RFLP技术结合的一种方法。CAPS的基本原理是利用己知位点的DNA序列资源设计出一套特异性的PCR引物(19—27bp),然后用这些引物扩增该位点上的某一DNA片段,接着用一种专一性的限制性内切酶切割所得扩增产物,凝胶电泳分离酶切片段,染色并进行RFLP分析。CAPS标记揭示的是特异PCR片段的限制性长度变异的信息。CAPS是一类共显性分子标记,其优点是避免了RFLP分析中膜转印这一步骤,又能保持RFLP分析的
精确度。另外,由于很多限制性内切酶均可与扩增DNA酶切,所以检测到多态性机会较大。
DNA芯片
核苷酸多态性(Single Nucleotide Polymorphism,
SNP)
SNP标记是美国学者Lander E于1996年提出的第三代DNA遗传标记。SNP是指同一位点的不同
等位基因之间仅有个别核苷酸的差异或只有小的插入、缺失等。从分子水平上对单个核苷酸的差异进行检测,SNP 标记可帮助区分两个个体遗传物质的差异。
人类基因组大约每 1250 bp SNP 出现一次,已有2000多个标记定位于人类染色体,对人类基因组学研究具有重要意义。检测 SNP 的最佳方法是 DNA 芯片技术。SNP 被称为第三代 DNA 分子标记技术,随着 DNA 芯片技术的发展,其有望成为最重要最有效的分子标记技术。
遗传标记
基因型的特殊的易于识别的表现形式。其最基本的两个特性是:
可遗传性。
可识别性(多态性)。
遗传标记是研究遗传现象和物种进化的不可缺少的工具。
应用领域
基因组作图和基因定位研究
长期以来,各种生物的
遗传图谱几乎都是根据诸如形态、生理和生化等常规标记来构建的,所建成的遗传图谱仅限少数种类的生物,而且图谱分辨率大多很低,图距大,饱和度低,因而应用价值有限。分子标记用于遗传图谱构建是遗传学领域的重大进展之一。随着新的标记技术的发展,生物遗传图谱名单上的新成员将不断增加,图谱上标记的密度也将越来越高。建立起完整的高密度的分子图谱,就可以定位感兴趣的
基因。
基于图谱克隆基因
图位克隆(Map—bascd cloning))是近几年随着分子标记遗传图谱的相继建立和基因分子定位而发展起来的一种新的
基因克隆技术。利用分子标记辅助的图位克隆无需事先知道基因的序列,也不必了解基因的表达产物,就可以直接克隆基因。图位克隆是最为通用的
基因识别途径,至少在理论上适用于一切基因。基因组研究提供的高密度遗传图谱、大尺寸
物理图谱、大片段
基因组文库和基因组全序列,已为图位克隆的广泛应用铺平了道路。
物种亲缘关系和系统分类中的应用
分子标记广泛存在于基因组的各个区域,通过对
随机分布于整个基因组的分子标记的
多态性进行比较,就能够全面评估研究对象的多样性,并揭示其
遗传本质。利用
遗传多样性的结果可以对物种进行
聚类分析,进而了解其系统发育与亲缘关系。分子标记的发展为研究物种亲缘关系和系统分类提供了有力的手段。
用于疾病诊断和遗传病连锁分析
1980年,Botstein等成功的将PFLP技术用于镰刀型贫血症的诊断分析,开创了
基因诊断的先河。PFLP是以孟德尔方式遗传,因此可以作为染色体上
致病基因座位的
遗传标志。许多与相连锁的
致病基因得以定位。小卫星和微卫星因其高度多态性而被广泛用于疾病诊断和遗传病的连锁分析。随着高通量SNP检测技术方法的出现,作为数量最多且易于批量检测的多态标记,SNP在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的
易感性研究中将发挥愈来愈重要的作用。
技术展望
分子标记技术已飞速发展,并被广泛应用于动植物的
遗传研究中。分子标记中的已在玉米、大豆、鸡、猪等动植物育种和生产中有许多应用研究,主要集中在基因定位、辅助育种、疾病治疗等方面的应用研究工作,取得了一些应用成果。分子标记技术的开发是分子生物学领域研究的热点。随着分子生物学理论与技术的迅猛发展,必将研发出分析速度更快、成本更低、信息量更大的分子标记技术。而分子标记技术与提取程序化、电泳胶片分析自动化、信息(数据)处理计算机化的结合,必将加速遗传图谱的构建、基因定位、基因克隆、物种亲缘关系鉴别及与人类相关的致病基因的诊断和分析。