遗传作图(genetic mapping)是指应用遗传学技术构建能显示基因以及其他序列特征在基因组上位置的图。遗传学技术包括
杂交育种实验,对人类则是检查家族史或
系谱。与任何一种图一样,一个遗传图必须显示出显著特征的位置。
由来
大量实验表明,重组是
同源染色体发生交换的结果,两个
连锁基因之间的距离决定了它们的
重组值。用遗传重组实验来确定
真核生物染色体上连锁排列的一些基因间的相对位置,这种方法就称作遗传作图。此方法由
摩尔根的学生
斯特蒂文特(Sturtevant)于1913年建立。
方法
三点测交
摩尔根的学生
斯特蒂文特(Sturtevant)想出了一个的办法进行遗传作图,那就是
三点测交(three-point test cross)。从几何知识上知道,要证明a、b、c三点共线,可以通过三点之间的距离加以证明,当ab+bc=ac时三点在一条直线上。斯特蒂文特借鉴了这一思路,选择了六个
性连锁基因进行果蝇的杂交实验,我们以红眼V(Vermilion eyes)、翅无脉Cv(crossveinless)和截翅Ct(cut,or snipped wing edges)三个基因为例,杂交及结果如下。
根据计算的结果,可以绘出V、Cv、Ct的遗传图。但是我们会发现V-Ct(13.2 m.u)和Ct-Cv(6.5 m.u)之和为19.7 m.u,大于V-Cv的距离(18.5 m.u),因为18.5 m.u这个数据是V-Cv的
重组值,即从V和Cv这两个标记的重组中直接得来的,这两点中如果发生双交换的话,因不会产生重组而无法计算,易被漏掉,但从Cv-Ct和V-Cv的重组中可以看到确实发生了两次
双交换,交换率为0.6 %×2=1.2%,如果把漏掉的双交换值加进去则:
(V-Cv)=(Cv-Ct)+(V-Cv)
18.5 m.u+1.2 m.u=6.5 m.u+13.2 m.u=19.7 m.u
因此我们可用下面的公式来表示a-b之间的重组值和双交换的关系:
ab=ac+cb-2(ac)(cb)
ab是a和b两个基因之间的重组值。c是a与b之间的一个基因,ac、cb表
示a和c、c和b的重组值,(ac)(cb)表示双交换值。
形态学标记
最初的
遗传学图是在20世纪初对
果蝇等生物构建的,使用基因作为标记:许多年之后人们才认识到基因是
DNA分子的片段。而在当时,基因被认为是能将可
遗传的性状从亲子传递到后代的抽象实体一个遗传性状必须以两种替换形式或表型(phenotype)存在才能用于遗传学分析。如
孟德尔首先研究的豌豆茎的高或矮。每种表型是由相应基因的不同
等位基因(allele)所决定的。起切只有那些能通过视觉区分的基因表型能用于研究。比如,第一张果蝇遗传图显示了负责身体颜色、眼睛颜色、翅膀形态等基因的位置,这些表型都可在低倍显微镜下或肉眼观察果蝇而看到。
早期尚觉得这种方法很精细,但遗传学家们很快就发现,只有有限的几种可见表型的遗传可用于研究,而在许多情况下,由于不止一个基因影响一个物理特征,分析起来并不大容易。例如,到1922年,有超过50个基因被定位在4条果蝇染色体上、而其中9个基因负责眼睛的颜色,想在此领域有所贡献的每一个初涉者必须首先学会辨别果蝇眼睛的颜色是红、淡红、朱红、朽榴石色、
康乃馨色、肉桂色、深褐色、猩红或深红色。因此,为了使基因图更加全而,有必要找到一些比可见的
性状更多、更明确而且更简单的性状。
生化标记
以上问题的解决方案之一是应用
生物化学方法来区分表型。这对于
微生物与
人类这两种生物尤为重要,
细菌与
酵母等微生物只有为数很少的可见性状,因此这类生物的基因作图只能依赖于少数的生化表型。人类虽然有可见的性状持征,但以
血液分型为代表的生化表型研究从20世纪20午代就开始了。
血液分型研究不仅包括如ABO系统的标准
血型,还有
血清蛋白以及人类白细胞抗原(HLA系统)等免疫蛋白的
等位基因可变体。这些标记相对于可见表型的一个巨大优点是其相关基因往往为
复等位基因(multiple allele)。例如,HLA—DRBI基因至少有59个等位基因,而HLA- B至少有60个。这正是与人类基因遗传作图相关的。与在果蝇或小鼠等生物中建立的杂交实验不同,人类基因遗传的数据只能通过检查—个家族中各成员的表型来获得。如果对所研究的基因而言,所有的家族成员都为纯合子,就得不到有用的信息。这对于只有两个等位基因的基因较常见,因为婚配可偶然地发生于同一个等位基因纯合子个体之间。而当所研究的基因有60个而不是2个等位基因时,这就很少见了。
简单的说:形态标记和生化标记的局限性在于多态性太低,可标记的位点太少。这是他们共同的致命弱点。
DNA分子标记
DNA 分子标记大多是以DNA片段电泳谱带形式表现的。依其遗传特性可分为显性和共显性标记2种;依多态性检测手段可分为以
Southern杂交技术为核心的
分子标记和以PCR技术为核心的分子标记;根据在基因组中出现的频率,又可分为低拷贝序列和重复序列标记。
限制性片段多态性
RFILP是第—种用于研究的DNA标记。限制性
核酸内切酶是一种在特定序列上切割DNA分子的
酶,用它处理一个
DNA分子时,即产生限制片段。这种序列特异性意味着用一种限制酶处理一种DNA分子总会产生同样的片段。但对于基因组DNA来说,并不总是这样。这是因为有些限制位点具多态性,以两种等位形式存在。一种等位形式有正确的限制位点序列,能被酶切开;另一等位形式的序列有改变,从而该限制位点不能被识别。后者的结果是在
核酸内切酶处理后,两个相邻的限制片段仍然连接在一起,从而导致了长度多态性(如图1)。这就是一个RFLP的例子。如同用基因作为标记一样,RFLP在基因组图谱上的位置可以通过追踪其等位基因的遗传而得到。人类基因组中大约有100000个RFLP,但是理所应当的每个RFLP只能有两种等位形式(有或没有这个位点),这就限制了RFLP在人类基因作图上的应用价值,因为一个家庭的所有成员很可能都是某一个RFLP的纯合子。(简单来说,它不能区分纯合子和杂合子)。
随机扩增片段长度多态性标记
(Random Amplified Polymorphic DNA ,RAPD)RAPD技术是由Williams等首先创立的一种DNA分子标记技术,利用单一的10个碱基
寡核苷酸作为引物,对基因组DNA进行PCR扩增。经
琼脂糖凝胶电泳来检测DNA序列多态性。
扩增片段长度多态性
(Amplified Fragment Length Polymorphism ,AFLP)AFLP是Zeabeau 等(1993)发明的一项技术,它既有RFLP的可靠性,又有RAPD的方便性。其基本原理是通过PCR 扩增基因组DNA片段,扩增产物的变性
聚丙烯酰胺电泳显示扩增片段长度多态性,其中引物=接头+酶切位点+2~3个核苷酸。
AFLP技术分析流程:⑴DNA 模板制备;⑵提取样本DNA 经浓度和质量检测后,一般采用双酶(EcoRI和MSEI或PstI或TaqI)酶切, 在基因组DNA上产生低频和高频切口;⑶选择性扩增酶切片段。酶切后,限制性片段在T4连接酶作用下与特定接头连接,形成带有接头的特异性片段;⑷PCR前扩增,一般用带一个选择性引物进行预扩增,反应条件与常规PCR反应基本一致;⑸利用
放射性同位素标记或荧光标记PCR 引物;⑹在Taq
聚合酶作用下完成94 ℃变性30s ,65 ℃淬火30s,72 ℃延伸60s,PCR扩增36个循环;⑺PCR产物在含
尿素聚丙烯酰胺上电泳;⑻将电泳后的凝胶转移到吸附滤纸上,经干胶仪进行干胶处理;⑼在X光片上感光,数日后冲洗胶片并进行结果分析。
AFLP反应起始一般高温复性(一般65 ℃),因此只有那些与3’端严格配对的片段才能得到扩增,选择性很强。实验结果稳定,重复性好,呈典型的孟德尔式遗传,每个AFLP可以获得50~100条谱带信息,多态性强。
微卫星
(Microsatellite)微卫星是指以几个(1~6 bp) 核苷酸为单位,多次
串联重复序列,也称之为
简单重复序列(single sequence repeats ,SSR) 、
短串联重复序列(short tandem repeats ,STR)或简单序列长度多态性(single sequence length polymorphism ,SSL P)。广泛分布于
真核生物基因组中,大约每隔10~50bp就有一个微卫星,由于重复次数和重复程度的不完全而造成每一个位点的多态性。
单核苷酸多态性
(Single Nucleotide Polymorphism,SNP)基因组中存在单个的点
突变,且数量极大,有些也对产生RFLP,但许多并个能。这是囱为它们所处的序列不能被限制件内切核酸酶所识别。在人类基因组中,据认为有200000个以上的
SNP(single nucleotidc polymorphism)位干基因内.而且有更多的SNP位于非基因的DNA中。
每个SNP只有两个等位基因,所以这些标记在人类绘制
遗传图谱方面又与RFLP同样的缺点:对于一个SNP,很可能—个家族的所有成员都是纯合子。SNP的优点是它数目庞大,而且对SNP分型所用的方法不需
凝胶电泳。这非常重要,因为已证明凝胶电泳很难实现自动化,所以使用它的检测方法相对缓慢而且费力。由于SNP以寡核苷酸杂交分析(oligonucleotide hybidization analysis)为基础,故其检测更快速。寡核苷酸是在试管中合成的通常小于50个核苷酸的短单链DNA分子。在适当的条件下,一个寡核苷酸与另一个DNA分子仅在可形成完全的碱基配对结构时才能杂交。如果有一个错配,寡核昔酸上就有一个位置不能形成碱基对。则不能杂交(图1)。因此寡核苷酸杂交能区分一个SNP的两个等位基因。筛选策略包括:
DNA芯片是一块面积为2cm平方或更小的硅片,以高密度排列方式携带有许多不同的寡核苷酸。待测DNA用荧光标记后加到芯片的表面。用
荧光显微镜观察杂交情况,显示荧光信号的位置即表示该处的寡核苷酸与待测DNA发生了
杂交。因此一个实验中可以量化许多SNP。
动态等位基因特异的杂交(dynamic allele-specific hybridization,DASH) 在这种技术中,杂交在溶液中进行,比如在96孔微量滴定板的一个孔中进行G荧光标记只能与双链DNA结合,因此只有发生了杂交才能检测到信号。开始,杂交在允许有错配的条件下进行。在这个阶段,无论待测DNA含有哪一种SNP等位基因,寡核苷酸都能与之杂交。由于错配的杂交产物不如完全杂交产物稳定,故在较低温度
解链.因此可以通过升高温度来区分等位基因。这样就可以从使杂交依赖性荧光信号消失的温度来判定待测DNA中存在哪一种等位基因。
其他信息
并发率和干涉
并发与干涉是影响作图的因素之一,如果在二条非姊妹染色单体上分别发生两次
单交换,单交换Ⅰ的概率为α,单交换Ⅱ的概率为β,如果这两次交换同时发生(即为
双交换),其概率理论上为(α)(β),假设实际测得双交换的概率为γ。
并发系数(coefficidence of coincidence or coincidence)C为观察到的双交换数除以预期双交换这一比值。
按上列数据
C=γ∕(α)(β)
这个结果远小于1,也就是说实际发生的双交换比预期发生的概率要小得多,这是由于一次重组事件的发生,干扰了另一次重组事件的发生,这一现象称为染色体的干涉(chromasomal interference)或称为交叉干涉(chiasma interference)。以I来表示。干涉和并发系数的关系以下式表示 I=1-C
当 C=1,I=0时, 表示无干涉存在
C=0,I=1时, 表示存在完全干涉
1>C>0时 表示存在
正干涉(positive interference),即是一次交换抑制了邻近位点另一次交换的发生。这可能是由于染色单体的断裂和重接物理性地干涉了邻近位点的交换。
C>1,I<0时,表示存在
负干涉(negative interference),负干涉仅在
微生物中发生基因转变时才出现。