HapMap是人类基因组中常见遗传多态位点的目录,它描述了这些变异的形式、在DNA上存在的位置、在同一群体内部和不同人群间的分布状况。HapMap计划并不是利用HapMap中的信息来建立特定的遗传变异与某一疾病之间的联系,而是为其他研究者提供相关信息使之能够将遗传多态位点和特定疾病风险联系起来,从而为预防、诊断和治疗疾病提供新的方法。
国际人类基因组单体型图计划(The International HapMap Project)是继国际
人类基因组计划(The Human Genome Project,HGP)之后人类基因组研究领域的又一个重大研究计划。HapMap计划是一个多国参与的合作项目,旨在确定和编目人类遗传的相似性和差异性。利用HapMap获得的信息,研究人员将能够发现与人类健康、疾病以及对药物和
环境因子的个体反应差异相关的基因。项目由来自日本、英国、加拿大、中国、
尼日利亚和美国的科学家和资助机构合作完成,所产生的全部数据将免费向公众开放。
HapMap计划起始于2002年,由美、加、中、日、英、
尼日利亚等国研究机构发起、参与及完成。中国科学家们由中科院北京基因组研究所牵头,承担3号、21号和8号染色体短臂
单体型图的构建,约占总计划的10%。项目共取样270个正常个体,其中欧洲30个三联家系,亚洲45个中国人,45个日本人,非洲30个三联家系。2005年10月26日,由国际协作组总负责人,现任美国NIH负责人Francis Collins向全世界宣布了一个拥有数亿数据的
人类基因组单体型图的成功构建,以及一个更精细的
遗传图谱即将完成。至此hapmap一期计划证实宣告完成。一期计划共成功分型100多万个
多态性位点,也称
单核苷酸多态性(
SNP)位点,全基因组平均3kb一个SNP位点。由于染色体
块状结构,也即
连锁不平衡的存在,一期数据可以捕获大部分
基因组上的遗传差异信息。HapMap计划的第一阶段任务完成后,国际协作组委托Perlegen Sciences 完成第二阶段扩大SNP分型密度的任务。2007年10月18日,国际协作组在Nature上发表了根据第二阶段数据构建的
人类基因组的第二代HapMap。至HapMap 二期共发现了超过一千万的人类基因组的
SNPs,完成了约310万SNPs(≥5%)在270个样品中的分型反应。这些SNPs约占预测的
遗传变异的25%~35%,并使第二代HapMap的分辨率达到平均不到1kb一个
SNP,比预定计划超过100%,准确度达到99.8%。二期数据密度约为一期数据的3倍,构建起一张精度更高信息更完整的多人种遗传
多态图谱。可以说正是这些遗传多态位点的存在,在遗传体质上,你我之间有了个体差异,不同人种之间有了种群差异。
HapMap计划建立了人类全基因组遗传多态图谱,依据这张图谱我们可以进一步研究
基因组的结构特点以及SNP位点在人群间的分布情况,为
群体遗传学的研究提供数据,为
遗传性疾病致病基因在基因组上的定位提供高密度的SNP位点。HapMap的构建分为三个步骤:(a)在多个个体的DNA样品中鉴定
单核苷酸多态性(
SNPs);(b)将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;(c)在
单体型中找出用于识别这些单体型的标签SNPs。通过对图中的三个标签SNPs进行
基因分型,可以确定每个个体拥有哪一个单体型。
结合群体遗传学的研究手段,我们可以更加深入地去观察和研究使我们之所以成为我们的
基因组。
重组率推算提供了我们一张
基因组进化痕迹图;
连锁不平衡的计算给了我们一张基因组块状连锁结构图;种群差异FST的计算让我们看到一张种群间基因组结构差异图;
SNP的杂合情况告诉我们
人类基因组上受到选择的区域或区域内的基因;利用SNP位点向两边延伸的长度差异情况,我们可以观察到一些基因组上近期正在进行的选择事件,甚至是当前正在悄悄进行中的进化,因为新产生的突变位点传代较少,它和周围位点的连锁情况受重组事件的影响较小,另一方面优势突变也会因
选择压力的存在使周围的重组受到影响…...当然这些不同的指标中也隐藏了人类成长过程中的一些信息,例如迁徙,战争,灾难,繁盛等各种对
基因组遗传多态性产生影响的历史事件。
高密度的
SNP位点,为全
基因组相关性分析(GWA)提供了可能,以往遗传学上定位基因的使用较多的工具是
微卫星,这一套新产生的SNP位点弥补了微卫星在基因组上分布不够均匀,以及密度不够高的缺点,SNP联合微卫星将使
目的基因的精细定位更加可行。目前已经有很多致病基因借助SNP数据得到定位。另外,根据SNP在基因的不同功能元件中的分布情况和基因在细胞中的表达情况,我们可以研究基因上的不同元件序列是如何控制蛋白表达进而影响个体
表型的。
伴随着HapMap二期数据的产出和各种实验技术的进一步发展以及更加大量的基因组序列数据加入到人类的知识库中,我们将能更加完整更加深入和更加正确地认识我们自己,认识自然界的奥秘,揭示生命的本质。