国际千人基因组计划
中英美德等国科学家共同承担的研究任务
国际千人基因组计划,由中英美德等国科学家共同承担研究任务,旨在绘制迄今为止最详尽的、最有医学应用价值的人类基因组遗传多态性图谱。2012年11月大型国际科研合作项目“千人基因组计划”的研究人员在新一期英国期刊《自然》上发布了1092人的基因数据,这一成果将有助于更广泛地分析与疾病有关的基因变异。
研究介绍
国际千人基因组计划依托中国深圳华大基因研究院、英国桑格研究所、美国国立人类基因组研究所。
“国际千人基因组计划”自2008年1月22日启动,测序的总任务为1200个人(故称为千人基因组计划),旨在绘制迄今为止最详尽、最有医学应用价值的人类基因组遗传多态性图谱。深圳华大基因研究院作为发起单位之一,不仅承担了400个黄种人全基因组样本的测序和分析工作,而且还帮助完成了非洲人群的全部测序和分析任务。该计划的中方协调人、深圳华大基因研究院副院长王俊说:“我们将开放全部数据供科研机构使用,以更好地理解人类生老病死的秘密。我们正全力以赴与国际同仁紧密合作,解读导致癌症和糖尿病等疾病的基因密码。千人基因组计划为未来个体化医学时代的到来奠定了坚实的科学基础。”
测序人群
“千人基因组计划”将测序的人群包括:尼日利亚伊巴丹区域的约鲁巴人;居住于东京的日本人;居住于北京的中国人;美国犹他州的北欧和西欧人后裔;肯尼亚Webuye的Luhya人和Kinyawa的Maasai人;意大利的Toscani居民;居住于休斯顿的Gujarati印第安人;居住于丹佛的中国人;居住于洛杉矶的墨西哥人后裔;居住于美国西南部的非洲人后裔。
发起机构
这一国际合作计划的主要发起者和承担者包括英国的Sanger研究所,中国的深圳华大基因研究院(BGI Shenzhen),以及美国的国立卫生研究院(NIH)下属的美国人类基因组研究所(NHGRI)。
公布数据
2012年11月,大型国际科研合作项目“千人基因组计划”的研究人员在新一期英国期刊《自然》上发布了1092人的基因数据,这一成果将有助于更广泛地分析与疾病有关的基因变异。
由中美英等多国科研机构联合发起的“千人基因组计划”最终目标是获得世界各地不同人群中2500人的基因数据。本次逾千名基因提供者来自欧洲、美洲、亚洲、非洲的14个国家和地区。
这是科学界首次实现千人规模以上的基因组对比分析,这一规模可以帮助发现一些罕见的基因变异,比如携带者占总人口比例不到1%的基因变异。这些罕见基因变异或许与疾病有关,例如可能增加心脏病或癌症的患病风险,对基因变异进行研究有助于开发预防、治疗相关疾病的方法。
这份研究报告的主要作者、英国牛津大学教授吉尔·麦克韦恩说,根据已获得的基因数据,每个看起来很健康的人其实都携有数百个罕见的基因变异,其中有些基因变异已证实与某些疾病风险有关。这些基因变异究竟在什么情况下才会实际增加患病风险,是今后深入研究的目标。
由于这1092名基因提供者的分布地域较广,此次发布的数据也为今后的基因研究提供了一份可供参考的“基因地图”。如果要对一个人的基因组进行分析,就可以不再泛泛地找一些人的基因组用于对比,而是直接调阅他们长期生活区域的人群基因组数据,开展更有针对性的比较。
上述成果见证了基因组研究的快速发展,过去鼎鼎大名的“人类基因组计划”耗费10多年才在2003年绘出一个人的完整基因组图谱,而“千人基因组计划”自2008年启动以来,短短4年间就已获得超过1000人的基因组数据。
主要内容
2010年6月21日,由中国深圳华大基因研究院、英国桑格研究所和美国国立人类基因组研究所等共同发起并主导的“国际千人基因组计划”协作组对外宣布:该计划第一阶段的3个先导项目已圆满完成,全部数据已存储于该计划所设立的公共数据库,公众可免费获取和浏览第一阶段产生的全部数据。
据专家介绍,任何两个人在基因水平上99%是一样的,小部分的基因组序列因人而异。了解这些差异是非常重要的,它能帮助了解人与人之间对疾病的易感性、对药物和环境因素的反应性的不同。然而,现有的图谱还不够详细。新图谱能让研究者更快地锁定与疾病相关的基因变异点,从而能够使用遗传信息更快地开发常见疾病的诊断、治疗和预防的新策略。“千人基因组计划”将采用几种新的高通量测序平台。若使用标准的DNA测序技术,同样的工作可能需要花费5亿美元以上。然而,由于该计划的创造性的努力,建立了更高效更低价的新测序技术,“千人基因组计划”的发起者希望这一计划的成本最终将降低至3000万到5000万美元。
该数据库最终将包含来自全球27个族群的2500个人的全部基因组信息,产生的数据量已达到50TB(5万GB),包含8万亿个DNA碱基对。这一数据资源是一个开放的公共资源,为各种疾病的关联分析提供详细的基础数据;为解释人类重大疾病发病机理、开展个性化预测、预防和治疗打下基础。此外,该项目还加深了人们对人类群体遗传学的理解,促进人类进化史的研究。
已完成的3个先导项目是为了验证多种测序方法对于东亚、欧洲和非洲人群中遗传多态性频率不低于1%的鉴别能力,这将大大高于之前完成的国际单倍体型计划(HapMap计划)5%~10%的遗传多态性的检出能力。
先导项目
内容
第一个先导项目运用多种下一代高通量测序技术平台,完成了两个核心家庭共6人的高覆盖度全基因组测序,每个基因组的测序深度在20~60倍。通过此项目,可以评价多种主要测序方法的优缺点,为“国际千人基因组计划”的后续项目扫清技术障碍。第二个先导项目完成了179人的低覆盖度全基因组测序,平均测序深度在3倍。数据表明,大样本低覆盖度测序在降低成本的同时,仍然能有效识别人群中的基因多样性。
第三个先导项目通过对700人的1000个基因外显子的测序,获得了占人类基因组全部序列2%的蛋白质编码基因名录。前所未有的大样本量有助于研究人群罕见变异的表达图谱。
意义
第一阶段3个先导项目的完成具有重大应用价值。科学家可在下列方面大有可为:在更大的人群范围内定位人群突变基因;检测导致人类遗传疾病的相关基因;鉴定特定遗传病人群中含有的罕见致病基因。
美方协调人展望了此计划的美好前景:“先导项目完成的意义重大,为下一阶段更大样本量的研究打下了坚实的技术基础。我们的最终目标是完成2500个人的全基因组数据,我非常希望如此海量的数据能更精确地定位已发现的遗传风险因子、挖掘出更多未知的致病遗传因子,为人类健康造福。”
专家评价
“千人基因组计划”,是举世闻名的人类基因组计划的延续和发展,是基因组科学研究向临床医学迈进的重要转折点。“千人基因组计划”产生的数据和研究成果将迅速通过公共数据库发布,供全球科学家免费共享。
主要意义
1、自“人类基因组计划”完成以来,因为难以同时对许多人进行基因测序,基因研究一直只在较小的层面上进行。本次研究不仅使大规模测序成为可能,还绘制了一个详尽的基因图谱以供比对,这标志着人类基因研究进入了一个划时代的新阶段。2、面对人类生长和发育、遗传疾病和健康、进化和医疗等一系列问题,一份详尽的人类基因组图谱是必不可少的。
3、弗朗西斯高度赞扬了中国科学家的成就,中国人占世界人口的五分之一,深圳华大基因研究院的研究对理解中国人的基因组具有非凡的意义,她预计到2011年,华大基因将能完成10000至20000个人类基因组测序。
4、参与此项计划的中国深圳华大基因研究院负责人、中科院院士杨焕明表示,有人喝口水都要长肉是缘于基因的不同变异,我们参与的“千人基因组计划”,就是为了搞清楚你我他为什么不一样。 杨焕明说研究院做了600个人的测序和分析,在“千人基因组计划”中的贡献超过30%。
5、深圳华大基因研究院副院长王俊博士表示,“千人基因组计划”中的黄种人基因组研究,将使中国基因组科学和相关医学研究直接跨入与国际前沿完全接轨的世界先进行列,极大地促进中国药物基因组学研究的发展。
基因研究大事
1859年至1959年
1859年达尔文出版《物种起源》,提出了自然选择原则。但他无法解释生物为什么能将性状遗传给下一代。1865年 奥地利修道士孟德尔在观察过2.1万株豌豆后发现了遗传法则。
1869年 瑞士生物学家弗雷德里希·米歇尔分离出核酸。
1879年 德国胚胎学家瓦尔特·弗莱明发现染色体,并描述了细胞分裂过程中染色体的行为。
1900年 孟德尔的成果被重新发现。
1903年 美国生物学家瓦尔特·萨顿发现染色体是成对的,并携带遗传信息。
1905年 英国医生加洛德提出了人类先天代谢疾病的概念,这是人类自身遗传研究的开始。
1911年 美国遗传学家摩尔根提出基因学说,阐释基因在染色体上的分布,以及繁殖过程中染色体重组形成独特新个体的过程。
1913年 美国遗传学家斯特提万特绘制出第一张线式基因图谱。
1928年 英国生物学家弗雷德里克·格里菲斯发现了一种可以在细菌之间转移的遗传分子。
1929年 俄裔美国生物化学家列文提出DNA的化学成分和基本结构。
1944年美国细菌学家奥斯瓦德·西奥多·艾弗里、科林·麦克劳德和麦克林·麦卡第共同撰文指出,1928年格里菲斯发现的遗传分子就是DNA。
1948年 美国量子化学家鲍林提出蛋白质为螺旋形的理论。
1950年 奥地利生物化学家查加夫发现核酸中四种碱基的含量比例是一定的。
1951年 英国女生物物理学家罗莎琳德·富兰克林拍摄到了核酸的X射线衍射照片。
1952年 美国遗传学家阿尔弗雷德·赫尔希和玛莎·蔡斯通过病毒证实,传递遗传信息的是DNA而不是蛋白质。
1953年美国科学家詹姆斯·沃森和弗朗西斯·克里克在《自然》杂志上发表DNA双螺旋结构的论文。
1956年美籍华裔科学家蒋有兴和瑞典细胞遗传学家阿尔伯特·列文确定人类共有23对染色体。美国生物化学家阿瑟·科恩伯格分离出DNA聚合酶
1957年 美国科学家弗朗西斯·克里克发表《论蛋白质合成》的演讲,提出DNA制造蛋白质的概念。
1959年 法国遗传学家杰罗姆·勒琼发现唐氏综合征是由于人体的第21对染色体变异造成的。
1960年至2006年
1960年 美国“分子细胞学之父”西德尼·布伦、 美国科学家弗朗西斯·克里克等人发现信使RNA(mRNA)。1966年 美国生物化学家与遗传学家马歇尔·尼伦伯格与罗伯特·霍利及哈尔·葛宾·科拉纳阐明遗传。
1969年 哈佛大学遗传学家乔纳森·贝克韦斯分离出一个细菌基因。
1972年 美国生物化学家保罗·伯格创造出第一个重组DNA分子。
1975年 美国进化生物学家玛丽-克莱尔·金和艾伦·C·威尔逊发现,人类和猩猩的基因相似度达到99%。
1977年 美国科学家沃尔特·吉尔伯特、弗雷德里克·桑格和艾伦·M·马克希姆开发出DNA测序技术
数据免费对外开放
2012年3月29日,美国国立卫生研究院宣布,他们的。这些数据总量达到200TB,是世界上最大的人类基因变异数据集。亚马逊旗下的云计算公司——“亚马逊网络服务”将存储这个庞大的数据库。所有数据免费对外开放意味着更多科学家可以利用这些数据进行研究,以更快的速度得出基因型与癌症、糖尿病等疾病间关系的发现。
由于类似千人基因组计划这样的数据集规模庞大,很少有研究人员具备处理能力,因此也就无法使用。根据国立卫生研究院的计算,千人基因组计划的数据如果打印出来,可放满1600万个档案柜;如果使用标准DVD存储,需要3万多张DVD。对于科学家和他们所在的研究机构来说,千人基因组计划数据进行云存储无疑是一个好消息,对于亚马逊网络服务公司来说,存储千人基因组计划的数据可能也是一个好消息。美国《纽约时报》报道称,处理如此海量数据需要极大的运算能力,亚马逊网络服务公司可以要求获得额外的资源,用于进一步处理或者分析这些数据。
研究成果
千人基因组计划共同主席、英国桑格研究所基因专家、《自然》封面文章主要作者之一理查德·德宾说这一计划已经取得了两个重要成果,第一是获得了迄今最详尽的人类基因多态性图谱,第二是探索出了研究基因多态性的新技术手段。
在第一个成果方面,研究人员找出了1000多万个大大小小的基因变种,其中约800万个都是前所未知的。对于人群携带率在1%以上的基因变种,本次研究的覆盖率达到95%以上,得出了迄今最详尽的基因多态性图谱。这一成果在医学等领域有很高的应用价值,比如通过参照图谱,可以方便地找出致病的基因变种。
在第二个成果方面,研究人员验证了在大型基因研究中综合使用多种基因测序手段的可行性。由于基因测序成本仍很高昂,如果能在“精测”一些基因序列的同时,对另一些基因序列只需“粗测”就能保证最终结果的准确性,将可以大幅降低基因测序研究的成本。
最新修订时间:2023-05-23 14:57
目录
概述
研究介绍
参考资料