“DNA元件百科全书”计划(encyclopedia of dna elements,encode)是继“
人类基因组计划”后最大的国际合作计划之一,于2003年9月由美国国立人类基因组研究所启动,其目的是寻求新一代
DNA研究技术对人类基因调控序列在全
基因组的水平上研究的应用。这个计划包括全世界11个国家80家科研机构35个小组的研究人员,当前已经产生了许多令人惊讶的发现,为未来进一步认识整个人类基因组的功能蓝图开辟了道路,对与人类疾病相关的基因序列研究产生重大的影响。
计划内容
“DNA元件百科全书”计划主要目标是对
人类基因组功能元件进行鉴定和分析,主要包括以下几个部分:
②(小规模)试点研究;
ENCODE团队试点计划目前已经基本完成 ,主要包括以下三方面的内容:
①对编码的功能DNA 进行鉴定和分类;对已存在的几种方法进行了测试和比较,严格分析了人类基因组序列中已被定义的序列。
③对大量鉴定基因特征的方法、技术和手段进行检测和评估。
ENCODE计划的研究对象包括:编码蛋白基因、非编码蛋白基因、调控区域、
染色体结构维持和调节染色体复制动力的 DNA元件。到目前为止,ENCODE计划主要集中研究了44个
靶标,共3000万个DNA碱基对。
计划进展
ENCODE计划主要分为三个阶段进行 :
①利用目前的技术进行小规模实验 ( 试点研究阶段 ) ,研究的重点主要是关于
转录调节单元,转录调节序列 ,
酶切位置,
染色体修饰 ,复制起始
原点的确定等方面。
②技术开发阶段 ,这阶段主要关注没有被充分研究的功能基因。
③实际生产阶段 ,该阶段主要将前面两个阶段的研究成果应用到对整个基 因组的研究中 。
2007年6月,E NCODE团队相继在《自然》( Na t u r e)和《基因组研究》(Genome Research)上发表了29篇相关论文,报道了他们 4年来努力的成果,即通过建立一个目录,详尽地描述1%
人类基因组的全部
生理功能基础。该结果高度肯定了鉴定和归类
人类基因组 功能元件的工程的成功 ,并且由于几项新技术的兴起 ,大量关于功能元件的数据被获得,这标志着技术发展阶段也获得了成功。随着 ENCODE计划初始阶段的成功,NHGRI 在2 0 0 7年9月投入了新的资金使ENCODE工程
规模化,扩大到实际生产阶段对整个
基因组进行研究,并伴随有中试研究。生产阶段中还具备数据整合中心和数据分析中心,数据整合中心用于追踪、存储和公布数据,而数据分析中心用于对数据进行综合分析。ENCODE研究者们获取的全部数据都会尽快公布到公共
数据库中,项目数据整合中心的数据也是公开的。
目前 EN COD E计划的成果亮点包括 :确定了许多之前不为人知的DNA转录启动位点;推翻了传统观点的认识 ,调控区域也有可能位于DNA转录启动位点的下游;确定了
组蛋白( histones)变化的特定标记;加深了人们对组蛋白改变协调
DNA复制的理解。
计划意义
2003年
人类基因组计划的完成仅仅标志着人类向着利用
基因信息诊断、治疗和预防疾病的目标迈出了重要的第一步。这就好比我们只得到了人体的“ 使用手册”,但是如果要将这份手册用于疾病诊断和治疗,我们必须读懂这份手册。ENC0DE计划首次 系统地研究了所有类型的功能元件的位点和组织方式,对基 因组计划的实际应用具有划时代的意义,为未来进一步认识整个人类基因组的功能
蓝图开辟了道路。
首先 EN CODE计划推翻了传统的观点:即我们的基因蓝图 ( genetic blueprint)作为一群独立基因( independent genes) ,漂浮在“垃圾DNA”( junk DNA) 的大海上。事实上,人类基因蓝图的30亿个化学“字母”组成了一个极 为复杂的网络 ,在这个网 络中,
基因、调控基序( regulatory elements) 和其它
DNA序列以 一种人们尚未了解的重叠方式相互作用,共同着控制人类的生理活动。美国国家人类基因组研究所主任弗朗西斯 柯林斯(Fr anc iSCO11ins) 将这些结果称之为“ 这是人类生物学上的一个里程碑”。他表示:“这种令人印象深 刻的努力 ,已揭示出许 多激动人心的意外,并为未来探究整个人类基 因组功能 图景开辟 了道路 。 ”
其次“DNA元件百科全书”加深了对
哺乳动物基因组进化的认识。传统理论认为,与生理功能相关的重要D N A 序列往往位于基因组中的“进化限制”(evolutionary constraint)区域,它们在物种进化过程中更容易保存下来。但是,最新 的研究表明,大约一半人类基因组 中的功能元件在进化过程中,不会受到很大限制 。科学家认为 ,
哺乳动物缺乏 “ 进化限制”这一点很可能意味着,许多物种的
基因组都囊括了大量的包括RNA 转录副本在内的功能元件,在进化过程中,这些功能元件成了基因“ 仓库” 。
科学家预言,ENC0DE计划的研究将导致药物开发方面实质性的突破, 以使人类真正攻克
癌症等顽疾。
总之,ENC0DE计划产生了许多令人惊讶的发现,对于人类自身的生存和发展具有重大的意义,为未来进一步认识整个人类基因组的功能蓝图开辟了道路。ENCODE计划破解人类疾病和生老病死之谜、解决人类健康问题 ,对
生命科学的研究和生物产业的发展具有非常重要的意义,它为人类社会带来的巨大影响是不可估量的 。科学共 同体有必要重新考虑长期以来对于
基因和
基因组功能的认识,这将对与人类疾病相关的基因序列研究产生重大的影响。
研究成果
到目前为止,ENCODE计划主要集中研究了44个
靶标,共3000万个DNA
碱基对。负责该计划数据整合和分析工作的欧洲分子生物学实验室(European> Molecular> Biology>Laboratory)研究人员认为,“这些结论揭示了有关DNA功能元件构成的重要原理,为从DNA转录到
哺乳动物进化的一切过程提供了新的认识。”
研究发现,人类基因组中的大多数DNA都会转录成
RNA,这些副本会普遍交迭。因此,人类基因组实际上是一个非常复杂的网络,所谓的无用基因实际上非常少。基因只不过是众多具有特定功能的
DNA序列类型之一。科学家们在基因之外的调控区域新发现了4491个转录启动位点,这一数字超过了已知
基因的10倍。这些都挑战了长期以来的观点,即
基因组中的
基因是孤立的,同时,新的发现也支持了人类基因数量应该超过3万个的看法。
ENCODE 计划的另一个巨大成就就是对
哺乳动物基因组进化的认识。传统理论认为,与生理功能相关的重要
DNA序列往往位于
基因组中的“进化限制”(evolutionary>constraint)区域,它们在物种进化过程中更容易保存下来。但是,最新的研究表明,大约一半人类基因组中的功能元件在进化过程中,不会受到很大限制。科学家认为,
哺乳动物缺乏“进化限制”这一点很可能意味着,许多物种的
基因组都囊括了大量的包括RNA转录副本在内的功能元件,在进化过程中,这些功能元件成了基因“仓库”。
ENCODE计划的成果亮点还包括:确定了许多之前不为人知的DNA转录启动位点;推翻了传统观点的认识,调控区域也有可能位于DNA转录启动位点的下游;确定了
组蛋白(histones)变化的特定标记;加深了人们对组蛋白改变协调DNA复制的理解。