转录组学是指一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。转录组学是从RNA水平研究
基因表达的情况。转录组即一个活细胞所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。所谓基因表达,是指基因携带的遗传信息转变为可辨别的表型的整个过程。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。通常,同一种组织表达几乎相同的一套基因以区别于其他组织,如脑组织或心肌组织等分别只表达全部基因中不同的30%而显示出组织的特异性。
以DNA为
模板合成RNA的
转录过程是
基因表达的第一步,也是
基因表达调控的关键环节。所谓基因表达,是指基因携带的
遗传信息转变为可辨别的
表型的整个过程。与
基因组不同的是,
转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。通过
测序技术揭示造成差异的情况,已是最常用的手段。
人类基因组包含有30亿个
碱基对,其中大约只有5万个
基因转录成
mRNA分子,转录后的mRNA能被翻译生成蛋白质的也只占整个转录组的40%左右。通常,同一种组织表达几乎相同的一套
基因以区别于其他组织,如:脑组织或
心肌组织等分别只表达全部基因中不同的30%而显示出组织的特异性。
转录组谱可以提供什么条件下什么
基因表达的信息,并据此推断相应未知基因的功能,揭示特定
调节基因的作用机制。通过这种基于
基因表达谱的分子标签,不仅可以辨别细胞的
表型归属,还可以用于疾病的诊断。例如:
阿尔茨海默病(Alzheimer′s diseases, AD)中,出现
神经原纤维缠结的大脑神经细胞基因表达谱就有别于正常
神经元,当
病理形态学尚未出现纤维缠结时,这种表达谱的差异即可以作为分子标志直接对该病进行诊断。同样对那些临床表现不明显或者缺乏诊断金标准的疾病也具有诊断意义,如自闭症。对自闭症的诊断要靠长达十多个小时的临床评估才能做出判断。基础研究证实自闭症不是由单一基因引起,而很可能是由一组不稳定的基因造成的一种
多基因病变,通过比对正常人群和患者的
转录组差异,筛选出与疾病相关的具有诊断意义的
特异性表达差异,一旦这种特异的差异表达谱被建立,就可以用于自闭症的诊断,以便能更早地,甚至可以在出现自闭症临床表现之前就对疾病进行诊断,并及早开始干预治疗。转录组的研究应用于临床的的另一个例子是可以将表面上看似相同的病症分为多个亚型,尤其是对
原发性恶性肿瘤,通过转录组差异表达谱的建立,可以详细描绘出患者的生存期以及对药物的反应等等。
用于转录组数据获得和分析的方法主要有基于
杂交技术的
芯片技术包括
cDNA芯片和
寡聚核苷酸芯片,基于序列分析的
基因表达系列分析SAGE (serial analysis of gene expression,SAGE)和大规模平行信号
测序系统MPSS(massively parallel signature sequencing,MPSS)。
1991年Affymetrix公司在Southern blot 基础上,开发出世界上第一块
寡核苷酸基因芯片,自此
微阵列技术(基因芯片)得到迅速发展和广泛应用,已成为功能基因组研究中最主要的技术手段。但是芯片无法同时大量地分析组织或细胞内
基因组表达的状况,而且由于
芯片技术需要准备
基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的
调节基因。SAGE是近年来发展的以
测序为基础的分析特定组织或细胞类型中
基因群体表达状态的一项技术。其显著特点是快速高效地、接近完整地获得基因组的表达信息。SAGE可以定量分析已知基因及未知
基因表达情况,在疾病组织、癌细胞等
差异表达谱的研究中,SAGE可以帮助获得完整转录组学图谱、发现新的基因及其功能、作用机制和通路等信息。MPSS是对SAGE的改进,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。因其需要配套的软硬件较为昂贵,国内外的相关应用报道不多。MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在
基因组功能方面及其相关领域研究中发挥巨大的作用。