基因表达谱(gene expression profile):指构建处于某一特定状态下的细胞或组织的非偏性
cDNA文库,通过大规模的
cDNA测序,收集cDNA序列片段、定性、定量分析其
mRNA群体组成,从而描绘该特定细胞或组织在特定状态下的
基因表达种类和
丰度信息,这样编制成的
数据表就称为基因表达谱。
在
基因芯片的实验中,首先选取来自不同状态的样本,如正常组织与
肿瘤组织、不同
发育阶段组织,或用药前后的细胞或组织等。其中一种被称为实验样本,另一种就是相应地被称为参考样本。实验样本和参考样本
mRNA在
逆转录过程中,分别用不同的红、绿荧光基团标记,并将它们混合,与
微阵列上的探针序列进行杂交,经过适当的洗脱步骤后,用
激光扫描仪对芯片进行扫描,获得对应于每种荧光的
荧光强度图像,通过专用的
图像分析软件,可获得微阵列上每个点的红、绿荧光强度(Cy5和Cy3),其比值(Cy5/Cy3)称为该基因在实验样本中的表达水平。
Step1:基因芯片的制备。在
硅胶、玻璃片、
聚丙烯或
尼龙膜等载体上按特定的排列方式固定大量的探针,形成
DNA芯片。芯片种类较多,制备方法也不尽相同,基本上可以分为两大类:
原位合成和直接
点样法。
Step2:荧光
标记探针的制备。将待分析的
基因探针在芯片杂交之前进行纯化、
逆转录或扩增级
荧光标记。最普遍的荧光标记法是用Cye3-dUTP(绿色荧光)标记对照样本,Cye5-dUTP(红色荧光)标记实验室样本。
Step3:标记探针与芯片杂交。选择杂交条件,将制备的
荧光探针与芯片进行杂交,一定时间以后,洗去未结合探针,然后进行荧光信号的扫描与分析。
Step4:杂交芯片的扫描。杂交后的芯片用特定波长的激光进行激发,此时芯片上的探针会发出不同波长的荧光。用
共聚焦激光扫描仪检测探针的
荧光强度,可以得到Cy5和Cy3的两幅单色图像。分别对这两幅图像进行
伪色彩处理,然后叠加称为一幅图像,这就是实验所得到的原始数据——杂交图像。图像中
样点的荧光强度值间接给出了
基因芯片中对应探针的
相对丰度值。如果来自测试样本的表达
丰度高,那么样点呈红色;如果来自参考细胞样本的表达丰度高,那么样点呈绿色;如果两者丰度相当,样点就呈黄色;如果二者没有进行杂交反应,则样点保持背景黑色不变。通过这种方法,取自两个不同样本的基因相对表达
水平差异就可以表现出来。
肿瘤在组织
形态学上被划分为多种不同的类型和亚型,而肿瘤亚型的准确诊断对肿瘤的临床治疗具有重要意义,然而肿瘤的分型在临床上一直处于难以处理的状态,许多形态学上相似的肿瘤,如
白血病的许多亚型等都会有相似的临床症状,但却需要不同的治疗方法,从
分子生物学的角度上看 ,肿瘤是由于某些染色体上
DNA损伤致使细胞内基因异常表达,导致
细胞生长失控、缺乏分化和
异常增生的一类复杂基因疾病。正因为肿瘤发展机制的复杂性,100多年来的研究仍未揭开其中的奥秘。研究肿瘤
基因表达谱、选取信息基因是从
信息学角度出发以寻找肿瘤相关基因、发现肿瘤基因表达特征的直接手段。肿瘤基因表达谱数据显著特点是样本的位数高而样本很小、噪声冗余大而信息基因少。每个样本都记录了
组织细胞中所有可测基因的表达水平,但实际上只有少数基因才真正同样本类别相关,它包含了样本分类的信息。信息基因选取问题是肿瘤基因表达谱分析的核心内容。它既是建立有效分类模型的关键,也是发现肿瘤分类与分型的基因
标记物以及药物治疗潜在靶点的重要手段,人们对该问题已进行了一定程度的探索。然而,如何在基因表达谱的成千上万个基因中有效选出样本的分类特征,一直是肿瘤基因表达谱分析中的难点所在,这个问题仍有待深入研究。
当前的肿瘤分类技术高度依赖
病理学工作者对肿瘤组织的
主观判断,而基于
微阵列技术,即使一些组织没有显著变化,利用基因表达谱也能够对之做出早期诊断;基于基因表达谱的肿瘤分型和分类研究为理解肿瘤的发生的机制,以及肿瘤的临床治疗提供了重要依据;研究人员可以根据基因表达谱的变化来区分形态学上相似的肿瘤,而肿瘤类型的精确诊断将有助于制定配套的最佳治疗方案。