表达序列标签从互补DNA(cDNA)分子所测得部分序列的短段DNA(通常300~500bp)。从
cDNA文库所得到的许多表达序列标签集合组成表达序列标签数据库,代表在一定的发育时期或特定的环境条件下,特定的
组织细胞基因表达的序列。可用于验证基因在特定组织中的表达,推导全长cDNA序列,或作为标签标志基因组中的特殊位点以确定基因的位置等。
EST是从一个随机选择的cDNA克隆进行5’端和3’端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为360±120bp 。EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此EST也能说明该组织中各
基因的表达水平。
首先从样品组织中提取mRNA,在逆转录酶的作用下用oligo(dT)作为引物进行RT-PCR合成
cDNA,再选择合适的载体构建cDNA 文库,对各菌株加以整理,将每一个菌株的
插入片段根据载体
多克隆位点设计引物进行两端一次性自动化测序,这就是EST序列的产生过程。
EST作为表达基因所在区域的分子标签因编码DNA序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如
AFLP、
RAPD、SSR 等)相比更可能穿越家系与种的限制,因此EST标记在亲缘关系较远的物种间比较
基因组连锁图和比较
质量性状信息是特别有用。同样,对于一个DNA序列缺乏的目标物种,来源于其他物种的EST也能用于该物种有益基因的
遗传作图,加速物种间相关信息的迅速转化。
⑼ 促进
基因芯片的发展等方面。正是因为EST 表现出了这些巨大潜能,使其得到了充分的利用与发展。
在
人类基因组研究中,有一个区别于“全基因组战略”的“
cDNA战略”,既只测定
转录的
DNA序列,也就是测定
基因转录产物mRNA
反转录产生的互补DNA——cDNA。cDNA代表了基因中编码蛋白质的序列。EST则是cDNA的一个片段,一般长200-400个
核苷酸对。一个全长的cDNA分子可以有许多个EST,但特定的EST有时可以代表某个特定的cDNA分子。两端有重叠的
共有序列的EST可以组装成一个
叠连群(
contig),直到装配成全长的
cDNA序列,这样就等于是克隆了一个基因的
编码序列。将EST定位在
基因组,也可作为
基因组作图时的一种标记序列。