遗传密码是一组规则,将
DNA或
RNA序列以三个
核苷酸为一组的
密码子转译为
蛋白质的
氨基酸序列,以用于
蛋白质合成。
简介
遗传密码是
活细胞用于将DNA或mRNA序列中编码的
遗传物质信息翻译为
蛋白质的一整套规则。mRNA的翻译是通过
核糖体完成的,核糖体利用
转运RNA(tRNA)分子一次读取mRNA的三个核苷酸,并将其编码的氨基酸按照
信使RNA(mRNA)指定的顺序连接完成蛋白质
多肽链的合成。由于
脱氧核糖核酸(
DNA)
双链中一般只有一条单链(称为模版链)被转录为
信使核糖核酸(
mRNA),而另一条单链(称为
编码链)则不被转录,所以即使对于以双链 DNA作为遗传物质的生物来讲,密码也用
核糖核酸(
RNA)中的
核苷酸顺序而不用DNA中的
脱氧核苷酸顺序表示。
遗传密码决定蛋白质中
氨基酸顺序的
核苷酸顺序 ,由3个连续的核苷酸组成的
密码子所构成 。遗传密码在所有生物体中高度相似,几乎所有的生物都使用同样的遗传密码,可以在一个包含64个条目的密码子表中表达。即使是非
细胞结构的
病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。
虽然“遗传密码”决定了蛋白质的氨基酸序列,但DNA的其他
基因组区域决定了根据各种“
基因调控密码”生产这些蛋白质的时间和地点。
遗传密码由两套相对独立的系统——RNA和DNA构成,是为了实现对细胞内成百上千同时发生的
生化反应进行有序的信息管控,因为在生命构建与运行过程之中,mRNA的使命完成之后,马上就被销毁掉,而DNA所记录的
遗传信息则是要永久保存的,是种族延续的根本。遗传密码是与
原始生命的生化系统
协同演化而来的,遗传密码的诞生是生命诞生的重要标志。
基本特点
方向性
密码子是对
mRNA分子的
碱基序列而言的,它的阅读方向是与
mRNA的合成方向或mRNA编码方向一致的,即从5'端至3'端。
连续性
mRNA的读码方向从5'端至3'端方向,两个
密码子之间无任何
核苷酸隔开。mRNA链上
碱基的插入、缺失和重叠,均会造成
框移突变。
简并性
指一个
氨基酸具有一种以上的
密码子。密码子的第三位
碱基改变往往不影响对其三联码编码氨基酸的翻译。
摆动性
mRNA上的
密码子与
转运RNA(tRNA)J上的
反密码子配对辨认时,大多数情况遵守
碱基互补配对原则,但也可出现不严格配对,尤其是密码子的第三位碱基与反密码子的第一位
碱基配对时常出现不严格碱基互补,这种现象称为
摆动配对。
通用性
蛋白质生物合成的整套密码,从
原核生物到人类都通用。但已发现少数例外,如
动物细胞的
线粒体、
植物细胞的
叶绿体。
破解过程
历史
遗传密码的发现是20世纪50年代的一项奇妙想象和严密论证的伟大结晶。mRNA由四种含有不同
碱基腺嘌呤(简称A)、
尿嘧啶(简称U)、
胞嘧啶(简称C)、
鸟嘌呤(简称G)的
核苷酸组成。最初科学家猜想,一个碱基决定一种
氨基酸,那就只能决定四种氨基酸,显然不够决定生物体内的
二十种氨基酸。那么二个碱基结合在一起,决定一个氨基酸,就可决定十六种氨基酸,显然还是不够。如果三个碱基组合在一起决定一个氨基酸,则有六十四种组合方式(4 *4*4=64)。前
苏联科学家乔治伽莫夫(George Gamow)最早指出需要以三个核酸一组才能为20个
氨基酸编码。克里克的实验首次证明密码子由三个DNA
碱基组成。1961年,美国国家卫生院的海因里希 马太(Heinrich Matthaei)与马歇尔 沃伦尼伦伯格(Marshall Warren Nirenberg)在
无细胞系统(Cell-free system)环境下,把一条只由
尿嘧啶(U)组成的RNA转释成一条只有
苯丙氨酸(Phe)的多肽,由此破解了首个
密码子(UUU -> Phe)。随后科拉纳(Har Gobind Khorana)破解了其它密码子,接着
霍利(Robett W.Holley)发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了
诺贝尔生理学或医学奖。
阅读方式
破译遗传密码,必须了解阅读密码的方式。遗传密码的阅读,可能有两种方式:一种是重叠阅读,一种是非重叠阅读。例如mRNA上的
碱基排列是AUGCUACCG。若非重叠阅读为AUG、CUA、CCG、;若重叠阅读为AUG、UGC、GCU、CUA、UAC、ACC、CCG。两种不同的阅读方式,会产生不同的
氨基酸排列。
克里克等用T
噬菌体为
实验材料时发现,在
编码区增加或删除一个碱基,便无法产生正常功能的蛋白质;增加或删除两个碱基,也无法产生正常功能的蛋白质。但是当增加或删除三个碱基时,却合成了具有正常功能的蛋白质。他们的实验证明了遗传密码中三个碱基编码一个
氨基酸,阅读密码的方式是从一个固定的起点开始,以非重叠的方式进行,编码之间没有
分隔符。
破译方法
尼伦伯格等发现由三个
核苷酸构成的微mRNA能促进相应的
氨基酸-tRNA和核糖体结合。但微mRNA不能
合成多肽,因此不一定可靠。
科兰纳(Khorana,Har Gobind)用已知组成的两个、三个或四个一组的核苷酸顺序人工合成mRNA,在细胞外的转译系统中加入
放射性标记的氨基酸,然后分析合成的多肽中氨基酸的组成。
通过比较,找出实验中三联码相同的部分,再找出多肽中相同的
氨基酸,于是可确定该三联码就为该氨基酸的遗传密码。
科兰纳用此方法破译了全部遗传密码,从而和尼伦伯格分别获得1968年
诺贝尔奖金。
后来,尼伦伯格等用多种不同的人工mRNA进行实验,观察所得多
肽链上的氨基酸的类别,再用
统计方法推算出人工mRNA中
三联体密码出现的频率,分析与合成蛋白中各种氨基酸的频率之间的
相关性,以此方法也能找出20种氨基酸的全部遗传密码。最后,科学家们还用了由3个
核苷酸组成的各种多核苷链来检查相应的氨基酸,进一步证实了全部
密码子。
密码子表
注:(起始)标准起始编码,同时为
甲硫氨酸编码。
mRNA中第一个AUG就是蛋白质翻译的起始部位。
逆密码
其他信息
阅读框
阅读框由翻译
起始位点的初始核苷酸三联码决定,它为一系列连续的非重叠密码子设置
阅读框架,称为“
开放阅读框”(ORF)。例如,一段序列GGGA
AACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的
氨基酸序列(在上例中,相应为
Gly-
Lys-Pro,Gly-Asp,和Glu-
Thr)。而因为
DNA的双螺旋结构,每段DNA实际上有六个阅读框。实际的框架是由
起始密码子确定,通常是mRNA序列上第一个出现的AUG。破坏阅读框架的变异(例如,插入或删除1个或2个
核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。在
真核生物中,外显子中的ORF经常被内含子打断。
起始终止密码子
蛋白质的翻译从初始化
密码子(
起始密码子)开始。单独的起始密码子不足以启动翻译过程,需要适当的初始化序列和起始因子才能使mRNA和核糖体结合,如
大肠杆菌中的Shine-Dalgarno序列和
起始因子。最常见的起始密码子是AUG,其同时编码的
氨基酸在细菌为
甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。其他备选起始密码子还包括“GUG”或“UUG”,分别编码
缬氨酸或
亮氨酸,但作为起始密码子,它们被翻译为甲硫氨酸或甲酰甲硫氨酸。
终止密码子也称为“终止”或“无意义”密码子。在经典遗传学中,
终止密码子各有名称:
UAG为琥珀(amber),UGA为
蛋白石(opal),UAA为
赭石(
ochre)。这些名称是由最初发现这些终止密码子的发明者命名的。因为没有同源tRNA具有这些终止密码子互补的反密码子,使得
释放因子有机会与核糖体结合,促进新合成的多肽从核糖体分离从而结束
翻译程序。另外,在
哺乳动物的
线粒体中,AGA和AGG也充当终止密码子。
简并性
遗传密码的
简并性指的是遗传密码的冗余性。这个词由Bernfield和Nirenberg给出。遗传密码具有冗余但没有歧义。
大部分
密码子具有
简并性,即两个或者多个密码子编码同一
氨基酸。简并的密码子通常只有第三位
碱基不同,例如,GAA和GAG都编码
谷氨酰胺。如果不管密码子的第三位为哪种
核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为
嘌呤(A/G)或者
嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是
起始密码子;另一个是
色氨酸,由UGG编码。
遗传密码的简并性可使基因更加耐受点突变。例如,四重
简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。
非标准遗传密码
虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的
线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。
支原体会把UGA转译为色氨酸。
纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些
绿藻也有同样现象),或把UGA转译为
半胱氨酸。一些酵母会把GUG转译为
丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的
起始密码子。
真菌、
原生生物和人以及其它动物的粒线体中的遗传密码与标准遗传密码的差异,主要变化如下:
按信使RNA的序列,在一些蛋白质里终止密码子会被翻译成非标准的
氨基酸,例如UGA翻译为
硒半胱氨酸,UAG翻译为
吡咯赖氨酸。硒半胱氨酸和吡咯赖氨酸被认为是第21和第22个氨基酸。
随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。
使用偏好性
密码子的频率,也称为密码子使用偏差性,可以因物种而异,对控制翻译具有功能意义。