蛋白质折叠(Protein folding)是蛋白质获得其功能性结构和构象的过程。通过这一
物理过程,蛋白质从
无规则卷曲折叠成特定的功能性
三维结构。在从
mRNA序列翻译成线性的
肽链时,蛋白质都是以去折叠多肽或无规则卷曲的形式存在。
前言
结构决定功能,仅仅知道基因组序列并不能使我们充分了解蛋白质的功能,更无法知道它是如何工作的。蛋白质可凭借相互作用在细胞环境(特定的
酸碱度、温度等)下自己组装自己,这种自我组装的过程被称为蛋白质折叠。
蛋白质折叠问题被列为“21世纪的
生物物理学”的重要课题,它是
分子生物学中心法则尚未解决的一个重大生物学问题。从一级序列预测蛋白质分子的
三级结构并进一步预测其功能,是极富挑战性的工作。研究蛋白质折叠,尤其是折叠早期过程,即新生肽段的折叠过程是全面的最终阐明中心法则的一个根本问题,在这一领域中,近年来的新发现对新生肽段能够自发进行折叠的传统概念做了根本的修正。这其中,
X射线晶体衍射和各种
波谱技术以及
电子显微镜技术等发挥了极其重要的作用。第十三届
国际生物物理大会上,Nobel奖获得者Ernst在报告中强调指出,
NMR用于研究蛋白质的一个主要优点在于它能极为详细的研究蛋白质分子的动力学,即动态的结构或结构的运动与蛋白质分子功能的关系。目前的NMR技术已经能够在秒到
皮秒的时间域上观察
蛋白质结构的运动过程,其中包括主链和
侧链的运动,以及在各种不同的温度和压力下蛋白质的折叠和去折叠过程。蛋白质
大分子的
结构分析也不仅仅只是解出某个具体的结构,而是更加关注结构的涨落和运动。例如,运输小分子的酶和蛋白质通常存在着两种构象,结合
配体的和未结合配体的。一种构象内的结构涨落是构象转变所必需的前奏,因此需要把
光谱学,
波谱学和X 射线结构分析结合起来研究结构涨落的平衡,构象改变和改变过程中形成的多种
中间态,又如,为了了解蛋白质是如何折叠的,就必须知道折叠时几个基本过程的
时间尺度和机制,包括
二级结构(螺旋和折叠)的形成,卷曲,长程相互作用以及未折叠肽段的全面崩溃。多种技术用于研究次过程,如快速
核磁共振,快速光谱技术(荧光,远紫外和
近紫外圆二色)。
研究概况
在生物体内,
生物信息的流动可以分为两个部分:第一部分是存储于
DNA序列中的
遗传信息通过转录和翻译传入蛋白质的一级序列中,这是一维信息之间的传递,三联子密码介导了这一
传递过程;第二部分是
肽链经过疏水塌缩、空间盘曲、
侧链聚集等折叠过程形成蛋白质的天然构象,同时获得
生物活性,从而将生命信息表达出来;而蛋白质作为生命信息的
表达载体,它折叠所形成的特定
空间结构是其具有生物学功能的基础,也就是说,这个一维信息向三维信息的转化过程是表现生命活力所必需的。
自从20世纪60年代,Anfinsen基于还原变性的牛胰
RNase在不需其他任何
物质帮助下,仅通过去除
变性剂和
还原剂就使其恢复天然结构的实验结果,提出了“多
肽链的
氨基酸序列包含了形成其
热力学上稳定的天然构象所必需的全部信息”的“
自组装学说”以来,随着对蛋白质折叠研究的广泛开展,人们对蛋白质折叠理论有了进一步的补充和扩展。Anfinsen的“自组装热力学假说”得到了许多
体外实验的证明,的确有许多蛋白在体外可进行可逆的变性和
复性,尤其是一些小分子量的蛋白,但是并非所有的蛋白都如此。而且由于特殊的
环境因素,体内蛋白质的折叠远非如此。
体内蛋白质的折叠往往需要有其他
辅助因子的参与,并伴随有
ATP的水解。因此,Ellis 于1987年提出了蛋白质折叠的“辅助性组装学说”。这表明蛋白质的折叠不仅仅是一个
热力学的过程,显然也受到动力学的控制。有的学者基于有些相似
氨基酸序列的蛋白质具有不同的
折叠结构,而另外一些不同氨基酸序列的蛋白质在结构上却相似的现象,提出了
mRNA二级结构可能作为一种
遗传密码从而影响
蛋白质结构的假说。但目前为止,该假说尚没有任何实验证据,只有一些纯数学论证[3]。那么,蛋白质的氨基酸序列究竟是如何确定其空间构象的呢?围绕这一问题
科研人员已进行了大量出色的工作,但迄今为止我们对蛋白质的折叠机制的认识仍是不完整的,甚至有些方面还存在着错误的观点。
在这方面作出重要贡献的典型研究实例是美国C.B.
安芬森小组关于
牛胰核糖核酸酶的变性和
复性的研究。牛胰核糖核酸酶含有124个
氨基酸残基,由8个
巯基配对组成4对
二硫键。可以计算出酶分子中8个巯基组成4对二硫键的可能方式有105种,这就提供了一个定量估算复性重组的指标。在温和的碱性条件下,8
摩尔的浓脲和大量
巯基乙醇能使四对二硫键完全还原,整个分子变为
无规则卷曲状,酶分子变性。透析去除脲,在氧的存在下,二硫键重新形成,酶分子完全
复性,二硫键中成对的巯基都与天然一样,复性分子可以结晶且具有与天然酶
晶体相同的X射线衍射花样,从而证实,酶分子在复性过程中,不仅能自发地重新折叠,而且只选择了105种二硫键可能配对方式中的一种。
2023年,日本科学家发现了一系列前所未知的蛋白质折叠。
理论模型
框架模型
(Framework Model)
框架模型[4] 假设蛋白质的局部构象依赖于局部的
氨基酸序列。在
多肽链折叠过程的起始阶段,先迅速形成不稳定的
二级结构单元; 称为“flickering cluster”,随后这些二级结构靠近接触,从而形成稳定的二级结构框架;最后,二级结构框架相互拼接,
肽链逐渐紧缩,形成了蛋白质的三级结构。这个模型认为即使是一个
小分子的蛋白也可以一部分一部分的进行折叠,其间形成的亚结构域是折叠中间体的重要结构。
塌缩模型
(Hydrophobic Collapse Model)
在疏水塌缩模型[5]中,疏水
作用力被认为是在蛋白质折叠过程中起决定性作用的力的因素。在形成任何
二级结构和
三级结构之前首先发生很快的非特异性的疏水塌缩。
粘合机制
(Diffusion-Collision-Adhesion Model)
该模型认为蛋白质的折叠起始于伸展
肽链上的几个位点,在这些位点上生成不稳定的
二级结构单元或者疏水簇,主要依靠局部序列的进程或
中程(3-4个
残基)相互作用来维系。它们以非特异性
布朗运动的方式扩散、碰撞、相互黏附,导致大的结构生成并因此而增加了稳定性。进一步的碰撞形成具有疏水核心和二级结构的类
熔球态中间体的球状结构。球形中间体调整为致密的、无活性的类似天然结构的高度有序熔球态结构。最后无活性的高度有序熔球态转变为完整的有活力的天然态。
生长模型
(Nuclear-Condensation-Growth Model)
根据这种模型,
肽链中的某一区域可以形成“折叠
晶核”,以它们为核心,整个肽链继续折叠进而获得天然构象。所谓“晶核”实际上是由一些特殊的
氨基酸残基形成的类似于天然态相互作用的
网络结构,这些残基间不是以非特异的
疏水作用维系的,而是由特异的相互作用使这些残基形成了紧密堆积。晶核的形成是折叠起始阶段
限速步骤。
拼版模型
(Jig-Saw Puzzle Model)
此模型[9]的中心思想就是
多肽链可以沿多条不同的途径进行折叠,在沿每条途径折叠的过程中都是天然结构越来越多,最终都能形成天然构象,而且沿每条途径的折叠速度都较快,与单一途径折叠方式相比,多
肽链速度较快,另一方面,外界生理生化环境的微小变化或突变等因素可能会给单一折叠途径造成较大的影响,而对具有多条途径的折叠方式而言,这些变化可能给某条折叠途径带来影响,但不会影响另外的折叠途径,因而不会从总体上干扰多肽链的折叠,除非这些因素造成的变化太大以致于从根本上影响多肽链的折叠。
格点模型
格点模型(也简称HP模型),最早是由Dill等人1989年提出的。格点模型可分为
二维模型和
三维模型两类。二维格点模型就是在平面空间中产生正交的
单位长度的网格,每个
氨基酸分子按在序列中排序的先后顺序依次放置到这些网格交叉点上,在序列中相邻的氨基酸分子放置在格点中时也必须相邻,即相邻氨基酸分子在格点模型中的距离为1。但是需要注意的是,网格中的每个交叉点最多只能放置一个氨基酸分子,如果序列中的某个氨基酸分子已经放置在此位置上,则
后序的氨基酸分子就不可以再放置在这个格点上。如果在放置氨基酸分子的过程中出现当前所要放置的氨基酸分子没有位置可以放置了,那就说明该构型是不合理的,需要重新放置。三维格点模型和二维格点模型相似,它是在
三维空间中产生的单位长度的立体网格。格点中放置
氨基酸分子的方法和二维的相同,但在二维格点模型中放置氨基酸分子时除了序列前两个氨基酸分子外最多只有三个方向可以选择,而在三维格点模型中复杂度提高了很多,放置氨基酸分子最多可以有五个方向可选。
分子伴侣
1978 年,Laskey 在进行
组蛋白和
DNA 在体外生理
离子强度实验时发现,必须要有一种
细胞核内的酸性蛋白———核质素(nucleoplasmin) 存在时,二者才能组装成
核小体,否则就发生沉淀。据此Laskey 称它为“
分子伴侣”。分子伴侣是指能够结合和稳定另外一种蛋白质的不稳定构象,并能通过有控制的结合和释放,促进新生
多肽链的折叠、
多聚体的装配或降解及
细胞器蛋白的跨膜运输的一类蛋白质 [10,11]。分子伴侣是从功能上定义的,凡具有这种功能的蛋白质都是分子伴侣,它们的结构可以完全不同。这一概念目前已延伸到许多蛋白质,现已鉴定出来的分子伴侣主要属于三类高度保守的
蛋白质家族[12]:stress 90 family、stress 70 family、stress 60 family。其中stress 60 family存在于
真核生物的
线粒体(在
哺乳动物中称为Hsp58)、
叶绿体(称为cpn60)中,在
原核生物的
细胞质中,它被称为GroEL。
意义
蛋白质折叠机制的阐明将揭示生命体内的第二套
遗传密码,这是它的理论意义。蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定
三维空间结构形成的规律、稳定性和与其
生物活性的关系。在概念上有
热力学的问题和动力学的问题;蛋白质在体外折叠和在细胞内折叠的问题;有理论研究和
实验研究的问题。这里最根本的
科学问题就是
多肽链的一级结构到底如何决定它的空间结构?既然前者决定后者,一级结构和空间结构之间肯定存在某种确定的关系,这是否也像
核苷酸通过“
三联密码”决定
氨基酸顺序那样有一套密码呢?有人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。
如果说“三联密码”已被破译而实际上已成为明码,那么破译“第二
遗传密码”正是“
蛋白质结构预测”从理论上最直接地去解决蛋白质的折叠问题,这是蛋白质研究最后几个尚未揭示的奥秘之一。“
蛋白质结构预测”属于理论方面的
热力学问题。就是根据测得的蛋白质的一级序列预测由Anfinsen原理决定的特定的空间结构。蛋白质氨基酸序列,特别是编码蛋白质的
核苷酸序列的测定现在几乎已经成为常规技术,从互补DNA(
cDNA)序列可以根据“
三联密码”推定氨基酸序列,这些在上一世纪获得重大突破的
分子生物学技术,大大加速了
蛋白质一级结构的测定。目前
蛋白质数据库中已经存有大约17万个蛋白的一级结构,但是测定了空间结构的蛋白大约只有1.2万个,这中间有许多是很相似的
同源蛋白,而真正不同的蛋白只有1000多个。随着
人类基因组计划的胜利完成,解读了人类DNA的全序列,蛋白质一级结构的数据增长必定会出现爆炸的态势,而空间结构测定的速度远远滞后,因此二者之间还会形成更大的距离,这就更需要进行
蛋白质结构的预测。
前景
同时,它还存在重要的潜在应用前景,例如以下几个方面:
包涵体复性
▲利用
DNA重组技术可以将
外源基因导入宿主细胞。但重组基因的表达产物往往形成无活性的、不溶解的
包涵体。折叠机制的阐明对包涵体的复性会有重要帮助。
蛋白质
▲
DNA重组和
多肽合成技术的发展使我们能够按照自己的意愿设计较长的
多肽链。但由于我们无法了解这一多肽将折叠为何种构象,从而无法按照自己意愿设计我们需要的、具有特定功能的蛋白质。
致病机理
▲许多疾病,如
阿兹海默症(Alzheimer's),
疯牛病(Mad Cow,
BSE),可传播性
海绵状脑病(CJD),肌
萎缩性脊髓侧索硬化症(
ALS),还有帕金森氏症(Parkinson's)等正是由于一些细胞内的重要蛋白发生突变,导致蛋白质
聚沉或错误折叠而造成的。因此,深入了解蛋白质折叠与错误折叠的关系对于这些疾病的致病机制的阐明以及治疗方法的寻找将大有帮助。
揭示功能
▲基因组序列的发展使我们得到了大量的蛋白质序列,结构信息的获得对于揭示它们的生物学功能是十分重要的。依靠现有手段(X-ray晶体衍射、
NMR及电镜)测定蛋白质的结构需要较长的时间,因此结构解析的步伐已落后于发现新蛋白的步伐。而结构预测的方法虽然速度较快,但可靠性并不高,只有当我们对于维持
蛋白质结构,驱动蛋白质折叠的理化因素更为了解,这一方法才可能有根本的改进。另外,我们对于蛋白质相互作用、
配体与蛋白质的作用
等结构与
功能关系的研究也有赖于蛋白质折叠机制的阐明。
折叠病
蛋白质分子的
氨基酸序列不发生改变,只是其结构或者说构象有所改变也能引起疾病,称为“
构象病”,或称“折叠病”。
疯牛病由
Prion蛋白质的感染引起,这种蛋白质也可以感染人而引起
神经系统疾病。在正常机体中,Prion是正常神经活动所需要的蛋白质,而致病Prion与正常Prion的
一级结构完全相同,只是空间结构不同。
由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有
老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些
肿瘤、
白内障等等。
由于
分子伴侣在蛋白质折叠中至关重要的作用,分子伴侣本身的突变显然会引起蛋白质折叠异常而引起折叠病。随着蛋白质折叠研究的深入,科学家会发现更多疾病的真正病因和更针对性的治疗方法,设计更有效的药物。