? ? ? ? 人类已知的蛋白质折叠有2亿种,人类生物学家花了几十年才解码19万种,要解码2亿种用人类的传统方法得几千年。AlphaFold用人工智能把剩下的2亿个全给解码了。重点是完全 open直接开源,困扰人类几十年的问题就这样轻松地解决了。
? ? ? ? 医学与生物学的发展如此之快,令科学家们兴奋不已,新药研发的速度将大幅度加快,人类的多种致命疾病将得到比较理想的解决,人类活到120岁将不再是奢望。
蛋白质折叠(Protein folding)
? ? ? ? 是蛋白质获得其功能性结构和构象的过程。通过这个物理过程,蛋白质从不规则卷曲折叠成特定的功能三维结构。当从mRNA序列翻译成线性肽链时,蛋白质以未折叠多肽或不规则卷曲的形式存在。结构决定功能。仅仅知道基因组序列不能使我们完全理解蛋白质的功能,更不用说它是如何工作的。蛋白质可以通过相互作用在细胞环境(特定pH、温度等)中自行组装。这种自组装过程称为蛋白质折叠。
? ? ? ? 蛋白质折叠问题被列为"21世纪的生物物理学"的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。从一级序列预测蛋白质分子的三级结构并进一步预测其功能,是极富挑战性的工作。研究蛋白质折叠,尤其是折叠早期过程,即新生肽段的折叠过程是全面的最终阐明中心法则的一个根本问题,在这一领域中,近年来的新发现对新生肽段能够自发进行折叠的传统概念做了根本的修正。这其中,X射线晶体衍射和各种波谱技术以及电子显微镜技术等发挥了极其重要的作用。第十三届国际生物物理大会上,Nobel奖获得者Ernst在报告中强调指出,NMR用于研究蛋白质的一个主要优点在于它能极为详细的研究蛋白质分子的动力学,即动态的结构或结构的运动与蛋白质分子功能的关系。目前的NMR技术已经能够在秒到皮秒的时间域上观察蛋白质结构的运动过程,其中包括主链和侧链的运动,以及在各种不同的温度和压力下蛋白质的折叠和去折叠过程。蛋白质大分子的结构分析也不仅仅只是解出某个具体的结构,而是更加关注结构的涨落和运动。例如,运输小分子的酶和蛋白质通常存在着两种构象,结合配体的和未结合配体的。一种构象内的结构涨落是构象转变所必需的前奏,因此需要把光谱学,波谱学和X 射线结构分析结合起来研究结构涨落的平衡,构象改变和改变过程中形成的多种中间态,又如,为了了解蛋白质是如何折叠的,就必须知道折叠时几个基本过程的时间尺度和机制,包括二级结构(螺旋和折叠)的形成,卷曲,长程相互作用以及未折叠肽段的全面崩溃。多种技术用于研究次过程,如快速核磁共振,快速光谱技术(荧光,远紫外和近紫外圆二色)。
研究概况
? ? ? ? 在生物体内,生物信息的流动可以分为两个部分:第一部分是存储于DNA序列中的遗传信息通过转录和翻译传入蛋白质的一级序列中,这是一维信息之间的传递,三联子密码介导了这一传递过程;第二部分是肽链经过疏水塌缩、空间盘曲、侧链聚集等折叠过程形成蛋白质的天然构象,同时获得生物活性,从而将生命信息表达出来;而蛋白质作为生命信息的表达载体,它折叠所形成的特定空间结构是其具有生物学功能的基础,也就是说,这个一维信息向三维信息的转化过程是表现生命活力所必需的。
? ? ? ? 自从20世纪60年代,Anfinsen基于还原变性的牛胰RNase在不需其他任何物质帮助下,仅通过去除变性剂和还原剂就使其恢复天然结构的实验结果,提出了"多肽链的氨基酸序列包含了形成其热力学上稳定的天然构象所必需的全部信息"的"自组装学说"以来,随着对蛋白质折叠研究的广泛开展,人们对蛋白质折叠理论有了进一步的补充和扩展。Anfinsen的"自组装热力学假说"得到了许多体外实验的证明,的确有许多蛋白在体外可进行可逆的变性和复性,尤其是一些小分子量的蛋白,但是并非所有的蛋白都如此。而且由于特殊的环境因素,体内蛋白质的折叠远非如此。
? ? ? ? 体内蛋白质的折叠往往需要有其他辅助因子的参与,并伴随有ATP的水解。因此,Ellis 于1987年提出了蛋白质折叠的"辅助性组装学说"。这表明蛋白质的折叠不仅仅是一个热力学的过程,显然也受到动力学的控制。有的学者基于有些相似氨基酸序列的蛋白质具有不同的折叠结构,而另外一些不同氨基酸序列的蛋白质在结构上却相似的现象,提出了mRNA二级结构可能作为一种遗传密码从而影响蛋白质结构的假说。但目前为止,该假说尚没有任何实验证据,只有一些纯数学论证[3]。那么,蛋白质的氨基酸序列究竟是如何确定其空间构象的呢?围绕这一问题科研人员已进行了大量出色的工作,但迄今为止我们对蛋白质的折叠机制的认识仍是不完整的,甚至有些方面还存在着错误的观点。
? ? ? ? 在这方面作出重要贡献的典型研究实例是美国C.B.安芬森小组关于牛胰核糖核酸酶的变性和复性的研究。牛胰核糖核酸酶含有124个氨基酸残基,由8个巯基配对组成4对二硫键??梢约扑愠雒阜肿又?个巯基组成4对二硫键的可能方式有105种,这就提供了一个定量估算复性重组的指标。在温和的碱性条件下,8摩尔的浓脲和大量巯基乙醇能使四对二硫键完全还原,整个分子变为无规则卷曲状,酶分子变性。透析去除脲,在氧的存在下,二硫键重新形成,酶分子完全复性,二硫键中成对的巯基都与天然一样,复性分子可以结晶且具有与天然酶晶体相同的X射线衍射花样,从而证实,酶分子在复性过程中,不仅能自发地重新折叠,而且只选择了105种二硫键可能配对方式中的一种。
理论模型
框架模型(Framework Model)
? ? ? ? 假设蛋白质的局部构象依赖于局部的氨基酸序列。在多肽链折叠过程的起始阶段,先迅速形成不稳定的二级结构单元; 称为"flickering cluster",随后这些二级结构靠近接触,从而形成稳定的二级结构框架;最后,二级结构框架相互拼接,肽链逐渐紧缩,形成了蛋白质的三级结构。这个模型认为即使是一个小分子的蛋白也可以一部分一部分的进行折叠,其间形成的亚结构域是折叠中间体的重要结构。
塌缩模型(Hydrophobic Collapse Model)
? ? ? ? 在疏水塌缩模型中,疏水作用力被认为是在蛋白质折叠过程中起决定性作用的力的因素。在形成任何二级结构和三级结构之前首先发生很快的非特异性的疏水塌缩。
粘合机制(Diffusion-Collision-Adhesion Model)
? ? ? ?该模型认为蛋白质的折叠起始于伸展肽链上的几个位点,在这些位点上生成不稳定的二级结构单元或者疏水簇,主要依靠局部序列的进程或中程(3-4个残基)相互作用来维系。它们以非特异性布朗运动的方式扩散、碰撞、相互黏附,导致大的结构生成并因此而增加了稳定性。进一步的碰撞形成具有疏水核心和二级结构的类熔球态中间体的球状结构。球形中间体调整为致密的、无活性的类似天然结构的高度有序熔球态结构。最后无活性的高度有序熔球态转变为完整的有活力的天然态。
生长模型(Nuclear-Condensation-Growth Model)
? ? ? ? 根据这种模型,肽链中的某一区域可以形成"折叠晶核",以它们为核心,整个肽链继续折叠进而获得天然构象。所谓"晶核"实际上是由一些特殊的氨基酸残基形成的类似于天然态相互作用的网络结构,这些残基间不是以非特异的疏水作用维系的,而是由特异的相互作用使这些残基形成了紧密堆积。晶核的形成是折叠起始阶段限速步骤。
拼版模型(Jig-Saw Puzzle Model)
? ? ? ? 此模型的中心思想就是多肽链可以沿多条不同的途径进行折叠,在沿每条途径折叠的过程中都是天然结构越来越多,最终都能形成天然构象,而且沿每条途径的折叠速度都较快,与单一途径折叠方式相比,多肽链速度较快,另一方面,外界生理生化环境的微小变化或突变等因素可能会给单一折叠途径造成较大的影响,而对具有多条途径的折叠方式而言,这些变化可能给某条折叠途径带来影响,但不会影响另外的折叠途径,因而不会从总体上干扰多肽链的折叠,除非这些因素造成的变化太大以致于从根本上影响多肽链的折叠。
格点模型
? ? ? ? 也简称HP模型,最早是由Dill等人1989年提出的。格点模型可分为二维模型和三维模型两类。二维格点模型就是在平面空间中产生正交的单位长度的网格,每个氨基酸分子按在序列中排序的先后顺序依次放置到这些网格交叉点上,在序列中相邻的氨基酸分子放置在格点中时也必须相邻,即相邻氨基酸分子在格点模型中的距离为1。但是需要注意的是,网格中的每个交叉点最多只能放置一个氨基酸分子,如果序列中的某个氨基酸分子已经放置在此位置上,则后序的氨基酸分子就不可以再放置在这个格点上。如果在放置氨基酸分子的过程中出现当前所要放置的氨基酸分子没有位置可以放置了,那就说明该构型是不合理的,需要重新放置。三维格点模型和二维格点模型相似,它是在三维空间中产生的单位长度的立体网格。格点中放置氨基酸分子的方法和二维的相同,但在二维格点模型中放置氨基酸分子时除了序列前两个氨基酸分子外最多只有三个方向可以选择,而在三维格点模型中复杂度提高了很多,放置氨基酸分子最多可以有五个方向可选。
mRNA的基本定义和功能
mRNA(信使核糖核酸)是一种天然存在的分子,带有人类细胞的“蓝图”,可以产生靶标蛋白或免疫原,激活体内免疫反应,以对抗各种病原体。mRNA疫苗利用的是病毒的基因序列而不是病毒本身,因此,mRNA疫苗具有不带有病毒成分,没有感染风险。同时,mRNA疫苗还具有研发周期短,能够快速开发新型候选疫苗应对病毒变异;体液免疫及T细胞免疫双重机制,免疫原性强,不需要佐剂以及易于批量生产,支持全球供应的关键优势。