近日,武汉物数所唐淳研究员带领的生物大分子动态学研究团队和北京生命科学研究所董梦秋研究组合作,在《The Journal of Biological Chemistry》发表题为“Modeling protein excited-state structures from "over-length" chemical cross-links”的研究论文,成功探索了利用化学交联质谱(chemical cross-linking of proteins coupled with mass spectrometry, or CXMS)和结构计算来研究蛋白质动态的新途径,并发布了通用流程。
到目前为止,结构生物学研究主要关注蛋白质的基态结构,但是蛋白质行使功能往往需要在基态和激发态之间转变构象。解析蛋白质的激发态构象和结构动态(protein dynamics)对于X射线晶体学和电镜等传统的结构生物学方法是一大难题。核磁共振(NMR)虽然适合研究蛋白质在溶液中的多种构象,但是仅限于50 kDa以下的蛋白,而且需要大量的、同位素标记的、高度纯化的蛋白。
对于CXMS实验而言,蛋白样品中两个氨基酸之间发生交联反应,必须满足交联剂的化学特异性要求(如氨基特异性)以及空间距离小于或等于交联剂臂长的要求。因此,由CXMS获得的交联位点对提供了可用于结构计算的距离约束信息。作为结构生物学的新工具,特别是单分子电镜技术的辅助工具,CXMS在很多大型蛋白质复合体的结果解析中做出了贡献。但该技术最令人困扰的问题是:即便用最严苛的筛选标准,总有小部分交联位点对在晶体结构(一般是基态构象)中的距离大于交联剂臂长("over-length" chemical cross-links)。对于此类数据,大部分实验室选择丢弃或者放松距离约束(如果结构未知)。
本文两个实验室一年前合作发现分子间的高可信度过长交联反映了蛋白-蛋白间的弱或瞬时相互作用(Gong Z, Biophysics Reports 2016)。本文重点研究分子内不同结构域之间的相对运动。实验结果表明,分子内的高可信度过长交联来源于蛋白质的激发态构象;它们不是制造麻烦的问题数据,而是“众里寻他千百度”的反映蛋白质结构动态的珍贵信息。作者通过交联数据和结构计算发现,结合了钙离子但没有结合配体肽段或蛋白的钙调蛋白(Ca2+-CaM)除了采取哑铃状的开放态构象(基态),还有一种闭合态构象,非常接近之前用NMR手段观察到的激发态构象。这种闭合态构象与结合了各种配体的Ca2+-CaM晶体结构或NMR结构也非常相似,说明配体肽段或蛋白的结合稳定了原已存在的Ca2+-CaM的闭合态构象。本文还用同样方法研究了细菌磷酸转移系统中的蛋白EIN和谷氨酰胺结合蛋白QBP,发现它们均含有基态构象之外的一种激发态构象。已发表的NMR研究表明,Ca2+-CaM的激发态构象在溶液中所占的比例小于5% ;EIN和QBP的激发态构象很可能由于丰度过低未能被NMR检测到。这说明CXMS-DynaXL方法可以灵敏地检测到溶液中的低丰度构象,灵敏度达到甚至超过NMR,且不受蛋白大小限制,可以广泛应用于蛋白质动态变化研究。
本文建立了一套基于交联数据的结构模拟计算方法,内容包括:用15N同位素标记的蛋白与天然同位素标记的蛋白等量混合后进行交联质谱分析,从中得到高可信度的分子内交联数据,然后用专门开发的DynaXL软件进行构象模拟计算。DynaXL包含结构域识别、模拟交联反应、分子动力学模拟等多个模块,并采用友好的可视化用户界面。它首先尝试用基态构象模拟交联反应,如果不能满足全部交联约束,则添加一个构象,直到所有交联约束都得以满足。同类其它算法只考虑单一构象,试图让单个构象满足所有交联数据;当蛋白质在溶液中存在多种构象时,容易造成过拟合,得到错误结构。(DynaXL下载链接:http://tanglab.org/resources)。
在本文接收发表的同时,由研究团队提交的封面设计也从众多候选稿件中脱颖而出,被《The Journal of Biological Chemistry》杂志社选中作为期刊封面,并于1月27日刊印出版。出版日期恰逢中国农历除夕,这也是一份最好的新年礼物。
武汉物数所龚洲副研究员和董梦秋实验室的博士后丁曰和为本文共同第一作者。武汉物数所助理研究员刘侃负责了DynaXL软件的设计工作。这项研究得到了科技部、国家自然科学基金委、美国霍华德休斯医学研究所(HHMI)基金和北京市政府资助。
附:论文链接