科研动态

《Advanced Science》|机器学习助力GPCR结构组学破译受体G蛋白选择性机制

来源 :基础医学系    发布时间 :2024-04-25    浏览次数 :1762

G蛋白偶联受体(G protein-coupled receptor, GPCR)是人类最大的一类膜受体超家族,人体内目前已发现超过800种GPCR,分布于各种细胞组织,参与几乎所有生命过程。GPCR能够响应细胞外界的各种刺激,其信号分子与GPCR胞外部分的配体结合口袋结合,引起受体胞内侧构象变化,暴露受体与胞内效应蛋白的相互作用位点,放大信号形成级联反应,从而实现细胞信号转导。GPCR激活G蛋白是其发挥功能的主要方式,根据Gα亚基的不同,G蛋白主要分为Gi/o、Gs、Gq和G12/13等四类。值得一提的是近86%的GPCR主要通过调控腺苷环化酶的Gs/Gi/o发挥作用。然而受体选择性识别下游G蛋白的机制极其复杂,一直是GPCR领域内悬而未决的难题。

2024年4月23日,浙江大学/浙江中医药大学陈忠课题组,浙江大学基础医学院张岩/沈庆亚课题组、浙江大学基础医学院胡薇薇课题组、浙江大学计算机学院章敏课题组和山东大学/北京大学孙金鹏课题组合作在《Advanced Science》杂志上发表了题为“Molecular Determinant Underlying Selective Coupling of Primary G-protein by Class A GPCRs”的研究论文,该研究以高分辨率组胺受体H2R-Gs和H3R-Gi信号转导复合物结构为启发,基于机器学习研究分析GPCR-G蛋白复合物结构组学,揭示了包含组胺受体在内的A类GPCR的TM5/TM6胞内结构特征决定其下游主要G蛋白信号的选择性,进一步加深了对GPCR下游信号选择性的理解。

image.png

组胺(histamine)是一种重要的神经递质和神经调质,主要由组胺能神经元合成并释放。组胺能神经元起源于下丘脑结节乳头核(tuberomammillary nucleus,TMN),广泛地投射至全脑,对多种脑功能发挥调节作用,如睡眠觉醒、学习记忆、摄食行为等。组胺存在四种受体,有意思的是其不同受体分别主要偶联不同的下游G蛋白信号,具有显著的选择性。为了研究不同组胺受体选择性结合不同G蛋白的分子机制,张岩课题组与长期研究组胺受体的陈忠/胡薇薇课题组以及孙金鹏课题组分别解析了高分辨的H2R-Gs和H3R-Gi信号转导复合物结构。H2R-Gs/H3R-Gi复合物不仅揭示了H1R/H2R配体选择性的分子机制和H3R与单胺类受体均不一致的、特殊的配体结合口袋,其偶联下游Gs或Gi蛋白时TM5/TM6展现了截然不同的结构特征,为后续破译受体G蛋白选择性提供了重要线索。

image.png


图1 研究示意图

许多GPCR能同时激活数条下游信号通路,其中主要偶联的G蛋白信号通路因其卓越的结合效率和快速响应的动力学过程脱颖而出,成为其主要的信号转导途径。但由于GPCR与不同的G蛋白偶联通常采用几乎相同的构象,且其与G蛋白互作界面上缺乏保守的基序,因此探究GPCR主要偶联G蛋白选择性的机制一直存在争议。受组胺受体结构的启发,研究者将已报道高分辨率结构的13种主要偶联Gs蛋白的GPCR和30种主要偶联Gi/o蛋白的GPCR的TM5/TM6的结构几何学特征提炼出来,包括TM5的长度、TM5胞内端向TM6卷曲的角度、TM6的长度和TM6激活后外扩的角度等,发现TM5的长度、TM5卷曲的角度和激活后TM6外扩的角度与主要偶联Gs和Gi/o的选择性相关,而TM6的长度与该选择性缺乏显著相关性。

为了对上述结论进行更为系统深入的验证,张岩课题组引入了课题组内部尚未发表的结构,并结合GPCRdb中有关GPCR-G蛋白复合物预测结构以丰富GPCR结构组学,进而评估G蛋白选择性与受体TM5/TM6结构特征的关系。然而,面对多维度及数量庞大的GPCR结构组学,传统的结构分析及数据统计手段难以满足研究需求,遭遇了巨大挑战。为此张岩课题组与浙江大学计算机学院章敏课题组携手合作,利用集成学习、主成分分析、降维投影等机器学习方法,对受体TM5/TM6的结构几何学特征进行了提取和统计分析。通过对这些特征的深入剖析,他们成功地对主要偶联Gs和Gi/o的受体进行了精确分类,并实现了高达91%的预测准确率,充分证明上述三种特征在G蛋白选择性中的核心作用,为相关领域的研究提供了新的思路和方法。根据机器学习产生的决策森林模型和降维后的决策边界,研究者发现主要偶联Gs蛋白的受体在TM5长度、TM5卷曲角度以及TM6外扩角度相对于主要偶联Gi/o蛋白的受体具有显著优势。

浙江大学/浙江中医药大学陈忠教授,浙江大学基础医学院张岩教授,山东大学/北京大学孙金鹏教授,浙江大学基础医学院胡薇薇教授和浙江大学计算机学院章敏研究员为该论文共同通讯作者。浙江大学基础医学院/良渚实验室副研究员沈庆亚、浙江大学博士生唐新颜、山东大学博士生文鑫、浙江大学博士生程诗卓为本文共同第一作者。程诗卓为浙江大学“医学+计算机”学科交叉培养项目博士生,完成了本研究涉及的机器学习相关工作。本研究得到科技部重点研发计划、国家自然科学基金、国家杰出青年科学基金以及浙江省“尖兵”“领雁”研发攻关计划项等资助。