网站地图 加入收藏 中文 English
 
首页 中心概况 组织机构 研究队伍 科学研究 人才培养 交流合作 支撑服务 人才招聘 下载专区 联系我们
当前位置:首页 - 科学研究 - 科研进展
科研进展

 JCIM | 宋晨课题组开发适用于水溶剂和磷脂膜环境的蛋白质残基可及性预测器

 


溶剂可及性(Solvent Accessibility)是一个表征和预测可溶蛋白外表面氨基酸残基分布的化学特征量,广泛应用于蛋白质结构预测及药物筛选设计等领域。然而,这一特征量在描述膜蛋白的外表面残基时存在局限性:膜蛋白跨膜区域的外表面残基大都暴露于疏水的磷脂膜环境中,并不与水溶剂接触。由于膜蛋白是重要的功能蛋白和药物靶标,因此表征和预测氨基酸残基的磷脂可及性具有重要意义,可完善膜蛋白外表面残基的描述。

2023年1月24日,生命科学联合中心、北京大学前沿交叉学科研究院定量生物学中心宋晨研究组在化学信息学和人工智能研究领域的国际权威学术期刊"Journal of Chemical Information and Modeling"上发表了题为“ProtRAP: Predicting Lipid Accessibility Together with Solvent Accessibility of Proteins in One Run”的研究论文。该研究基于分子动力学模拟数据重新定义了“溶剂可及性”和“磷脂可及性”,并发展了一个基于注意力机制的深度学习模型 ProtRAP (Protein Relative Accessibility Predictor),可同时对处于水溶剂和磷脂膜环境的蛋白质残基可及性进行全面而准确的预测。
 

该研究从膜蛋白分子动力学模拟数据库MemProtMD [1-2]中收集了已知结构膜蛋白的每个氨基酸残基的膜接触概率 MCP [3],并根据蛋白结构计算了各残基的相对可及面积 RASA。结合 MCP 和 RASA,作者定义了相对磷脂可及性RLA、相对溶剂可及性 RSA 和相对包埋面积 RBSA,并用于预测器 ProtRAP 的训练、验证与测试(图1)。在测试结果中,RLA、RSA 和 RBSA 的预测值与真实值之间的皮尔森相关系数分别达到0.80、0.76和0.74。RSA 和 RBSA 的预测准确度与领域内的其他领先方法相当 [4-5],而RLA预测作为 ProtRAP 独有的功能也达到了较高的精度。因此,以蛋白质序列为唯一输入,ProtRAP 能够准确预测给定序列中各氨基酸残基在水溶剂和磷脂膜环境中的可及性信息,从而可以更完整和定量地描述膜蛋白各残基的化学暴露或包埋情况。
 
 

 

 

 

 

图1:ProtRAP 的训练与预测流程。(A)数据集的生成。(B)输入的预处理。(C)ProtRAP的深度学习架构。

 
为了更具体地研究 ProtRAP 的预测效果,作者以几个典型的可溶蛋白、α-螺旋跨膜蛋白和β-桶状跨膜蛋白为例对预测结果进行了细致分析(图2)。从样例研究结果中可以看出,ProtRAP 在对可溶蛋白的预测中没有 RLA 假阳性的问题,并且 RSA 准确标注了可溶蛋白的外表面残基(图2A)。更为重要的是,ProtRAP 可以有效识别α-螺旋跨膜蛋白和β-桶状跨膜蛋白,并能正确预测其外表面的跨膜条带区的残基。因而,结合 RLA 和 RSA 预测,ProtRAP 可以完整地描述膜蛋白的外表面残基(图2B-2C)。此外, ProtRAP 对于跨膜蛋白二聚体界面上的磷脂可及的疏水残基(图2B黄色圈出)以及包埋在蛋白内部的疏水残基(图2C下),也都做出了令人满意的预测,表明该预测器可从蛋白质序列的疏水残基中有效甄别出磷脂可及残基。

 

 


 

 

 

 

 

 

 

 

 

 

图2:ProtRAP在代表性可溶蛋白、α-螺旋跨膜蛋白和β-桶状跨膜蛋白的预测结果。第一列为蛋白质的3D卡通结构,第二和三列分别用可及性的预测值和真实值对残基表面进行了染色。
 
 

综上,该研究为“磷脂可及性”这一特征量提出了一个新的定量方法,使之与“溶剂可及性”具有相同量纲,并发展了一个高准确度的预测器 ProtRAP,可预测给定蛋白质序列中各残基的相对磷脂可及性和相对溶剂可及性,进而可以推测出残基的化学环境和位置:磷脂可及、溶剂可及或埋藏在蛋白质内部。为了更广泛地服务于相关膜蛋白研究,研究组搭建了ProtRAP云计算服务器(http://www.songlab.cn/ProtRAP/home/)。这将有助于研究人员从蛋白质序列出发对蛋白整体的折叠情况、生理环境以及跨膜区域等信息有更全面的了解,预期可在膜蛋白的结构和功能预测研究中发挥重要作用。

 

 

 

 


 

 

 

 

北京大学前沿交叉学科研究院PTN项目博士生康凯与定量生物学中心博士后王磊为该论文的共同第一作者。北大-清华生命科学联合中心、北京大学前沿交叉学科研究院定量生物学中心宋晨研究员为文章的通讯作者。该项工作得到了科技部重点研发计划和生命科学联合中心等方面的经费资助和支持。

 
版权所有 生命科学联合中心 京ICP备15006448号-5