网站地图 加入收藏 中文 English
 
首页 中心概况 组织机构 研究队伍 科学研究 人才培养 交流合作 支撑服务 人才招聘 下载专区 联系我们
当前位置:首页 - 科学研究 - 科研进展
科研进展

Methods in Enzymology|王初课题组发展高速识别硒同位素印记的算法

近日,北京大学化学与分子工程学院、生命科学联合中心王初课题组在Methods in Enzymology杂志上发表了题为“An accelerated and optimized algorithm of selenium-encoded isotopicsignature targeted profiling for global selenoproteome analysis”的论文。在这项工作中,作者在本课题组此前开发的特异性识别质谱数据中含硒肽段印记的算法SESTAR基础上,发展了具有极高计算速度、更低假阳性率的新一代算法SESTAR++,并提供了在windows操作系统上易于使用的图形用户界面。SESTAR++可在https://github.com/wangchulab/SESTARpp免费下载。

硒在生物体中发挥着重要的作用,硒缺乏可能会导致克山病、大骨节病等症状。硒在生物体中的主要存在形式为硒代半胱氨酸,硒代半胱氨酸也被称为“第21种氨基酸”,其活泼的化学性质赋予了硒蛋白在氧化还原方面更高的活性,在清除氧化压力、维持氧化还原稳态发挥了重要的作用。但因硒蛋白的丰度极低,在蛋白质组中对其直接的检测较为困难。硒具有与构成蛋白质的C、H、O、N、S元素明显不同的天然同位素组成,因此当硒进入肽段后,会明显改变肽段的同位素分布。此前王初课题组发展了名为SESTAR的算法,利用含硒肽段特异的同位素分布,可特异性地识别蛋白质组数据中的含硒肽段,提升对含硒肽段的检测效果。SESTAR不仅可提高内源硒肽段的检测效果,也可提高外源含硒标签标记肽段的检测效果。


本文作者使用了C++重写SESTAR,并优化了部分算法,将计算速度提高了超过100倍,新算法命名为SESTAR++。在此前的使用过程中发现SESTAR对于高分子量肽段的识别假阳性率过高,原因可能在于随分子量的提高,含硒肽段与不含硒肽段的同位素分布差异变小。在SESTAR++中对算法进行了优化,降低了总体识别假阳性率,尤其是高分子量肽段的假阳性率,同时保证了对实际蛋白质组样品中硒蛋白的识别与原版SESTAR无异。SESTAR++也提供了windows操作系统下简单易用的图形用户界面,并且集成了方便后续质谱检测设置参数的inclusionlist生成功能,以及方便筛选靶标的肽段匹配功能。

 

利用SESTAR++进行含硒肽段靶向鉴定需要两轮质谱检测。首先需要进行常规DDA鉴定,主要得到一级谱信息供SESTAR++识别潜在含硒肽段。在使用SESTAR++时仅需简单设置的参数,对于单次DDA数据的计算仅需约5 min。在第二轮鉴定中则使用inclusion list、PRM等靶向采集模式对SESTAR++识别到的可能含硒肽段进行靶向鉴定。在开启inclusion list生成功能后,SESTAR++计算得到的结果经过极简单的excel处理即可在此步中导入质谱进行含硒肽段特异的靶向鉴定。


本文中使用了小鼠肝脏硒肽段富集样品进行测试,发现经SESTAR++辅助的PRM能相对于传统DDA鉴定到额外3个硒蛋白,且在一级谱及二级谱上都可以看到明显的硒特异同位素信号,进一步增强了可信度。

总之,本文首次报道了更快速、假阳性率更低的含硒肽段识别算法SESTAR++,提高了硒蛋白的检测效果。并且在文章中对SESTAR++软件的使用,以及SESTAR++辅助靶向鉴定的整体流程进行了详细的介绍,可便于研究者利用SESTAR++提升内源硒肽段或外源硒化学标签标记肽段的检测效果。本文的通讯作者为北京大学化学与分子工程学院、生命科学联合中心的王初教授,其指导的化学与分子工程学院2019级研究生贾国赓为本文的第一作者。王初课题组博士毕业生高晋君、杨帆与研究生冯天宇等合作者为本课题做出了贡献。

 

 

文章链接:
https://www.sciencedirect.com/science/article/pii/S0076687921004535
文章引用:10.1016/bs.mie.2021.10.013

 


 

 




版权所有 生命科学联合中心 京ICP备15006448号-5