研究动态

Science Letter

价值数十亿美元!人工智能已渗透入蛋白质组学

  2019-06-09       生物通

任何有机体的基因组都包含了数千种蛋白质的蓝图,这些蛋白质几乎控制着生命的所有功能。蛋白质缺陷会导致严重的疾病,如癌症、糖尿病或痴呆症。因此,蛋白质也是药物最重要的靶点。

为了更好地了解生命过程和疾病,开发更合适的治疗方法,有必要同时分析尽可能多的蛋白质。目前,使用质谱法测定生物系统中蛋白质的种类和数量。然而,数据分析环节仍然存在许多错误。

TUM的一个研究小组,在生物信息学科学家Mathias Wilhelm和TUM蛋白质组学和生物分析学教授Bernhard Küster领导,下现在已经成功地利用蛋白质组学数据训练神经网络,使人工智能学会更快地识别蛋白质,并且能够识别蛋白质,几乎没有错误。

解决一个严峻问题

质谱仪不能直接测量蛋白质。它们用其多达30个构建基块分析的是由氨基酸序列组成的小部分。再将这些链的测量光谱与数据库进行比较,以便对应特定的蛋白质。然而,评估软件只能使用光谱包含的部分信息。因此,某些蛋白质不能被识别或容易被错误识别。

“这是一个严重的问题,”Küster说。TUM团队开发的神经网络利用所有光谱信息进行识别。“我们错过的蛋白质更少,犯的错误也少了100倍。”

适用于所有生物


研究人员将该人工智能软件命名为“Prosit”,“( Prosit)适用于世界上所有的生物体,即使它们的蛋白质组以前从未被检测过,”Mathias Wilhelm解释说。“这使得以前无法想象的研究成为可能。”

在1亿台质谱的帮助下,该算法得到了广泛的训练,无需任何额外的训练即可上手用于所有普通质谱仪,我们的系统是这个领域的全球领导者,”Küster说。

价值数十亿美元的市场

诊所、生物技术公司、制药公司和研究机构都在使用这种高性能设备,市场价值已经达到数十亿美元。有了“Prosit”,未来还有可能开发出更强大的仪器。研究人员和医生也将更好、更快地在患者的血液或尿液中寻找生物标记物,或监测治疗的有效性。

研究人员对基础研究也抱有很高的希望。“这种方法可以用来追踪细胞中新的调控机制。我们希望从中获得大量知识,从中长期来看,这些知识将反映在人类、动物和植物所患疾病的治疗上。”

Wilhelm预计“Prosit等人工智能方法将很快改变蛋白质组学领域,因为它们几乎可以用于蛋白质研究的每个领域。

 

原文检索:Prosit: proteome-wide prediction of peptide tandem mass spectra by deep learning

(生物通:伍松)

  责编: