机器学习工具可以发现肿瘤中的突变,比现有模型更准确

机器学习工具可以发现肿瘤中的突变,比现有模型更准确

癌症肿瘤不断生长和进化,它们的DNA也是如此。究竟DNA如何变化是重要的信息,因为它会影响医生的治疗决策。

有些技术可以执行这种复杂的分析。对肿瘤样本的DNA进行测序,然后计算工具和人类专家的组合分析数据,以确定发生了哪种遗传变化或突变。

但根据发表在“Science Translational Medicine”上的一份报告,这些现有工具都不是完全准确的。为了解决这个问题,报告的作者说他们开发了一种新的方法,包括机器学习,自动化肿瘤DNA诊断过程。

“在临床肿瘤标本中识别真正的突变非常困难,” 巴尔的摩个人基因组诊断报告和首席信息官Samuel Angiuoli说,“ 与现有技术相比,我们的机器学习方法提高了该识别准确性。”

有了肿瘤中突变的类型,数量和位置这些信息,医生可以选择一种特定于肿瘤类型的治疗方法。其中一些疗法已经存在于市场上。一种名为vemurafenib的药物专门治疗一种名为BRAF的基因突变的皮肤癌细胞。许多其他突变特异性疗法正在开发中。

当然,如果可以正确识别肿瘤中的突变,这些疗法更有可能起作用。这并不像听起来那么简单。测序数据的庞大规模使得很容易错过小的遗传变化。此外,该数据中存在大量噪音。实验室准备方法和测序机器本身可以引入看起来像遗传改变的人工制品。并且存在诱饵DNA突变,其可以存在于细胞中但对于肿瘤鉴定不重要。这些误报很难过滤掉。

计算机化工具可以提供帮助,但经常需要人工审核员团队来确保结果的高质量。这使得这些癌症诊断工具集中在实验室中,远离患者。“我们的目标是开发一种套件,包括可以在世界任何地方运行的软件,而无需专家评审,”Angiuoli说。

他的公司的新工具,被称为Cerebro,使用称为随机森林分类器的算法集合自动完成工作。这种传统的机器学习技术通过评估大量决策树来生成每个候选突变的置信度得分。

Angiuoli和他的团队使用数百万个真实世界和计算机模拟突变训练了Cerebro。然后,他们将Cerebro与几种现有的癌症突变鉴定方法进行了直接对抗,发现机器学习技术在几乎所有情况下都更准确。

“突变鉴定软件的改进很重要,并具有临床意义,”Angiuoli说,尤其是随着更多DNA特异性癌症疗法继续在市场上出现。

Angiuoli的公司简称PGDx,于2010年从约翰霍普金斯大学分离出来,目的是开发专有算法来识别癌症基因组的改变。该公司计划将其产品带到美国食品和药物管理局(FDA),以期获得市场认可。

本文为ATYUN(www.atyun.com)编译作品,ATYUN专注人工智能
请扫码或微信搜索ATYUN订阅号及时获取最新内容

发表评论