人工智能检测癌症仍需谨慎对待
2020年02月02日 由 yining 发表
760223
0
如今,似乎每一个环节都有算法在参与,识别出危险的病变。就在本月,谷歌发布了一系列新闻,一项研究显示,其人工智能系统比医生更能准确地在乳房X光检查中发现乳腺癌。
但对许多医疗领域的人来说,,尽管算法处理数据的能力显而易见,但护士和医生微妙的、基于判断的技能并不是那么容易数字化的。
癌症的危害
戴尔医学院皮肤科医生兼助理教授阿德沃尔·阿达姆森(Adewole Adamson)在接受《边缘》杂志采访时说:“社会上有一种观点,认为发现更多的癌症总是更好的,但事实并非总是如此。”。“我们的目标是发现更多的癌症,这些癌症实际上会导致死亡。”但问题是“癌症的构成没有黄金标准。”
正如研究发现的,你可以向一组医生展示同样的早期病变,并得到关于能否确诊为癌症的完全不同的答案。即使他们确实同意病变所显示的情况——而且他们的诊断是正确的——也无法知道癌症是否对某人的生命构成威胁。错误的判断,会导致过度诊断。
一旦你称之为癌症,它就会引发一连串的医疗干预,这些干预可能是痛苦的、昂贵的,而且会改变生活。就乳腺癌而言,这可能意味着放疗、化疗、乳腺组织切除术(肿块切除术)或完全切除一个或两个乳房(乳腺切除术)。这些都不是仓促的决定。
阿达姆森说,这种复杂的诊断在谷歌的研究中没有得到应有的重视。首先,该公司的研究人员训练了他们的图像算法来确定是否是癌症。但是,由于没有癌症诊断的固定标准,特别是早期癌症,这样的训练数据是否提供了一个良好的基线是有争议的。其次,谷歌的算法只能产生二元结果:是的,是癌症,或者不是。正如阿达姆森在最近的一篇论文中所说,医疗检测需要有不确定性的空间,第三种选择代表诊断的灰色区域,延长诊断时间,而不是结束辩论。
当被问及这些问题时,Google的团队告诉Verge,他们的算法减少了假阳性率(当某些东西被错误地识别为癌症时发生的事件),将减少过度诊断的威胁。他们还强调,他们将在未来调查亚当森提倡的那种非二元分析。
“这正是我们下一步将与合作伙伴进行的研究,”谷歌健康发言人说。“我们希望在许多其他领域探索工作流考虑因素、用户界面考虑因素等。”
不过,对亚当森来说,这些挑战比一篇论文更大。他说,过度诊断“是许多不同癌症的问题;前列腺癌、黑色素瘤、乳腺癌、甲状腺癌。如果人工智能系统在发现越来越小的病变方面越来越好,你就会制造出许多患有“疾病”的假性病人。”
不是那么过时的放射科医生
当人工智能与医学结合时,过度诊断是一个挑战,但对一些医生来说,问题的根源更深。人工智能可以取代整个医疗工作类别:放射学,但是这种想法不是在论文或算法中发现的,而是来源于对人工智能的盲目信心。
2016年,人工智能先驱杰弗里·辛顿(获得2018年图灵奖的三位“人工智能教父”之一)说:“人们现在应该停止培训放射科医生。很明显,在五年内,深入的学习会比放射科医师做得更好。”2017,谷歌大脑的联合创始人Andrew Ng在评论一种用X射线检测肺炎的算法时重复了这一点:“放射科医师应该担心他们的工作吗?””
近年来,这种说法已经平息下来,但对于真正的放射科医生来说,这些声音听起来总是有点误导和侮辱。虽然算法肯定能够在医学图像中发现特定的病理特征,但这与穿上白大褂在病房里“望闻问切”相去甚远。
该问题的核心是放射科医生不仅仅是看图像,放射科医生和健康技术顾问休哈维说。“这完全是对放射科医生工作的误解,”他说,“这项工作更像是读一本小说,试图写一篇关于它的摘要。”
哈维在2018年的一篇博客文章中指出,医疗诊断包括接收患者,以各种方式收集数据(从荧光透视、超声波、活检等),将其与诊断的其他部分相关联,并从事各种辅助任务,如教学、培训和审计他人的工作。哈维说:“人工智能在任何意义上都无法取代放射科医生的工作。”。“人工智能仅仅可以找到一些人类很难找到的东西,并把它们展示给放射科医生,让他们发表意见,”。
人工智能世界过度自信的根源不在于对放射科医生的仇视,而在于人工智能本身的结构性亲和力。到目前为止,机器视觉已经被证明是最强大的深度学习,是人工智能的主导风格。这是一项图像识别测试,在2012年开启了当前的人工智能热潮,而从自动驾驶汽车到面部识别,深学习视觉算法支撑着它最强大的应用。
正因为如此,人工智能研究人员从将相对标准的视觉算法应用到医学数据集中获得了大量的成就。这会产生很多“第一”,因为人工智能学会在数据Y中识别特征X,并给人留下技术进步快速发展的印象。医生们说,像这些应用程序中最有用的工具——那些简单地标记数据特征以供医生验证的工具——是最有用的。但那些试图自己诊断的更为复杂的人并不一定能应对潜在的医学挑战。尤其是当许多创建算法还没有集成到临床环境中时。
正如哈维所说:“深度学习被当作锤子,科技公司也在寻找钉子,但是一把锤子不适合所有钉子。”
人工智能与医疗的故事重构
如果在人工智能和医学的重叠地带找到一个一致的主题,那就是医疗问题并不像最初看起来那么简单。
卫生保健记者玛丽·克里斯·雅克列维奇(Mary Chris Jaklevic)在最近的一篇文章中指出,这里的许多错误信息源于在许多人工智能研究和随后的报道中发现的“机器与医生”的叙述。这样的叙述既轻快又吸引眼球,吸引了读者对当下的兴趣,塑造了他们对未来的理解。但它也是一维的,将医学诊断的复杂性降低到几个数字和简单的图像。
尽管如此,大多数参与这项工作的专家——无论是程序员还是医生——仍然对人工智能在医疗领域的潜力持谨慎乐观的态度。正如亚当森所指出的,正是人工智能的扩展能力使得它如此强大,给了它如此多的希望,同时也要求谨慎。
他指出,一旦对算法进行了详尽的审查,就可以在世界上几乎任何地方快速轻松地部署它。但如果这些检查仓促进行,那么像过度诊断这样的不良副作用也会迅速增加。
“我不认为人工智能应该被扔进垃圾箱,恰恰相反,”亚当森说。“如果设计得当,它有潜力做好事。我关心的不是人工智能技术,而是我们将如何应用它。”