参加比赛的双方,AI这边是一个名叫“BioMind 天医智”的系统,由国家神经系统疾病临床医学研究中心与首都医科大学人脑保护高精尖创新中心、北京安德医智科技有限公司共同研发,号称全球首款CT、MRI神经影像人工智能辅助诊断产品。
人类这边,则由25名全球神经影像领域顶尖专家、学者和优秀临床医生组成,他们中有拥有几十年临床工作积累的影像学大咖,也有有志于AI系统研究的青年科技人才。经过前期招募、预赛及定向邀请选拔而出。
经过紧张激烈的角逐,在两轮比赛中,BioMind分别以87%、83%的准确率,战胜医生战队66%、63%的准确率。值得一提的是,两轮比赛BioMind均仅用15分钟左右时间便答完所有题目,而医生战队几乎答到最后一秒。
神经影像人工智能人机大赛赛制介绍
据了解,大赛将分A、B组进行,内容包括:颅内肿瘤CT、MRI(核磁)影像判读;脑血管疾病CT、MRI影像判读及血肿预测;脑血管病(狭窄、微出血、梗死、脑白质病变、腔隙灶、血肿)病灶标识,出血体积及梗死体积测量。
A组比赛中,有15名人类医生,包括此前全国线上预赛产生的优胜者6名、国内神经疾病排名前列的专家7名,以及国外知名医院专家2名。本组试题共225题,人类选手每人回答15题,AI 回答225题,最终以人类选手整体成绩与AI对比。
B组比赛由10名人类神经影像领域“大咖”(国内神经疾病排名前列医院专家8名+知名医院的专家2名)和AI比赛。其中,每名人类选手都与AI一样,完成30道题的挑战,最终将以人类选手整体成绩 VS AI成绩。
A组试题为首都医科大学附属北京天坛医院神经影像学中心主任高培毅教授从天坛医院脑肿瘤病例库中随机挑选,B组为首都医科大学附属北京天坛医院常务副院长王拥军教授从国家神经系统疾病临床医学研究中心脑出血病例库随机挑选,两组试题均非AI训练试题,为保证试题的保密性,北京市长安公证处的公证人员为试题挑选、封存进行了公证。
赛前,公证人员正式为试题解封,并交付本次决赛评审专家,进行最终题目抽取。据了解,由于本次比赛使用的病例均为首都医科大学附属北京天坛医院病例库中回顾性病例,因此,最终评判结果以医院最终病理结果为准。为保证准确性,选手开始答题后,评委对试题结果进行二次审核。
最终,在A组比赛中:225例判读,AI用15分钟准确率达87%,15位医生用30分钟准确率达66%;B组比赛中,10名顶尖医生对战AI,同样完成30道脑血肿扩大预测试题,AI以83% VS 63% 准确率胜出。
获胜医疗AI:每个肿瘤背后都学习了1000个病例,基本掌握50种颅脑肿瘤
参加比赛的AI——BioMind天医智,是由国家神经体系疾病临床医学研讨中心和首都医科大学人脑维护高精尖立异中心等一起研制的全球首款CT、MRI神经印象人工智能辅佐确诊产品。
在参加比赛前,它已经跟着北京天坛医院神经影像学中心主任高培毅学习了半年。
对于本次比赛AI学生取得的成绩,高培毅并不意外,他介绍说,通过对北京天坛医院近十年来接诊的数万余神经系统相关疾病病例影像的系统学习,“BioMind天医智”在脑膜瘤、胶质瘤等常见病领域的磁共振影像诊断能力相当于一个高级职称医师级别的水平,实力不容小觑。
“每种肿瘤背后,它都学习了1000个病例,目前基本上已经掌握了50种颅脑肿瘤,这是任何一名医生都难以实现的。”
在近期“人机大战”决赛备战中,高培毅还为提高AI体系应战表现打开集训。300多个病例,陪练医师们需10小时以上时刻才做完结,AI只需不到半小时。除了学习速度外,它的安稳性也显着逾越人类。“不知道累,也不受外界搅扰要素的影响。不像医师会被心情、状况、时刻地址等外界要素打扰,然后影响描绘准确性。它永久坚持镇定,水平安稳。”
不过,他对自己AI学生的表现还不太满意。“对它的比赛成绩不够满意,我认为它的准确率应该在90%以上,”高培毅说,接下来他们将对AI的“丢分”原因进行研究分析。
战胜25位医生≠战胜人类医生,AI和专业医师仍然存在差距
关于这次比赛结果,中国科学院院士、第三军医大学病理学研究所所长、西南医院病理科主任卞修武表示,“我希望大家不要产生对立性思维,因为无论医生胜还是人工智能胜,对于医疗界和广大患者都是一件大好事。”卞修武认为,人工智能更聚焦于某一细分领域,但医生有其系统性的学习,所以人工智能如果能作为一个帮手帮助医生工作,将会是医生的一大福利。
美国卡内基梅隆大学(CMU)计算机科学学院副教授马坚告诉新智元,AI对一些特定的问题在特定的时间内比人做得更好,这类事情之前也发生过,这可能是又一个有意思的案例。但是,通过 AI 和几个医生的比赛的结果,就说AI战胜某个整个的职业领域肯定不妥。
马坚表示,目前AI对单一数据源的分类可能做的不错,但是如何从复杂的多模态数据中有效综合作出诊断和治疗意见,AI可能还有非常多问题要解决,而且,这还涉及到更多社会学意义上的问题,譬如AI和医生以及病人互相间信任、沟通的问题。
BioMind的老师高培毅也表示,“觉得它容易就能代替医师的人,把医师的作业看得太简略了。”AI在大数据深度学习方面确实具有巨大的优势,不过在实践确诊中,放射科医师仍具有很强的不行代替性。
“除了影像查看,一个合格的放射科医师还需求看化验单、体检单,问询宗族史、个人病史,了解患者从前接受过的药物、医治、反响。归纳以上状况后,才敢做出确诊。”AI或许能够代替“看片匠”的任务,但不可能成为一个真实的医师。
王拥军也以为,人工智能使用能够将医师们从单调、重复的作业中解放出来,然后腾出更多时刻进行开发性作业。
此外,现在AI在神经体系印象确诊方面,仍彻底依赖于数据真实性和质量的支撑,在缺少大数据支撑的疑难病、稀有病确诊范畴,AI和专业医师之间仍存在距离。
使用AI辅助,核磁检查结果有望缩短至几分钟
王拥军表示,这次向全球招募神经科医师打开“人机大赛”,意图主要是为了验证天医智确诊的准确性。
目前,全国影像科人才资源地域性分配不均衡问题十分突出。以脑肿瘤为例,北京天坛医院每年手术量约为一万例,而在大部分底层医院,这个数字可能只停留在两位数。大多数患者即便在底层做了查看,仍是会挑选带着片子到三甲大医院来看,有的在“上流”的过程中重复屡次拍片,形成资源糟蹋。假如底层医院能使用AI技能为确诊赋能,让底层医师在读片确诊上与大医院具有平等水准,提高医治功率,就能削减患者不必要的医治环节和经济损失,也能减轻大医院压力。
此外,在天坛医院,天医智有用发掘信息与疾病的潜在联络的才干还可辅佐医师对疾病做出更为精准的猜测,如猜测患者血肿后是否会大出血的准确度,可从人为判别的60%提高至90%,辅佐医疗团队提早为患者可能遇到的风险供给处理方案。
这次比赛,医疗AI表现出了速度快、准确率高的结果,令人赞叹的同时,更多人关心的是它未来将给神经医学带来哪些改变——人脑疾病真的可以实现电脑诊断吗?
高培毅介绍说,一个CI病例背后,可能是近千张片子,天坛医院一个影像大夫每天读片诊断的时间甚至达到18个小时。按照“BioMind天医智”目前的速度,一个大夫一天的工作量,它只需要400-500秒,也就是不到10分钟的时间。
“现在患者到医院做核磁,结果都要等第二天以后才能拿到。如果让AI来做,那么核磁结果基本上立等可取,几分钟就行”。
北京天坛医院院长王拥军介绍说,目前已经向国家药监局提交申请,希望在临床中应用这款AI产品,提高基层医院影像诊断准确率,同时也提高影像判读速度,为患者节约时间。
不必担心机器在临床技术上超越人类医生
北京大数医达有限公司创始人、CMU博士邓侃在了解到这项比赛后,给出了如下的点评:
以往司机必须具备三种能力,第一种是规划路径的导航能力,熟悉地图,能够规划从起点到终点的合理路径。第二种是驾驶汽车的操作能力,包括踩油门、踩刹车、转方向盘等等。第三种是对交通实况,迅速做出判断的能力,譬如避让行人,如何处理其它车辆超车。
有了导航软件以后,司机们不再需要熟记地图,不再需要第一种能力。随着无人驾驶技术的发展,不久的将来,司机们也不再需要第二种和第三种能力。
随着人工智能医疗技术的发展,人类医生也将不再像以往那样,依赖临床经验的个人积累,而是越来越依赖电脑的提示。
读片是医疗过程中,诊断的一个环节。输入是检查设备生成的影像,输出是文字版的检查报告,检查报告中包括两部分,一个是检查所见,列出检查影像中需要关注的特征标志物。另一个是检查结果,根据检查特征标志物,判断患者罹患的疾病。
昨天北京举办了一场AI vs人类神经科医生的读片大赛,在A组比赛中,225例判读,AI 系统用 15分钟完成读片,准确率达87%,15位医生用30分钟准确率达66%;B组比赛中,10名顶尖医生对战AI,同样完成30道脑血肿扩大预测试题,AI 系统以83% vs 人类医生 63% 准确率胜出。
昨天的比赛,人工智能系统以 20% 的显著优势,战胜人类医生。这说明,在某几类疾病的读片中,人工智能确实比人类智能更有优势。而且,不久的将来,在其它疾病的读片中,机器也势必超越人类。
整个诊断过程,包括问诊、体检、化验、检查。读片只是检查这个单个环节。不久的将来,机器势必在诊断和治疗全过程,而不仅仅是读片单个环节,超越人类。人工智能医疗,下一步的发力点,一定是诊断和治疗的全过程的整合,把问诊、体检、化验、检查全部串连起来。
人类医生会失业吗?医疗界有句名言,“To Cure Sometimes, To Relieve Often, To Comfort Always,有时是治愈;常常是帮助;总是去安慰”。也许机器在治愈和帮助方面,确实比人类医生更精准,但是患者需要关怀,需要安慰,医生提供的“话疗”,哪怕是无声的一个同情的眼神,机器能难替代人类医生。
不用担心机器在临床技术方面超越人类,就像不用担心导航软件和无人驾驶技术,超越人类司机一样。 历史经验表明,机器取代人类,完成繁琐的工作,让人类腾出手去,完成更精巧的工作。全球人口发展的历史也表明,随着机器的普及和进步,人类人口非但没有下降,反而不断增加。