近日,《自然》杂志再出人工智能重磅成果。
来自美国、德国、意大利等100多个实验室的近150位科学家通力合作,联合在顶级期刊《自然》发表了这篇文章,他们开发了一个超级AI系统,该系统基于肿瘤组织DNA的甲基化数据,可以准确区分近100种不同的中枢神经系统肿瘤。更厉害的是,这个AI系统还能自学成才,发现一些临床指南里面没有的新分类。
为了更广泛的可访问性,团队设计了一个免费的在线分类工具,不需要任何额外的现场数据处理。团队称,研究结果为跨越其他癌症实体生成基于机器学习的肿瘤分类器提供了蓝图,并具有从根本上改变肿瘤病理的应用前景。
大约一个月之前,张康教授那篇“重磅!中国科学家最新医学AI成果荣登《细胞》杂志”在朋友圈刷屏,也充分体现了公众对于AI技术在医疗领域的不断突破给予了极大的热情。
准确的诊断对于适当的疾病治疗至关重要。目前,临床上中枢神经系统肿瘤的诊断核心技术还是基于显微镜的组织学诊断。然而,这需要对细微的细胞改变进行评估。在某些情况下,可能导致不同个体对特定样本进行不同的分类。如今,技术的发展使大量的分子数据能够被获取和评估,这种主观判断的误差也在不断缩小。
1926年,一篇由神经外科医生Percival Bailey和Harvey Cushing发表的题为“神经胶质瘤组的肿瘤分类与预后相关的研究”,为公众提供了对中枢神经系统(CNS)癌症类型的发展、细胞特征和临床后果的早期认识。这本书的标题充满了预见性,因为他们所倡导的基于显微镜的诊断方法并不普遍。作者的想法早于他们的时间。例如,书名中的“histo-genetic”一词指出了细胞变化与遗传学之间的联系。Bailey 和Cushing对细节的强烈关注使得他们能够发现与临床结果相关的宏观和微观肿瘤特征,并提出了14种肿瘤的分类。
今天,许多脑肿瘤通过组织学和分子特征的分析来鉴定。世界卫生组织在2016年更新其对某些脑肿瘤的诊断指南,以推荐一种结合组织学和分子信息的综合诊断方法。然而,不同的中枢神经系统肿瘤的临床表现和生物学特性有高度特异性,很难确诊。很多在显微镜下表现相似的肿瘤,实际上有不同的基因变异特点,这些几乎是很难观察到的,这就给精准诊断带来了极大的困难。
组织学分析的一个重要发展是计算工具的拓展,让机器学习过程分析组织学数据。在这种方法中,使用由医生分类的肿瘤样本图像的数据集对“计算机”进行“训练”。计算机使用分类信息来开发自己的模式识别标准,用以识别肿瘤类型。然而,如果缺乏对某些肿瘤明确定义的诊断标准,或者如果不同类型的肿瘤在组织学上难以区分,机器就会遇到挑战。
研究团队决定专注于分类信息,其分类不需要复杂的视觉评估。他们采用机器学习方法根据DNA甲基化的变化(将甲基添加到DNA中)进行肿瘤分类,并将这些诊断与病理学家使用组织学分析所做的诊断相比较。
雷锋网了解到,DNA甲基化是最早发现的基因表观修饰方式之一。这类改变不会改变DNA序列,但可影响基因表达或细胞命运。异常DNA甲基化和癌症其他后生变化的作用正日益明显。在许多癌症中,表观遗传变化的基因组范围模式(称为表观基因组)可能发生显着改变。例如,神经胶质瘤中基因IDH1或IDH2的突变引起DNA甲基化模式的全基因组失调,这可能与特定的临床结果相关。
之前的研究已经强调了在某些类型的脑肿瘤中,分析DNA甲基化的诊断优势:甲基化特征一方面能够标记相应的细胞变化,一方面还能够用于追踪细胞来源,例如用来诊断那些病灶不明的癌症。然而,常规的全基因组范围甲基化分析对于临床诊断仍然不常见,原因有几个:成本;样品要求;缺少必要的数据分析专家以及这些发现是否会对临床治疗产生影响。
但是,相关研究正在取得一些进展。现在科学家已经可以很容易地从经福尔马林固定后石蜡包埋的少量组织(FFPE)中提取DNA。
作者向计算机提供了由世界卫生组织分类的几乎所有CNS肿瘤类型样本的全基因组甲基化数据。此外,为了区分中枢神经系统肿瘤与其他肿瘤和正常脑组织之间的差异,研究团队还分析了部分间充质肿瘤、黑色素瘤、弥漫性大B细胞淋巴瘤、浆细胞瘤以及6种垂体腺瘤,以及健康脑组织的DNA甲基化情况。
根据世卫组织的分类以及样本的诊断结果,在有监督的机器学习算法下,分析世卫组织定义的每类肿瘤的甲基化特征;然后又用无监督的机器学习算法再分析一遍,让AI系统总结出自己对中枢神经系统肿瘤甲基化的认知。
据雷锋网了解,经过训练,计算机可以根据特定的甲基化特征将肿瘤分为82个不同的类别。其中有29个符合世卫组织定义的特定肿瘤类型,第二类也有29个,它们能与WHO分类中的某种肿瘤下面的亚类型匹配。剩下的就是只能部分匹配,或者完全不能匹配。研究人员认为,这些发现可以帮助研究人员更深入地理解中枢神经系统肿瘤,并有助于治疗方案的选择或诊断工具的发展。
图1 | 使用机器学习方法的肿瘤分类。Capper 等人使用机器学习方法根据称为甲基化的DNA改变类型的全基因组模式对脑肿瘤进行分类。使用基于标准显微镜分析或选定病理学家诊断的肿瘤样品的甲基化数据来训练计算机。训练结束后,电脑获得1104个测试用例。
作者比较了计算机和病理学家所做的诊断。在60.4%的样本上,AI系统和病理学家诊断是一致的。15.5%的样本AI系统和病理学家的也是一致的,只不过AI系统认为,它们应该属于一个更小的亚型。还有12.6%的病例,AI系统和病理学家诊断的结果不一致。经过更加深入的分析(例如基因测序)之后,92.8%的样本是AI系统正确。
考虑到每种样本的低成本与标准癌症诊断相比的优势,研究团队的方法是否代表了肿瘤诊断的未来可能标准?
针对这个问题,研究者也提出,甲基化特征还不能作为单一的诊断标准,还需要临床的验证。
获得肿瘤标本的全面分子图谱当然是有用的(尤其是当与显微镜检查相结合时),并且可能会随着医学治疗变得更加个性化以适应个体肿瘤特征的前进方向。
组织学仍然是疾病分类中不可或缺的部分,因为显微镜标本保存和检查的标准方法为世界各地临床实验室使用的常规诊断工作流程提供了最容易获取和标准化的切入点。疾病可以在分子和细胞变化中表现出来; 因此,整合分子分析和视觉检查的方法可以加强诊断能力。
常规和广泛使用由研究人员开发的平台,对于目前许多实验室来说可能并不实用。所以这种技术最可能的直接应用是评估具有不明确组织学特征的病例。然而,这一新的方法对传统方式来说是一个有益的补充。
责任编辑:吴一波