AI 在癌症识别诊断中的突破与应用:点亮抗癌之路的希望之光
AI 在癌症识别诊断中的突破与应用:点亮抗癌之路的希望之光
癌症,作为当今世界严重威胁人类健康的头号杀手,长期以来给无数患者和家庭带来了巨大的痛苦。然而,随着科技的飞速发展,人工智能(AI)技术正以前所未有的力量介入癌症的识别与诊断领域,为这一难题带来了新的曙光。从哈佛医学院的 CHIEF 模型,到港科大的一系列 AI 医学大模型,再到中国达摩院的 PANDA 模型和华中科技大学的 Joint - AI 模型,AI 正在改写癌症诊断的历史,为人类对抗癌症注入了强大的动力。
哈佛医学院 CHIEF 模型:多功能诊断的新突破
2024 年,哈佛医学院等机构的科学家们开发出了名为 CHIEF(Clinical Histopathology Imaging Evaluation Foundation)的多功能 AI 癌症诊断模型,并于 9 月 4 日在「Nature」杂志上发表。这一成果标志着癌症诊断领域的又一重要里程碑,它展现出了类似于 ChatGPT 的灵活性,在癌症诊断方面远超其他现有模型。
超越传统的多功能设计
大多数传统的 AI 癌症诊断系统往往只能执行特定任务,比如检测癌症的存在或者分析肿瘤的基因特征,而且通常仅适用于少数几种癌症类型。但 CHIEF 模型与众不同,它能够执行多种任务。通过读取肿瘤组织的数字切片,它不仅可以检测癌细胞,还能根据图像中观察到的细胞特征分析肿瘤的基因特征。此外,它还能预测多种癌症类型的患者生存率,并精确定位肿瘤周围组织的特征,即肿瘤微环境。这些肿瘤微环境的特征与患者对手术、化疗、放疗和免疫治疗等标准治疗的反应息息相关。更值得一提的是,CHIEF 还具有生成新见解的潜力,它发现了此前未被认为与患者生存相关的特定肿瘤特征。
CHIEF 模型的训练过程十分精细且复杂。首先,它在 1500 万张未标记的图像上进行训练,这些图像被分成多个模型可能需要特别关注的部分。随后,在 6 万张全切片图像上进行进一步训练,这些全切片图像涵盖了肺、乳腺、前列腺、结肠、胃、食管、肾脏、脑、肝、甲状腺、胰腺、宫颈、子宫、卵巢、睾丸、皮肤、软组织、肾上腺和膀胱等多种组织。这种训练方法使得模型既能关注图像的局部细节,又能结合整个图像,将局部变化与整体联系起来。这样在进行癌症分析时,CHIEF 能够考虑更广泛的背景信息,更全面地解读图像。
在对 19400 多张来自全球 24 家医院和患者群体中收集的 32 个独立数据集的全切片图像进行测试后,结果令人惊叹。CHIEF 在癌细胞检测、肿瘤起源识别、预测患者结果以及识别与患者治疗反应相关的基因和 DNA 模式等任务中,比其他最先进的 AI 方法高出 36%。而且无论肿瘤细胞是通过活检还是手术切除获得,无论使用何种技术对癌细胞样本进行数字化处理,它都能保持高准确性。这种适应性使 CHIEF 能够在不同的临床环境中广泛应用,这是当前大部分 AI 癌症诊断模型所不具备的优势。
CHIEF 的四大应用领域与出色准确率
癌症检测:在癌症检测方面,CHIEF 的准确率极高。在涵盖 15 个数据集、11 种癌症类型的测试中,准确率达到了近 94%。在另一个涵盖 5 个活检数据集,包括食道、胃、结肠和前列腺等多种癌症类型的检测中,准确率更是高达 96%。当用数据集之外的手术切除肿瘤切片进行测试时,其准确率也超过了 90%。模型注意力得分的可视化显示,它能准确识别黑色素瘤、肺癌和肾癌的癌变区域。
分析肿瘤的基因特征:肿瘤的基因构成对肿瘤发展和治疗方案至关重要,但传统的 DNA 测序成本高且耗时。CHIEF 在预测肿瘤的基因变异方面表现优异,它成功识别了与癌症生长和抑制相关的多个重要基因特征,并预测了肿瘤在各种标准癌症疗法过程中的关键基因突变。例如,在观察全组织图像时,它能识别出 54 个常见突变癌症基因中的突变,总体准确率超过 70%,优于当前用于基因组癌症预测的最先进 AI 方法。在检测弥漫性大 B 细胞淋巴瘤的血液癌症中的 EZH2 基因突变时,准确率达 96%;在检测甲状腺癌中的 BRAF 基因突变时,准确率达到 89%;在检测头颈部癌症中的 NTRK1 基因突变时,准确率为 91%。
预测患者生存率:基于初次诊断时获得的肿瘤组织病理图像,CHIEF 能够成功预测患者的生存期。在来自 17 家不同机构的患者样本中,它预测高风险和低风险死亡率的能力得到了验证。在所有研究的癌症类型和患者群体中,CHIEF 能够区分长期生存和短期生存的患者,且表现比其他模型好 8%,在患有晚期癌症的患者中,表现更是比其他 AI 模型高出 10%。
识别不同癌症类型需要特别关注的区域:该模型在图像上能够识别出与肿瘤侵袭性和患者生存率相关的明显模式。通过生成热图进行可视化,人类病理学家在分析这些热点时发现了癌细胞与周围组织相互作用的有趣信号。例如,在长期生存者的肿瘤区域中,免疫细胞的数量比短期生存者更多,这表明免疫系统的激活可能对肿瘤攻击有积极作用。而在短期生存者的肿瘤中,会出现细胞成分比例异常、细胞核非典型特征多、细胞间连接弱、肿瘤周围结缔组织少以及更多死亡细胞等特征。而且这些特征因癌症类型而异。
港科大四大 AI 医学大模型:全方位助力癌症诊断
香港科技大学于 2024 年 10 月 31 日宣布成功研发的四大 AI 医学大模型,旨在协助全科及专科医生诊症,能为多达 30 种癌症及疾病提供诊断和预后评估,部分模型的准确度可与拥有 5 年或以上经验的专业医疗人员媲美,这无疑是医学诊断领域的又一重大突破。
MOME 模型:乳癌诊断的新利器
MOME 是首个以大模型方式分析多参数磁力共振(MRI)影像的 AI 模型,主要针对乳癌诊断。在香港,乳癌是女性最常见的癌症之一,该模型能帮助医生分析病人的乳房 MRI,快速区分乳房肿瘤是良性还是恶性,从而避免病人进行不必要的病理穿刺化验。而且,它还能预测患者对化疗的反应,为病人制定个性化治疗方案。其系统准确度与具有 5 年或以上经验的放射科医生相当,为乳癌的非入侵性和个性化治疗管理开创了新的途径。
mSTAR 模型:优化病理检查流程
mSTAR 是世界领先的病理学基础模型之一。病理检查虽被认为是诊断癌症的「黄金标准」,但撰写病理报告过程耗时且易出错。mSTAR 模型不是将整张切片分割和独立分析,而是对整幅病理全景影像进行分析,并引入多模态知识增强识别能力。它有助于病理学家执行多达 40 项诊断和预后任务,减少病理分析所需时间并提高诊断准确性。
MedDr 模型:AI 全科医生
MedDr 如同一位 AI 全科医生,是多模态语言模型,堪称医学界的「GPT」。它能解答问题、撰写医疗报告,并根据医学图像为病人作初步诊断等,是目前全科医学中最具规模的开源软件,有助于医生做出快速、准确和可靠的诊断。在上海人工智能实验室的评测中,MedDr 被评为全球同类模型中性能最佳的 AI 系统之一。
XAIM 模型:提升医疗人员对 AI 的信任
XAIM 是一个创新的 AI 框架,用于剖析各个 AI 医学系统如何作出决策。虽然当前不少 AI 系统准确度高,但透明度问题惹人疑虑。XAIM 能为系统的诊断结果提供图像及文字解释,提升医疗人员对系统分析结果原因的理解,从而增加对 AI 模型的信任度。
达摩院 PANDA 模型:改写胰腺癌筛查困境
胰腺癌因其隐蔽性强、致死率高,素有 “癌症之王” 之称。全球临床指南通常不推荐胰腺癌筛查,原因是缺乏可靠、高精度的筛查手段。然而,一群中国医生与科学家决定借助 AI 改变这一现状,他们将 AI 作为新武器引入胰腺癌的抗击中。
PANDA 模型的研发历程
上海市胰腺疾病研究所的曹凯医生在导师因胰腺癌去世后,萌生了利用 AI 识别癌症的想法。他与达摩院医疗 AI 团队负责人吕乐等人联合全球多家医院与研究机构发起课题,向基于 “平扫 CT + AI” 的大规模胰腺癌早筛发起挑战。这个联合研究团队包括优秀的胰腺肿瘤治疗科室、前沿的医疗 AI 算法团队和提供多样性训练数据的合作医院。
与其他医疗 AI 模型不同,PANDA 模型的训练需要医生耗费大量精力整理病人全临床周期的真实临床数据,用确诊信息指导临床检测性能。医生们每天结束看诊后,会整理病人的病理图片、报告、CT 等多模态数据,手工确认病灶并在增强 CT 上勾勒出来,再通过工程师做三维图像配准,将病灶的三维勾画从增强 CT 映射到平扫 CT 上,让 AI 学会识别早期胰腺肿瘤在平扫 CT 上的特征。通过这种方式,构建了超过 3000 名真实病患的胰腺肿瘤 CT 训练集。
PANDA 模型的突破与意义
2023 年 11 月 21 日,《自然・医学》刊发了 PANDA(PANcreatic cancer Detection with AI)模型的研究成果。PANDA 的发布首次证实了在平扫 CT 上使用 AI 进行大规模胰腺癌筛查的可行性,这也是中国放射影像领域的科研成果首次登上《自然・医学》。PANDA 模型特异性达到了 99.9%,即每 1000 例检测只会出现 1 次假阳性,敏感性达到了 92.9%,相较于人工诊断提高 34.1%。在对 20530 名真实世界连续病例的多场景验证中,发现了 31 例临床漏诊病变,其中 2 例早期胰腺癌病患已完成手术治愈。例如上海杨浦的王女士,通过 PANDA 模型在体检 CT 影像回顾性临床验证中被提示胰腺肿瘤概率为 95%,经进一步检查确诊并手术,术后恢复良好,这充分展示了 PANDA 模型在胰腺癌早期筛查中的巨大潜力。
PANDA 模型的价值与后续发展
从医疗领域的核心命题来看,PANDA 模型对于降低医疗费用、增加医疗可及性和提高医疗服务质量有着重要意义。平扫 CT 价格低廉、接受度高,结合 AI 技术可实现规模化推广。达摩院的目标是通过医疗影像 AI 实现 “8 + 5” 的一扫多筛,目前已在胰腺癌、食管癌、肺癌、乳腺癌、肝癌、胃癌、结直肠癌等七种致死率最高的癌症上取得阶段性进展。但要真正让这一技术被医学界接受,还需要进行严格的前瞻临床试验,达摩院正联合医院开展真实世界无症状人群的前瞻性队列研究,同时以 “科研 + 公益” 的方式在浙江丽水等地进行验证,为全球更多地区抗击癌症提供可能。
华中科技大学 Joint - AI 模型:提高胰腺肿瘤诊断准确率
针对胰腺肿瘤诊断的挑战
胰腺癌作为一种高致死性、难治性消化道肿瘤,症状隐匿、恶性程度高、发展速度快,5 年生存率约为 10%。超声内镜是诊断胰腺癌的重要手段,但目前超声内镜在区分恶性肿瘤和良性肿块方面的特异性并不理想,范围仅为 50% - 60%。而且现有的深度学习模型大多只在单一模式上运行,忽略了其他潜在诊断信息。
Joint - AI 模型的开发与优势
华中科技大学同济医学院附属同济医院程斌教授团队开发了一个多模态 AI 模型(Joint - AI 模型)。该模型可基于患者的临床信息与超声内镜图片对胰腺占位综合考虑做出诊断,克服了传统单模态模型仅基于超声内镜图像、忽略其他临床信息对患者诊断潜在价值的问题。通过在内部、外部和前瞻性数据集中的测试,Joint - AI 模型的准确率达到了 98%。
模型在临床实践中的辅助作用
在一项前瞻交叉试验中,Joint - AI 模型表现出了出色的辅助能力。它能显著提高新手内镜医师的准确性,在模型辅助下,新手内镜医师的准确率可从 69% 提高至 90%。同时,模型还能通过提供可解释性分析结果,帮助经验丰富的内镜医师理解模型的决策逻辑,进一步提高他们对人工智能预测的接受度。目前团队正在积极进行临床转化,希望能在病理结果不确定的复杂情况下,帮助临床医生做出更准确的判断。
AI医学诊断技术应用前景
AI 在癌症识别诊断领域的应用正呈现出蓬勃发展的态势。从哈佛医学院的 CHIEF 模型到港科大的系列模型,再到达摩院的 PANDA 模型和华中科技大学的 Joint - AI 模型,这些先进的 AI 技术在不同癌症类型的检测、基因特征分析、患者生存率预测以及协助医生诊断等方面都展现出了巨大的优势和潜力。它们不仅提高了诊断的准确性和效率,还为癌症的早期筛查和个性化治疗提供了有力支持。
从产业前景来看,AI 医学诊断技术拥有广阔的发展空间。随着全球癌症发病率的持续上升,对高效、精准诊断技术的需求将不断增加。AI 医学诊断技术有望在各大医疗机构中得到广泛普及,成为癌症诊断流程中不可或缺的一部分。一方面,越来越多的科技公司和医疗机构将加大对这一领域的投入,促进模型的持续优化和创新。例如,通过不断增加训练数据的多样性和规模,进一步提高模型对不同种族、地域人群癌症特征的识别能力。
另一方面,随着 AI 医学诊断技术的成熟,与之相关的产业链也将逐渐完善。包括数据采集、标注、模型训练、软件和硬件设备开发、医疗人员培训等环节都将迎来发展机遇。同时,AI 医学诊断技术还有望与其他医疗技术如基因治疗、靶向治疗等深度融合,实现癌症诊疗一体化的全新模式。不过,尽管取得了显著的成果,但 AI 癌症诊断技术仍面临一些挑战,如需要更严格的临床试验验证、提高模型的透明度和可解释性等。未来,随着技术的不断进步和完善,AI 有望成为人类战胜癌症的关键力量,为全球癌症患者带来更多的希望和生机。我们期待这些技术能够在全球范围内得到更广泛的应用和推广,为人类健康事业做出更大的贡献。