提前10年预测致命心脏疾病:AI在医学领域的突破与应用
提前10年预测致命心脏疾病:AI在医学领域的突破与应用
随着人工智能(AI)的浪潮袭来,GPT(生成式预训练转换器)及其他通用大模型已经风靡全球。它们以惊人的速度和能力,改变了我们与机器交互的方式,从语言翻译到内容创作,这些模型正在塑造着一个全新的信息时代。
然而,尽管这些技术在公众视野中无处不在,但是在垂直细分领域,AI技术的发展又带来了怎样改变,它们的影响和潜力尚未被广泛理解。
本文以“四大顶级医学期刊”之一的《柳叶刀》上今年以来的发布的AI相关技术文章为视角,带大家一探AI在医学领域的应用和突破。
疾病预测
1. CaRi-Heart AI技术:提前10年预测致命心脏疾病
英国CaristoDiagnostics公司在《柳叶刀》上发表了《无阻塞性冠状动脉疾病患者的炎症风险和心血管事件:ORFAN多中心纵向队列研究(TheLancet·PublishedOnline)》,揭示一项具有里程碑意义的临床研究结果。
冠状动脉计算机断层血管造影(CCTA)是胸痛的一线检查,用于指导血运重建。然而,CCTA同样也会发现大量没有阻塞性冠状动脉疾病(CAD)的患者,这些患者预后和治疗管理并不明确。
由于动脉中分泌的炎症信号可以驱动血管周围脂肪组织的变化,因此可以反过来,用标准化的脂肪衰减指数(FAI)量化估计冠状动脉炎症的情况。
Cartiso公司开发的CaRi-HeartAI技术可以为患者每条冠状动脉生成FAI评分,并运行AI-Risk算法计算得出患者未来8年发生致命心脏时间的风险。
本研究数据包括英国八家医院的40,091名连续患者,这些患者接受了临床指征的CCTA检查,随访时间中位数为2.7年,随访期间未出现MACE(即心肌梗死、新发心力衰竭或心源性死亡)。并在两家医院随访时间最长(中位数7.7年)的3,393名连续患者中评估了FAI评分在存在和不存在阻塞性CAD时的预后价值。
AI-Risk算法结合了FAI评分、冠状动脉粥样硬化的程度(如果有)以及患者的传统风险因素,能够有力地预测10年内的心脏死亡率和MACE,无论是否存在冠状动脉粥样硬化。
在对744名参与者进行的前瞻性真实世界评估调查中,临床护理团队使用AI-Risk分类后,调整了45%的患者的管理建议,CaRi-HeartAI技术的使用让医生发现传统指标不能发现的风险。
CaRi-HeartAI技术发现了超出当前临床风险分层和CCTA解释的炎症风险,特别是在没有阻塞性CAD的患者中。CaRi-Heart将这些信息整合到预测算法中,实现作为传统风险因素(常规临床CCTA解释、钙化评分和斑块量化)之外的补充。
2. 急性白血病AI预测:预测准确率达99.7%
Vincent Alcazer团队基于来自六所独立法国大学医院被诊断患有AML、APL或 ALL的1410名18岁或以上的患者。
在初步疾病评估时收集了 22 个常规参数;两个数据集中缺失值超过 25% 的变量未用于AI-PAL模型训练,因此最终纳入了 19 个参数。
急性白血病是一种危及生命的血液系统癌症,其特征是转化的未成熟造血细胞浸润血液和骨髓。
及时准确地诊断三种主要的急性白血病亚型(即急性淋巴细胞白血病[ALL]、急性髓细胞白血病 [AML] 和急性早幼粒细胞白血病 [APL])对于指导初始治疗和预防早期死亡至关重要。
AI-PAL对APL、ALL和AML的自信预测准确率为99.7%,对ALL和AML的总体预测准确率为98.8%,对APL、ALL和AML的总体预测准确率为96.1%,对ALL和AML的总体预测准确率为86.3%。
疾病检查
1. 颅内动脉瘤AI检测:98.8%的真正阳性动脉瘤病例可以通过AI模型检测到
南京大学医学院附属金陵医院(东部战区总医院)张龙江教授团队联合徐州医科大学胡春峰教授团队、香港大学俞益洲教授团队和北京深睿人工智能实验室等多家单位合作开展的用于中国CT血管成像颅内动脉瘤检测的深度学习模型研究。
他们也于《TheLancet·DigitalHealth》发表了《中国CT血管造影图像颅内动脉瘤检测的深度学习模型:一项分步、多中心、早期临床验证研究》。
颅内动脉瘤是一种常见的脑血管病,全球人口发病率为3.2%,我国发病率为7.0%。
动脉瘤破裂是蛛网膜下腔出血的主要原因,动脉瘤性蛛网膜下腔出血的病死率高达50%。由于颅内动脉瘤体积相对较小且颅内血管复杂,在常规临床实践中经常被忽视或误诊。
在一项CTA研究中,小动脉瘤(<5毫米)的漏诊率高达40%。鉴于潜在动脉瘤性蛛网膜下腔出血的致命风险,有必要采取其他方法来降低CTA的诊断变异性。
团队采用来自中国八家医院的14,517名患者的16,546张头颈部CTA检查图像开发了一个深度学习模型,使用900例经数字减影血管造影验证的CTA病例(检查)图像对AI模型进行外部验证,并与24名临床医生的表现进行比较。
AI模型的患者级敏感度(0.943)高于临床医生(0.658)。AI模型的特异性(0.852)与临床医生的特异性(0.852)没有差异。三家参与医院也显示出了类似的结果。
接下来,作为进一步的外部验证,一项多读者多案例研究招募了48名临床医生,以单独审查298例经数字减影血管造影验证的CTA病例。
在多读者多案例研究中,借助AI模型的临床医生的AUC(0.878vs0.795)和加权替代自由反应ROC下面积(0.865vs0.765)均高于临床医生的独立诊断。在所有四个临床医生亚组中都观察到了相似的结果。
然后,一项随机开放标签对照研究招募了48名临床医生,以评估该AI模型的接受度和性能。AI辅助组的临床医生获得的AUC(0.858)明显高于对照组的临床医生(0.789)。AI辅助组的患者级敏感度高于对照组(0.801vs0.660)。
最后,该模型在1562个真实临床CTA病例中进行了前瞻性部署和验证。
在初步诊断中,8名放射科医生报告了1575次CTA检查中1562个动脉瘤相关阳性结果中的126个(8.1%)。在审查AI结果后,最终报告了1562个阳性结果中的203个(13.0%),共有82个新的阳性结果来自临床医生和AI,5个新的阴性结果。
在审查AI结果后,放射科医生的AUC、患者水平敏感度、病变水平敏感度和阴性预测值从0.787提高到0.909,0.59提高到0.82,0.549提高到0.764,以及0.959提高到0.979。新发现的动脉瘤的中位大小为3.1毫米(IQR2.6–3.6)。
单独的AI模型具有98.8%的高灵敏度、81.2%的特异性和99.8%的阴性预测值。
数据显示,在AI辅助策略中,只有18.2%的病例需要对其诊断进行双重检查,其中98.8%的真正阳性动脉瘤病例可以通过AI模型检测到。
2. 心衰诊断:AI效率优于人工
奥地利维也纳医科大学心内科与核医学科联合主导一套AI系统,旨在论证由AI进行心衰诊断的影响,并于《TheLancet·DigitalHealth》上发表了《人工智能辅助胶囊内镜检查对疑似小肠出血的诊断:一项多中心前瞻性研究》。
心脏淀粉样变性可通过使用骨亲和示踪剂的闪烁显像术非侵入性地确诊,但视觉评估具有主观性,可能导致误诊。
AI 技术应用:
本次研究,收集到了16241个患者的19401个显像数据。共来自4个国家9个中心:奥地利3个,英国5个,中国2个,意大利1个。
数据集包括所有接受前部全身99mTc闪烁显像的患者以及目前用于识别提示心脏淀粉样变性的摄取的所有99mTc标记示踪剂。
使用来自一个中心的数据开发了一种用于检测心脏淀粉样变性相关高级别心脏示踪剂摄取的人工智能系统,并在其余中心进行了独立验证。
通过将人工智能系统的性能与临床专家读者进行比较,以评估观察者间的差异和临床价值。将人工智能系统的诊断性能与一组五名获得委员会认证的核医学医师进行了比较。
多病例多读者研究案例包括从英国队列中随机抽样的100个阳性扫描和100个阴性扫描。五位医师在200例病例中的22例(11%)中意见不一致。临床专家评估员的平均AUC为0.946,平均敏感度为0.893,平均特异度为0.998。
与临床评估员的表现相比,人工智能系统的表现更出色,AUC为0.997,敏感度为0.931,特异度为1.000。
AI模型预测的结果可作为总死亡率的独立预后因素(HR:1.44[95%CI1.19-1.74],P<0.0001)。
3. 卵巢癌诊断:低成本、易获取且准确的辅助诊断工具
中山大学肿瘤防治中心妇科刘继红教授团队,联合南方医科大学、华中科技大学同济医学院附属同济医院、浙江大学医学院附属妇产科医院的合作者团队在《The Lancet Digital Health》发表《使用实验室检验的人工智能模型准确诊断卵巢癌:一项中国的多中心、回顾性队列研究》。
该研究针对卵巢癌目前早期诊断困难、缺乏有效肿瘤标志物的困境,研究团队基于常规体检中的实验室检验构建了卵巢癌诊断人工智能融合模型,为卵巢癌提供了一种低成本、易获取,且高准确率的辅助诊断工具,有望助力卵巢癌的精准防控及早期诊断。
卵巢癌是最致命的妇科恶性肿瘤。由于缺乏有效的生物标志物,卵巢癌的及时诊断非常困难。
在这项多中心回顾性队列研究中,采用中国三家医院的患有或未患有卵巢癌的女性的98项实验室检查和临床特征。
使用基于多标准决策的分类融合(MCF)风险预测框架建立了一个模型,该模型结合了20个AI分类模型的估计值,以形成为卵巢癌诊断开发的综合预测工具。该工具在内部验证集(3,007人)和两个外部验证集(5,641人和2,344人)上进行了评估。主要结果是该模型在识别卵巢癌方面的预测准确性。
在使用来自三个验证集的实验室检测时,MCF模型在卵巢癌预测方面始终取得令人满意的表现。
MCF模型在区分卵巢癌患者和非卵巢癌患者方面表现出较高的预测效力,内部验证集的AUC为0.949。第一个外部验证集的AUC为0.882,第二个外部验证集达到 0.884。MCF还表现出比七种竞争方法更优越和更稳定的性能,尤其是在AUC和灵敏度方面。
该模型提供了一种低成本、易于获取且准确的卵巢癌诊断工具。所包含的实验室检测有助于卵巢癌患者的特征分析,可以为卵巢癌的发现提供决策支持,尤其是在常规健康检查或妇科肿瘤临床经验有限的基层医疗机构中。
风险评估
1. 手术前风险评估:心电图深度学习预测术后死亡率
来自美国国家心肺血液研究所进行的一项关于心电图与术后死亡率的研究,实现通过AI分析心电图来更好的预测患者术后死亡率,并于《TheLancet·DigitalHealth》上发表了《心电图深度学习预测术后死亡率:模型开发和验证研究》。
AI技术应用:
本研究采用美国加利福尼亚州洛杉矶市雪松西奈医疗中心的一组术前患者数据(这些患者均有心电图(ECG)),我们开发了一种深度学习算法,利用波形信号来区分术后死亡率。
我们将患者(8:1:1)随机分成子集,进行训练、内部验证和最终算法测试分析。使用保留测试数据集和两个外部医院队列中的受试者工作特征曲线下面积(AUC)值评估模型性能,并与已建立的修订心脏风险指数(RCRI)评分进行比较。
应用于术前心电图(ECG)的深度学习方法可以提供更多信息,从而改善术后死亡结果的辨别能力并改进当前的术前风险分层工具。
PreOpNet是一种深度学习算法,它利用ECG波形信号来增强术后死亡结果的辨别能力,其性能已在三个独立的医疗保健系统中进行了评估。
心电图包含大量可辅助术前风险分层的信息,使用深度学习对心电图进行评估可以比使用已建立的修订心脏风险指数更好地区分术后死亡率。
小结
当前,人工智能在医学研究中正经历飞速发展,深刻改变着医疗领域的面貌。AI不仅在药物研发领域加速新药发现流程,减少成本,同时也直接深入到医疗一线诊断环节中去。
从今年的《柳叶刀》及其子刊上的文章可以看到,AI技术在医学影像分析上的应用尤为显著,提高了诊断速度与精确度,特别在肿瘤学、心血管疾病等多个专科领域实现了辅助诊断、个性化治疗方案设计与疾病风险评估的突破。
同时,通过分析电子病历和遗传数据,促进了个性化医疗和精准治疗的发展。随着算法的不断精进和数据集的扩大,AI在医学研究中的潜力正逐渐变为现实,引领医学向更精准、高效、个性化的未来迈进。