问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

机器学习模型对临床医生术后并发症预测的影响:围术期ORACLE随机临床试验

创作时间:
作者:
@小白创作中心

机器学习模型对临床医生术后并发症预测的影响:围术期ORACLE随机临床试验

引用
MedSci-临床研究与学术平台
1.
https://m.medsci.cn/article/show_article.do?id=b94e85614369

机器学习在医疗领域的应用日益广泛,尤其是在临床决策支持方面展现出巨大潜力。然而,一项最新研究对机器学习在术后并发症预测中的作用提出了新的见解。

这项单中心、前瞻性、随机临床试验评估了机器学习模型对临床医生术后并发症预测的影响。研究共纳入5071名患者,由89名临床医生进行评估。主要结果为临床医生预测死亡率和急性肾损伤(AKI)的接受者操作特征曲线下面积(AUROC),并比较辅助评估组和非辅助评估组之间的AUROC。

研究方法

研究在美国密苏里州圣路易斯市的巴恩斯-犹太医院进行。纳入标准包括:年龄≥18岁;在巴恩斯-犹太医院接受麻醉服务的外科手术患者;手术时间安排在每周一至周五的07:00至16:00之间。

机器学习模型干预包括预测术后30天内任何原因导致的死亡和AKI。模型使用来自同一机构的回顾性外科患者队列训练,并定期更新。预测信息包括每种并发症的预测风险、预测风险随时间的变化图表以及每个输入特征对风险的贡献比例。

研究结果

研究共分析5071名患者(平均(范围)年龄:58岁(18-100)岁;52%为女性),由89名临床医生进行评估。98名患者(2.2%)在术后30天内死亡,450名患者(11.1%)发生AKI。

与非辅助组相比,辅助组的临床医生预测更符合模型(死亡率:加权kappa 0.75 vs 0.62,均值差异为0.13 [95%CI 0.10-0.17];AKI:0.79 vs 0.54,均值差异为0.25 [95%CI 0.21-0.29])。死亡率预测在辅助组(AUROC 0.793)和非辅助组(AUROC 0.780)之间相似(均值差异:0.013 [95% CI -0.070至0.097];P=0.76)。AKI预测在辅助组的AUROC为0.734,非辅助组为0.688(均值差异0.046 [95% CI -0.003至0.091];P=0.06)。

结论

机器学习辅助并未提高临床医生的预测表现。未来仍需要进一步研究以阐明机器学习在实时围术期风险分层中的作用。


图1. TECTONICS试验与ORACLE试验的关系。ORACLE包括了一个TECTONICS子集中患者。CA3,临床麻醉第三年(住院医师培训的最后一年);CRNA,注册麻醉护士;ML,机器学习。


图2. CONSORT流程图。AKI,急性肾损伤;ML,机器学习。


图3. 临床医生对术后死亡预测的分布。通过治疗分配(辅助组vs 非辅助组)和ML预测进行分层。蓝条表示临床医生预测与分类ML预测相匹配的病例。ML,机器学习。


图4. 临床医生对术后AKI预测的分布。通过治疗分配(辅助组vs 非辅助组)和ML预测进行分层。蓝条表示临床医生预测与分类ML预测相匹配的病例。ML,机器学习。


图5. 接受者操作特征曲线下面积。(a)术后30天内死亡预测。(b)术后AKI预测。曲线下面积AUC;ML,机器学习。

讨论

在这项单中心随机临床试验中,临床医生在有无机器学习模型预测算法辅助的情况下,对术后死亡率的预测均表现出较高的区分度。对于急性肾损伤(AKI)的预测,临床医生表现出中等的区分度,并且机器学习辅助组和非辅助组之间的区分度差异没有统计学意义。

研究发现机器学习模型在辅助组中未能显著提高临床医生的预测表现。尽管机器学习对临床医生预测结果有影响,但这并未转化为死亡率或AKI预测的准确性提升,表明机器学习在实时围术期风险评估中的作用仍需进一步研究。

重要性

这项研究揭示了机器学习在医疗决策支持中的复杂性。虽然机器学习模型在某些情况下可以提供准确的预测,但将其整合到临床实践中并不一定能提高医生的判断能力。这为未来开发和应用医疗人工智能系统提供了重要启示。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号