资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大语言模型LLMs在医学领域的最新进展总结（4000字全面综述）

创作时间:

作者:

@小白创作中心

大语言模型LLMs在医学领域的最新进展总结（4000字全面综述）

引用

CSDN

https://m.blog.csdn.net/2301_76168381/article/details/143714755

大语言模型（LLMs）在医学领域的应用正日益广泛，从辅助诊断到药物研发，从基因组学研究到医患沟通，LLMs正在为医疗行业带来革命性的变化。本文将为您全面介绍LLMs在医学领域的最新研究进展，探讨其带来的机遇与挑战。

医学影像辅助诊断

哈佛大学生物医学信息学助理教授余坤兴团队开发的CHIEF模型，能够对19种癌症进行诊断，检测准确率接近94%。该团队正在与业界合作，希望将CHIEF模型发展为临床辅助诊断工具，并在准备FDA的相关审批工作。

图2 CHIEF 模型概述（来源：Nature，【2】）

美国商业公司Paige研发的病理学基础模型Virchow，能够实现泛癌症检测，在九种常见癌症和七种罕见癌症中，样本级接收者操作特征曲线下面积达到0.95。此外，在训练数据较少的情况下，Virchow也能够实现与生产中的组织特异性临床级模型相似的性能，并在某些罕见癌症变种上超越它们。

哈佛大学医学院研究团队近期开发了一个用于人类病理学切片鉴定的视觉语言通用AI助手——PathChat。该系统通过自我监督学习对来自100万多张切片的图像片段进行预训练，能够从活检切片中正确识别疾病，准确率近90%，超越GPT-4V。

图3 PathChat 的训练和构建过程。（来源：Nature，【4】）

SkinGPT-4，是一个基于多模态大型语言模型的互动皮肤病诊断系统。基于Llama-2-13b-chat大型语言模型，通过52,929 张病理图像及临床概念进行训练。用户可以上传自己的皮肤照片进行诊断。系统自主评估图像，识别皮肤状况的特征和类别，进行深入分析，并提供互动治疗建议。

图4 SkinGPT-4 是一个基于多模态大型语言模型的互动皮肤病诊断系统。（来源：Nature Communications，【5】）

中山大学附属第一医院针对甲状腺结节影像及病理评估的一项实验表明，725 名患者中的 1161 幅甲状腺结节的影像诊断对比，ChatGPT 4.0 和 Bard 显示出显著到几乎完美的内部一致性，与两名高级影像师和一名初级影像师的人机交互策略相当，并超过了仅有一名初级影像师的人机交互策略。

中国学者开发的肺尘病诊断大模型PneumoLLM，开辟了针对数据稀缺的职业病应用LLMs的新范式，通过广泛的实验展示了大模型在诊断尘肺病方面的优越性。

药物开发

浙江大学人工智能医学创新研究院开发了LEDAP模型，利用了基于LLM的生物文本特征编码来预测药物-疾病关联、药物-药物相互作用和药物-副作用关联。LEDAP 在与其他流行的 DBA 分析工具相比时展示了其显著的竞争力。

哈佛医学院研究人员开发的TxGNN 模型，在涵盖 17,080 种疾病的疾病机制和 7,957 种药物的作用机制的医学知识图谱上进行训练，旨在解决现有药物的新应用，为治疗选择有限且分子数据稀缺的疾病识别候选药物。

图5 TxGNN：该几何深度学习模型结合了一个庞大而全面的生物知识图谱，以准确预测任何给定疾病-药物对的适应症或禁忌症的可能性，适用于老药新用途的开发。（来源：Nature Medicine）

中国科学技术大学联合微软研究院，开发了 TamGen–一种采用类似 GPT 的化学语言模型的方法，能够实现靶向感知的分子生成和化合物精炼。将 TamGen 集成到药物发现流程中，并识别出 14 种对结核病 ClpP 蛋白酶表现出显著抑制活性的化合物，其中最有效的化合物的半最大抑制浓度（IC50）为 1.9 μM。

理解化学干扰的转录响应对于药物发现至关重要。中科院计算技术研究所联合合作者，开发了PRnet深度生成模型，能够预测从未在大规模和单细胞水平上进行实验干扰的新化学扰动的转录响应（transcriptional response）。PRnet 使基因水平的响应解释和基于基因特征的计算药物筛选成为可能。PRnet 生成了一个大规模的扰动特征整合图谱，涵盖 88 个细胞系、52 种组织和各种化合物库。并成功推荐了 233 种疾病的药物候选者。

化疗和靶向治疗中，药物耐药性是一个关键挑战。佛罗里达大学团队提出的DrugFormer 模型，整合了序列化基因标记和基于基因的知识图谱，以高精度预测单细胞水平的药物耐药性。来自不同癌症类型的全面单细胞数据分析突显了 DrugFormer 在识别耐药细胞和揭示潜在分子机制方面的有效性。

图6 DrugFormer 模型的整体框架。（图源：Advanced science）

基因组学

布朗大学团队开发了多模态深度学习模型 EPBDxDNABERT-2。使用包含 690 个 ChIP-seq 实验结果的染色质免疫沉淀测序（ChIP-Seq）数据进行训练， EPBDxDNABERT-2 显著提高了 660 多个 TF-DNA 的预测，揭示了在全基因组关联研究中发现的与疾病相关的非编码变异的机制。

图7 EPBDxDNABERT-2的构建过程。

受大型语言模型的启发，北京理工大学邵斌等开发了一种用于基因组的长上下文生成模型megaDNA。模型的基础能力，包括预测必需基因、遗传变异效应、调控元件活性以及未注释序列的分类。此外，它能够生成长度达到 96 K 碱基对的 de novo 序列，这些序列包含潜在的调控元件和具有噬菌体相关功能的注释蛋白。该生成基因组模型代表了全功能基因组从零开始设计的第一步。

Memorial Sloan Kettering癌症中心报告了一种基于遗传，而非组织病理学数据训练的人工智能算法的构建，该算法能够准确分类浸润性乳腺癌（ILCs）并揭示 CDH1 失活机制，为开发应用于全切片图像的诊断人工智能模型提供了正交真实数据利用的基础。揭示了与强基因型-表型相关性相关的遗传改变可用于开发应用于病理学的人工智能系统，从而促进癌症诊断和生物学发现。

肽在许多生物活动中发挥着关键作用，是药物设计中有前景的候选者。然而，准确预测蛋白质-肽结合亲和力仍是一项挑战。针对这一问题，北京工业大学团队开发了一种基于卷积神经网络和多头注意力的预测模型 PepPAP，该模型仅依赖于序列特征。PepPAP可用于广泛基因组蛋白-肽结合亲和力预测，并有潜力为基于肽的药物设计提供有价值的见解。

其他

对于肌萎缩侧索硬化症（ALS）患者来说，眼动追踪技术使用户能够利用键盘，输入文本以进行语音输出和电子消息传递。但是效率仍远低于语言交流。谷歌及合作者团队利用微调的LLMs和对话上下文，开发了一种名为 SpeakFaster 的文本输入用户界面，将高度缩写的英语文本扩展为所需的完整短语，具有非常高的准确性。与传统基线相比，文本输入速度显著提高（29-60%）并节省了运动动作。

图8 SpeakFaster 用户界面。（来源：Nature Communications）

医患沟通

2024年7月，中国医学科学院基础医学研究所龙尔平团队与耶鲁大学陈庆宇合作，基于35418例真实导诊对话信息形成的知识库作为训练数据，构建了SSPEC导诊大模型。相比人类导诊，SSPEC在事实性、安全性、共情能力均展现出明显优势，在真实应用场景中，降低了11.2%的重复沟通和5.4%的医患冲突比例。