心狗团队研发世界首个“心电大模型”:面向全人群的自动心电图诊断系统
心狗团队研发世界首个“心电大模型”:面向全人群的自动心电图诊断系统
近日,心狗健康团队在Cell Press细胞出版社期刊Cell Reports Medicine上发表重要研究成果,宣布开发出世界首个“心电大模型”KED。该模型基于80万份患者心电图训练而成,在中国、美国等多个国家和地区的人群中展现出高精准度的诊断性能,为心血管疾病的早期诊断和治疗提供了新的解决方案。
心血管疾病是全球死亡的主要原因,因此早期识别高危人群至关重要。心电图(ECG)因其便捷、经济且无创的特点,每年用于超过3亿人次的检测,是从健康筛查到重症监护等各种临床环境中,用于早期诊断和评估心血管疾病的重要工具。有研究表明,即便是经验丰富的心内科医生,解读复杂的心电图仍然耗时且容易出错。在偏远且医疗资源匮乏的地区,由于专业医生稀缺,提供准确诊断更为困难。人工智能(AI)在心电图诊断中的应用显示出巨大的潜力。研究显示,基于AI的心电图诊断在某些特定疾病的识别上已经超过普通医生。此外,医生使用AI辅助诊断显著提高了判读效率和准确性。然而,由于缺乏高质量的大规模标注数据以及传统深度学习模型架构的限制,导致现有的心电图自动诊断系统大多集中于少数几种特定疾病的诊断。而且这些研究仅针对特定人群进行评估。人群特征的多样性、疾病的广泛性和复杂性,使得现有AI模型在实现通用普适和广泛覆盖各种疾病上面临巨大挑战。因此,为确保AI诊断系统在各种医疗环境中普遍适用,并使心电图诊断不完全依赖于医生的水平,开发一种基于大规模数据训练的高精准度大模型至关重要。
针对上述问题,团队提出了一种知识增强的心电诊断大模型(KED),该模型根据80万份患者的心电图进行训练。KED中首先引入了一个知识增强策略,通过利用大型语言模型来整合心电信号的领域特定知识,从而提高模型的泛化能力和在各种场景中的稳定性。KED的模型架构由四个模块组成:心电信号编码器、医学知识编码器、标签查询网络和分类头。心电信号编码器负责将原始信号编码为特定维度的表示向量,知识编码器则将医学报告或标签文本编码为相应的表示向量。标签查询网络在接收到标签和心电图编码后,输出标签查询结果的编码;分类头根据标签查询结果的编码,输出对应疾病在心电图中存在的概率。此外在训练阶段,团队提出了一种新的对比学习算法——增强信号-文本-标签对比学习(AugCL),将医学文本知识整合到ECG信号学习中,以缓解标签的噪声问题。
KED在包括中国、美国和其他地区的人群中表现出了优异的诊断性能。KED适用于所有年龄组的心电图形态异常、节律异常、传导阻滞、房室肥大、心肌缺血和心肌梗死等各种情况的诊断,例如,房颤诊断的受试者工作特征曲线下面积(AUC)为0.994、灵敏度为0.949、特异性为0.975,左束支传导阻滞的AUC为0.972、灵敏度为0.904、特异性为0.994,前间隔心肌梗死的AUC为0.927、灵敏度为0.740、特异性为0.914,室上性心动过速的AUC为0.928、灵敏度为0.726、特异度为0.911,前外侧壁心肌缺血的AUC为 0.764,灵敏度为0.496,特异度为0.841等。另外,通过与经验丰富的心内科医生在真实临床数据集上的对比,该模型对常见的临床心电图类型均达到了与三甲医院医生相当的诊断性能。总之,这一研究结果表明,KED不受地理、种族、年龄、性别或ECG采集设备差异的影响。它能够在多种场景下诊断心律失常、心梗等各种疾病,对于在医疗资源匮乏和不发达地区进行辅助医生诊断和早期快速精准筛查具有重要的应用价值。
心狗健康团队一直致力于前沿科技成果的转化和落地,为此提出了“智能在端-智慧在云-管控在屏”的理念,这一理念支撑了在智慧医疗和机器健康领域的科研及成果应用。团队最新发布的心电大模型KED是“智慧在云”的核心部分,也就是我们常说的“云医生”。实际上这一套完整的系统已经为六万多人提供心电图快速监测、辅助诊断服务。并被广泛应用于交通运输、建筑、物业、矿业、企业工会、养老院、基层社区和医院等领域。这次发布的心电大模型KED经过我们在中国、美国和其他地区的不同人种,以及所有年龄段人群中的充分验证和评估,在对各种心律失常、心电图形态变异、房室肥大、心肌缺血和心肌梗死的诊断中表现出优越的性能。这为我们进一步地为更广泛的人群提供精准的心电图快速诊断奠定了重要基础。