国家呼吸系统疾病临床研究中心发布流感预测模型:多源数据融合提升预测准确性
国家呼吸系统疾病临床研究中心发布流感预测模型:多源数据融合提升预测准确性
近期,中疾控和各地疾控反映当前流感态势开始波动,南北方流行趋势出现明显差异。为应对这一挑战,国家呼吸系统疾病临床研究中心PI杨子峰研究员团队构建了以临床监测库为核心、涵盖九大数据库的多源异构数据库,并开发了一种改良的流感指数构建方法。通过综合考虑流感实验室阳性率和流感样病例占比两项关键指标,构建了一个多维度的流感流行指数,更精确地反映流感的实际传播情况。
数据库介绍
本研究以临床监测库为核心构建三大类九大库的多源异构数据库,其中包括线上调研库、病原学文献成果库、及疾控公开数据库、第三方监测机构核酸检测数据库、药物销量数据库、舆情数据库、气象与环境数据库(图1)。该库从数据采集到精准应用进行全流程管理体系并规范化标准流程。实现数据持续更新与长期积累,为疫情防控提供全面支持。核心库为临床监测数据库,涵盖了广泛的医院和样本,覆盖范围广,病原种类丰富。线上调研库通过自主研发的程序,持续采集公众健康数据,包括症状、确诊信息、治疗方式等(图1)。其他库包括舆情数据、药物销量数据、病毒学文献、第三方检测数据等。
预测模型介绍
该流行预测模型的核心为优化传播动力学模型SEIRS趋势预测和自适应傅里叶分解方法(AFD)-长短期记忆网络模型(LSTM)波动预测两大部分。流感预测选择优化的传播动力学SEIRS模型进行主要趋势分析预测,充分考虑群体免疫保护力等因素。随后,运用AFD-LSTM波动预测算法进行精准全面的预测,该算法先采用AFD方法分析多源数据趋势进行特征提取,再运用LSTM对波动进行预测。其中,AFD算法是钱涛教授的原创理论,AFD信号重构算法被称为钱方法,是一种先进的非线性波形分析方法[4],在本模型中起到关键作用。
在得到未来多周的流感阳性率与ILI%后,我们将计算流其转换为流感指数,并将流感指数划分为五个等级:1级、2级、3级、4级和5级,分别对应不同的流感流行程度,具体说明如表1所示。
未来流感指数预测
未来两周的流感指数如表2所示,南北方流感指数均呈现上升趋势。2024年12月23日至2024年12月29日,南方流感指数为2,北方流感指数为3,说明南方地区的流感病人逐渐增多,逐渐进入流行期,处于流感爆发前夕;北方地区的流感病人较多,流感活动较强,处于流感流行期。预计2025年1月6日至2025年1月12日,流感指数将进一步上升,流感感染人数快速增加。
图2南方流感指数预测值与真实值
(来源:https://www.chinacdc.cn/jksj/jksj04_14249/)
图3北方流感指数预测值与真实值
(来源:https://www.chinacdc.cn/jksj/jksj04_14249/)
图4南方流感指数预测混淆矩阵
图5北方流感指数预测混淆矩阵
中心联合多地疾控,基于国家呼吸疾病临床中心病毒分平台建设单位对多种常见呼吸道病原体流行趋势进行分析及预警,旨在为呼吸道感染临床诊治提供最新的流行病学证据。