AI在医学领域:使用眼底图像和基线屈光数据来定量预测近视
AI在医学领域:使用眼底图像和基线屈光数据来定量预测近视
儿童近视已成为全球重大健康议题,其发病率持续攀升且可能带来严重且不可逆转的视力损伤。当前,主要依靠主观临床评估进行预测,存在偏差且资源消耗大。本文介绍了一种基于眼底图像和屈光数据的深度学习方法,通过在中国河南省进行的纵向研究验证,能够高精度预测儿童近视发展轨迹和风险。
方法
核心思想是通过分析眼底图像中与近视进展相关的特征,并结合屈光度数据,预测儿童未来近视的发展轨迹和风险。
图1:系统示意图
a. 系统示意图:系统接收儿童的眼底图像序列,并能够筛选出具有未来近视高风险和快速近视发展的高风险儿童。系统还可以定量预测儿童未来几年的近视发展情况。
b. 数据分段示意图:将儿童连续六年的数据根据已知和预测的年份分类为15个类别,例如,使用2年的眼底序列预测接下来的4年近视发展,每个类别根据已知和预测的年份进一步分为支持数据和测试数据。
c. 儿童人群特征的实际检查:比较原本近视和原本非近视儿童的近视发展,并研究儿童近视发展的数据显示,儿童的近视在五年内发展得非常迅速。
d. 模型示意图:模型使用n年的眼底图像序列和球面等效屈光度(SE)序列进行特征提取和时间序列建模,以预测未来m年的近视情况,并用于创建模型的热图
1.1 数据集
对河南省安阳市 11 所小学的 3408 名一年级学生进行了为期六年的纵向研究,收集了 16,211 张眼底图像和相应的屈光度数据。
1.2 流程
1.2.1数据预处理
为了提高模型的准确性和鲁棒性,研究人员开发了一套图像预处理和增强系统。该系统包括图像裁剪、缩放、缺陷检测和特征增强算法,用于突出眼底图像中的生理特征。
1.2.2模型构建
研究人员设计了一个名为“多年度近视预测网络”(MMPN)的深度学习模型。该模型由编码器和解码器两部分组成。
编码器: 使用基于 ResNet34 架构的卷积神经网络 (CNN) 从单个眼底图像中提取特征。
解码器: 使用基于 LSTM 架构的循环神经网络 (RNN) 分析眼底图像序列中的时间动态信息,并结合屈光度数据,预测未来几年的屈光度发展和近视/高度近视风险。
1.2.3模型训练和评估
使用 Python 1.12.0 和 A5000-24G 显卡对 MMPN 模型进行训练和评估。他们使用了准确率、特异性、灵敏度、ROC 曲线和 AUC 面积等指标来评估模型的预测性能。
1.3模型优势
数据效率高: 仅需一次就诊的数据即可进行预测,节省时间和人力成本。
预测能力强: 能够对近视和高度近视进行短期和长期预测,并提供近视进展的定量轨迹。
预测准确率高: AUC 值分别为 0.944 和 0.995,平均预测误差为每年 0.311D。
可解释性强: 可以通过热力图分析模型关注的区域,发现与近视发展相关的潜在因素和新的生物标志物。
1.4研究局限性
模型的泛化能力: 需要在不同人群中进行测试,以评估模型的泛化能力。
数据集的局限性: 高度近视样本数量较少,可能影响模型的灵敏度。
快速进展近视的预测: 对于快速进展近视的儿童,模型的预测误差可能较大。
实验
2.1 实验结论
预测准确率高:模型预测近视和高度近视风险的 AUC 值分别为 0.944 和 0.995,平均预测误差为每年 0.311D。
与传统的预测方法相比,该方法的准确率和 AUC 值更高。
预测能力强:该方法能够对近视和高度近视进行短期和长期预测,并提供近视进展的定量轨迹。即使只使用一年的数据,模型也能预测未来三年的近视风险,准确率仍然很高。
数据效率高:该方法只需一次就诊的数据即可进行预测,节省时间和人力成本。
可解释性强:热力图分析显示,模型关注的区域主要集中在视盘、黄斑区和视网膜上下方区域,这与高度近视的眼底病变区域一致。这表明模型能够识别与近视发展相关的潜在因素和新的生物标志物。
2.2 结论分析
近视风险预测:模型预测未来一年近视风险的准确率为 87.9%,AUC 值为 0.944。模型预测未来一年高度近视风险的准确率为 99.5%,AUC 值为 0.995。
这表明模型能够有效识别高风险儿童,并预测近视/高度近视的发生概率。
屈光度预测:模型预测未来一年等效球面屈光度的平均误差为 0.311D,R² 值为 0.843。这表明模型能够准确预测儿童未来几年的屈光度发展轨迹。
性别差异:模型在男性和女性儿童中的预测性能没有显著差异。这表明模型对性别没有偏见。
初始近视状态:模型对初始近视儿童未来近视进展的预测误差大于初始非近视儿童,这表明初始近视状态对预测结果有较大影响。然而,使用相对误差进行测量时,两组预测结果的差异可以缩小,因为初始近视儿童的屈光度本身更高。