问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

观察性研究中的缺失数据处理:以COVID-19心肌损伤研究为例

创作时间:
作者:
@小白创作中心

观察性研究中的缺失数据处理:以COVID-19心肌损伤研究为例

引用
CSDN
1.
https://blog.csdn.net/weixin_44693403/article/details/136860309

数据的缺失会对研究结果的真实性产生巨大影响,例如增加偏倚风险、降低样本代表性、影响统计能力等。尤其是在观察性研究和临床试验中,数据完整性直接关系到研究的效度与信度。因此,学会根据具体情况选用合适的统计方法来应对数据缺失问题,是研究者必须掌握的技能。本文通过一个具体的研究案例,详细介绍了观察性研究中缺失数据的处理方法,特别是多重插补法的应用。

观察性研究包括横断面研究、队列研究和病例对照研究。数据缺失在观察性研究中普遍存在,其原因可能包括受试者中途退出、数据采集错误、填答不完整等。

案例分享

2021年2月,美国约翰霍普金斯大学学者在《Circulation》(一区,IF=37.8)发表题为《Myocardial Injury in Severe COVID-19 Compared With Non–COVID-19 Acute Respiratory Distress Syndrome》的研究论文。

研究背景与目的

研究旨在比较重症COVID-19患者与非COVID-19 ARDS患者的心肌损伤患病率和结局。研究纳入了2020年3月15日至6月11日期间来自5家医院的COVID-19插管患者,并评估了肌钙蛋白水平。研究还比较了ARDS中心肌损伤队列研究的患者,并进行了生存分析,主要结局是与心肌损伤相关的院内死亡。此外,还进行了线性回归,以确定与COVID-19心肌损伤相关的临床因素。

研究结果

  1. 重症COVID-19患者心肌损伤的患病率和死亡情况
  • 在COVID-19插管患者中,总死亡率为36.2%。
  • 肌钙蛋白低于正常上限(ULN)的插管COVID-19患者死亡率为22.7%,肌钙蛋白水平越高死亡率越高,肌钙蛋白水平最高的患者死亡率高达61.5%(P<0.001)。


重症COVID-19患者的Kaplan-Meier生存曲线显示,肌钙蛋白水平与生存率显著相关。

Cox回归结果显示,在未经调整的模型中,肌钙蛋白阳性与死亡风险增加>2倍相关(风险比,2.31 [95% CI 1.47-3.65]);与低于ULN的肌钙蛋白相比,肌钙蛋白水平最高与死亡风险相关>3倍(风险比,3.17 [95% CI,1.80-5.56])。但调整多个变量后,心肌损伤与死亡率的相关性不再具有统计学意义。

  1. 重症COVID-19患者与ARDS患者心肌损伤和死亡的差异
  • COVID-19和ARDS之间的心肌损伤发生率相似:COVID-19组为51.0%,而ARDS组为49.6%。
  • COVID-19组的死亡率高于ARDS组:36.2% vs 26.5%(P=0.007)。

K-M曲线和交互作用分析显示,在未经调整的分析中,肌钙蛋白阳性的COVID-19患者观察到的死亡率最高(P交互作用=0.012)。但调整年龄、性别、肌酐、胆红素、Pa o 2/F io 2比值和血管加压药使用后,交互作用不再显著(P交互作用=0.082)。

统计学方法

  1. 缺失数据处理
  • 由于JH-CROWN注册表中的数据来自电子医疗记录,因此并非所有协变量的数据都是完整的。研究使用多重插补方法来解决缺失数据问题,通过链式方程和50个插补进行多重插补。使用“mi estimate”命令在Stata中进行分析,该命令使用Rubin公式组合多重插补的数据集。结果显示,多重插补和没有多重插补的结果相似,因此使用多个估算数据集来报告结果。
  • 白细胞介素-6和纤维蛋白原具有高水平的缺失,因此不进行估算。为了进行描述性分析,在感兴趣的独立变量(肌钙蛋白类别、死亡和新冠肺炎状态)中,使用连续变量的线性回归和分类变量的logistic回归进行比较。
  1. 生存分析

使用STATA 15进行分析,P值<0.05被认为具有统计学意义。

多重插补法解读

多重插补法的基本步骤包括:

  1. 插补 imputation
  2. 分析 analysis
  3. 合并 pooling

根据文章统计分析中关于缺失数据的内容,研究详细介绍了多重插补的三个步骤,包括使用Stata软件的具体命令和Rubin's rules公式整合插补结果的方法。

结论

本文通过一个具体的研究案例,详细介绍了观察性研究中缺失数据的处理方法,特别是多重插补法的应用。研究结果表明,虽然重症COVID-19患者的心肌损伤与死亡率之间存在显著相关性,但在调整多个变量后,这种相关性不再具有统计学意义。此外,研究还发现COVID-19组的死亡率高于ARDS组,但这种差异可能与其他因素有关,而非单纯由肌钙蛋白水平造成。

这篇文章对于从事医学研究的读者具有较高的参考价值,特别是对于如何处理观察性研究中的缺失数据问题提供了详细的案例分析和方法指导。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号