JCO「手把手」教你开展真实世界研究
JCO「手把手」教你开展真实世界研究
真实世界数据(RWD)是与患者健康状况相关的数据,并在提供医疗保健时定期收集,可以提供癌症全程管理及结局相关的关键性证据。近年来,美国临床肿瘤学会(ASCO)系列期刊收到越来越多的 RWD 相关研究稿件;但遗憾的是,《临床肿瘤学杂志》(JCO)收到的大多数研究稿件要么质量不足以保证审查,要么没有得到审稿人和编辑的出版支持(接受率 <5%)。尽管如此,JCO 的编辑们仍然认为 RWD 和真实世界研究(RWS)对于癌症治疗临床实践和卫生政策具有非常高的价值。本文结合美国 Fred Hutchinson 癌症中心 Scott D. Ramsey 等近期于 JCO 发表的社论及相关文献,总结 RWD 相关概念、意义及质量控制等问题。
RWD、RWS、RWE 的定义
真实世界数据(real world data,RWD)
- 美国食品药品监督管理局(FDA)对 RWD 的定义:与患者健康状况有关的和/或日常医疗过程中收集的各种来源的数据。
- 欧洲药品管理局(EMA)对 RWD 的定义:从传统临床试验以外的各种来源定期收集与患者健康状况或医疗服务提供相关的数据。
- 中国国家药品监督管理局(NMPA)对 RWD 的定义:与患者使用药物以及健康状况有关的和/或来源于各种日常医疗过程所收集的数据。
真实世界证据(real world evidence,RWE)
- FDA 定义的 RWE:通过分析 RWD 而产生的、与医疗产品的使用及潜在获益或风险相关的临床研究证据。
真实世界研究(real world study,RWS )
- RWS 是指在真实世界环境下收集与患者有关的数据(RWD),通过分析,获得医疗产品的使用价值及潜在获益或风险的临床证据(RWE)的这一过程。
RWD、RWS、RWE三者关系逐步递进,先有RWD,再有RWS,最后升级为RWE。RWS作为一个整体性的概念,代表了从收集真实数据到形成真实世界证据的过程。
开展 RWD 和 RWS 的意义
长期以来,随机对照试验(RCT)一直被认为是干预性研究的金标准,但其本身存在一些局限性:RCT 的研究对象都是按照入组及排除标准严格筛选的,不能代表实际患者情况;RCT 的外部真实性差,结果外推受限;RCT 的执行难度大,可行性差等。
RWS 中的真实临床医疗环境与 RCT 中的标准相差很大,理想的 RCT 入组条件以及干预措施很难满足真实世界中遇到的诸多问题。
相对于 RCT,RWS 有如下优势:
- 受试病例的入选标准可以相对较宽泛;
- 干预措施可以使标准或非标准的,更能够满足真实临床实际需要;
- 干预措施可更加灵活,可设置更多的治疗标准;
- RWS 对干预措施的评价不仅仅局限于疗效及安全性,可得到更多的试验信息;
- 随访数据主要依靠日常诊疗记录及健康数据。
图 1:不同研究对 RWD 的依赖;来源:参考文献 1
RWD 的主要来源及局限性
RWD 的主要来源通常分为管理数据库、疾病登记、电子病历、患者生成的数据(例如调查)以及可穿戴设备和移动设备生成的数据。
其中许多数据资源通过各种方法链接在一起,以促进随着时间和空间的推移更丰富、更深入地了解健康和医疗保健。
研究人员和分析师现在正在利用这些多样化的数据库进行前所未有的研究,包括描述疾病模式、医疗保健服务和相关患者结果的研究;比较医疗治疗的益处和风险;报告患者的经历和行为;并阐明医疗服务提供流程、医疗成本、质量缺陷以及卫生系统结构的可变性。
RWD 在具有巨大优势的同时也存在局限性,即在现实世界数据库中捕获的内容反映了观察到的经验、偏好和患者、提供者和医疗保健本身的偏见,仅部分解释了可能影响这些结果的因素。
因此,从 RWD 的使用和分析中产生的临床证据受到重要的偏见和局限性的影响。在对这些发现作出临床或政策推论之前,必须在概念上和方法上适当地承认和解决这些偏见和局限性。
RWD 的要素和质量衡量标准
从广义上讲,现实世界的数据库包含结构化、非结构化和派生变量。结构化变量提取及处理相对比较方面。许多 RWD 来源,包括大部分电子健康记录(EHR)和患者报告数据库的组成部分,都是由非结构化数据组成,即不以可直接分析的标准方式记录的信息。为便于分析,非结构化数据必须转换为结构化格式。
表 1:RWD 的要素和质量衡量标准;来源:参考文献 2
将非结构化数据转换为结构化数据的过程至关重要,因为这个过程最常发生错误和偏倚。另外,派生变量的处理对 RWD 的质量也极为重要。因此,JCO 对 RWD 的质量提出以下要求:
RWD 目的适用性
目的适用性是指数据与特定研究问题的适用性。组成部分包括可靠性和与决策环境的相关性。数据记录或处理的不准确、整合相关信息的延迟或临床相关信息的不全面捕获可能会损害数据可靠性。目的适用性的另一个组成部分是每个研究变量的数据完整性。
例如,许多源自电子健康记录(EHR)数据库的报告声称具有患者基线的体能状态数据,但事实上,由于临床医生没有记录,该变量经常缺失。此外,不同受试者的长期随访往往不完整或不一致。使用此类数据的研究应明确报告影响可靠性和准确性的纳入/排除标准和数据采集细节、关键变量的数据缺失(以及缺失的影响),并区分缺乏检查和缺乏结果。
RWD 数据来源
数据来源通过描述以下内容来记录数据的可信度:
- 数据特征
- 收集、整理、转化
- 覆盖范围
- 治理使用原则
第一个组成部分是数据特征,描述数据来源以及指定在构建分析数据集之前如何整理和转换源数据的数据管理协议。
第二个组成部分是提供有关数据收集、管理和转化的详细信息。要素包括数据收集的初始目的、数据收集的方法和设置、描述数据模型和数据字典的数据规范文档、数据处理和质量管理。
第三个组成部分是数据覆盖范围必须考虑患者如何进出数据库以及如何在分析中考虑这一点。此外,还应注意地理覆盖范围和涵盖的时间段,以及在队列识别或群体识别中做出的决定或假设对外部普遍性造成的潜在威胁。
最后,数据治理使用原则要提供相关信息,说明管理数据二次使用的法律和法规的措施、与数据供应商的任何相关协议以及机构审查委员会的批准,以及遵守人类受试者机密性和安全性的标准保护和隐私。
RWD 的透明度
在描述数据的目的适用性和来源之后,必须详细说明分析方法,并保证假设、潜在偏差和局限性的方法学完全透明。这一点对于 JCO 的统计编辑和审稿人来说尤其重要,他们将重点关注偏差和不确定性的潜在来源以及在分析中适当考虑这些因素的程度;与实验性研究相比,这些方法细节应该更加深入,对于评估观察性研究的严谨性至关重要。
JCO 较为感兴趣的 RWD 研究
除了用于分析的数据和方法的质量之外,主题和研究结果也是杂志感兴趣的重要方面。总体而言,可直接为临床实践或实践政策提供信息的 RWD 研究将具有更高的发表优先级。当然,这些一般规则也有例外。RWD 研究具有新颖的见解,在这些领域中既有意义又可操作的发现也是令人感兴趣的。
表 2:JCO 较为感兴趣的 RWD 研究类型;来源:参考文献 2
总之,RWD 及其产生的证据已经以有意义的方式影响了癌症治疗实践和政策,从而影响了治疗策略及患者结局。更多可以识别、整理和链接的 RWD 资源不断涌现将促进并加深我们对于健康、医疗保健服务和结果的理解。
重要的是,我们需要负责任地使用这些数据,对其进行适当的分析,并充分关注适合目的、出处和治理。
JCO 鼓励作者考虑肿瘤学中具有影响力的 RWE并关注以下方面:
- 超越观察以确定潜在的作用机制;
- 为临床医生提供可以指导其实践的见解;
- 告知需要干预的重点人群的识别;
- 明确研究结果是否代表关联或因果关系;
- 不仅仅是简单地描述护理方面的差距,而是设计和实施干预措施,以改善患者护理和结果并减少有据可查的差异。
参考文献
[1] Concato John, Corrigan-Curay Jacqueline. Real-World Evidence - Where Are We Now?[J]. N Engl J Med, 2022, 386: 1680-1682.
[2] Scott D. Ramsey, et al. Real-World Database Studies in Oncology: A Call for Standards. JCO 0, JCO.23.02399.