临床证据分级系统:如何评估医学研究的可靠性
临床证据分级系统:如何评估医学研究的可靠性
在医学研究领域,临床证据的质量和可靠性是评估治疗效果和安全性的重要依据。本文将为您详细介绍临床证据的分级系统,帮助您更好地理解不同研究设计的优劣,并学会如何在众多研究中辨别高质量的证据。
科学证据也分“等级”
科学证据的质量通常取决于其研究设计。因此,研究设计分级的依据是可获得数据的质量,也就是所谓的“证据水平”。1
证据分级模型有多种。2更高等级的证据在质量上不一定更高(例如,一个随机对照试验的执行和报道方式上不一定做到了最佳)。随机对照试验的设计并不适用于所有情况,例如在外科手术、疾病预后或某些公共卫生背景下(由于伦理方面的影响)提供证据;因此,因研究设计导致的证据层级下降并不意味其证据质量就低。2,3
临床证据水平分级
牛津循证医学中心证据水平分级体系认为,除研究设计外,还必须考虑数据质量,例如,设计不佳的随机对照试验提供的证据水平与队列研究相当。2,4
评估证据质量的分级系统
因此,在对定量研究加权时,仅依据研究设计是不够的;对分级系统中同一水平的证据质量进行评估也同样重要。当前存在多种模型,可对证据质量进行分级,有助临床实践中的建议和决策。2
GRADE(Grading of Recommendations, Assessment, Development and Evaluations,证据质量和推荐强度分级系统)是一个用于发掘和呈现证据要点的透明框架,并为证据质量分级和临床推荐提供了一种系统方法。5, 6, 7
“分级”是在级别上而不是在研究级别上对证据进行分级,并为证据的确定性提供了透明可重现的框架,8“考克兰评价(Cochrane Reviews)”就是采用了这种分级系统。
可点击此处阅读更多有关“分级系统及其如何被用于评估益生菌的证据”的信息。
作出有信心的推荐
在评价科学和临床证据时,证据水平非常重要。通常,随机对照试验和荟萃分析提供最佳证据。
随机对照试验(RCT)是更严格的评价健康干预产生有效性的科学方法,医疗专业人士于病置推荐病人使用RCT证据支持的产品。重要的是要记住“不是所有的4级证据都应该被忽略,也不是所有的1级证据都应该被当作事实进行接受”。证据的级别仅仅是一个参考,因此读者在解读研究结果时需保持谨慎。2
1级证据
随机对照试验是对比不同实验组以建立特定干预措施有效性或效能的试验性研究。随机对照试验至少包括一组试验治疗和一组对照治疗,试验组和对照组的招募入组和后续随访同时进行。受试者通过随机过程选择接受的治疗。
系统性评价结合了来自随机对照试验的相关证据,整合从所有纳入的研究中提取的数据,已形成更综合的证据总结。
荟萃分析是一种使用定量方法来总结结果的系统性评价。
2级证据
队列研究是一种观察性研究,鉴别参与者是否暴露于某一特定风险因素。然后对参与者进行跟踪,以确定他们是否患所研究疾病。
系统性评价合并了来自相关队列研究的证据。整合从所有纳入的研究中提取的数据,以形成更综合的证据总结。低质量的随机对照试验也属于2级证据。
3级证据
病例对照研究是指选择具有某种临床结局或疾病的患者和一组适当的(通常是匹配的且无此临床结局或未患病的个体)对照组,调查研究对象是否曾暴露于所研究的风险因素。
系统性评价结合了来自相关病例对照研究的证据。整合从所有纳入的研究中提取的数据,已形成更综合的证据总结。
4级证据
病例系列是追踪已知暴露者(例如接受过类似治疗的参与者)的研究。低质量的队列案件和病例对照研究也属于4级证据。
5级证据
专家意见是没有明确的批判性评价的观点或解释。其并非基于生理学、实验研究或“首要原则”。