孟德尔随机化(MR):一种新兴的疾病因果关系研究方法
孟德尔随机化(MR):一种新兴的疾病因果关系研究方法
近年来,孟德尔随机化(Mendelian Randomization,简称MR)作为一种新颖、简便且高效的研究方法,其热度持续攀升。2024年1月,《柳叶刀》子刊Lancet Diabetes Endocrinol杂志发表评论文章,讨论了MR在过去20年中的发展和应用,强调这种方法在疾病因果关联研究中的重要性。本文将为您详细介绍MR的概念、循证等级以及在糖尿病领域中的应用进展。
一、厘清概念:关于MR,轻松了解核心要点
1. MR研究背景及发展历史:我们为什么需要这种新方法?
众所周知,随机对照试验(RCT)是评价因果效应的金标准,但受到伦理学、高成本等因素的制约,很多情况下难以实施。相对而言,观察性研究数据更易获得,也更接近真实世界情况,但存在混杂因素及因果倒置等问题,推断因果往往受限,需借助恰当的因果模型来推断暴露因素(干预)与疾病结局之间的因果关联。
1986年,Katan首次提出:基于等位基因在配子形成时遵循随机分配原则,可用基因型作为待研究中间表型的工具变量来推断其与疾病状态的因果关联。2003年,Smith首次发表MR文章于《国际流行病学杂志》(IJE),正式提出MR的研究框架和研究设计。自此之后的20年间,MR逐渐成为临床科研领域的“新宠儿”,近年来更是热度飙升、备受青睐。
2. 定义:MR为何被称为“天然RCT”?
简言之,MR是一种基于遗传变异的因果推断方法,不用真的开展临床研究,而是利用基因型数据作为桥梁,来探索某一暴露因素与某种结局之间的因果关联。
这就好比在人群中做了一个自然界的随机对照研究,主要基于两个重要假设:首先,个体从父母随机继承的基因变异是固定的,不受后天混杂因素影响;其次,这些基因变异在人群中随机分布,有这个基因和没有这个基因的人其他方面均相似,就相当于一个“天然RCT”。
MR与RCT同为进行因果推断的方法,通过以下对比图可了解两者之间的异同(图1)。RCT贵为“金标准”但费时、费力、费钱,且可能不被伦理所支持,MR使用基因型来代替暴露因素进行因果关系推断,可大大提高研究效率和可行性,两者各有优势,共同完善循证体系。
图1. 孟德尔随机化和随机对照试验的比较
3. 基本原理举例:简单易懂,一看就会
举个简单的例子:研究肥胖和糖尿病是否存在因果关系
- 暴露因素:肥胖
- 结局:糖尿病
- 工具变量:“肥胖的基因”
传统的观察研究可能会提示这两者之间存在联系,但我们不知道是肥胖导致了糖尿病,还是有其他没有考虑到的混杂因素,它们也可能导致糖尿病。
为了解决这个问题,我们可以利用基因来进行MR分析。通过在全基因组关联研究(GWAS)数据库中检索,寻找与肥胖直接相关、但与糖尿病无关的基因变异,将其作为工具变量。从理论上讲,肥胖的基因变异在糖尿病和非糖尿病人群中发生的概率是完全随机的,因此,如果发现携带肥胖基因人群糖尿病发病率显著高于不携带这个基因的人群,那么就可以推断肥胖与糖尿病可能存在因果关系。
二、证据等级:MR在循证金字塔中位居高位
MR研究迅速崛起,并在循证医学中占据了重要地位。2022年发表于《欧洲心脏杂志》(Eur Heart J)的一篇全球热点文章中,明确界定了MR在循证医学证据金字塔中的地位,并细分为两种场景(图2):
- 当RCT可行时:MR循证等级仅次于RCT的系统综述和RCT,位列第三;
- 当RCT不可行时:MR循证等级最高,位列第一。
图2. 孟德尔随机化在循证金字塔中的等级
三、最新进展:在糖尿病领域,MR高分文章不断涌现
近年来,MR论文数量呈爆炸式增长,截至2023年11月1日,搜索PubMed每周MR相关文章近60篇,且呈不断增长态势(图3)。
图3. 孟德尔随机化论文数量呈爆炸式增长
其中,在糖尿病领域,近年来MR高分文章也不断涌现,引起内分泌医生高度关注。这些研究发表于权威期刊,探索了与糖尿病相关的各种因果关系,例如:
文章题目:《1型糖尿病与心血管疾病之间的因果关系:一项孟德尔随机化研究》
发表期刊:2023年Cardiovasc Diabetol(医学1区,IF 9.3)
研究结论:1型糖尿病对外周动脉粥样硬化和冠状动脉粥样硬化的影响存在因果关系,高血压在一定程度上介导了这一作用
文章题目:《血糖与血脂相关性状之间的因果关系:一项孟德尔随机化研究》
发表期刊:2022年Diabetes(医学1区,IF 7.7)
研究结论:空腹胰岛素(IF)水平升高与甘油三酯血症(TG)升高和高密度脂蛋白胆固醇(HDL-C)水平降低之间存在双向因果关联,提示在糖尿病发生早期控制血脂有助于减轻胰岛素抵抗
文章题目:《评估葡萄糖激酶激活对心血管疾病风险的影响:一项孟德尔随机化分析》
发表期刊:2022年Cardiovascular Diabetology(医学1区,IF 9.3)
研究结论:葡萄糖激酶激活剂(GKA)可能降低冠状动脉疾病和心衰风险,且这种心血管保护作用独立于糖化血红蛋白(HbA1c)降低的作用
专家点评
李静教授(中国医科大学附属第一医院)指出,随着基因组医学迅猛发展以及海量遗传学数据的涌现,MR方法应运而生。MR将基因组数据纳入传统的流行病学研究设计中,以推断危险因素与疾病风险之间的因果关系,这不仅在很大程度上避免了混杂因素及反向因果关系对研究结果的影响,还通过纳入个体与生俱来的遗传标志来反映相关危险因素和疾病风险间可能的因果联系。这是一种奇妙的思路,为疾病因果关系的推断提供了全新方法。
MR以单核苷酸基因多态性(SNP)作为工具变量,具有自身的独特优势,包括遗传学中的遗传信息从亲代传递给子代的流向确定性,同时在很大程度上避免了环境、社会因素等混杂因素影响,进而提高了分析结果的可靠性,更令研究人员可喜的是GWAS数据库含有庞大的测序数据并且数据相对容易获取,更加方便分析。与传统的RCT相比,MR可大大节省临床试验的巨大成本,是一种更具经济性的分析工具。这些特点及优势使其备受临床科研人员的青睐,在短短几年内相关论文呈井喷态势。
目前国际上已赋予MR很高的循证医学等级,其地位仅次于RCT,而当RCT不可实施时,MR被视为最高循证医学证据。MR被赋予此等级别的地位,也离不开其三种基本的原理假设(1)相关性假设:代表暴露因素的工具变量要和暴露因素本身存在强相关关系;(2)独立性假设:工具变量要与其他任何混杂因素不相关;(3)排他性假设:暴露因素仅通过其自身影响结局,而排除其他途径干扰。这三种基本假设令MR分析如虎添翼,在证据链上更加完善。这意味着,MR不仅是易于操作的发文新风口,其本身就具备较高的循证地位,对于评估暴露因素或干预因素对结局的影响具有重要参考价值。
MR新浪潮正迅速席卷各疾病领域,内分泌医生也应与时俱进,关注并重视MR证据,掌握好这种新的方法,无论从科研还是临床角度都能获益匪浅!
本文原文来自《国际糖尿病》编辑部
