问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

多类别逻辑回归:三种模型的比较与选择

创作时间:
作者:
@小白创作中心

多类别逻辑回归:三种模型的比较与选择

引用
1
来源
1.
https://tidsskriftet.no/en/2022/06/medicine-and-numbers/logistic-regression-more-two-categories

当因变量有三个或更多类别时,如何选择合适的逻辑回归模型?本文通过一个具体的研究案例,详细介绍了单独的二元回归模型、序数逻辑回归和多项逻辑回归三种方法,并通过实际数据展示了它们在不同场景下的应用。

当因变量只有两个水平或类别时,可以使用标准的二元逻辑回归。当因变量有三个或更多类别时,我们可以使用其他变体的逻辑回归。

让我们从一个例子开始:Munthe-Kaas等人(1)研究了中风前虚弱与中风后三个月认知障碍程度之间的可能关联。研究对象为598名患者。自变量虚弱程度通过一个理论上范围从0到1的指数来测量,数值越高表示虚弱程度越大。中风前,患者的得分从0到0.56,平均值为0.14,标准差为0.10。因变量认知障碍程度是有序的,分为三个类别。中风后三个月,286名(45%)患者认知正常,172名(29%)有轻度认知障碍,158名(26%)患有痴呆。

单独的二元回归模型

当因变量是有序的,如本例中,我们可以选择将其二值化并使用二元逻辑回归。一个具有三个类别的变量可以以两种方式二值化(图1)。如果我们设定阈值在痴呆和轻度认知障碍之间,我们将有一个类别是痴呆,另一个类别是轻度障碍和正常认知的组合。相应的每增加0.10单位虚弱指数的比值比为3.09(95%置信区间(CI)2.45至3.89,p<0.001)。如果我们设定阈值在正常认知和轻度认知障碍之间,比值比为2.29(CI 1.83至2.87,p<0.001)。


图1不同的逻辑回归模型及其每增加0.10单位虚弱指数的比值比(OR)。

序数逻辑回归

另一种选择是使用序数逻辑回归。它有多个版本(2),最常用的是“比例优势逻辑回归”。与上述方法类似,我们对因变量的每个可能类别阈值进行分析,但现在假设每个阈值的比值比相同。在我们的例子中,我们得到一个比值比为2.70(CI 2.23至3.27,p<0.001)。

假设每个阈值的比值比相同,称为“比例优势假设”。在我们的例子中,这个假设的假设检验p值为0.014。这表明假设没有完全满足。然而,序数逻辑回归可能仍然适合于研究问题(3,第315-316页)。因此,这个假设检验可能意义有限。在他们的研究中,Munthe-Kaas等人(1)选择了单独的二元回归模型,不仅基于这个假设检验,而且特别为了研究虚弱是否是区分痴呆和轻度认知障碍的更强预测因子,而不是区分轻度认知障碍和正常认知。

多项逻辑回归

如果因变量的类别不是有序的,我们可以使用多项逻辑回归。我们需要选择一个参考类别。在我们的例子中,自然选择正常认知作为参考。然后我们得到轻度认知障碍的比值比为1.47(CI 1.12至1.92,p=0.06),痴呆的比值比为3.70(CI 2.81至4.87,p<0.001),两者都相对于正常认知。注意,在这种情况下,轻度认知障碍的比值比1.47低于二元逻辑回归中的2.29。原因是,在二元逻辑回归中,我们看到的是轻度认知障碍和痴呆的组合类别的比值比,而在多项逻辑回归中,我们只看轻度认知障碍。相应地,我们看到多项逻辑回归中痴呆的比值比3.70适用于正常认知,而二元逻辑回归中的3.09较低,因为它适用于轻度认知障碍和正常认知的组合。

模型选择

如果因变量不是有序的,多项逻辑回归是最自然的选择。如果因变量是有序的,如果比例优势假设对数据是一个很好的近似,或者如果在因变量的不同水平之间区分效应没有实际意义,我们可以选择序数逻辑回归。与单独的二元回归模型相比,序数逻辑回归的一个优势是它在模型中包含的未知量较少,这里是指比值比。这导致了模型的显著简化,特别是在因变量有三个以上类别或有多个预测因子的情况下。

这里描述的三种替代回归模型的比值比解释与二元逻辑回归相同:比值比是预测因子每增加一个单位的相对增加的几率。

参考文献

  1. Munthe-Kaas R, Aam S, Saltvedt I et al. Is Frailty Index a better predictor than pre-stroke modified Rankin Scale for neurocognitive outcomes 3-months post-stroke? BMC Geriatr 2022; 22: 139. [PubMed][CrossRef]
  2. Hosmer DW, Lemeshow S, Sturdivant RX. Applied logistic regression. 3. utg. Hoboken, NJ: Wiley, 2013.
  3. Harrell FE. Regression modeling strategies. With applications to linear models, logistic and ordinal regression, and survival analysis. 2. utg. Cham: Springer, 2015.

本文原文来自挪威医学期刊Tidsskriftet,原文链接:https://tidsskriftet.no/en/2022/06/medicine-and-numbers/logistic-regression-more-two-categories

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号