资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

BMC期刊发表：samplesizedev优化临床预测模型样本量计算

创作时间:

2025-01-22 00:35:30

作者:

@小白创作中心

BMC期刊发表：samplesizedev优化临床预测模型样本量计算

在临床研究中，预测模型的开发和验证是提高医疗决策科学性的重要手段。然而，样本量的计算一直是困扰研究者的一大难题。近期，发表在BMC Medical Research Methodology上的一篇研究论文提出了一种新的样本量计算方法，并开发了相应的R语言包samplesizedev，为这一问题提供了新的解决方案。

为什么样本量计算如此重要？

临床预测模型的目的是基于患者特征预测疾病风险或预后，从而辅助临床决策。如果样本量过小，模型可能会出现过拟合，即在训练数据上表现很好，但在新数据上预测效果不佳。这会导致模型的泛化能力下降，影响其临床应用价值。

样本量计算的关键指标

在二分类结果的风险预测模型中，有两个关键指标用于评估模型性能：

校准斜率（Calibration Slope, CS）：反映模型的过拟合程度。CS值越接近1，表示模型校准越好。
平均绝对预测误差（Mean Absolute Prediction Error, MAPE）：衡量单个预测值的准确性。MAPE值越小，表示预测精度越高。

现有方法的局限性

传统的样本量计算方法主要基于经验法则，如每变量事件数（EPV）或每参数事件数（EPP）。然而，这些方法在模型强度较高时（如c统计量>0.85）会出现偏差：

校准斜率公式会严重低估所需样本量
MAPE公式则可能高估样本量

新方法：samplesizedev包

为了解决这一问题，研究者开发了samplesizedev R包。这个包通过模拟方法来估计样本量，能够更准确地处理高模型强度的情况。同时，它还能计算CS和MAPE的变异性，帮助评估模型的稳定性。

如何使用samplesizedev？

samplesizedev包的使用相对直观。用户需要输入以下参数：

预期的模型强度（c统计量）
结局发生率
目标CS和MAPE值
模型中参数的数量

包会输出所需的最小样本量，以及在该样本量下CS和MAPE的预期变异性。

与pmsampsize包的对比

pmsampsize是之前常用的样本量计算R包，基于Riley等人的五步法。然而，它在高模型强度下的表现不如samplesizedev。下表总结了两个包的主要区别：

特征	pmsampsize	samplesizedev
基础方法	五步法	模拟方法
适用场景	一般模型强度	高模型强度
输出指标	样本量	样本量+变异性
使用难度	简单	中等

实际应用案例

假设我们要开发一个预测心血管疾病风险的模型，预期c统计量为0.85，结局发生率为10%，模型包含10个参数。使用samplesizedev包进行计算：

library(samplesizedev)
result <- ssdev(cstat=0.85, prev=0.1, npar=10, target_cs=0.9, target_mape=0.05)
result$sample_size

计算结果显示，需要至少2000例样本才能满足模型性能要求。

结语

随着临床研究的深入，开发高精度预测模型的需求日益增长。samplesizedev包的出现，为研究者提供了一个强大的工具，帮助他们更准确地计算样本量，从而提高模型的可靠性和泛化能力。对于从事临床研究的医生和数据科学家来说，掌握这一工具将大大提升研究效率和质量。

热门推荐

【矩阵】入门到精通！概念题型一网打尽|线性代数

显卡升级指南：提升游戏性能的5个关键步骤

寒冬羽绒服时尚搭配全攻略：款式、颜色、配饰全解读

唐朝官品制度：一品至三品官员的权势与地位

祛“麻”之惑：走出麻风病认知误区

OKR的四大核心原则：透明、对齐、聚焦、挑战性

如何高效阅读SCI文献：从入门到精通的完整指南

情绪管理：培养孩子的心理韧性

智能客服机器人：自动化知识更新与学习，赋能持续成长

乌骨鸡炖汤：从选材到烹饪的全面指南

彩盒印刷成本控制策略：如何在质量和预算之间找到合理的平衡？

复旦团队实现全球首创！双耳基因治疗让先天性耳聋患儿重获听力

《鲁迅杂文集华盖集-题记》运交华盖欲何求

鸟类和哺乳动物的智能进化之路殊途同归

如何进行理财规划？这种规划有哪些特点？

精益炼金术：超越财报 - 精益视角下的A股价值投资（上）

如何高效进行日志查询？揭秘最佳实践和技巧

酒驾被吊销驾照的职工调岗难题：HR必须掌握的合规处理指南

黄龙：中华山水文明的典范

请客吃饭的“三七定律”：如何在饭局中游刃有余

艾曲泊帕在儿童患者中的应用：6岁以上ITP患儿的治疗新希望

西方哲学史核心脉络剖析：基于本体论、认识论与价值论的三维视角

音乐名字大全：诗经楚辞灵感+五行属性搭配，帮你取个好听的名字

黄苗子书画艺术特点及收藏价值

把自然带回家！16款超有创意的自然风手工艺品

【佩戴玉器须知】玉可以戴着睡觉吗？注意事项一次看懂

考雅思还是考托福？1分钟带你了解所有区别！

空调外机清洗方法（有效清洗空调外机的常用方法及注意事项）

从数据仓库到商业智能：深度解析与应用指南

如何更换汉兰达车钥匙电池？更换电池时应注意哪些细节？