当你想使用预测概率作为医学预测模型的结果
创作时间:
作者:
@小白创作中心
当你想使用预测概率作为医学预测模型的结果
引用
CSDN
1.
https://blog.csdn.net/skyskytotop/article/details/139339206
当你想使用预测概率作为医学预测模型的结果
分类预测模型的预测结果有两种。一种是直接判断是哪一类,这种情况下唯一可以调节的就是决策阈值,或者是默认的0.5,也可以是参数确定的决策阈值,比如约登指数,没有太多可以说的。另一种是使用预测概率作为预测结果,其大小代表了发生阳性结果的可能性的大小。几个思考和大家讨论。
当你想使用预测概率作为医学预测模型的结果
- 确认模型具有一个良好的校准曲线,也就是预测值贴近理想曲线,这代表预测概率没有高估或者低估阳性事件实际的发生概率。从数据方面来说,不平衡数据,也就是结局变量中阳性结果偏低,会容易发生校准曲线不佳的情况;算法方面,线性模型往往具有较好的校准曲线,而树形模型的校准曲线往往较差,从这一点上说,建议选择逻辑回归等线性模型,还可以尝试堆叠聚合模型(逻辑回归+随机森林)来获得一个良好的校准曲线。
后概率校准可以一定程度上改善校准曲线。如果发现模型的校准曲线不佳,可以考虑使用后概率校准方法来校准预测概率。Python的scikit-learn库和R语言probably库都在对后概率校准提供了丰富的参数。需要提醒的是,后概率校准也是要在训练集上训练,然后应用到测试集上,包括个体的预测值。
采用临床决策曲线分析(DCA)来确定决策阈值。因为使用了预测概率作为模型预测的结果,还是需要一个阈值来决定哪些患者是阳性的,需要采取相应的措施,但是使用预测概率的好处就是预测阈值不是固定的,可以根据实际情况随时变化,这更能适合临床实践过程中复杂多变的情况。DCA分析中就是通过医生和患者对后续措施的危害和收益的考量来确定个性化的决策阈值,比如,模型预测为阳性结果后的结果是进行手术,如果患者和医生考量坏处和收益的比值是1:10,那么决策阈值就是0.1,如果预测概率大于0.1,即可考虑进行手术,对于其它的患者和医生可以接受的危害收益比值可能是0.2,那么预测概率为0.1,就不考虑进行手术。
最后
使用预测概率作为模型的预测结果,这时候校准曲线是比其它指标(比如准确度)等更优先的指标,并不要求模型具有非常高的准确度才可以进入到临床实践,因为我们可以通过改变决策阈值来调节临床的收益。DCA最有用的地方是确定决策阈值,而不是评价模型的优劣,虽然它用于评价模型的优劣也是不错的指标。我们在和鲸社区建立了一个R代码的演示,欢迎大家参考。
热门推荐
内容审核与法律界定:探讨其是否构成违法犯罪行为
济南带孩子一日游攻略,这三条线路总有一条适合你
济南天下第一泉景区全攻略:趵突泉、大明湖等景点详解
毕加索:传奇一生,艺术之旅的无限魅力
酒店不锈钢厨具选购攻略:耐用与美观的完美平衡
项目管理材料清单怎么写
揽胜是七座还是六座?
最惨自媒体出现了!被三家车企索赔700万,且不准公开道歉
一楼带院子房子的优缺点及购买建议
农用拖拉机类型及优缺点详,哪种最适合你的农田?
金宇澄:一位将黎里刻入骨血的作家
什么是财产合法性确认
如何通过法律咨询确保外贸网站的合法性
人类很可能通过基因改造加速进化,最终成为名副其实的“外星人”
怎样避免代开发票过程中的问题
八字算事业发展位置
在高速公路低能见度情况下如何安全驾驶?
UnZipLoRA:AI图像处理方法,能将图像分解为主题和风格
零售银行业的未来:如何提升客户体验
癌症晚期呕吐怎么缓解
蔷薇常见病虫害及防治方法
宝宝肺炎可以吃什么饭
《最后生还者》第二季4月上线,PV受空前关注
数说奥运 | 15名中国游泳冠军,9位出自“江浙沪”
《Fate/Zero》中七位英灵生前的传奇故事
这几种安全避孕方式,你选对了吗?
青少年抑郁症的症状有什么
冒险团队伍如何组合
花卉育苗土壤选择指南:从配方到品种推荐
油菜育苗技术:从土壤选择到收获贮藏的全程指南