交叉验证与网络搜索:机器学习模型调优的关键技术
创作时间:
作者:
@小白创作中心
交叉验证与网络搜索:机器学习模型调优的关键技术
引用
CSDN
1.
https://blog.csdn.net/pursuit_CR/article/details/138201437
交叉验证和网络搜索是机器学习模型调优中的两个重要概念。本文将详细介绍这两个概念的原理和应用,并通过一个乳腺癌预测案例,展示如何将理论知识应用到实际项目中。
一、交叉验证
- 交叉验证是一种数据集的分割方法,将训练集划分为 n 份,拿一份做验证集(测试集)、其他n-1份做训练集。
- 交叉验证原理:将数据集划分为 cv=4 份
- 第一次:把第一份数据做验证集,其他数据做训练
- 第二次:把第二份数据做验证集,其他数据做训练
- ... 以此类推,总共训练4次,评估4次。
- 使用训练集+验证集多次评估模型,取平均值做交叉验证为模型得分
- 若k=5模型得分最好,再使用全部训练集(训练集+验证集) 对k=5模型再训练
一边,再使用测试集对k=5模型做评估
交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分。
二、网络搜索
- 网格搜索是模型调参的有力工具。寻找最优超参数的工具,只需要将若干参数传递给网格搜索对象,它自动帮我们完成不同超参数的组合、模型训练、模型评估,最终返回一组最优的超参数。
- 网格搜索 + 交叉验证的强力组合 (模型选择和调优)
- 交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型
- 网格搜索解决超参数的组合
- 两个组合再一起形成一个模型参数调优的解决方案
三、预测乳腺癌案例实践
本文原文来自CSDN博客
热门推荐
29张显卡实测, 黑神话悟空显卡搭配指南
一次重复最大重量(1RM)的概念与计算器
声声慢,李清照的诗词世界与情感深度解读
健康长寿必吃6大食物 专家揭秘多吃1种饭防心脏病/糖尿病 这种小食也上榜!
鸿蒙HarmonyOS架构详解:从内核到应用层的分层设计
英国年度最佳猫咪!可爱奶牛猫智力超群,帮听障主人打理家务
皇家寺院——法门寺
没交物业费物业可以不让业主回自己家吗
祛斑全攻略:激光、药物、饮食调理等多种方法详解
染发剂化学知识:从成分到安全使用指南
户外露营不能少了手冲咖啡
打造强健核心肌群:九种“杀手级”的腹部绳索动作
山梨酸钾的用量标准是什么
科学分配三餐热量,助你健康减脂
HTML设置浏览器窗口最小宽度的三种方法
2025年中国开关柜行业深度分析:产业链全景、市场竞争格局及未来发展趋势
如何将一体机当显示器
什么人不能用白胡椒
牛奶为何天天打折促销,产品创新或待提速
社会实践活动有哪些?社会实践的定义、类型及作用全解析
清代医家孟文瑞《春脚集》的学术特色
你还能撑多久?马斯克:5年内AI智商碾压人类,失业潮席卷全球
电动和混合动力汽车:了解特定的 OBD 代码
如何高效解酒?全方位喝酒解酒指南
30位上市公司大佬返校,浙大系资本市场“隐形军团”有多强?
擦亮国家历史文化名城“金名片”
《黄帝内经》经典养生名言20句,值得一看,赶紧收藏!
1寸证件照拍摄指南:从准备到后期处理的全方位详解
如何提升青少年营养健康素养 专家建议加强食育教育
女性甲减如何治疗