问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

交叉验证与网络搜索:机器学习模型调优的关键技术

创作时间:
作者:
@小白创作中心

交叉验证与网络搜索:机器学习模型调优的关键技术

引用
CSDN
1.
https://blog.csdn.net/pursuit_CR/article/details/138201437

交叉验证和网络搜索是机器学习模型调优中的两个重要概念。本文将详细介绍这两个概念的原理和应用,并通过一个乳腺癌预测案例,展示如何将理论知识应用到实际项目中。

一、交叉验证

  1. 交叉验证是一种数据集的分割方法,将训练集划分为 n 份,拿一份做验证集(测试集)、其他n-1份做训练集。
  2. 交叉验证原理:将数据集划分为 cv=4 份
    1. 第一次:把第一份数据做验证集,其他数据做训练
    2. 第二次:把第二份数据做验证集,其他数据做训练
    3. ... 以此类推,总共训练4次,评估4次。
    4. 使用训练集+验证集多次评估模型,取平均值做交叉验证为模型得分
    5. 若k=5模型得分最好,再使用全部训练集(训练集+验证集) 对k=5模型再训练
      一边,再使用测试集对k=5模型做评估
      交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分。

二、网络搜索

  1. 网格搜索是模型调参的有力工具。寻找最优超参数的工具,只需要将若干参数传递给网格搜索对象,它自动帮我们完成不同超参数的组合、模型训练、模型评估,最终返回一组最优的超参数。
  2. 网格搜索 + 交叉验证的强力组合 (模型选择和调优)
  • 交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型
  • 网格搜索解决超参数的组合
  • 两个组合再一起形成一个模型参数调优的解决方案

三、预测乳腺癌案例实践

本文原文来自CSDN博客

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号