了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
- 超参数优化
- 交叉验证
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
新公司问离职理由怎么说合适:依法合规表达你的离职原因
cos sin tan 哪边比哪边?解析三角函数的关系
遇见名城 | 长春电影制片厂
OpenRefine如何与数据库一起使用?完整教程详解
光速为参照系?揭秘相对论如何化解超光速谜团
窗帘安装与装饰指南:轨道安装、轮子更换及小卧室窗帘搭配技巧
如何选择窗帘轨道?这类轨道的选择依据是什么?
7天新增285例!不见面都能传染!里水紧急提醒→
横沥镇:执“就业”之笔 全力提升民生“温度”
文物会说话:西安市创新演绎历史文化遗产多重价值
女人心脏不好的症状
C盘格式化全攻略:备份、操作与系统重装详解
初高中全面取消晚自习意味着什么?
农产品S2B2C商城:重塑农村经济的新动力
背痛解密——腰椎间盘突出的预防与康复指南
2025年1月商务印书馆十大好书发布
葫芦种花盆里行吗?庭院家居创意新选择
中国股市历史与现状分析
乳胶床垫测评报告:真实体验与数据对比
哪个检测机构的质量分数评定最权威?
节后肠胃不适?9种食物搭配5个妙招,助你轻松应对“节日后遗症”
自由职业社保缴纳方式
中小学门口违规售盲盒 常州市长:市场监管局牵头 长效监管
如何检查正时链条的状况?这种检查方法对发动机性能有何影响?
三代EA888发动机的正时链条使用寿命及迈腾车型应用情况
用Excel绘制折线图的完整教程
拙政园,又出圈啦!
全景共赢 | 光伏跨界融合 渔光兴业惠民生
写真如何找资源源码图片
SQL中的group by用法详解:如何使用group by进行数据分组