了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
权威榜单推荐:打造游戏神机的最佳配置
电动三轮房车实用指南:证件办理、安全使用与改装建议
电动三轮车管理新规实施:三大条件缺一不可
电动三轮房车驾驶与保养全攻略
从传统到现代:世界各地特色水疗文化探析
GNO苏糖酸镁复合片:职场人的高效赋能神器
苏糖酸镁:缓解焦虑抑郁的突破性营养补充剂
AI写作入门:如何用AI创作小说并实现变现
水文情势和河湖地貌如何塑造生态系统?
三亚到底有什么啊?
别让果糖毁了你的健康和身材
中国广电5G:一网整合加速推进,技术创新驱动发展
水的化学性质大揭秘:从电解到水解,一文读懂H₂O的神奇特性
电动三轮车上牌费用全解析:最新政策、所需材料及办理流程
续断片的功效与作用与主治
古人的青春:从李白到李清照的诗意人生
清华副校长谈“器识教育”:培养具有格局与视野的未来人才
《穿越火线:枪战王者》教你成为CF大师
《穿越火线》新手必学:基础操作技巧大揭秘!
Windows 10优化技巧:畅玩《穿越火线》
GB14880推荐:L-苏糖酸镁在儿童乳粉中的安全用量
L-苏糖酸镁获欧盟许可,这款“护脑神器”到底有何神奇之处?
苏糖酸镁:预防化疗副作用的新选择
廖春岭:从心理调节入手,改善你的睡眠质量
春节火爆出圈,潮汕英歌舞到底有何魅力?
黄金牛市的历史密码:从布雷顿森林体系到5000美元/盎司
黄金定投:工薪族财富增值新宠
黄金突破2890美元创历史新高:地缘政治与货币政策双重驱动
DDR4 2666 vs DDR4 2400:性能对比,你选哪个?
笔记本加装内存条:从选购到安装的完整指南