了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
心理亚健康是一个隐形杀手,需警惕!
绿色安乐蜥:北美洲常见的"假变色龙"
职业联赛管办分离改革迎来标志性节点,中足联的新意与挑战
孕晚期腹痛一阵一阵的
早上空腹喝水与不吃早餐的危害及应对方法
什么是用户体验,如何提升
河北阜平天生桥:华北最大瀑布群的地质奇观
五行中虎命格揭秘:揭秘虎年出生者的命运密码
30年前的世界500强榜单:美国153家、日本141家、中国仅3家,如今呢
长期坐办公族的健康保护策略
WPS高效文档技巧:批量修改文字的实用方法
抽油烟机开关在哪里?使用与维护全攻略
成都火锅和重庆火锅的区别是什么?为什么大家爱吃成都火锅?
新能源汽车BMC技术详解:如何保障电池安全与延长使用寿命
怎样炖鸽子汤有营养又好吃,学会了你就是粤菜大师傅
勇士队伤病困境下的坚持与突破
《无尽的拉格朗日》ST59战舰攻略:性能详解与使用建议
中国15座名山,大部分人只去过3座!你拖后腿了吗
农村信用社存款安全指南:四大要点确保资金无忧
绘画艺术 藏族传承和保护史诗《格萨尔王传》的智慧
工程管理专业就业前景:未来十年最抢手的“黄金赛道”?
女生说爱豆是什么意思
2024年11月SUV投诉指数排行:车机系统升级难
国学常识之蒙学介绍
如何改善紧张的职场人际关系氛围
冻伤的护理与预防
三国时期蜀汉将领廖化简介:其性格以果敢刚直著称
膝盖里的“水库”怎么泄?膝关节积液有话说
浴室安全规划:让行动不便者也能自主如厕沐浴
为姓氏选择寓意深远的男孩名字建议