了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
- 超参数优化
- 交叉验证
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
蒸鼻器有用吗?和洗鼻器的差异、功用比较一次告诉你
未成年作者签约晋江文学城:你需要知道的那些事
未成年签约晋江:利大于弊还是弊大于利?
晋江文学城初中生签约引热议:是培养兴趣还是分散精力?
兰州到汉中自驾游:网红景点打卡与美食指南
2024,荆州如此精彩
林小钦教你识别猫咪咳嗽的秘密
麦富迪BARF猫粮:猫咪咳嗽的救星?
《鹊刀门传奇2》原班人马回归,2025年播出引发观众热议
哈利·波特与火焰杯:三强争霸赛的惊险历程
《哈利·波特与火焰杯》金蛋任务:电影与小说的差异与魅力
哈利波特的成长秘籍:爱与勇气
防城港市:打造面向东盟的交通新枢纽
广西国土规划集团助力防城港市最新发展规划
防城港市:广西的滨海明珠,中越边境的风情小镇
防城港市:十万大山下的致富密码
家庭版高丽肉制作攻略:传统美味与现代健康的完美结合
景区探索系列|景区里的非遗“初体验”

湄洲岛:福建最美海岛,妈祖文化的发祥地
宿迁学院数字经济专业:产教融合育英才
宿迁学院宿舍揭秘:空调、独立卫浴全都有!
碳酸饮料:从生产工艺到饮用危害的全面解析
人最终的结局都是死亡,儒、释、道三家,是如何看待生命的意义?
BOSS 的设计哲学:固定模式与随机模式的演变
医生为什么建议不要经常喝粥?警惕老人营养不良
行车记录仪怎么选?6个参数先看清!
赵丽蓉:抗癌路上的坚强艺人
赵丽蓉:一位艺术家的最后十年
享受风景好心情短语:在自然中寻找内心的宁静
如何彻底戒赌,杜绝复赌?