了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
咳嗽黄痰是什么原因造成的
尼山圣地:祭孔背后的文化传承
茵陈红枣泡水,你喝对了吗?
专家共识:7个饮食调整助你改善睡眠质量
2025年基金投资攻略:股市、债市、商品市场全面解析
治愈系音乐:让心灵找到宁静的港湾
济南地铁3号线助力早班机出行攻略
电脑更新后无法连接网络怎么办?网络恢复指南
“俩字能干”真的能选到好伴侣吗?
支付宝最新防骗指南:你的钱包安全吗?
安东尼·戴维斯加盟独行侠:交易始末与未来展望
《哪吒2》:一部电影引发的社会热议
社会转型期的阵痛:如何破解国民素质失衡难题?
股票涨跌的原理是什么
小市值股票投机策略回测:年化收益率40%
工商银行总市值超中国移动背后:高股息资产受追捧
成为温室气体核查员:抓住双碳风口的新职业选择
水浒卡背后的故事:正子公也的传奇
健身人士补充维生素的科学指南
《大明风华》朱祁镇、朱祁钰两兄弟,历史上哪个评价更高?
AI互动中的提问技巧,助你获取更优答案
4家机构预测:2025年,房价还要调整,最高25%!
神经外科有哪些手术?哪种手术更适合我?
从丙年常年期第六主日看现代人的幸福观
致命美食为何让人趋之若鹜?河豚美食指南来了!
WiFi 连接不上?无线网卡重置教程来啦!
詹姆斯VS爱德华兹:跨时代对决点燃NBA新赛季
水陆两栖车应对应急事件发挥的作用
少儿AI机器人课程:开启儿童科技教育的未来之门
如何判断是否连接web