了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
- 超参数优化
- 交叉验证
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
为什么感觉鼻孔里很臭?这些原因和护理方法需了解
电动阀的工作原理及其在DCS系统中的控制方式
美联储亏损超2040亿美元,会破产吗?
如何理解不同类型的基金产品?这种理解对投资组合有何帮助?
书法学专业就业市场与未来前景 —— 基于政策、行业与教育发展的多维度分析
家务劳动小报:法律视角下的家庭责任与权益保障
辅导员助理工作思路与助理工作计划
OpenWrt远程Web访问设置指南
五步工作法的具体内容
尚织汉服学塾:元代服饰艺术,汉蒙文化的和谐共生
坐骨神经痛的药物治疗:从NSAIDs到抗癫痫药物
乙肝表面抗原 ELISA 操作过程中,哪些因素会影响结果的准确性?
国内十大热门步行街,最值得逛的步行街排行榜,好吃好玩又好逛,你打卡过几个?
招商加盟合作协议范本
多年生的香雪兰盆栽,从种球到开花完全操作指南,新手轻松掌握
钙元素检测服务:必要性与应用
长公主头衔解析:古装剧里长公主扎堆的背后原因
混杂变量:识别和管理
英伟达背后的A股“功臣”,600亿龙头如何逆袭?
打嗝时耳朵有响声?可能与咽鼓管功能有关
如何办理失业金申领手续
命里有劫难的人怎么化解吉凶
洪武三年明朝大封功臣,谁前谁后,谁亲谁疏:朱重八的心思你别猜
叫谁都叫“老师”?合适的职场称呼怎么选
从科普到人文,华山罕见病中心第一本科普专著发布
有了医保农保后如何合理规划保障?这种规划保障的实施难点在哪里?
长期大量摄入糖分,危害不小,5类疾病都和糖有关,做好6点预防
数据结构详解:双向、带头、循环链表
股权变更需要交哪些税,股权变更的税务规划与注意事项
成吉思汗西征背后的秘密:为何他要横扫欧洲?