了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
增长绝对值是什么?增长绝对值如何进行衡量?
化学中的宏观与微观思想
制氧机的规格参数
历史上的神秘官府组织结构及其影响
猫咪耳朵肿了一个大包像气球一样,该怎么办?
中国古代行政建筑的布局与构造
财产保全保险费应由谁承担?
每天一粒阿托伐他汀,当出现这4种情况,医生:建议“停止服药”!
辅警受伤怎样走工伤
应届生公务员政审关键信息审核指南:全面考察与严格要求
缬沙坦胶囊和苯磺酸氨氯地平片可以一起吃吗
专家解读:如何通过饮食促进十一岁男孩身高增长
系统未检测到U盘,请检查连接——常见U盘问题及解决方案
内存卡不显示?15个实用解决方案帮你轻松应对
吉林长春国家农高区:打造现代农业发展新高地
遇上不讲道理的室友怎么办?这份应对指南请收好
中国8条最惊险的天路,每一条都令人叹为观止
日月双贝:珠海歌剧院的建筑艺术与工程奇迹
px是什么?深入解读像素单位及其应用场景
多地探索秸秆焚烧新政策:从"全面禁烧"到"限时分区"
ST股在股市中有什么特殊地位?这种股票如何影响投资者的风险管理策略?
机械本科生如何逆袭职场?高薪之路全攻略!
高考语文作文想拿高分该怎么写?
胃黏膜不仅怕辣,还怕什么?经常胃痛的人,建议尽量少吃
创造城市空间的动态对话!互动装置带来公共空间艺术新表达
数字化提升保险业服务水平
一个护照,走遍世界?揭秘全球护照通用性的真相
篮球竞赛知识普及:篮球必懂的十大规则
脑脓肿是否可以进行腰椎穿刺
现代简约风格家装色彩搭配的黄金法则与实用技巧