了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
- 超参数优化
- 交叉验证
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
深度分析:商鞅的法治为何遭到后世批判?
高血糖的饮食禁忌及注意事项打印要点
流苏花的花语是什么?如何正确解读流苏花的含义?
流苏代表什么
诛仙世界电脑版,配置优化、流畅运行与画质提升全攻略!
C语言函数返回值是如何保存的?
晨跑如何全面提升身心健康与生活品质
美团外卖繁荣的背后,骑手人均月薪900
方舟生存进化 蔬菜蛋糕制作指南,使用树脂与药作为关键原料
史诗级重映!带着这份“奇幻建筑学”攻略重返霍格沃茨,神奇的知识又增加了!
冰箱异味严重?教你20种去除冰箱异味的方法
曾国藩的10句经典,最好能够背下来
北爱尔兰赛决赛席位出炉!威尔逊将战特鲁姆普冲击赛季第二冠
H5页面如何兼容PC端和移动端
美国FDA认证中,对产品的标签和包装要求介绍!
泰戈尔的童诗:在自然与生命中寻求哲思
推动算法和平台治理透明化,直面问题才能更好解决
阿托品的功效和作用
变频器的种类和应用简析
鲤跃丹青:吴良涛的笔墨禅心与东方意韵
清淡饮食的正确选择:如何搭配食材与烹饪,保持健康
电动汽车真的划算吗?理财与环保的双重考量
“昕”字的读音、字形结构、历史渊源及其在古代文学和文化中的应用
关于慢性肾病
体检报告这3项异常?当心"隐性纤维饥荒"
如何了解一个房产项目的实际情况?这种了解如何反映市场价值?
键盘侠心理探究:虚拟世界中的自我表达与攻击性
最动人的三句情话,你喜欢哪一句?
【故障诊断与排除】:万用表问题快速诊断与解决的实用技巧
什么是软件开发工程师?北美就业前景怎么样?