了解超参数优化
创作时间:
作者:
@小白创作中心
了解超参数优化
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/tune-hyperparameters-azure-databricks/2-understand-hyperparameter-tuning
构建机器学习解决方案涉及测试许多不同的模型。 让我们来探讨两个概念,它们可以帮助找到最佳模型:
超参数优化
超参数是机器学习算法中使用的一个参数,在学习过程开始前设置。换言之,机器学习算法不能从数据本身学习超参数。 超参数是通过训练多个模型进行测试和验证的。 常见的超参数包括迭代次数和模型复杂性。 超参数优化是选择对我们的损失函数具有最佳效果的超参数的过程,也可以说是我们对算法错误的惩罚方式。
交叉验证
根据相同的数据训练和评估模型时,可能会导致过度拟合。 过度拟合是指模型在它已经查看的数据上性能良好,但无法根据尚未查看的数据做出任何有用的预测。 若要避免过度拟合,可以使用训练/测试拆分方法,将数据集分为用于训练模型的训练集和用于评估模型在未查看数据上的性能的测试集。
如果你使用不同的超参数训练许多不同的模型,然后在测试集上评估它们的性能,你仍然会面临过度拟合的风险,因为你可能会选择一个恰好在数据集中的数据上性能最佳的超参数。 若要解决在使用超参数时的过度拟合问题,可以使用训练集的 k 子集来训练模型,这是一个称为“k-折交叉验证”的过程。 然后,基于训练数据的 k-1 个折叠训练模型,并使用最后一个折叠来评估其性能。
在 Azure Databricks 中,有两种优化超参数的方法,下面的各单元中将对此进行介绍:
- 自动化 MLflow 跟踪。
- 使用 Hyperopt 进行超参数优化。
热门推荐
吉林珲春:五年百倍跨越,从边陲小城到外贸增长极
中山沙溪龙瑞:来“粥城”看“村BA”,还能游赏人文古迹,尽享服装潮购
存在一维以上的多维时间吗?
养花不开花?只需一种方法就可全部解决
敏感肌大作战,红血丝不再来!
海南看日出日落地点及时间表
成都楼市双轮驱动韧性凸显,成都市场政策调整效果如何?
怎么写法律援助申请书
不同植物种子的催芽温度指南
质量管理体系审核员知识解析
火星,终究是梦想之地?解析马斯克的火星移民计划与理性现实
云台山入选全国冰雪精品旅游线路!
2024年十二星座12月运势
床头无靠如何化解?这些实用解决方案帮你轻松应对
寓意高考成功的物品
电动汽车电池换电站选址与定容优化研究
快速充电新方式:换电技术提升用户体验
Windows: 如何解决 PowerShell 脚本执行被禁止的问题
女人气血不足10个征兆 女人补气血吃什么食物最好
众望所归!8个级别拳王帕奎奥:正式入选2025年国际拳击名人堂
花了2年时间,我终于弄懂壁挂炉地暖和空气能主机地暖的区别了!
广州名菜-白云猪手,如何做到皮爽肉脆,林厨教你详细的烹饪技巧
智齿拔除全攻略:从基础知识到术后护理
最新全球癌症负担数据发布!结直肠癌发病率第三,死亡率第二!
给机器人加个“心脏”?福田企业在这场大赛上又双叒出圈了
K8s大模型算力调度策略的深度解析
经常用热水泡脚,身体会发生什么变化?这4类人千万别乱泡!
如何找到值得信赖的辩护律师
103岁杨振宁寿辰全家福曝光,49岁翁帆气质如少女,美的太突出了
如何处理臀肌挛缩导致的髋关节酸痛