训练集、验证集和测试集:机器学习中的数据划分详解
创作时间:
作者:
@小白创作中心
训练集、验证集和测试集:机器学习中的数据划分详解
引用
CSDN
1.
https://blog.csdn.net/m0_49866160/article/details/136381625
在机器学习和深度学习中,数据集的划分是模型训练和评估的基础。训练集、验证集和测试集各自承担着不同的角色,正确理解它们的概念和作用对于构建有效的模型至关重要。本文将详细解释这些概念,并探讨它们之间的联系和实验注意事项。
训练集、验证集和测试集概念
训练集(Training Set):用于训练模型的数据集。训练集用来训练模型,拟合出数据分布规律,即确定模型的权重和偏置等参数,这些参数称为学习参数。
- 训练集使用多次
- 确定模型权重、偏置等学习参数
- 训练出(学习出)模型
验证集(Validation Set):用于验证模型性能的数据集。在模型训练过程中,验证集用来调整模型参数和超参数,以优化模型性能,避免过拟合,即验证集用于模型选择,并不参与学习参数的确定,而是为了选择出模型误差较小的模型参数和超参数。
- 验证集使用多次
- 调整并选择模型参数和超参数
- 选择模型(验证模型性能)
测试集(Test Set):用于评估模型性能的数据集。在模型训练完成后,测试集用来评估模型的泛化能力(泛化能力即模型在未知数据上的表现),即测试集仅在训练完成后使用一次,评价最终模型的效果(其实,测试集可以跑多个epoch)。
- 不参与学习参数过程,也不参与超参数选择过程
- 测试集仅使用一次,完全独立,测试集未参与过训练或验证
- 评价最终模型
三者的联系和实验注意事项
- 因训练集在学习模型过程中反复大量使用,验证集对模型偶尔的调整,测试集只对最终模型评价,所以,训练集、验证集和测试集数据常常划分关系:8:1:1或6:2:2,且三个数据集所用数据是不重叠的,是不同的!
- 测试集如同高考,决定最终成绩,决定最终模型性能,两人参加高考考同一份试卷,分数才能作对比,即只有在同样的测试集上,两个(或以上)模型的对比才有效。(已有论文中常常不告知数据集的划分方式,为了和已有论文模型作对比,就是自己划分数据集,复现已有论文模型,将自己提出的模型和复现的对方的模型在相同测试集上作对比,说明自己提出模型的效果!!!)
- 验证集如同高考的模拟考试——一模、二模、三模,通过参与模拟考,就可以调整自己考试状态,争取高考时达到一个好的状态,即验证集是为了从一堆可能的模型中,找到帮你表现最好的模型(指模型的参数、超参数),注意:这里的表现是在验证集上,选择了模型表现最好的超参数,再用测试集评估时,也可能存在效果不好的情况;
- 训练集如同作业题、练习题、周测、月测等等,模拟考、高考题一般都不会和平时练习题相同,是为了让学生学会知识、规律和举一反三的能力,所以训练集、验证集和测试集最好都没有重叠,模型才具有说服力。(目前公开的数据集,很多都已经划分好了训练集、验证集和测试集,且都没有数据重叠)
- 训练集和测试集易区分,验证集和测试集常搞混,验证集和测试集主要区别:
交叉验证
将数据集单纯划分为训练集、验证集和测试集时,并不是所有数据都参与了训练,存在数据信息利用不全的弊端,由于验证集只代表一部分非训练数据集,导致最终训练好的模型测试时的泛化能力并不好,所以为了保证泛化误差的稳定性,得到理想的模型,可以使用交叉验证,这里介绍K折验证法
(交叉验证方法很多,此篇涉及多种以及代码实现:https://blog.csdn.net/WHYbeHERE/article/details/108192957)
K折交叉验证:
- 将数据集分为训练集和测试集,测试集放在一边。
- 将训练集分为 k 份,每次使用 k 份中的1 份作为验证集,其他全部作为训练集。
- 通过 k 次训练后,得到了 k 个不同的模型。
- 评估 k 个模型的效果,从中挑选效果最好的超参数。
- 使用最优的超参数,然后将 k 份数据全部作为训练集重新训练模型,得到最终所需模型,最后再到测试集上测试。
参数、超参数的理解
- 模型参数:参数属于模型内部的配置变量,它们通常在建模过程自动学习得出。如:线性回归或逻辑回归中的系数、支持向量机中的支持向量、神经网络中的权重、偏置。
- 模型超参数:超参数属于模型外部的配置变量,他们通常由研究员根据自身建模经验手动设定。如学习速率,迭代次数,层数、K近邻中的K值。
深度学习的三大要素
- 数据
- 架构
- 损失
热门推荐
四川电力职业技术学院王牌专业 最好的专业是什么
提升《我的世界》体验:如何选择最佳电脑配置
增加住宅层高将带来哪些变化?
C语言数组指针的用法详解(附带实例)
去广州想探秘真正的广东文化,这些博物馆可以了解下
混欺负员工犯法吗知乎:职场霸凌的法律界定与应对策略
猫咪随意改名,你知道吗(宠物命名的重要性与技巧)
华盛顿大学樱花盛开的文化象征与气候变化的影响
明缅战争:明朝向缅甸割让大片领土求和而结束的战争
湖北新旧高考课本差异对比
白酒类营销策略:提升品牌影响力与市场占有率的关键路径
如何用VIX指数判断市场方向?
医院预约挂号系统:简化就医流程,提升患者体验
快速缓解抑郁症的艺术疗法有哪些?如何借助艺术表达情感?
不同啤酒风格的最佳适饮温度指南
家用净水器常见问题预防与维护全攻略
《海贼王》第627话深度解析:路飞的觉醒与新时代的开启
F1:纽维为何坚决离开红牛?原因曝光,在红牛太没挑战性了
成吉思汗的征服之路:消灭国家的计数与黑海之终
六大因素帮你确定适合的职业领域
如何在电梯中给他人留下良好的印象
实习期司机上高速公路的法律限制与安全风险分析
春季口腔溃疡高发?5个原因+3种类型,教你轻松预防和应对!
深入解析芯片背后的技术:揭开半导体产业的神秘面纱
唐三彩——斑斓釉彩下的盛世气象与文化寓意
如何科学地进行1000米跑步(技巧、训练计划和运动装备全解析)
利用汇率差赚钱是否合法?一文了解国内外汇率差利用方式
王者荣耀三件吸血装备详解:泣血之刃、制裁之刃与末世的选择攻略
特利迦奥特曼百科
Excel保存时系统资源不足怎么办?多种实用解决方案帮你轻松应对