训练集、验证集和测试集:机器学习中的数据划分详解
创作时间:
作者:
@小白创作中心
训练集、验证集和测试集:机器学习中的数据划分详解
引用
CSDN
1.
https://blog.csdn.net/m0_49866160/article/details/136381625
在机器学习和深度学习中,数据集的划分是模型训练和评估的基础。训练集、验证集和测试集各自承担着不同的角色,正确理解它们的概念和作用对于构建有效的模型至关重要。本文将详细解释这些概念,并探讨它们之间的联系和实验注意事项。
训练集、验证集和测试集概念
训练集(Training Set):用于训练模型的数据集。训练集用来训练模型,拟合出数据分布规律,即确定模型的权重和偏置等参数,这些参数称为学习参数。
- 训练集使用多次
- 确定模型权重、偏置等学习参数
- 训练出(学习出)模型
验证集(Validation Set):用于验证模型性能的数据集。在模型训练过程中,验证集用来调整模型参数和超参数,以优化模型性能,避免过拟合,即验证集用于模型选择,并不参与学习参数的确定,而是为了选择出模型误差较小的模型参数和超参数。
- 验证集使用多次
- 调整并选择模型参数和超参数
- 选择模型(验证模型性能)
测试集(Test Set):用于评估模型性能的数据集。在模型训练完成后,测试集用来评估模型的泛化能力(泛化能力即模型在未知数据上的表现),即测试集仅在训练完成后使用一次,评价最终模型的效果(其实,测试集可以跑多个epoch)。
- 不参与学习参数过程,也不参与超参数选择过程
- 测试集仅使用一次,完全独立,测试集未参与过训练或验证
- 评价最终模型
三者的联系和实验注意事项
- 因训练集在学习模型过程中反复大量使用,验证集对模型偶尔的调整,测试集只对最终模型评价,所以,训练集、验证集和测试集数据常常划分关系:8:1:1或6:2:2,且三个数据集所用数据是不重叠的,是不同的!
- 测试集如同高考,决定最终成绩,决定最终模型性能,两人参加高考考同一份试卷,分数才能作对比,即只有在同样的测试集上,两个(或以上)模型的对比才有效。(已有论文中常常不告知数据集的划分方式,为了和已有论文模型作对比,就是自己划分数据集,复现已有论文模型,将自己提出的模型和复现的对方的模型在相同测试集上作对比,说明自己提出模型的效果!!!)
- 验证集如同高考的模拟考试——一模、二模、三模,通过参与模拟考,就可以调整自己考试状态,争取高考时达到一个好的状态,即验证集是为了从一堆可能的模型中,找到帮你表现最好的模型(指模型的参数、超参数),注意:这里的表现是在验证集上,选择了模型表现最好的超参数,再用测试集评估时,也可能存在效果不好的情况;
- 训练集如同作业题、练习题、周测、月测等等,模拟考、高考题一般都不会和平时练习题相同,是为了让学生学会知识、规律和举一反三的能力,所以训练集、验证集和测试集最好都没有重叠,模型才具有说服力。(目前公开的数据集,很多都已经划分好了训练集、验证集和测试集,且都没有数据重叠)
- 训练集和测试集易区分,验证集和测试集常搞混,验证集和测试集主要区别:
交叉验证
将数据集单纯划分为训练集、验证集和测试集时,并不是所有数据都参与了训练,存在数据信息利用不全的弊端,由于验证集只代表一部分非训练数据集,导致最终训练好的模型测试时的泛化能力并不好,所以为了保证泛化误差的稳定性,得到理想的模型,可以使用交叉验证,这里介绍K折验证法
(交叉验证方法很多,此篇涉及多种以及代码实现:https://blog.csdn.net/WHYbeHERE/article/details/108192957)
K折交叉验证:
- 将数据集分为训练集和测试集,测试集放在一边。
- 将训练集分为 k 份,每次使用 k 份中的1 份作为验证集,其他全部作为训练集。
- 通过 k 次训练后,得到了 k 个不同的模型。
- 评估 k 个模型的效果,从中挑选效果最好的超参数。
- 使用最优的超参数,然后将 k 份数据全部作为训练集重新训练模型,得到最终所需模型,最后再到测试集上测试。
参数、超参数的理解
- 模型参数:参数属于模型内部的配置变量,它们通常在建模过程自动学习得出。如:线性回归或逻辑回归中的系数、支持向量机中的支持向量、神经网络中的权重、偏置。
- 模型超参数:超参数属于模型外部的配置变量,他们通常由研究员根据自身建模经验手动设定。如学习速率,迭代次数,层数、K近邻中的K值。
深度学习的三大要素
- 数据
- 架构
- 损失
热门推荐
电力调整器有效值与平均值的区别
0xc0000005错误修复指南:应用程序无法启动的多种解决策略
低钙血症的症状及表现
提升履约管理培训
如何管理项目履约情况分析
《文明7》大型更新发布 新增内容及付费扩展包同步上线
中国古代“黄历”的历史渊源和基本常识
小规模纳税人如何顺利转一般纳税人?
结婚喜字什么时候揭下来好?揭喜字吉日及习俗详解
国外潜艇燃料电池AIP技术发展现状及趋势
最适合野营的蓄电池怎么选择
氢原子的束缚态波函数
全球死刑法律制度概述:各国如何规定“死刑法”?
火刑绞刑:一种残酷的死刑执行方式的历史演变
如何在银行办理个人燃气费代扣?
八字命最硬是哪种?哪些八字命会克父母?
美味牛肝菌(Boletus edulis)的化学特性和健康促进作用
美国公司注册信息查询系统使用指南
网站侵权如何提出申诉:法律途径与维权策略
签约率100%!这里的居民即将告别煤卫合用的“老破小”,原地回搬新家
激励人心的励志正能量句子,句句让人乐观豁达
政策效果初显 房地产市场呈现积极变化
宠物猫的抓板训练(如何让你的猫适应抓板并防止损坏家具)
工业废气排放检测的技术及其应用
A股:股民们要注意,明天走势很关键,大盘将要选择方向
复方利血平片的疗效与作用及副作用
爬楼梯,适合你的健身选择吗?
电源纹波的测量、判断标准及电容选型指南
武安"零彩礼"新风:爱与责任共谱婚姻乐章
2024必读生死主题好书:来条生命士力架!