YOLOv5水印检测实战:从原理到代码实现
创作时间:
作者:
@小白创作中心
YOLOv5水印检测实战:从原理到代码实现
引用
CSDN
1.
https://blog.csdn.net/yangzheng_520/article/details/122448070
YOLOv5是基于YOLOv4算法的改进版本,其在COCO数据集上的测试效果表现良好。本文将详细介绍YOLOv5的网络结构、参数配置以及训练过程,并提供具体的代码实现和报错解决方案。
简介
YOLOv5在YOLOv4算法的基础上做了进一步的改进,检测性能得到进一步的提升。虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析,但是YOLOv5在COCO数据集上面的测试效果还是挺不错的。
YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。主要的改进思路如下所示:
- 输入端:在模型训练阶段,提出了一些改进思路,主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放;
- 基准网络:融合其它检测算法中的一些新思路,主要包括:Focus结构与CSP结构;
- Neck网络:目标检测网络在BackBone与最后的Head输出层之间往往会插入一些层,Yolov5中添加了FPN+PAN结构;
- Head输出层:输出层的锚框机制与YOLOv4相同,主要改进的是训练时的损失函数GIOU_Loss,以及预测框筛选的DIOU_nms。
网络结构
改编自知乎大佬的一张图:
Yolov5s网络是Yolov5系列中深度最小,特征图的宽度最小的网络。后面的3种(Yolov5m、Yolov5l、Yolov5x)都是在此基础上不断加深,不断加宽。
参数
train.py(训练)
- weights:权重文件(官方给了很多,看情况下载)
- cfg:网络结构参数配置文件(锚点、骨干网络、头网络)
- data:数据位置的配置文件
- hyp:超参数配置文件(学习率、损失增益等)
- epochs:训练轮数
- batch-size:图片输入数量
- img-size:输入图片大小,放缩图片
- rect:矩形训练,减去一些不必要的信息
- resume:是否接着上次打断的训练,TRUE的话需要指定上次中断的训练模型路径
- nosave:不保存模型,仅保存最后的模型
- notest:不进行test测试,仅测试最后一轮
- noautoanchor:不调整anchor,禁止自动定位检查,设置目标检测的锚点框
- evolve:对超参数进行净化
- bucket:谷歌云盘,不使用
- cache-images:将图片缓存到内存中,加快模型训练
- image-weights:使用加权图像进行训练(测试过程),对训练不好的图片下一轮增加权重
- device:GPU还是CPU的使用
- multi-scale:改变图像尺寸
- single-cls:用于设定训练集是多类数据、单类数据
- adam:优化器
- sync-bn: 分布式训练
- local_rank:不能修改,单机多卡训练
- workers:最大工作训练核心、线程 网上建议设置0
- project:模型保存位置,没有会自动生成
- entity:wandb库,可以看训练过程,一般不用(需要自己注册账号)
- name:模型保存的文件夹,多次运行:exp1,exp2…
- exist-ok:预测结果保存位置,覆盖上次结果不新建结果文件
- quad:用于训练集图像大于–img-size设置的640图片,训练效果更好,小于的效果差一些
- linear-lr:学习速率调整,默认FALSE 通过余弦函数降低学习率
- label-smoothing:防止过拟合,对标签进行平滑处理,防止分类算法中产生过拟合
- upload_dataset:wandb库的
- bbox_interval:wandb库的
- save_period:用于记录训练日志
yolov5s.yaml(进行和你选择的结构参数配置文件)
- nc:分类的类别
- depth_multiple和width_multiple:根据选择的配置文件不同而不一样
voc.yaml(数据配置文件)
- train和val指定训练数据的位置,还可以设置test
- nc:分类的类别
- names:每个类别的名字
detect.py(预测)
- source:预测数据路径
- weights:训练好的best.pt文件路径
- conf-thres:置信度阈值
- iou-thres:交并比阈值
- conf-thres和iou-thres确定返回的预测框
test.py(测试)
- save-txt:返回检测框TXT文件
- save-hybrid:标签和预测结果保存TXT文件
- save-conf:检测到的坐标返回TXT文件
- 其余参数大致和train相同
数据标注
使用标注精灵:新建一个项目,选择位置标注和自定义标注类别,导入数据,选择矩形框标注,导出数据为XML文件。
格式转化
voc2yolov5.py
- classes:类别名称
- TRAIN_RATIO:按比例划分train和val
- convert_annotation函数:读取xml文件,写入TXT文件,确定标注好的XML文件和查找位置相同
- os.getcwd() 绝对路径
- 创建放图片、labe、train、val等文件夹
过程
先进行数据的格式转化,然后train的参数修改,最后修改对应的配置文件,运行train进行模型训练。预测、测试同理
结果
配置文件指定路径下生成结果,模型权重文件防在weights下面,存在best和last(最好的和最好的),参数文件
检测结果
开始运行:
报错
wandb:报错说没有账号等,可以直接关闭
找到utils下的wandb_loggig下面的wandb_utils添加:
利用tensorboard可视化训练过程,训练开始会在yolov5目录生成一个runs文件夹,利用tensorboard打开即可查看训练日志
tensorboard --logdir=runs
注意:数据转化的时候一定要把数据类别名称加上。
环境
符合CUDA11.1的pytroch:
pip install torch==1.8.1 torchvision==0.9.1 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
热门推荐
OA系统与RPA技术结合,提升企业管理效率
《西游记》人物名称演变:孙悟空、猪八戒、沙僧的多重身份
《门神》:中国动画学派的“新样貌”与“再思考”
云南所有大学排名及录取分数线一览表(含位次,2025参考)
天津煎饼果子的正宗做法,带你走进美味的世界!
护士执业注册常见问题答疑
退休金差好几千?养老保险怎么交,才最划算?
600元一斤的信阳毛尖值不值得入手?从品质到性价比的全面解析
揭秘可控核聚变:50年内or还在未来?
明朝第一“神算子”刘伯温,帮大明定鼎江山,却改不了自己的命?
鲜草莓瑞士卷制作教程
温湿度传感器:智能监测环境
广西南宁:不出国门也能一日畅游东盟十国
曾国藩家训16字箴言探析
金融资本的定义是什么?这种资本如何影响市场运作?
老年痴呆症的病因是什么
中国皮卡发展进入新时代 亟需构建特色皮卡消费文化
棉裤选购指南:材质与保暖性解析
Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳
气候变化的原因:科学解读与应对策略
解锁医学领域的"隐藏职业":医学检验科学!
法语动词变位完全手册:掌握法语动词变位,让你的法语更地道!
《诗经》里的成语:七月流火 万寿无疆
为什么欧洲国家有不少著名女王,而法国王位却一直“与女无瓜”?
李素裳篇2:舰长离开后,女武神们过着怎样的日子21
韩雨霏:财商融入大学 构建大学生全面财务素养新模式
洛川:全力推进洛川苹果特征品质评价与全产业链标准体系构建项目
女人妇科病吃什么好得快?对妇科病好的5类食物
父母与子女:维系缘分的三个关键
设计一种利用睡眠周期提高睡眠质量的智能灯