资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

YOLOv5水印检测实战：从原理到代码实现

创作时间:

作者:

@小白创作中心

YOLOv5水印检测实战：从原理到代码实现

引用

CSDN

https://blog.csdn.net/yangzheng_520/article/details/122448070

YOLOv5是基于YOLOv4算法的改进版本，其在COCO数据集上的测试效果表现良好。本文将详细介绍YOLOv5的网络结构、参数配置以及训练过程，并提供具体的代码实现和报错解决方案。

简介

YOLOv5在YOLOv4算法的基础上做了进一步的改进，检测性能得到进一步的提升。虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析，但是YOLOv5在COCO数据集上面的测试效果还是挺不错的。

YOLOv5是一种单阶段目标检测算法，该算法在YOLOv4的基础上添加了一些新的改进思路，使其速度与精度都得到了极大的性能提升。主要的改进思路如下所示：

输入端：在模型训练阶段，提出了一些改进思路，主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放；
基准网络：融合其它检测算法中的一些新思路，主要包括：Focus结构与CSP结构；
Neck网络：目标检测网络在BackBone与最后的Head输出层之间往往会插入一些层，Yolov5中添加了FPN+PAN结构；
Head输出层：输出层的锚框机制与YOLOv4相同，主要改进的是训练时的损失函数GIOU_Loss，以及预测框筛选的DIOU_nms。

网络结构

改编自知乎大佬的一张图：

Yolov5s网络是Yolov5系列中深度最小，特征图的宽度最小的网络。后面的3种（Yolov5m、Yolov5l、Yolov5x）都是在此基础上不断加深，不断加宽。

参数

train.py（训练）

weights：权重文件（官方给了很多，看情况下载）
cfg：网络结构参数配置文件（锚点、骨干网络、头网络）
data：数据位置的配置文件
hyp：超参数配置文件（学习率、损失增益等）
epochs：训练轮数
batch-size：图片输入数量
img-size：输入图片大小，放缩图片
rect：矩形训练，减去一些不必要的信息
resume：是否接着上次打断的训练,TRUE的话需要指定上次中断的训练模型路径
nosave：不保存模型，仅保存最后的模型
notest：不进行test测试，仅测试最后一轮
noautoanchor：不调整anchor,禁止自动定位检查,设置目标检测的锚点框
evolve：对超参数进行净化
bucket：谷歌云盘，不使用
cache-images：将图片缓存到内存中，加快模型训练
image-weights：使用加权图像进行训练（测试过程），对训练不好的图片下一轮增加权重
device：GPU还是CPU的使用
multi-scale：改变图像尺寸
single-cls：用于设定训练集是多类数据、单类数据
adam：优化器
sync-bn：分布式训练
local_rank：不能修改，单机多卡训练
workers：最大工作训练核心、线程网上建议设置0
project：模型保存位置，没有会自动生成
entity：wandb库，可以看训练过程，一般不用（需要自己注册账号）
name：模型保存的文件夹，多次运行：exp1，exp2…
exist-ok：预测结果保存位置，覆盖上次结果不新建结果文件
quad：用于训练集图像大于–img-size设置的640图片，训练效果更好，小于的效果差一些
linear-lr：学习速率调整，默认FALSE 通过余弦函数降低学习率
label-smoothing：防止过拟合，对标签进行平滑处理，防止分类算法中产生过拟合
upload_dataset：wandb库的
bbox_interval：wandb库的
save_period：用于记录训练日志

yolov5s.yaml（进行和你选择的结构参数配置文件）

nc：分类的类别
depth_multiple和width_multiple：根据选择的配置文件不同而不一样

voc.yaml（数据配置文件）

train和val指定训练数据的位置，还可以设置test
nc：分类的类别
names：每个类别的名字

detect.py（预测）

source：预测数据路径
weights：训练好的best.pt文件路径
conf-thres：置信度阈值
iou-thres：交并比阈值
conf-thres和iou-thres确定返回的预测框

test.py（测试）

save-txt：返回检测框TXT文件
save-hybrid：标签和预测结果保存TXT文件
save-conf：检测到的坐标返回TXT文件
其余参数大致和train相同

数据标注

使用标注精灵：新建一个项目，选择位置标注和自定义标注类别，导入数据，选择矩形框标注，导出数据为XML文件。

格式转化

voc2yolov5.py

classes：类别名称
TRAIN_RATIO：按比例划分train和val
convert_annotation函数：读取xml文件，写入TXT文件，确定标注好的XML文件和查找位置相同
os.getcwd() 绝对路径
创建放图片、labe、train、val等文件夹

过程

先进行数据的格式转化，然后train的参数修改，最后修改对应的配置文件，运行train进行模型训练。预测、测试同理

结果

配置文件指定路径下生成结果，模型权重文件防在weights下面，存在best和last（最好的和最好的），参数文件

检测结果

开始运行：

报错

wandb：报错说没有账号等，可以直接关闭
找到utils下的wandb_loggig下面的wandb_utils添加：

利用tensorboard可视化训练过程，训练开始会在yolov5目录生成一个runs文件夹，利用tensorboard打开即可查看训练日志

tensorboard --logdir=runs

注意：数据转化的时候一定要把数据类别名称加上。

环境

符合CUDA11.1的pytroch：

pip install torch==1.8.1 torchvision==0.9.1 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

热门推荐

OA系统与RPA技术结合，提升企业管理效率

《西游记》人物名称演变：孙悟空、猪八戒、沙僧的多重身份

《门神》：中国动画学派的“新样貌”与“再思考”

云南所有大学排名及录取分数线一览表（含位次，2025参考）

天津煎饼果子的正宗做法，带你走进美味的世界！

护士执业注册常见问题答疑

退休金差好几千？养老保险怎么交，才最划算？

600元一斤的信阳毛尖值不值得入手？从品质到性价比的全面解析

揭秘可控核聚变：50年内or还在未来？

明朝第一“神算子”刘伯温，帮大明定鼎江山，却改不了自己的命？

金融资本的定义是什么？这种资本如何影响市场运作？

老年痴呆症的病因是什么

中国皮卡发展进入新时代亟需构建特色皮卡消费文化

棉裤选购指南：材质与保暖性解析

Grok 3冲击诺奖级突破，成证明「黎曼猜想」关键！AI与数学家打出终极组合拳

气候变化的原因：科学解读与应对策略

解锁医学领域的"隐藏职业"：医学检验科学！

法语动词变位完全手册：掌握法语动词变位，让你的法语更地道！

《诗经》里的成语：七月流火万寿无疆

为什么欧洲国家有不少著名女王，而法国王位却一直“与女无瓜”？

李素裳篇2：舰长离开后，女武神们过着怎样的日子21

韩雨霏:财商融入大学构建大学生全面财务素养新模式

洛川：全力推进洛川苹果特征品质评价与全产业链标准体系构建项目

女人妇科病吃什么好得快？对妇科病好的5类食物

父母与子女：维系缘分的三个关键

设计一种利用睡眠周期提高睡眠质量的智能灯