YOLOv8图像识别与目标检测实战：从项目文件结构开始到多场景应用的解析

创作时间:

作者:

@小白创作中心

YOLOv8图像识别与目标检测实战：从项目文件结构开始到多场景应用的解析

引用

CSDN

https://blog.csdn.net/qq_53773901/article/details/145784369

YOLOv8是一种先进的目标检测算法，能够快速准确地识别图像中的多个对象，并在图像上标注出检测结果。本文将详细介绍基于YOLOv8的图像目标检测项目，从项目结构到代码实现，再到应用场景，帮助读者全面了解和掌握YOLOv8的目标检测技术。

效果预览

原始图片（该图片是从一个交通的视频中截取的）：

处理后的图片（包括了识别的物体并标注了名称）：

项目文件结构

YOLO_Project/
│
├── TEST/
    ├── test2.py          # 主程序文件
    ├── yolov8x.pt        # YOLOv8预训练模型
    │
    ├── datasets/         # 输入图片目录
    │   └── test.png      # 测试图片
    │
    └── results/          # 输出结果目录
        └── result.png    # 检测结果图片

项目简介

这是一个基于YOLOv8模型的图像目标检测项目，能够识别图像中的多个对象，并在图像上标注出检测结果。

代码详细解析

1. 环境配置和依赖导入

import cv2
from ultralytics import YOLO
import os
current_dir = os.path.dirname(os.path.abspath(__file__))

使用OpenCV处理图像
导入YOLO模型进行目标检测
使用os模块处理文件路径
获取当前文件所在目录路径

2. 模型加载和图像预处理

# 加载模型
model = YOLO('yolov8x.pt')

# 设置图片路径
image_path = os.path.join(current_dir, 'datasets', 'test.png')
image_write_path = os.path.join(current_dir, 'results', 'result.png')
# 读取图像
image = cv2.imread(image_path)
# 获取屏幕分辨率和图像缩放
screen_res = 1920, 1080
scale_width = screen_res[0] / image.shape[1]
scale_height = screen_res[1] / image.shape[0]
scale = min(scale_width, scale_height) * 0.8
# 图像缩放处理
if scale < 1:
    new_width = int(image.shape[1] * scale)
    new_height = int(image.shape[0] * scale)
    image = cv2.resize(image, (new_width, new_height), interpolation=cv2.INTER_AREA)

加载预训练的YOLOv8x模型
自动处理图像尺寸，使其适应屏幕显示
支持大尺寸图像的自动缩放功能

3. 目标检测流程

# 进行目标检测
results = model(image)
# 显示检测结果
for result in results:
    boxes = result.boxes  # Boxes object for bbox outputs
    for box in boxes:
        # 获取边界框坐标
        x1, y1, x2, y2 = box.xyxy[0]
        x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)
        
        # 绘制边界框
        cv2.rectangle(image, (x1, y1), (x2, y2), (0, 255, 0), 2)
        
        # 添加类别标签和置信度
        conf = float(box.conf)
        cls = int(box.cls)
        label = f'{result.names[cls]} {conf:.2f}'
        cv2.putText(image, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

模型对输入图像进行推理
获取检测框信息
显示每个检测对象的类别和置信度
在图像上绘制边界框和标签

4. 结果展示

# 保存图像
cv2.imwrite(image_write_path, image)
# 创建可调整大小的窗口
cv2.namedWindow('Detection Result', cv2.WINDOW_NORMAL)
cv2.resizeWindow('Detection Result', new_width, new_height)
# 显示图像
cv2.imshow('Detection Result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()