资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

基于深度学习的花卉识别（附数据与代码）

创作时间:

作者:

@小白创作中心

基于深度学习的花卉识别（附数据与代码）

引用

来源

https://cloud.tencent.com/developer/article/1420138

用机器学习自动识花，不仅能帮助你准确区分玫瑰和蒲公英，还能让你在送花时避免踏入雷区。本文将详细介绍如何基于深度学习实现花卉识别，包括模型搭建、数据准备、训练过程和结果展示等关键步骤，并提供完整的代码示例。

什么是机器学习和计算机视觉？

计算机视觉是一门让计算机替你“看”的科学。机器学习，就是实现计算机视觉的一种工具和方法，它可以从数据中挖掘出规律，并用于预测或者分类。识别花卉的过程就是让计算机替你识别分类。

寻找一个合适的模型

实现学习和分类，我们可以采用神经网络模型。神经元的结构如下：

笼统说就是输入信号——处理——输出对应信号，而神经网络模型就是模仿了这一工作过程：

每个神经元都接受来自其它神经元的输入信号，每个信号都通过一个带有权重的连接传递;
神经元把这些信号加起来得到一个总输入值;
将总输入值与神经元的阈值进行对比（模拟阈值电位）;
通过一个“激活函数”处理得到最终的输出（模拟细胞的激活），这个输出又会作为之后神经元的输入一层一层传递下去。

如何让机器能够准确识别花的品种？很简单，一遍一遍反复的学习，直到能认准为止。“一遍一遍反复学习”这一行为，我们称之为深度学习。

学习要讲究方法，比如如何区分玫瑰和蒲公英，很简单，玫瑰一般为红色，花朵是卷起来的，而蒲公英大多为球状。这种提取特征的学习方法，我们通常称之为卷积。

花卉素材准备

如果想要认识各种花卉，首先要掌握每种花的特征。所以，我们先准备一些学习的素材：

大家可以在CSDN等技术网站搜集训练素材

这么多图片，一部分将用来作为训练集，另一部分数据会用来测试已经训练好模型的精确度。

训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。
测试集（Test Set）：用来测试已经训练好的模型的精确度。

测试的精确度越高越好吗？

并不是，如果模型在测试集上表现得越来越好，训练集表现却越来越差，就会过拟合。

欠拟合指模型没有很好地捕捉到数据特征，不能够很好地拟合数据：

过拟合通俗一点地说就是模型把数据学习的太彻底，以至于把噪声数据的特征也学习到了，这样就会导致在后期测试的时候不能够很好地识别数据，即不能正确的分类，模型泛化能力太差：

欠拟合和过拟合都不是好事情，这是我们判断该不该继续训练的重要指标。

搭建模型

这一部分是模型实现过程，有些步骤不再详细讲解，完整代码和学习资料可以在文末获取。

构建训练集模块和测试集模块：

train_datagen = ImageDataGenerator(
    rotation_range = 40,     # 随机旋转度数
    width_shift_range = 0.2, # 随机水平平移
    height_shift_range = 0.2,# 随机竖直平移
    rescale = 1/255,         # 数据归一化
    shear_range = 20,       # 随机错切变换
    zoom_range = 0.2,        # 随机放大
    horizontal_flip = True,  # 水平翻转
    fill_mode = 'nearest',   # 填充方式
)
test_datagen = ImageDataGenerator(
    rescale = 1/255,         # 数据归一化
)

在训练集中定义了旋转、平移、缩放等功能，这样可以让模型学习旋转、跳跃、闭着眼的花花图片，增加样本使用效率和模型准确度。

然后，开始搭建神经网络：

model = Sequential() #创建一个神经网络对象
#添加一个卷积层，传入固定宽高三通道的图片，以32种不同的卷积核构建32张特征图，
# 卷积核大小为3*3，构建特征图比例和原图相同，激活函数为relu函数。
model.add(Conv2D(input_shape=(IMG_W,IMG_H,3),filters=32,kernel_size=3,padding='same',activation='relu'))
#再次构建一个卷积层
model.add(Conv2D(filters=32,kernel_size=3,padding='same',activation='relu'))
#构建一个池化层，提取特征，池化层的池化窗口为2*2，步长为2。
model.add(MaxPool2D(pool_size=2,strides=2))
#继续构建卷积层和池化层，区别是卷积核数量为64。
model.add(Conv2D(filters=64,kernel_size=3,padding='same',activation='relu'))
model.add(Conv2D(filters=64,kernel_size=3,padding='same',activation='relu'))
model.add(MaxPool2D(pool_size=2,strides=2))
#继续构建卷积层和池化层，区别是卷积核数量为128。
model.add(Conv2D(filters=128,kernel_size=3,padding='same',activation='relu'))
model.add(Conv2D(filters=128,kernel_size=3,padding='same',activation='relu'))
model.add(MaxPool2D(pool_size=2, strides=2))
model.add(Flatten()) #数据扁平化
model.add(Dense(128,activation='relu')) #构建一个具有128个神经元的全连接层
model.add(Dense(64,activation='relu')) #构建一个具有64个神经元的全连接层
model.add(Dropout(DROPOUT_RATE)) #加入dropout，防止过拟合。
model.add(Dense(CLASS,activation='softmax')) #输出层，一共14个神经元，对应14个分类

为了方便观察模型，绘制一个网络结构图如下：

生成训练集和测试集的迭代器，用于把图片按一定批次大小传入模型训练：

train_generator = train_datagen.flow_from_directory( #设置训练集迭代器
    TRAIN_PATH, #训练集存放路径
    target_size=(IMG_W,IMG_H), #训练集图片尺寸
    batch_size=BATCH_SIZE #训练集批次
    )
test_generator = test_datagen.flow_from_directory( #设置测试集迭代器
    TEST_PATH, #测试集存放路径
    target_size=(IMG_W,IMG_H), #测试集图片尺寸
    batch_size=BATCH_SIZE, #测试集批次
    )

模型训练过程

一开始准确率是很低的，只有7%，约等于1/14，完全随机。

一段时间以后，训练超过200个周期，准确率就开始上升了，达80%。

而400个周期以后：

训练集准确率大于90%，而测试集准确率约84%。如果继续训练，训练集准确率还能再提高，但测试集准确率几乎提高不了。

这就是上文提到的过拟合，应该停止训练了。

结果展示

模型训练好了，我们可以采用实际的案例来测试下效果：

用一个简单的脚本来导入训练好的模型，再把用于预测的图片转换成模型的对应格式：

from keras.models import load_model
from keras.preprocessing.image import img_to_array,load_img
import numpy as np
import os
# 载入模型
model = load_model('flower_selector.h5')
label = np.array(['康乃馨','杜鹃花','桂花','桃花','梅花','洛神花','牡丹','牵牛花','玫瑰','茉莉花','荷花','菊花','蒲公英','风信子'])
def image_change(image):
    image = image.resize((224,224))
    image = img_to_array(image)
    image = image/255
    image = np.expand_dims(image,0)
    return image

遍历文件夹下的图片进行预测：

for pic in os.listdir('./predict'):
    print('图片真实分类为',pic)
    image = load_img('./predict/' + pic)
    image = image_change(image)
    print('预测结果为',label[model.predict_classes(image)])
    print('----------------------------------')

结果如下（可以上下滑动查看）：

预测准确率达到百分之百！！！！