资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

什么是深度学习？

创作时间:

作者:

@小白创作中心

什么是深度学习？

引用

CSDN

https://blog.csdn.net/lilinhai548/article/details/141073537

深度学习是机器学习的一个重要分支，通过构建多层神经网络模型，使计算机能够从大量数据中自动学习特征并做出预测或决策。本文将从深度学习的工作原理、模型类型、与机器学习的区别以及其重要应用等方面进行全面介绍。

1. 前言

深度学习是机器学习的一个分支，它使用神经网络教计算机做人类自然而然会做的事情：从示例中学习。在深度学习中，模型会学习直接从图像、文本或声音等数据中执行分类或回归任务。深度学习模型可以达到最先进的准确率，通常超过人类的表现水平。

2. 深度学习如何工作？

深度学习模型基于神经网络架构。神经网络的灵感来自人类大脑，由分层结构中相互连接的节点或神经元组成，将输入与所需输出联系起来。神经网络输入层和输出层之间的神经元称为隐藏层。术语“深度”通常指神经网络中隐藏层的数量。深度学习模型可以有数百甚至数千个隐藏层。

神经网络架构

深度学习模型使用大量带标签的数据进行训练，通常可以直接从数据中学习特征，而无需手动提取特征。虽然第一个人工神经网络在 1958 年就已提出理论，但深度学习需要强大的计算能力，而这种能力直到 2000 年代才出现。现在，研究人员可以使用计算资源来构建和训练具有数百个连接和神经元的网络。

高性能 GPU 具有并行架构，非常适合深度学习。与集群或云计算相结合，开发团队可以将深度学习网络的训练时间从数周缩短到数小时甚至更短。

2.1 深度学习模型的类型

三种类型的深度学习模型，分别是

卷积神经网络（CNN）
递归神经网络（RNN）
变换器模型（Transformers）

2.1.1 卷积神经网络（CNN）

CNN 将学习到的特征与输入数据进行卷积，并使用 2D 卷积层，因此这种架构非常适合处理 2D 数据（例如图像）。CNN 的工作原理是直接从图像中提取特征。在网络对一组图像进行训练时，会学习相关特征。这种自动特征提取使深度学习模型在图像分类任务中具有高度准确性。CNN 还可用于对其他类型的数据进行分类，例如时间序列和文本。

可视化卷积神经网络

2.1.2 递归神经网络（RNN）

递归神经网络 (RNN) 是一种用于深度学习的网络架构，可预测时间序列或顺序数据。RNN 特别适合处理长度不一的顺序数据，并解决自然信号分类、语言处理和视频分析等问题。长短期记忆(LSTM) 网络是一种特殊类型的 RNN，与简单的 RNN 相比，它更擅长学习长期依赖关系。

2.1.3 变换器模型（Transformers）

Transformers 旨在跟踪顺序数据中的关系。它们依靠自注意力机制来捕获输入和输出之间的全局依赖关系。它们通常用于自然语言处理，并且是 BERT 和ChatGPT™等大型语言模型 (LLM) 的基础。

2.2 如何创建深度学习模型

您可以从头开始创建深度学习模型，也可以从预先训练的深度学习模型开始，然后将其应用或调整到您的任务中。

2.1.1 从头开始训练

要从头开始训练深度学习模型，您需要收集大量带标签的数据集，并设计一个用于学习特征和模型的网络架构。对于新的或特定的应用程序，或者更一般地说，对于不存在现有模型的应用程序，这是一种很好的方法。这种方法的主要缺点是它需要大量数据集（标注了基本事实），并且训练时间可能需要数小时到数周，具体取决于您的任务和计算资源。

2.1.2 迁移学习

在图像分类、计算机视觉、音频处理和自然语言处理等深度学习应用中，迁移学习方法被广泛使用。它涉及对预训练的深度学习模型进行微调。您从现有模型（例如用于图像分类的 SqueezeNet 或 GoogLeNet）开始，然后输入包含以前未见过的类别的新数据。对网络进行一些调整后，您现在可以执行新任务，例如仅对狗或猫进行分类，而不是对 1000 个不同的对象进行分类。这还具有需要更少数据的优势，因此训练时间显著缩短。

预训练的深度学习模型也可用作特征提取器。您可以使用层激活作为特征来训练另一个机器学习模型（例如支持向量机 ( SVM)）。或者，您可以将预训练模型用作另一个深度学习模型的构建块。例如，您可以使用图像分类 CNN 作为对象检测器的特征提取器。

3. 深度学习与机器学习

深度学习是机器学习的一种特殊形式，两者都属于人工智能 (AI)领域。机器学习提供各种技术和模型，您可以根据应用程序、要处理的数据大小以及要解决的问题类型进行选择。

比较人工智能应用的深度学习或机器学习算法的选择取决于系统的目标和要求

为什么选择深度学习而不是机器学习？一个词就是准确度。与机器学习相比，深度学习通常能实现更高的准确度，并能提供更多扩展工作流程的自动化。深度学习模型的主要缺点是它们更复杂，需要更大的训练数据集，因此训练时间更长。存在一些方法可以克服或至少减轻这些缺点的影响。

3.1 特征工程自动化

机器学习工作流程首先从数据中手动提取相关特征。然后使用这些特征创建可以预测新数据的模型。借助深度学习工作流程，在图像识别和计算机视觉等应用中，可以自动从图像数据中提取相关特征。在处理信号或文本数据时，深度学习可以减少所需的数据预处理。

比较机器学习方法对车辆进行分类（左）和深度学习方法（右）

3.2 训练数据和时间

深度学习的准确性随数据而变化。也就是说，随着训练数据量的增加，深度学习的性能会不断提高。通常，深度学习需要大量数据（例如，用于图像分类的数千张图像）来训练模型。使用高性能GPU可以大大缩短训练时间。作为替代方案，使用迁移学习修改和重新训练预训练网络通常比从头开始训练网络要快得多，并且需要的标记数据也更少。

如果没有足够的训练数据，您可以使用合成数据补充现有数据。您可以使用生成对抗网络 (GAN)或通过创建和模拟物理系统模型来生成合成数据。