深度学习入门：神经网络基础与实战

创作时间:

作者:

@小白创作中心

深度学习入门：神经网络基础与实战

引用

CSDN

https://m.blog.csdn.net/Wei_sx/article/details/144907477

神经网络是一种模仿人脑神经元工作原理的机器学习模型，广泛应用于各类任务，如分类、回归和生成模型。本文将详细介绍神经网络的基本构成、工作原理、类型、训练过程以及应用场景。

1. 基本构成

神经网络主要由以下几个部分组成：

神经元（Neuron）：基本的计算单元，接收输入信号并产生输出。每个神经元执行加权求和并通过激活函数产生输出。
层（Layer）：
输入层：接收输入数据，节点数等于输入特征数量。
隐藏层：位于输入层和输出层之间，负责特征抽取。可以有多个隐藏层，形成深度网络。
输出层：产生最终的输出，节点数通常与任务相关（例如，在分类问题中与类别数相同）。
权重和偏置：连接各层神经元的参数，代表每个输入信号的重要性。通过训练进行调整以降低误差。
激活函数（Activation Function）：引入非线性特性，使神经网络能够学习非线性关系。常见的激活函数包括 ReLU（Rectified Linear Unit）、Sigmoid 和 tanh。

2. 工作原理

神经网络的工作原理可以概括为以下几个步骤：

2.1 前向传播（Forward Propagation）

输入数据通过神经网络，从输入层经过隐藏层到输出层。每个神经元将其输入信号加权并通过激活函数传递至下一层。

2.2 损失计算（Loss Calculation）

输出层生成的结果与真实标签（ground truth）进行比较，计算损失值（loss），常用损失函数有均方误差和交叉熵。

2.3 反向传播（Backward Propagation）

根据损失计算得到的结果，通过链式法则计算损失相对于每个参数的梯度，并向后传播以更新权重。

2.4 权重更新（Weight Update）

使用优化算法（如 SGD、Adam）更新网络权重和偏置，以最小化损失函数。

3. 类型

不同类型的神经网络适用于不同任务，主要包括：

全连接神经网络（Fully Connected Network, FNN）：每个神经元与上一层的所有神经元相连接。适用于结构化数据。
卷积神经网络（Convolutional Neural Network, CNN）：专门用于图像处理，通过卷积操作提取局部特征，广泛应用于图像分类和目标检测。
递归神经网络（Recurrent Neural Network, RNN）：用于处理序列数据，具有短期记忆，适合时间序列预测和自然语言处理。LSTM 和 GRU 是 RNN 的改进版本。
生成对抗网络（Generative Adversarial Network, GAN）：由生成器和判别器组成，通过对抗训练生成逼真的数据样本。

4. 训练过程

神经网络的训练通常包括以下步骤：

数据准备：收集和预处理数据，划分训练集和测试集。
模型构建：定义网络的架构，包括层数、节点数和激活函数。
模型编译：选择损失函数和优化器。
模型训练：使用训练数据进行学习，并迭代更新参数。
模型评估：在测试数据上评估模型性能，验证其泛化能力。

5. 应用场景

神经网络在多个领域得到了成功应用，包括：

计算机视觉：如图像分类、自动驾驶的目标检测、图像分割。
自然语言处理：如机器翻译、情感分析、文本生成，如 ChatGPT。
语音识别：将语音信号转录为文本。
推荐系统：为用户推荐个性化内容。
医疗：病例诊断、医学影像分析等。

示例代码：构建一个简单的神经网络

下面是使用 Keras 创建和训练简单的全连接神经网络的示例，以手写数字识别的 MNIST 数据集为例。

# 1 导入必要的库
import tensorflow as tf  
from tensorflow import keras  
from tensorflow.keras import layers

# 2. 加载和预处理数据
# 加载MNIST数据集  
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()  
# 数据预处理：将图片展平并归一化  
x_train = x_train.reshape(-1, 28*28).astype('float32') / 255  
x_test = x_test.reshape(-1, 28*28).astype('float32') / 255  
# 将标签进行独热编码  
y_train = keras.utils.to_categorical(y_train, 10)  
y_test = keras.utils.to_categorical(y_test, 10)

# 3. 构建模型
model = keras.Sequential()  
model.add(layers.Dense(128, activation='relu', input_shape=(28*28,)))  # 隐藏层  
model.add(layers.Dense(10, activation='softmax'))  # 输出层

# 4. 编译模型
model.compile(optimizer='adam',   
              loss='categorical_crossentropy',   
              metrics=['accuracy'])

# 5. 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=32)

# 6. 评估模型
test_loss, test_accuracy = model.evaluate(x_test, y_test)  
print("\nTest accuracy:", test_accuracy)