资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

生成模型概述

创作时间:

作者:

@小白创作中心

生成模型概述

引用

CSDN

https://blog.csdn.net/weixin_43186779/article/details/136969558

生成模型是深度学习领域的一类重要模型，它们的目标是学习如何生成数据的分布，从而能够生成新的、与真实数据类似的样本。本文将详细介绍几种主要的生成模型类型及其原理和应用。

生成模型概述

生成模型是深度学习领域的一类模型，它们的目标是学习如何生成数据的分布，从而能够生成新的、与真实数据类似的样本。以下是几种主要的生成模型：

一、生成模型类型

生成对抗网络（GANs）

GAN由两个部分组成：生成器（生成新数据）和判别器（区分真实数据和生成的数据）。这两部分在训练过程中相互竞争，提高彼此的性能。

应用：图像生成、艺术创作、数据增强、风格迁移等。

自回归模型（Autoregressive Models）

如Transformer在自然语言处理领域的应用。这些模型预测序列中的下一个元素，基于前面的元素。

应用：文本生成、机器翻译等。

扩散模型（Diffusion Models）

这类模型通过将数据转化为噪声，然后再逆过程中重建原始数据，来生成新的数据样本。

应用：高质量图像生成、文本到图像生成等。

流模型（Flow-based Models）

如RealNVP和Glow，这些模型通过可逆的神经网络变换实现从数据空间到潜在空间的映射。

应用：图像生成、数据去噪、概率建模等。

变分自编码器（VAEs）

VAE是一种基于贝叶斯推理的生成模型，它通过编码器将数据映射到潜在空间，然后通过解码器从潜在空间重构数据。

应用：图像生成、图像去噪、推荐系统等。

循环神经网络（RNNs）及其变体（如LSTM、GRU）

RNN及其变体特别擅长处理序列数据，可以用于生成文本、音乐等序列数据。

应用：文本生成、语音合成、音乐创作等。

其中，较为常见的方法主要为：生成对抗网络（GANs），自回归模型（Autoregressive Models），扩散模型（Diffusion Models）和Flow-base model。

二、生成对抗网络（GANs）

生成对抗网络的基本原理可以看左侧的示意图。

2014 年，Ian J.Goodfellow 提出了 GAN，它是由一个生成器 G 和一个判别器 D 组成。生成网络产生「假」数据，并试图欺骗判别网络；训练的时候，判别网络对生成数据进行真伪鉴别，试图正确识别所有「假」数据。在训练迭代的过程中，两个网络持续地进化和对抗，直到达到平衡状态，判别网络无法再识别「假」数据。

推理的时候，只要保留生成器 G 就行了，输入一个随机噪声 vector，生成一张图像。

右侧是一个经典的 AttnGAN 的框架，是一个引入了 attention 结构（使得图片生成局部能够和文本描述更加匹配）、并且从粗粒度到细粒度 coarse to fine 进行生成的框架，在当时还是取得了不错的生成效果。

GAN 的优势是在一些窄分布（比如人脸）数据集上效果很好，采样速度快，方便嵌入到一些实时应用里面去。

缺点是比较难训练、不稳定，而且有 Mode Collapse（模式崩塌）等问题。