问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

卷积的通俗解释

创作时间:
作者:
@小白创作中心

卷积的通俗解释

引用
CSDN
1.
https://blog.csdn.net/dog250/article/details/139935977

卷积(Convolution)是信号处理和机器学习领域中的一个核心概念。本文将从时间和空间两个维度来解释卷积的原理。

时间维度的卷积

在时间维度上,卷积可以理解为当前信号状态是所有历史信号状态的叠加。以信号 (f(t)) 为例,在时刻 (t) 的信号状态是所有 (t, t-1, t-2, t-3, \ldots) 时刻的信号 (f(t), f(t-1), f(t-2), f(t-3), \ldots) 作用到当前状态的叠加。如果用 (g(t)) 来刻画"作用力的变化",那么 (f(t), f(t-1), f(t-2), f(t-3), \ldots) 在当前的作用力分别为 (g(0), g(1), g(2), g(3), \ldots)。将这些作用力叠加起来,就得到了当前的信号状态。

为什么是 (f) 和 (g) 相乘?这里可以把 (g(t)) 理解为"单位信号随着时间流逝的作用力"。单位信号就是单位 1 的作用,即"单位冲激"。1 个信号强度随时间流逝的作用力是 (g),即"单位冲激响应",这描述了系统的特征。在线性系统中,(f) 的信号强度随时间的作用力自然就是 (f \times g)。

连续版本的卷积公式如下:

[
\int_0^t f(t-\tau)g(\tau)d\tau
]

这个写法和很多教科书上的写法是反着的,教科书上一般是:

[
\int_0^t f(\tau)g(t-\tau)d\tau
]

不过有了前面的解释后,这种写法也容易理解了。0 时刻的信号 (f(0)) 作用了 (t) 时间,以此类推,1,2,3,4 时刻的信号分别持续了 (t-1, t-2, t-3, t-4) 时间。

离散卷积的例子:移动指数平均

来看一个离散卷积的例子:移动指数平均。设时刻 (t) 的采样值为 (v_t),它在整体移动指数均值中的作用按系数 (\beta) 衰减,那么时刻 (t-1, t-2, t-3, \ldots) 的采样作用分别为 (v_{t-1} \cdot \beta^1, v_{t-2} \cdot \beta^2, v_{t-3} \cdot \beta^3, \ldots)。那么,当前的移动指数均值就是所有这些历史采样值作用的叠加:

[
A_t = (1-\beta)v_t + \sum_{n=1}^t v_{t-n} \cdot \beta^n
]

这就是一个离散的卷积形式。

空间维度的卷积

在空间维度上,卷积可以理解为当前位置的状态是其周边位置状态的叠加。在图像处理中,往往用矩阵卷积运算"用坐标 ((u, v)) 处周边坐标的特征影响坐标 ((u, v)) 的特征"。比如想要检测边缘,(g(x, y)) 是一个 (3 \times 3) 矩阵,为了加强像素差异,(g(x, y)) 矩阵可以写成下面这样:

[
\begin{bmatrix}
-1 & -1 & -1 \
-1 & 9 & -1 \
-1 & -1 & -1
\end{bmatrix}
]

这个和"当前信号状态是其周边状态的叠加"以及"当前移动指数平均是其周边采样值衰减的叠加"异曲同工,只是时间的周边只有历史,未来尚未到来。

卷积名称的由来

为什么叫"卷积"?这个名称来源于数学上的直观解释:想象一张纸的两面,一面写有函数 (f(x)),另一面写有函数 (g(x))。要让 (f(x)) 的每一个值和 (g(x)) 的每一个值相乘,就必须让它们相遇。最直观的方式就是将纸卷起来,使得 (f) 和 (g) 的每个值都能相遇并相乘。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号