从点积理解傅里叶变换:一个直观的数学推导
从点积理解傅里叶变换:一个直观的数学推导
傅里叶变换是数学和工程领域中一个极其重要的工具,它允许我们将信号或函数从时间域转换到频域,从而揭示信号的频率组成。本文将从一个全新的角度——向量点积,来理解傅里叶变换的原理,帮助读者建立直观的认识。
向量点积
先简单介绍一下向量的点积。假如我们现在有一个向量a长度为6,又有一个向量b长度为8,它们的夹角为60°,那么它们的点积就是用它们的模长乘以夹角的余弦值,得到24。
那么这样定义有什么用呢?它得出来的数值说明了什么呢?我们观察到,当夹角减小时,向量b在a方向上的投影变长,点积的结果也相应增大。这表明点积可以衡量两个向量的相似度:点积数值越大,相似度越高。
从观察者的角度来看,如果把向量具象化为一个观察者,那么观察者只能感知到与自己维度方向一致的部分。因此,向量b在向量a的眼里,其长度就是b在a方向上的投影长度,即b的模长乘以它们夹角的余弦值。
观察者角度看向量分解
我们找来两个相互垂直的观察者i和j,它们的长度都是1。通过i和m的点积可以得到i眼里的向量m的长度,同理,通过j和m的点积可以得到j眼里的向量m的长度。如果得到的数值分别是4和3,那么向量m就可以表示为4i加3j。
可以看出,向量m对观察者向量i的影响更大,它们也更相似。这里引入的观察者i和j都是单位向量,这其实就是归一化操作。归一化可以保证各个观察者在能量上是一致的,方便后续数据的处理。
连续函数的点积
我们放到直角坐标系当中去看。在直角坐标系下,两个向量X[x1,x2,x3,x4]和Y[y1,y2,y3,y4]的点积是对应的分量相乘再相加。现在我们来思考这样一种情况:假如我们有两个向量Xn[x1,x2,x3,x4,…xn] 和Yn[y1,y2,y3,…yn],我们把Xn的每一个分量均匀放在时间轴t上,假设范围是(t1,t2),那么这就可以看作是一个t1到t2的离散函数。
当n 越来越大趋于无穷的时候,那么均匀分布在t轴上的数就会越来越多,直到连续。那么这就是一个连续函数X(t),t∈[t1,t2],Yn同理。这样我们就可以看出来,一个连续的函数等价于无穷维的向量。
结合向量的点积,这些就是对应点的函数值相乘,当它们是连续函数的时候,直接用两个函数相乘就行了,就是X(t)乘以Y(t)。那么相加的动作,在连续函数当中就是求积分,如果定义域是t1,t2的闭区间,那么式子就是:
从图像上来看,这个式子的数值是大于0的,也就是说,它们之间是存在一些相似度的。那么上面的呢就是连续函数点乘的定义了。
从点积推导傅里叶变换
让我们把目光放在傅里叶级数上。傅里叶级数是由一系列简单的正余弦函数作为基,例如2pi周期的函数的基就是cost,cos2t,cos3t等等,这些基是通过不同频率来进行区分的,它们可以看到目标函数在自己频率世界中的投影,也就是影响是多少。
如果高频的观察者和目标函数相似度更高,那么就说明原函数的高频成分就更多。例如,我们有一个目标函数f(t),我们想看cosnt和目标函数相似度有多少,即成分的高低,那么我们直接让二者点乘即可,即从[-pi,pi]。
如果你还想进一步看一下f(t)在cosnt上具体的投影是多少呢,那就离不开归一化操作了,刚才已经讲过了要么观察者是归一的要么系数是归一的。连续函数不就是连续无穷维向量吗?所以连续函数的模长就是,cosnt的模长就是:
,其实连续函数的模长有一个专有名词叫做2-范数。很明显cosnt这个观察者没有归一,所以投影系数呢就得归一,我们看之前总结的公式。代入后就是:
这个式子是不是非常眼熟?它就是傅里叶级数求An的公式,对应到不同频率基的振幅。这样我们就可以求出原函数在不同频率下的投影是多少了。
接下来更进一步进入到傅里叶级数的复变换形式。上周我们都了解了欧拉公式,那么我们就可以把代入进去了。不过要注意一件事情,两个复函数的点乘是取后者的共轭函数进行计算的。取代了之前的cosnt成为了新的观察者,那么让它来对f(t)进行点乘来看相似度有多少,的共轭复数是,进行点乘之后有:
,而且我们可以看到,观察者已经归一了,因为它表示的都是半径为1的旋转,那么现在我们再看看这个公式,这其实就是连续函数的傅里叶变换的公式。我们积分出来的结果一般都是一个关于角频率w的复函数,那么这个复函数的模就可以理解为我们前面所说过的投影数。
以上就是从点积或者说点乘角度来理解傅里叶变换,希望能帮助到大家对傅里叶变换有更深层次的认识。
总结
- 点积就是计算A与B之间的相似程度。
- 一个n维向量存在n个基,第i个基与其进行点积,可以得到该向量在第i个基上的相似度。
- 无穷维的向量可以看作是一个连续的函数,此时点积可看作积分。
- 引入欧拉公式,将目标函数与不同基点乘,从而得到不同频率的成分大小,这就是连续傅里叶变换。
应用
- 图像压缩与增强:傅里叶变换可以将图像转换到频域,从而分离出代表图像细节的高频分量和表示图像结构的低频分量。这一特性被用于图像压缩,通过去除或减少高频噪声来减小图像大小,同时保持视觉质量。在图像增强方面,可以通过调整频域系数来改善图像的清晰度或进行去模糊处理。
- 音频信号处理:在语音识别、音乐分类和音频降噪等任务中,傅里叶变换用于分析音频信号的频率组成,帮助识别特定的声音特征,从而提高处理的准确性和效率。
- 时序数据分析:在处理时间序列数据(如股票价格、传感器读数)时,傅里叶变换能够揭示数据中的周期性成分,帮助预测未来趋势、异常检测和模式识别。
- 降维和特征工程:在高维数据集中,傅里叶变换可以揭示数据的频率特性,通过选择或构造基于频率的特征,降低数据维度,提高机器学习模型的训练效率和泛化能力。