问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

语音信号处理中的“窗函数”

创作时间:
作者:
@小白创作中心

语音信号处理中的“窗函数”

引用
1
来源
1.
https://www.cnblogs.com/LXP-Never/articles/18175066.html

在语音信号处理中,窗函数扮演着至关重要的角色。它能够帮助我们解决频谱泄漏和混叠问题,提高信号分析的准确性。本文将带你深入了解窗函数的基本概念、类型及其在实际应用中的选择方法。

什么是窗函数?

语音信号是一个非平稳的时变信号,但在10~30毫秒的短时间内可以认为是平稳的。为了分析这样的信号,我们通常会将其分割成短帧,然后对每一帧进行傅里叶变换。然而,这种简单的截断操作会导致两个主要问题:频谱泄漏混叠

  • 频谱泄漏:如果不加窗,默认就是矩形窗,时域的乘积就是频域的卷积,使得频谱以实际频率值为中心,以窗函数频谱波形的形状向两侧扩散,指某一频点能量扩散到相邻频点的现象,会导致幅度较小的频点淹没在幅度较大的频点泄漏分量中
  • 频谱混叠:会在分段拼接处引入虚假的峰值,进而不能获得准确的频谱情况

加窗的目的让一帧信号的幅度在两端渐变到 0,渐变对傅里叶变换有好处,可以让频谱上的各个峰更细,不容易糊在一起,从而减轻频谱泄漏和混叠的影响

加窗的代价一帧信号两端的部分被削弱了,没有像中央的部分那样得到重视。弥补的办法就是相互重叠。相邻两帧的起始位置的时间差叫做帧移,常见的取法是取为帧长的一半

常见的窗函数

对于语音信号处理,常用的窗函数包括汉宁窗(Hann)、汉明窗(Hamming)、平方根汉宁窗(sqrthann)等。它们的时域波形和幅频响应如下所示:

如何选择窗函数?

选择窗函数时需要考虑以下因素:

  1. 主瓣宽度:主瓣越窄,频率分辨率越高
  2. 旁瓣增益:旁瓣越小,泄漏失真越小

但需要注意的是,主瓣窄、旁瓣小且衰减快的窗函数是不容易找到的。例如,矩形窗虽然主瓣最窄,但旁瓣很大。下图展示了矩形窗与汉宁窗处理同一段语音信号时的时域波形及频谱图。可以看出,矩形窗导致基音谐波峰尖锐且频谱破碎,而汉宁窗则表现更好。

周期窗与对称窗

在实际应用中,窗函数可以分为周期窗和对称窗两种类型:

  • 周期窗:主要用于频谱分析
  • 对称窗:主要用于滤波器设计

下图展示了周期窗和对称窗的区别:

窗长的选择

窗长的选择需要在频率分辨率和时间分辨率之间做出权衡:

  • 长窗:频率分辨率高,但时间分辨率低
  • 短窗:时间分辨率高,但频率分辨率低

低延迟非对称窗

在实时处理场景中,延迟是一个重要指标。低延迟非对称窗通过特殊设计,可以在保持良好频谱特性的同时,显著降低处理延迟。这种窗函数在助听器等实时音频处理设备中得到广泛应用。

总结

窗函数是语音信号处理中的关键技术,合理选择和使用窗函数可以显著提高信号分析的准确性和效率。通过本文的介绍,希望读者能够对窗函数有更深入的理解,并在实际应用中做出合适的选择。

参考文献

  1. CEC2 E008 Technical Paper
  2. Wang Z Q, Wichern G, Watanabe S, et al. STFT-domain neural speech enhancement with very low algorithmic latency[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2022, 31: 397-410.
  3. Mauler D, Martin R. A low delay, variable resolution, perfect reconstruction spectral analysis-synthesis system for speech enhancement[C]//2007 15th European Signal Processing Conference. IEEE, 2007: 222-226.
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号