问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

音频从采集到输出涉及的关键参数

创作时间:
作者:
@小白创作中心

音频从采集到输出涉及的关键参数

引用
CSDN
1.
https://blog.csdn.net/CSDNedu/article/details/143510318

音频从采集到输出涉及多个关键参数,这些参数决定了音频的质量和表现。本文将详细介绍音频处理中的核心概念,包括采样数据格式、采样频率、声道布局、采样位深度、码率以及编解码技术。

音频采样数据格式

音频信号从自然界的声音到数字设备播放的过程可以概括为以下步骤:

  1. 模拟信号采集:自然界的声音(如鸟鸣、水流)是通过空气振动传输的模拟信号。这些信号可以通过麦克风或拾音器采集。
  2. 模数转换(ADC):采集到的模拟信号需要转换成数字信号。这个过程通常由麦克风或音频转换器完成。
  3. 脉冲编码调制(PCM):PCM是对连续变化的模拟信号进行采样、量化和编码,将其转换成离散的数字信号。
  4. 存储与输出:转换后的数字信号可以存储起来,也可以直接输出到扬声器或耳机。不同设备对音频数据的支持情况不同,因此需要对PCM采样数据进行格式转换。

音频采样频率

音频采样频率决定了音频信号的还原质量。人耳能听到的频率范围是20Hz~20kHz,为了保证音频不失真,采样频率通常需要在40kHz以上。以下是常见的采样频率及其应用场景:

  • 8000 Hz:主要用于电话通信
  • 11025 Hz、22050 Hz:主要用于无线电广播
  • 44100 Hz:常用于音频CD、MP3音乐播放等场景
  • 48000 Hz:常用于miniDV、数字电视、DVD、电影和专业音频设备

音频声道及其布局

声道布局决定了声音的空间分布。常见的声道布局包括:

  • 立体声:左声道和右声道
  • 环绕声:多个声道,如5.1声道(5个主声道+1个低音声道)

音频采样位深度

采样位深度决定了声音的动态范围。位深度越高,动态范围越大,能够记录的细节越多。以下是常见位深度及其对应的动态范围:

  • 8bit:约48dB
  • 16bit:约96dB
  • 20bit:约120dB
  • 24bit:约144dB

音频的码率

码率表示每秒钟存储或传输的编码压缩后的数据量。计算公式为:

$$声道数\times采样率\times采样位深\times时长$$

例如,一个双声道立体声、采样率为48000Hz、采样位深为16位、时长为1分钟的音频,其存储空间占用计算为:

$$2\times48000\times16\times60 = 92160000 b = 11520000 B = 11.52 MB$$

码率为:

$$92160000b\div60s=1536000bps=1536kbps=1.536Mbps$$

音频的编解码

为了节省传输带宽和存储空间,通常会对音频数据进行编码压缩。常见的音频编码格式包括:

  • AAC:广泛应用于音乐播放器和音乐格式封装
  • MP3:性价比相对较低,但仍在使用
  • OPUS:常见于语音通信
  • AC-3:在全景声音乐压缩场景下效果较好

思考题

当我们播放一段PCM音频的时候,声音听上去比正常声音显得更尖更细,但是速度是正常的,是什么原因呢?

欢迎在评论区留下你的答案和讨论。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号