常见的音频知识

PCM(Pulse Code Modulation，脉冲编码调制)

是未经压缩的原始音频数据。由麦克风采集到的模拟信号经过采样、量化、A/D转换而成的数字音频数据

采样频率（clock rate)

也称取样频率,以Hz为单位，指每秒钟取得声音样本的次数，香农定理中要求采样频率至少为最高信号源频率的2倍，实际应用中可能高于2倍。采样频率越高,声音的质量越好。但是，由于人耳的分辨率很有限, 太高的频率差异分辨不出来，所以实际应用中采样频率不会超过48KHz。一般分为22.05KHz、44.1KHz、48KHz三个等级，22.05只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。人能感受到的频率范围为20HZ--20kHZ,更高的可以是48kHZ和96kHZ

窄带和宽带

窄带频率范围为200Hz--3400Hz,相应的采样频率为8000Hz; 宽带频率范围为50Hz--7000Hz,相应的采样频率为16000Hz，即16kHz

采样位数

数字信号是用0和1来表示的。采样位数就是采样值用多少位0和1来表示，也叫采样精度，用的位数越多，表示的声音波形越平滑，就越接近真实声音。如用8位表示，采样值取值范围就是-128--127，如用16位表示，采样值取值范围就是-32768--32767。一般都用16位采样位数。

每帧采样数（samples per frame)

针对帧信号来说的，指每一帧所含的样本数。

声道（channel）

单声道（mono）：只有一个声道
双声道：分左、右声道，立体声（stereo)
多声道：环绕立体声，用于影院中

压缩

无损压缩和有损压缩：PCM数据压缩后无任何损伤叫无损压缩，不过压缩程度不高。把PCM数据压缩后有损伤叫有损压缩.

数据量

每秒产生的字节数

数据量（字节/秒）=（采样频率（Hz）×采样位数（bit）×声道数）/8

（其中，单声道的声道数为1，立体声的声道数为2）

音频3A

AEC(Acoustic Echo Chancellor）自动回声消除
AGC(Automatic Gain Control) 自动增益控制
ANS(Automatic Noise Suppression) 背景噪声抑制

音色

声音的属性（即响度、音调、音色）之一，主要由其泛音决定。每个人的声音以及各种乐器所发出的声音的区别，就是由音色不同造成的

相关阅读:
后端老项目迁移方法
.NET快速对接极光消息推送
如何把VRTE的应用程序在Ubuntu上跑起来？
web大作业比赛报名页面+ 团队介绍页面制作
多模态&多目标学习-vsn+transformer
springboot配置
线程池的4种拒绝策略
20行代码，给你的项目增加 DevUI 主题切换能力
mac vscode没有写入权限/无法自动更新
高频面试题1，删除有序数组重复元素

原文地址：https://blog.csdn.net/szkbsgy/article/details/126392251