采样频率: 44.1kHz ,它的意思是每秒取样44100次 。8kHz 8000次, 16kHz 160000次
比特率: 比特率是大家常听说的一个名词,数码录音一般使用16比特、20比特或24比特制作音乐。什么是“比特”?我们知道声音有轻有响,影响声音的物理要素是,作为,必须也要能精确表示乐曲的轻响,所以一定要对波形的振幅有一个精确的描述。“比特(bit)”就是这样一个单位,16比特就是指把波形的振幅划为2^16即65536个等级,根据的轻响把它划分到某个等级中去,就可以用数字来表示了。和采样频率一样,比特率越高,越能细致地反映乐曲的轻响变化。20比特就可以产生1048576个等级,表现交响乐这类动态十分大的音乐已经没有什么问题了。刚才提到了一个名词“动态”,它其实指的是一首乐曲最响和最轻的对比能达到多少,我们也常说“”,单位是dB,而动态范围和我们录音时采用的比特率是紧密结合在一起的,如果我们使用了一个很低的比特率,那么就只有很少的等级可以用来描述音响的强弱,当然就不能听到大幅度的强弱对比了。动态范围和比特率的关系是;每增加1比特,动态范围就增加6dB。所以假如我们使用1比特录音,那么我们的动态范围就只有6dB,这样的音乐是不可能听的。16比特时,动态范围是96dB。这可以满足一般的需求了。20比特时,动态范围是120dB,对比再强烈的交响乐都可以应付自如了,表现音乐的强弱是绰绰有余了。发烧级的还使用24比特,但是和采样精度一样,它不会比20比特有很明显的变化,理论上24比特可以做到144 dB的动态范围,但实际上是很难达到的,因为任何设备都不可避免会产生,至少在现阶段24比特很难达到其预期效果。
假设音频采样率 = 8000,采样声道 = 2,位深度 = 16,采样间隔(毫秒) = 20ms或30ms或... 数据量是1000ms(1秒)/20ms = 50 (20ms)
size = 8000 x 2 x 16bit x 0.02s = 5120bit / 8bit = 640 byte
(1byte == 8bit ,1字节==8位)bit就是位,也叫比特位,是计算机表示数据最小的单位
byte就是字节
1byte=8bit
1byte就是1B
一个字符=2字节
1KB=1024B
首先我们计算一秒钟总的数据量,采样间隔采用20ms的话,说明每秒钟需采集50次,这个计算大家应该都懂,那么总的数据量计算为
一秒钟总的数据量 =8000 * 2*16/8 = 32000
所以每帧音频数据大小 = 32000/50 = 640
每个声道采样样本数 = 640/2 = 320
https://blog.csdn.net/KevinDGK/article/details/52934221 speex和Opus 压缩库介绍
http://blog.csdn.net/wzy198852/article/details/48178703 AudioProcessing降噪处理过程
http://blog.csdn.net/chinabinlang/article/details/41867189 NS(Noise Suppression 噪声抑制)、VAD(Voice Activity Detection 静音检测)、AECM(Acoustic Echo Canceller for Mobile 声学回声消除)以及 AGC(Auto Gain Control 自动增益控制)
http://www.cnblogs.com/mod109/p/5469799.html
http://www.jianshu.com/p/77a363960711
http://blog.csdn.net/qazwsxwtc?viewmode=contents
https://chromium.googlesource.com/external/webrtc/+/master/webrtc/modules/ webrtc源码
http://blog.csdn.net/KevinDGK/article/details/52934221#二局域网语音配置 一些参考