webrtc 音频一点相关知识-白红宇

webrtc 音频一点相关知识

阅读量：4968 次

发布时间：2019-06-12

本文共 1796 字，大约阅读时间需要 5 分钟。

采样频率: 44.1kHz ，它的意思是每秒取样44100次。8kHz 8000次， 16kHz 160000次

比特率: 比特率是大家常听说的一个名词，数码录音一般使用16比特、20比特或24比特制作音乐。什么是“比特”？我们知道声音有轻有响，影响声音的物理要素是，作为，必须也要能精确表示乐曲的轻响，所以一定要对波形的振幅有一个精确的描述。“比特(bit)”就是这样一个单位，16比特就是指把波形的振幅划为2^16即65536个等级，根据的轻响把它划分到某个等级中去，就可以用数字来表示了。和采样频率一样，比特率越高，越能细致地反映乐曲的轻响变化。20比特就可以产生1048576个等级，表现交响乐这类动态十分大的音乐已经没有什么问题了。刚才提到了一个名词“动态”，它其实指的是一首乐曲最响和最轻的对比能达到多少，我们也常说“”，单位是dB，而动态范围和我们录音时采用的比特率是紧密结合在一起的，如果我们使用了一个很低的比特率，那么就只有很少的等级可以用来描述音响的强弱，当然就不能听到大幅度的强弱对比了。动态范围和比特率的关系是；每增加1比特，动态范围就增加6dB。所以假如我们使用1比特录音，那么我们的动态范围就只有6dB，这样的音乐是不可能听的。16比特时，动态范围是96dB。这可以满足一般的需求了。20比特时，动态范围是120dB，对比再强烈的交响乐都可以应付自如了，表现音乐的强弱是绰绰有余了。发烧级的还使用24比特，但是和采样精度一样，它不会比20比特有很明显的变化，理论上24比特可以做到144 dB的动态范围，但实际上是很难达到的，因为任何设备都不可避免会产生，至少在现阶段24比特很难达到其预期效果。

假设音频采样率 = 8000，采样声道 = 2，位深度 = 16，采样间隔(毫秒) = 20ms或30ms或... 数据量是1000ms(1秒)/20ms = 50　　 (20ms)

size = 8000 x 2 x 16bit x 0.02s = 5120bit / 8bit = 640 byte

(1byte == 8bit ,1字节==8位)bit就是位，也叫比特位，是计算机表示数据最小的单位

byte就是字节

1byte=8bit

1byte就是1B

一个字符=2字节

1KB=1024B

首先我们计算一秒钟总的数据量，采样间隔采用20ms的话，说明每秒钟需采集50次，这个计算大家应该都懂，那么总的数据量计算为

一秒钟总的数据量 =8000 * 2*16/8 = 32000

所以每帧音频数据大小 = 32000/50 = 640

每个声道采样样本数 = 640/2 = 320

https://blog.csdn.net/KevinDGK/article/details/52934221 speex和Opus 压缩库介绍

http://blog.csdn.net/wzy198852/article/details/48178703 AudioProcessing降噪处理过程

http://blog.csdn.net/chinabinlang/article/details/41867189 NS（Noise Suppression 噪声抑制）、VAD（Voice Activity Detection 静音检测）、AECM（Acoustic Echo Canceller for Mobile 声学回声消除）以及 AGC（Auto Gain Control 自动增益控制）

http://www.cnblogs.com/mod109/p/5469799.html

http://www.jianshu.com/p/77a363960711

http://blog.csdn.net/qazwsxwtc?viewmode=contents

https://chromium.googlesource.com/external/webrtc/+/master/webrtc/modules/ webrtc源码

http://blog.csdn.net/KevinDGK/article/details/52934221#二局域网语音配置一些参考

转载于:https://www.cnblogs.com/yeng/p/7120161.html

你可能感兴趣的文章