vad 相关算法该如何评价

24 8 月, 2021

总结一下最近的相关心得,不一定正确,有相关问题,烦请各位帮忙指正:

一、vad的准确性:

1、语音被检测为语音的概率(反过来就是漏检率)。

2、噪声被检测为噪声的概率。

3、被检测为语音的数据占真实语音的概率(反过来就是误检率)。

二、vad 不同的应用场景的要求:

1、vad 算法是否需要覆盖噪声场景,噪声场景的效果。

2、vad 算法覆盖的语音能量范围是什么。

3、vad 算法端点检测的起始、结束点与真实语音的区间的关系。

4、要求检测出的语音必须是语音同时允许部分语音检测为噪音。

5、要求检测出来的噪声必须是噪声同时允许部分噪音被检测为语音。

6、要求检测出来的语音和噪声的准确度都能达到一个很高的准确度。

三、列举相关vad 算法及对应的应用场景:

1、webrtc gmm vad :应用于是否使用cng 编码,对应的要求是4点。

四、如果你想到了其他vad 算法及其应用场景,请写出你的答案并一起讨论。


zeark