vad 相关算法该如何评价
8月 24, 2021
总结一下最近的相关心得,不一定正确,有相关问题,烦请各位帮忙指正:
一、vad的准确性:
1、语音被检测为语音的概率(反过来就是漏检率)。
2、噪声被检测为噪声的概率。
3、被检测为语音的数据占真实语音的概率(反过来就是误检率)。
二、vad 不同的应用场景的要求:
1、vad 算法是否需要覆盖噪声场景,噪声场景的效果。
2、vad 算法覆盖的语音能量范围是什么。
3、vad 算法端点检测的起始、结束点与真实语音的区间的关系。
4、要求检测出的语音必须是语音同时允许部分语音检测为噪音。
5、要求检测出来的噪声必须是噪声同时允许部分噪音被检测为语音。
6、要求检测出来的语音和噪声的准确度都能达到一个很高的准确度。
三、列举相关vad 算法及对应的应用场景:
1、webrtc gmm vad :应用于是否使用cng 编码,对应的要求是4点。
四、如果你想到了其他vad 算法及其应用场景,请写出你的答案并一起讨论。