基于深度神经网络的方法已经在语声增强领域得到了广泛的应用,然而若想取得理想的性能,一般需要规模较大且复杂度较高的模型。因此,在计算资源有限的设备或对延时要求高的环境下容易出现部署困难的问题。为了解决此问题,提出了一种基于...基于深度神经网络的方法已经在语声增强领域得到了广泛的应用,然而若想取得理想的性能,一般需要规模较大且复杂度较高的模型。因此,在计算资源有限的设备或对延时要求高的环境下容易出现部署困难的问题。为了解决此问题,提出了一种基于深度复卷积递归网络的师生学习语声增强方法。在师生深度复卷积递归网络模型结构中间的复长短时记忆递归模块提取实部和虚部特征流,并分别计算帧级师生距离损失以进行知识转移。同时使用多分辨率频谱损失以进一步提升低复杂度学生模型的性能。实验在公开数据集Voice Bank Demand和DNS Challenge上进行,结果显示所提方法相对于基线学生模型在各项指标上均有明显提升。展开更多
提出了一种双通道语音增强算法。该方法结合了最小方差无失真响应波束成形方法和基于超高斯联合的增益函数。同时,采用基于谱通量的语音活动检测来提高波束形成的输出精度。所提出的实时语音增强方法可在助听器等便携式设备上实时运行...提出了一种双通道语音增强算法。该方法结合了最小方差无失真响应波束成形方法和基于超高斯联合的增益函数。同时,采用基于谱通量的语音活动检测来提高波束形成的输出精度。所提出的实时语音增强方法可在助听器等便携式设备上实时运行。最后,利用语音质量和可理解度指标评价了该方法的有效性,并与其他方法进行了比较。客观和主观测试结果表明,该方法在-5 dB、0 dB和+5 dB 3种不同的低信噪比噪声条件下都具有良好的性能。展开更多
文摘基于深度神经网络的方法已经在语声增强领域得到了广泛的应用,然而若想取得理想的性能,一般需要规模较大且复杂度较高的模型。因此,在计算资源有限的设备或对延时要求高的环境下容易出现部署困难的问题。为了解决此问题,提出了一种基于深度复卷积递归网络的师生学习语声增强方法。在师生深度复卷积递归网络模型结构中间的复长短时记忆递归模块提取实部和虚部特征流,并分别计算帧级师生距离损失以进行知识转移。同时使用多分辨率频谱损失以进一步提升低复杂度学生模型的性能。实验在公开数据集Voice Bank Demand和DNS Challenge上进行,结果显示所提方法相对于基线学生模型在各项指标上均有明显提升。
文摘提出了一种双通道语音增强算法。该方法结合了最小方差无失真响应波束成形方法和基于超高斯联合的增益函数。同时,采用基于谱通量的语音活动检测来提高波束形成的输出精度。所提出的实时语音增强方法可在助听器等便携式设备上实时运行。最后,利用语音质量和可理解度指标评价了该方法的有效性,并与其他方法进行了比较。客观和主观测试结果表明,该方法在-5 dB、0 dB和+5 dB 3种不同的低信噪比噪声条件下都具有良好的性能。