看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于时频联合损失函数的语音增强算法 收藏
基于时频联合损失函数的语音增强算法

基于时频联合损失函数的语音增强算法

作     者:高戈 王霄 曾邦 尹文兵 陈怡 GAO Ge;WANG Xiao;ZENG Bang;YIN Wenbing;CHEN Yi

作者机构:国家多媒体软件工程技术研究中心(武汉大学)武汉430072 华中师范大学计算机学院武汉430079 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2022年第42卷第S1期

页      码:316-320页

摘      要:在频域语音增强算法中,由于估计幅度谱与带噪相位谱的不匹配,其性能难以突破固有上限。在时域语音增强框架中,模型将时域波形作为输入,由网络直接学习时域波形之间的映射关系,有效地避免了无效短时傅里叶变换(STFT)问题。然而,常见的采用波形最小均方误差的时域语音增强算法对语音频域特征的建模并未达到最优。针对这个问题,提出一种基于时频联合损失函数的语音增强算法。首先将时频联合损失函数应用到Wave-U-Net时域语音增强网络,同时设计并分析了一阶范数形式和二阶范数形式的时频联合损失函数对增强网络的影响,最后得到了面向语音通信任务和语音识别任务的相对最佳损失函数选择方案。实验结果表明,相较于采用时域损失的增强网络,采用面向语音通信时最佳联合损失函数的增强网络在语音质量的感知评估(PESQ)和短时目标清晰度(STOI)分别实现了3.6%和2.30%的相对提升,采用面向语音识别时最佳联合损失函数的增强网络在字符错误率(CER)上实现了1.82%的相对降低。相较于Wave-U-Net时域语音增强网络,该算法有更好的噪声抑制效果,在后端语音识别任务中表现更为优秀。

主 题 词:时域语音增强 联合损失函数 语音通信 语音识别 深度学习 

学科分类:0711[理学-心理学类] 07[理学] 

D O I:10.11772/j.issn.1001-9081.2021071325

馆 藏 号:203113546...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分