看过本文的还看了

相关文献

该作者的其他文献

文献详情 >联合精确比值掩蔽与深度神经网络的单通道语音增强方法 收藏
联合精确比值掩蔽与深度神经网络的单通道语音增强方法

联合精确比值掩蔽与深度神经网络的单通道语音增强方法

作     者:柏浩钧 张天骐 刘鉴兴 叶绍鹏 BAI Haojun;ZHANG Tianqi;LIU Jianxing;YE Shaopeng

作者机构:重庆邮电大学通信与信息工程学院信号与信息处理重庆市重点实验室重庆400065 

基  金:国家自然科学基金项目(61671095,61702065,61701067,61771085) 信号与信息处理重庆市市级重点实验室建设项目(CSTC2009CA2003) 重庆市自然基金项目(cstc2021jcyj-msxmX0836) 重庆市教育委员会科研项目(KJ1600427,KJ1600429)资助 

出 版 物:《声学学报》 (Acta Acustica)

年 卷 期:2022年第47卷第3期

页      码:394-404页

摘      要:针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。

主 题 词:深度神经网络 归一化互相关系数 幅度谱 语音增强 区分性 联合优化 可懂度 掩蔽 

学科分类:0710[理学-生物科学类] 0711[理学-心理学类] 12[管理学] 1201[管理学-管理科学与工程类] 07[理学] 081104[081104] 08[工学] 0714[0714] 0835[0835] 0701[理学-数学类] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.15949/j.cnki.0371-0025.2022.03.009

馆 藏 号:203111352...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分