文献详情 >联合精确比值掩蔽与深度神经网络的单通道语音增强方法收藏

联合精确比值掩蔽与深度神经网络的单通道语音增强方法

作者：柏浩钧张天骐刘鉴兴叶绍鹏 BAI Haojun;ZHANG Tianqi;LIU Jianxing;YE Shaopeng

作者机构：重庆邮电大学通信与信息工程学院信号与信息处理重庆市重点实验室重庆400065

基　　金：国家自然科学基金项目(61671095,61702065,61701067,61771085) 信号与信息处理重庆市市级重点实验室建设项目(CSTC2009CA2003) 重庆市自然基金项目(cstc2021jcyj-msxmX0836) 重庆市教育委员会科研项目(KJ1600427,KJ1600429)资助

出版物：《声学学报》 (Acta Acustica)

年卷期：2022年第47卷第3期

页码：394-404页

摘要：针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。

学科分类：0710[理学-生物科学类] 0711[理学-心理学类] 12[管理学] 1201[管理学-管理科学与工程类] 07[理学] 081104[081104] 08[工学] 0714[0714] 0835[0835] 0701[理学-数学类] 0811[工学-水利类] 0812[工学-测绘类]

核心收录：

D　O　I：10.15949/j.cnki.0371-0025.2022.03.009

馆藏号：203111352...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

联合精确比值掩蔽与深度神经网络的单通道语音增强方法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

联合精确比值掩蔽与深度神经网络的单通道语音增强方法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：