看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合注意力机制的改进U-Net网络在端到端语音增强中的应用 收藏
结合注意力机制的改进U-Net网络在端到端语音增强中的应用

结合注意力机制的改进U-Net网络在端到端语音增强中的应用

作     者:武瑞沁 陈雪勤 俞杰 王丽荣 赵鹤鸣 WU Ruiqin;CHEN Xueqin;YU Jie;WANG Lirong;ZHAO Heming

作者机构:苏州大学电子信息学院苏州215006 

基  金:国家自然科学基金项目(61340004)资助 

出 版 物:《声学学报》 (Acta Acustica)

年 卷 期:2022年第47卷第2期

页      码:266-275页

摘      要:设计了一个适用于端到端语音增强的改进的U-Net(Attention Dilated Convolution U-Net,ADC-U-Net)网络模型。与基线U-Net网络相比,一方面通过加入空洞卷积减小由采样带来的信息损失;另一方面引入了注意力机制结构,结合了含噪语音更多的上下文信息,提取更深层次和更丰富的特征信息。与传统语音增强方法相比,所提模型无需提取特征、对特征去噪、重构语音3个步骤,避免了对显性特征的依赖,转而由网络模型通过多层次多尺度学习获得隐性特征。用多个主客观指标对增强语音的质量和可懂度进行了评价。实验数据显示所提算法在噪声抑制能力和对噪声的适应度方面均表现出良好的性能,与基线U-Net网络及其它模型相比,展示了良好的语音质量和可懂度。

主 题 词:注意力机制 上下文信息 语音增强 网络模型 可懂度 信息损失 隐性特征 适应度 

学科分类:0711[理学-心理学类] 07[理学] 

核心收录:

D O I:10.15949/j.cnki.0371-0025.2022.02.011

馆 藏 号:203108164...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分