看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于信息提炼与残差特征聚合网络的单通道语音增强 收藏
基于信息提炼与残差特征聚合网络的单通道语音增强

基于信息提炼与残差特征聚合网络的单通道语音增强

作     者:张天骐 罗庆予 方蓉 张慧芝 ZHANG Tianqi;LUO Qingyu;FANG Rong;ZHANG Huizhi

作者机构:重庆邮电大学通信与信息工程学院重庆400065 

基  金:国家自然科学基金项目(61671095,61702065,61701067,61771085) 信号与信息处理重庆市市级重点实验室建设项目(CSTC2009CA2003) 重庆市自然基金项目(cstc2021jcyj-msxmX0836) 重庆市教育委员会科研项目(KJ1600427,KJ1600429) 

出 版 物:《信号处理》 (Journal of Signal Processing)

年 卷 期:2023年第39卷第7期

页      码:1285-1298页

摘      要:针对语音增强的深层神经网络中对丰富的全局语音相关信息提取困难、未充分利用中间层次特征的问题,本文以尽可能小的参数为前提,基于注意力U型网络,设计了一种基于信息提炼和残差特征聚合的新型卷积编解码网络来进行语音增强。本文在编解码部分提出一种2维的层次细化残差(HRR,Hierarchical Refinement Residual)模块,该模块能显著降低训练参数并扩大感受野,对多尺度上下文信息进行不同层次的提取;传输层提出一种轻量级的1维通道自适应注意力(1D-CAA,One-Dimensional Channel Dimension Adaptive Attention)模块,结合门控机制和范数归一化,选择性地传递特征并提高网络表达能力,并联合门控残差线性单元搭建了一种门控残差特征聚合(GRFA,Gating Residual Feature Aggregation)网络,增强了层间信息流动并充分利用中间层次特征细节,获取更多时序相关信息。实验部分,本文在21种噪声环境下训练和测试,最终以1.23×106的参数相比于其他方法取得更优的客观与主观指标,具备较强的增强效果与泛化能力,并在模型复杂度与精度上取得良好平衡。

主 题 词:语音增强 多尺度上下文 自适应注意力机制 残差特征聚合 

学科分类:0711[理学-心理学类] 07[理学] 08[工学] 080401[080401] 0804[工学-材料学] 080402[080402] 

核心收录:

D O I:10.16798/j.issn.1003-0530.2023.07.015

馆 藏 号:203122627...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分