看过本文的还看了

相关文献

该作者的其他文献

文献详情 >融合门控循环单元及自注意力机制的生成对抗语音增强 收藏
融合门控循环单元及自注意力机制的生成对抗语音增强

融合门控循环单元及自注意力机制的生成对抗语音增强

作     者:张德辉 董安明 禹继国 赵恺 周酉 ZHANG Dehui;DONG Anming;YU Jiguo;ZHAO Kai;ZHOU You

作者机构:齐鲁工业大学(山东省科学院)计算机科学与技术学院济南250353 齐鲁工业大学(山东省科学院)大数据研究院济南250353 中国科学院自动化研究所北京100190 山东海看新媒体研究院有限公司济南250013 

基  金:国家重点研发计划(2019YFB2102600) 国家自然科学基金(62272256) 山东省科技型中小企业创新能力提升工程项目(2022TSGC2180,2022TSGC2123) 济南市“高校20条”自主培养创新团队(202228093) 齐鲁工业大学(山东省科学院)科教产融合试点工程项目(基础研究类)先导项目(2022XD001) 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2023年第50卷第S2期

页      码:350-358页

摘      要:因其通过两种网络对抗训练并不断提升网络映射能力的特性,生成对抗网络(Generative Adversarial Networks,GAN)具有强大的降噪能力,近年来被应用于语音增强领域。针对现有生成对抗网络语音增强方法未充分利用语音特征序列中的时间相关性和全局相关性这一不足,提出一种融合门控循环单元(Gated Recurrent Unit,GRU)和自注意力机制(self-attention)的语音增强GAN网络。该网络利用串联和并联两种方式构建了时间建模模块,可捕获语音特征序列的时间相关性和上下文信息。与基线算法相比,所设计的新型GAN网络语音质量听觉估计分数(PESQ)提高了4%,且在语音信号分段信噪比(SSNR)和短时客观可懂度(STOI)等多个客观评价指标上表现更优。该研究结果表明,融合语音特征序列中的时间相关性和全局相关性有助于提升GAN网络语音增强的性能。

主 题 词:语音增强 生成对抗网络 门控循环单元 自注意力机制 特征融合 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.11896/jsjkx.230200203

馆 藏 号:203124334...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分