看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于离散余弦变换与Transformer的语音增强 收藏
基于离散余弦变换与Transformer的语音增强

基于离散余弦变换与Transformer的语音增强

作     者:刘汾港 马建芬 张朝霞 LIU Fen-gang;MA Jian-fen;ZHANG Zhao-xia

作者机构:太原理工大学信息与计算机学院山西晋中030600 太原理工大学物理与光电工程学院山西晋中030600 

基  金:2021年度中央引导地方科技发展资金基金项目(YDZJSX2021A007) 2020年度山西省高等学校科技成果转化培育基金项目(2020CG019) 山西省重点研发计划基金项目(高新技术领域)(201803D121057) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2023年第44卷第6期

页      码:1893-1898页

摘      要:为更有效提取低信噪比下含噪语音中的语音信息,受到基于多头自注意力机制的两阶段Transformer的启发,提出结合离散余弦变换与Transformer的语音增强算法。语音信号经离散余弦变换后的频谱为实数谱,将其作为深度神经网络的输入时,无需考虑实部、虚部的计算问题。使用两阶段Transformer提取局部和全局特征,在此基础上,通过编解码器网络得到增强后的语音。实验结果表明,所提方法与各参考方法相比,在-9到5的信噪比下,PESQ指标平均提升了9.92%,STOI指标平均提升了10.19%,在较低信噪比下具有良好的降噪能力。

主 题 词:语音增强 低信噪比 频域 离散余弦变换 神经网络 多头自注意力 变换器结构 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2023.06.040

馆 藏 号:203122294...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分