看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于双分支融合和时频压缩激励的鲁棒语音关键词识别 收藏
基于双分支融合和时频压缩激励的鲁棒语音关键词识别

基于双分支融合和时频压缩激励的鲁棒语音关键词识别

作     者:张婷婷 邱泽鹏 赵腊生 毛嘉莹 Zhang Tingting;Qiu Zepeng;Zhao Lasheng;Mao Jiaying

作者机构:大连大学先进设计与智能计算省部共建教育部重点实验室辽宁大连116622 

基  金:辽宁省教育厅基本科研资助项目(LJKMZ20221838) “111”计划资助项目(D23006) 大连市科技创新基金计划资助项目(2023JJ11CG002) 

出 版 物:《计算机应用研究》 (Application Research of Computers)

年 卷 期:2024年第41卷第12期

页      码:3658-3663页

摘      要:现实生活中的噪声会对语音时域和频域信息产生干扰,导致语音关键词识别模型在噪声环境下准确率下降。针对此问题,提出了双分支融合单元,其中时域分支与频域分支以并行的方式提取时域特征和频域特征,降低了串行堆叠时域卷积和频域卷积所带来的信息损耗;随后通过交叉融合的方式加强模型对时频信息的感知,进一步增强了模型特征表达能力。同时提出了时频压缩激励模块,通过对时域与频域中信息的重要性分布建模,可以为模型提供选择性关注有价值片段的能力,进一步提高了模型鲁棒性。在Google Command v2-12数据集上,相比于对比模型,所提模型在不同信噪比的测试中取得了更高的识别准确率,且参数量更低;对于训练阶段未涵盖的信噪比条件,所提模型在测试中展现出更高的泛化性。实验结果表明,本文模型在识别准确率和参数量方面更具优势,具有更好的噪声鲁棒性。

主 题 词:关键词识别 双分支融合 时频压缩激励 鲁棒性模型 注意力机制 

学科分类:1305[艺术学-设计学类] 13[艺术学] 081104[081104] 08[工学] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.19734/j.issn.1001-3695.2024.04.0121

馆 藏 号:203156315...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分