看过本文的还看了

相关文献

该作者的其他文献

文献详情 >协调语音能量区域的正则化优化算法 收藏
协调语音能量区域的正则化优化算法

协调语音能量区域的正则化优化算法

作     者:师晨康 薛珮芸 白静 赵建星 SHI Chen-kang;XUE Pei-yun;+;BAI Jing;ZHAO Jian-xing

作者机构:太原理工大学信息与计算机学院山西晋中030600 山西高等创新研究院博士后科研工作站山西太原030032 

基  金:山西省应用基础研究计划基金项目(201901D111094) 山西省基础研究基金项目(青年)(20210302124544) 山西省留学回国人员科技活动择优基金项目(20200017) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2024年第45卷第7期

页      码:2173-2179页

摘      要:为有效解决语音识别模型过拟合问题,提出一种协调语音能量区域的正则化优化算法。根据语音的共振峰特性,对语音信号高能量区域进行集体失活处理,增加模型对语音信号低能量区域的关注度;为进一步提升声学模型性能,采用堆叠8层的门控卷积神经网络提取语音时序特征,并对其中的门控机制进行优化,缓解梯度衰减现象;采用联结时序分类算法以汉字为建模单元对语音识别模型进行训练和解码。在公开中文语音数据集Aishell-1上的实验结果表明,该语音识别模型字错率降低至11.27%,与基线模型相比,字错率下降了7.93%,验证了该方法的有效性。

主 题 词:语音识别 声学模型 语音能量区域 正则化 卷积神经网络 联结时序分类 深度学习 

学科分类:1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.16208/j.issn1000-7024.2024.07.034

馆 藏 号:203140473...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分