看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于门控卷积网络与CTC的端到端语音识别 收藏
基于门控卷积网络与CTC的端到端语音识别

基于门控卷积网络与CTC的端到端语音识别

作     者:杨德举 马良荔 谭琳珊 裴晶晶 YANG De-ju;MA Liang-li;TAN Lin-shan;PEI Jing-jing

作者机构:海军工程大学电子工程学院湖北武汉430033 中国人民解放军91001部队北京100841 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2020年第41卷第9期

页      码:2650-2654页

摘      要:针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门控线性单元减少梯度弥散,利用CTC算法实现以汉字字符作为建模基元的端到端训练和解码。在公开数据集上的实验结果表明,与基线模型相比,该模型语音识别性能有明显提升,字错误率降低了3.3%以上。

主 题 词:语音识别 端到端 卷积神经网络 门控线性单元 链接时序分类 

学科分类:1305[艺术学-设计学类] 13[艺术学] 081104[081104] 08[工学] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.16208/j.issn1000-7024.2020.09.037

馆 藏 号:203978256...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分