看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于ResCNN-BiGRU的四川方言语音识别 收藏
基于ResCNN-BiGRU的四川方言语音识别

基于ResCNN-BiGRU的四川方言语音识别

作     者:谢金洪 魏霞 XIE Jinhong;WEI Xia

作者机构:新疆大学电气工程学院新疆乌鲁木齐830017 

出 版 物:《现代电子技术》 (Modern Electronics Technique)

年 卷 期:2024年第47卷第1期

页      码:89-93页

摘      要:由于基于深度卷积神经网络的语音识别模型中缺乏对特定方言音素特征的提取能力,造成方言发音底层特征部分信息丢失,进而导致方言识别准确率不高、鲁棒性差等问题。针对上述问题,提出一种结合残差网络(RestNet)和双向门控循环网络(BiGRU)的模型,该模型以GFCC特征图为输入,同时在残差网络中设计多尺度卷积模块,通过不同大小的卷积核提取特征,然后使用双向门控循环网络捕捉序列数据中的长期依赖关系,最后采用连接时序分类算法进行标签软对齐,实现四川方言语音识别模型。在四川方言语料库上的实验结果表明,提出的模型识别性能优于现有基准模型。

主 题 词:四川方言 音素特征 双向门控循环网络 多尺度卷积 连接时序分类 标签软对齐 

学科分类:0711[理学-心理学类] 07[理学] 

D O I:10.16652/j.issn.1004-373x.2024.01.016

馆 藏 号:203125179...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分