看过本文的还看了

相关文献

该作者的其他文献

文献详情 >DNN模型对汉语电话录音识别的研究与比较 收藏
DNN模型对汉语电话录音识别的研究与比较

DNN模型对汉语电话录音识别的研究与比较

作     者:孔玲军 李艳 KONG Lingjun;LI Yan

作者机构:南开大学滨海学院天津300270 

出 版 物:《福建电脑》 (Journal of Fujian Computer)

年 卷 期:2022年第38卷第3期

页      码:52-54页

摘      要:深度神经网络DNN(Deep Neural Network)是近年机器学习理论中被诸多研究者广泛关注的语音识别模型。DNN模型利用DNN的学习能力可提升对噪声和口音的鲁棒性,在很多大规模语音识别任务中都超过了GMM模型。本文基于DNN与HMM特点,提取40维的MFCC特征向量后,利用DNN的每个输出节点估计HMM每个状态的后验概率,进而得到了对电话录音场景下的模型参数。最后,对1000小时的汉语电话录音和公开汉语语料集thchs-30上进行三次模型训练设计实验,并对比GMM-HMM模型参数效果。实验结果表明,DNN-HMM模型在1000小时的电话录音测试集上误识率降低了5.84%-9.42%,且两种模型识别效果表现得都比较稳定。

主 题 词:DNN GMM 电话录音 Kaldi 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16707/j.cnki.fjpc.2022.03.014

馆 藏 号:203108445...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分