看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于DFCNN-CTC端到端的藏族学生普通话发音偏误检测 收藏
基于DFCNN-CTC端到端的藏族学生普通话发音偏误检测

基于DFCNN-CTC端到端的藏族学生普通话发音偏误检测

作     者:甘振业 周世华 曾浩 杨鸿武 GAN Zhen-ye;ZHOU Shi-hua;ZEN Hao;YANG Hong-wu

作者机构:西北师范大学物理与电子工程学院甘肃兰州730070 甘肃省智能信息技术与应用工程研究中心甘肃兰州730070 西北师范大学教育技术学院甘肃兰州730070 

基  金:国家自然科学基金资助项目(11664036 31860285) 

出 版 物:《西北师范大学学报(自然科学版)》 (Journal of Northwest Normal University(Natural Science))

年 卷 期:2020年第56卷第5期

页      码:49-53,108页

摘      要:计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist temporal classification,CTC)技术,建立了一种用于发音偏误检测和诊断任务的端到端语音识别方法.该方法不需要音位信息,也不需要强制对齐,以扩展声韵母为偏误基元,设计了64种偏误类型.实验结果表明,该方法能够有效地检测出错误发音,检测正确率为87.07%,错误拒绝率为7.83%,错误接收率为25.97%.

主 题 词:发音偏误检测 卷积神经网络 链接时序分类 端到端 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.16783/j.cnki.nwnuz.2020.05.010

馆 藏 号:203978161...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分