看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习可变长度语音片段的情感识别 收藏
基于深度学习可变长度语音片段的情感识别

基于深度学习可变长度语音片段的情感识别

作     者:魏金太 高穹 WEI Jin-tai;GAO Qiong

作者机构:河南林业职业学院信息与艺术设计系河南洛阳471002 中国洛阳电子装备试验中心河南洛阳471003 

基  金:国家自然科学基金:11404398 河南科技厅重点攻关:142102210097 

出 版 物:《承德石油高等专科学校学报》 (Journal of Chengde Petroleum College)

年 卷 期:2021年第23卷第6期

页      码:51-56页

摘      要:通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。实验结果表明,该方法在加权精度(WA)和不加权精度(UA)上均优于定长神经网络。

主 题 词:语音情感识别 可变长度语音片段 频谱图 深度神经网络 

学科分类:0711[理学-心理学类] 07[理学] 

D O I:10.13377/j.cnki.jcpc.2021.06.011

馆 藏 号:203107181...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分