文献详情 >基于时空特征的语音情感识别模型TSTNet 收藏

基于时空特征的语音情感识别模型TSTNet

作者：薛均晓黄世博王亚博张朝阳石磊 XUE Junxiao;HUANG Shibo;WANG Yabo;ZHANG Chaoyang;SHI Lei

作者机构：郑州大学软件学院河南郑州450002 郑州大学网络空间安全学院河南郑州450002 郑州大学信息工程学院河南郑州450001

基　　金：河南省高等学校青年骨干教师培养计划(22020GGJS014)

出版物：《郑州大学学报（工学版）》 (Journal of Zhengzhou University（Engineering Science）)

年卷期：2021年第42卷第6期

页码：28-33页

摘要：针对社交语音由于语气、音调、语速等差异以及填充信息丢失或冗余等问题,提出一种基于时空特征的语音情感识别方法。该方法利用卷积神经网络(CNN)和双向循环神经网络(BiGRU)技术,包含空间特征提取、时间特征提取和特征融合3个模块。考虑到音频数据内容长短不一,首先对音频数据进行预处理,应用3种补零填充方法,得到不同尺度的语谱图。设计了空间特征提取方法捕获音频的局部特征,并利用时间特征提取方法获取音频数据的时间特征和前后语义关系,从而得到3个时空特征向量。此外,融合了时空特征向量并通过全连接层进行语音情感分类。利用科大讯飞语音情感数据集进行了数值实验,实验结果与传统语音情感识别模型的实验结果相比,在准确率、精确率、召回率和F1值等4项指标上均取得了较好结果。

主题词：语音情感识别语谱图时空特征

学科分类：081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类]

D　O　I：10.13705/j.issn.1671-6833.2021.06.008

馆藏号：203106581...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于时空特征的语音情感识别模型TSTNet

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于时空特征的语音情感识别模型TSTNet

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：