看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向网络舆情分析的多任务学习策略时间卷积网络 收藏
面向网络舆情分析的多任务学习策略时间卷积网络

面向网络舆情分析的多任务学习策略时间卷积网络

作     者:张会云 黄鹤鸣 ZHANG Huiyun;HUANG Heming

作者机构:青海师范大学计算机学院西宁810008 藏语智能信息处理及应用国家重点实验室西宁810008 

基  金:国家自然科学基金(62066039) 青海省自然科学基金(2022-ZJ-925) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2023年第49卷第10期

页      码:89-96,104页

摘      要:检测与识别网络中语音的情感状态有助于把控舆情信息,若能同时辨别说话人及其性别,则对掌握舆情的真实意图更有帮助。基于数据集EMODB,提出用于情感分类、说话人辨别和性别识别的多任务学习策略时间卷积网络(DTCN)。针对多任务学习中数据集较小的问题,设计数据增强技术,在不同信噪比下采用加噪的方式对数据集EMODB进行扩充,构建单信噪比含噪数据集EMODB-10、EMODB-5、EMODB0、EMODB5、EMODB10以及多信噪比含噪数据集EMODBM。同时,通过研究单一噪声和混合噪声,验证不同噪声对DTCN模型性能的影响。为了更好地表征数据特性,提出适用于多任务学习的声学特征集。实验结果表明,在具有正信噪比和多信噪比含噪数据集上进行测试时,DTCN模型在多任务学习场景下的表现均优于基线,较容易辨别说话人性别,且随着噪声种类增多,对多任务学习的性能不断提高,在混合噪声下鲁棒性和泛化性更好。

主 题 词:语音情感识别 策略时间卷积网络 多任务学习 数据扩充 特征提取 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.19678/j.issn.1000-3428.0065977

馆 藏 号:203124123...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分