看过本文的还看了

相关文献

该作者的其他文献

文献详情 >弱标签声音事件检测的空间-通道特征表征与自注意池化 收藏
弱标签声音事件检测的空间-通道特征表征与自注意池化

弱标签声音事件检测的空间-通道特征表征与自注意池化

作     者:杨利平 侯振威 辜小花 郝峻永 YANG Li-ping;HOU Zhen-wei;GU Xiao-hua;HAO Jun-yong

作者机构:重庆大学光电技术及系统教育部重点实验室重庆400044 重庆科技学院电气工程学院重庆401331 

基  金:国家自然科学基金(No.61903054) 

出 版 物:《电子学报》 (Acta Electronica Sinica)

年 卷 期:2023年第51卷第2期

页      码:297-306页

摘      要:深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法.该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法.实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声音事件检测的综合性能.

主 题 词:特征表征 自注意池化 卷积循环神经网络 弱标签学习 声音事件检测 

学科分类:0710[理学-生物科学类] 1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.12263/DZXB.20210035

馆 藏 号:203121167...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分