看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于残差注意力U-Net结构的端到端歌声分离模型 收藏
基于残差注意力U-Net结构的端到端歌声分离模型

基于残差注意力U-Net结构的端到端歌声分离模型

作     者:汪斌 陈宁 WANG Bin;CHEN Ning

作者机构:华东理工大学信息科学与工程学院上海200237 

基  金:国家自然科学基金面上项目(61771196) 

出 版 物:《华东理工大学学报(自然科学版)》 (Journal of East China University of Science and Technology)

年 卷 期:2021年第47卷第5期

页      码:619-626页

摘      要:歌声分离是音乐信息检索领域最具挑战的任务之一,本文对基于Wave-U-Net的歌声分离模型进行了改进以增强其性能。首先,在Wave-U-Net的编码和解码块中设计并引入了残差单元以增强其特征提取的有效性和训练效率;然后,在Wave-U-Net的跳跃连接部分设计并引入了注意力门控机制以减少从编码块对应层提取的特征和来自解码块上一层特征之间的语义鸿沟。在MUSDB18数据集上的实验结果表明:本文提出的RA-WaveUNet模型在分离性能上优于传统的Wave-U-Net模型;采用残差单元和注意力门控机制均有助于提高模型的性能。

主 题 词:残差单元 注意力门控 Wave-U-Net RA-WaveUNet 歌声分离(SVS) 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.14135/j.cnki.1006-3080.20200903001

馆 藏 号:203105166...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分