看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于聚类的门控卷积网络语声分离方法 收藏
一种基于聚类的门控卷积网络语声分离方法

一种基于聚类的门控卷积网络语声分离方法

作     者:罗宇 胡维平 吴华楠 LUO Yu;HU Weiping;WU Huanan

作者机构:广西师范大学电子工程学院桂林541000 

基  金:国家自然科学基金项目(NSFC 61861005) 

出 版 物:《应用声学》 (Journal of Applied Acoustics)

年 卷 期:2023年第42卷第5期

页      码:1099-1105页

摘      要:基于深度聚类的语声分离方法已被证明能有效地解决混合语声中说话人输出标签排列的问题,然而,现有关于聚类进行说话人分离方法,大多数是优化嵌入使每个源的重建误差最小化。该文以时域卷积网络为基础网络设计了一种改进基于聚类的门控卷积语声分离方法,在时域上通过堆叠的门控卷积网络,实现端到端深度聚类的源分离。该框架将非线性门控激活用于时域卷积网络中,提取语声信号的深层次特征;同时在高维特征空间中聚类对语声信号的特征进行表示和划分,为恢复不同信号源提供了一个长期的说话者表示信息。该框架解决了说话人输出标签排列问题并对语声信号的长期依赖性进行建模。通过华尔街日报数据集进行实验得出,该方法在信号失真比和尺度不变信号噪声比指标上分别达到了16.72 dB和16.33 dB的效果。

主 题 词:深度聚类 门控卷积 语声分离 

学科分类:0711[理学-心理学类] 07[理学] 

D O I:10.11684/j.issn.1000-310X.2023.05.024

馆 藏 号:203123968...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分