看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于感知条件网络的可控语音增强模型 收藏
基于感知条件网络的可控语音增强模型

基于感知条件网络的可控语音增强模型

作     者:袁文浩 屈庆洋 梁春燕 夏斌 Yuan Wenhao;Qu Qingyang;Liang Chunyan;Xia Bin

作者机构:山东理工大学计算机科学与技术学院淄博255000 

基  金:山东省自然科学基金(ZR2022MF330,ZR2021MF017) 国家自然科学基金(61701286)项目资助 

出 版 物:《仪器仪表学报》 (Chinese Journal of Scientific Instrument)

年 卷 期:2023年第44卷第5期

页      码:53-60页

摘      要:为了给不同听者在不同场景下提供更好的语音增强主观听觉感受,提出了一种基于感知条件网络的可控语音增强模型。首先设计分位数损失函数来对语音的高估和低估进行权衡,并以此来指导网络的训练,通过调节网络输出中的语音损失和噪声残留水平,来控制模型的输出特性。然后为了让单个网络具有可变的输出特性,引入条件网络,利用分位数损失函数中与听者感知相关的分位值产生条件信息来对含噪语音特征进行调制,建立了可控的语音增强模型。实验结果表明,设计的分位数损失函数能够有效调节增强语音中的语音损失和噪声残留水平;基于感知条件网络建立的可控语音增强模型,能够提供可由听者主动控制的增强语音输出特性,使听者获得更好的语音增强体验。

主 题 词:语音增强 深度学习 深度神经网络 条件网络 损失函数 

学科分类:0710[理学-生物科学类] 0711[理学-心理学类] 07[理学] 08[工学] 080401[080401] 0804[工学-材料学] 081102[081102] 0811[工学-水利类] 0702[理学-物理学类] 0812[工学-测绘类] 

核心收录:

D O I:10.19650/j.cnki.cjsi.J2210872

馆 藏 号:203122697...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分