文献详情 >基于感知条件网络的可控语音增强模型收藏

基于感知条件网络的可控语音增强模型

作者：袁文浩屈庆洋梁春燕夏斌 Yuan Wenhao;Qu Qingyang;Liang Chunyan;Xia Bin

基　　金：山东省自然科学基金(ZR2022MF330,ZR2021MF017) 国家自然科学基金(61701286)项目资助

出版物：《仪器仪表学报》 (Chinese Journal of Scientific Instrument)

年卷期：2023年第44卷第5期

页码：53-60页

摘要：为了给不同听者在不同场景下提供更好的语音增强主观听觉感受,提出了一种基于感知条件网络的可控语音增强模型。首先设计分位数损失函数来对语音的高估和低估进行权衡,并以此来指导网络的训练,通过调节网络输出中的语音损失和噪声残留水平,来控制模型的输出特性。然后为了让单个网络具有可变的输出特性,引入条件网络,利用分位数损失函数中与听者感知相关的分位值产生条件信息来对含噪语音特征进行调制,建立了可控的语音增强模型。实验结果表明,设计的分位数损失函数能够有效调节增强语音中的语音损失和噪声残留水平;基于感知条件网络建立的可控语音增强模型,能够提供可由听者主动控制的增强语音输出特性,使听者获得更好的语音增强体验。

主题词：语音增强深度学习深度神经网络条件网络损失函数

学科分类：0710[理学-生物科学类] 0711[理学-心理学类] 07[理学] 08[工学] 080401[080401] 0804[工学-材料学] 081102[081102] 0811[工学-水利类] 0702[理学-物理学类] 0812[工学-测绘类]

核心收录：

D　O　I：10.19650/j.cnki.cjsi.J2210872

馆藏号：203122697...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于感知条件网络的可控语音增强模型

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于感知条件网络的可控语音增强模型

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：