文献详情 >基于频域卷积和三元组损失的端到端声纹识别收藏

基于频域卷积和三元组损失的端到端声纹识别

作者：董元菲王康 DONG Yuan-fei;WANG Kang

作者机构：武汉邮电科学研究院湖北武汉430074 南京烽火天地通信科技有限公司江苏南京210019

基　　金：国家重点研发计划(2017YFB1400704)

出版物：《电子设计工程》 (Electronic Design Engineering)

年卷期：2020年第28卷第13期

页码：154-159页

摘要：针对传统i-vector声纹识别模型在背景噪声急剧增加时泛化弱的问题,设计一种能学习丰富频域信息的卷积神经网络,并结合三元组损失构成端到端模型--Triplet-FD-CNN。该模型通过三元组损失约束含有频域卷积的CNN,直接训练特征空间上嵌入间的欧氏距离,使异类距离增大且同类距离缩小;同时拼接相同标签下的不同短语音,以缩小单条语音特征与说话人总体的差异。实验表明,Triplet-FD-CNN模型相对i-vector方法在辨认中的Top-1和Top-5准确率分别提高了45%和28.9%;在确认中的最小检测代价和等错误率分别减少了14%和25.5%。实验验证了Triplet-FD-CNN模型的鲁棒性强,能得到的嵌入类别区分性好。

主题词：声纹识别端到端模型深度说话人嵌入三元组损失卷积神经网络

学科分类：0711[理学-心理学类] 07[理学]

D　O　I：10.14022/j.issn1674-6236.2020.13.033

馆藏号：203946928...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于频域卷积和三元组损失的端到端声纹识别

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于频域卷积和三元组损失的端到端声纹识别

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：