看过本文的还看了

相关文献

该作者的其他文献

文献详情 >双模态融合特征下的说话人识别 收藏
双模态融合特征下的说话人识别

双模态融合特征下的说话人识别

作     者:谢娅利 庞炜千 白静 薛珮芸 赵建星 师晨康 XIE Ya-li;PANG Wei-qian;BAI Jing;XUE Pei-yun;ZHAO Jian-xing;SHI Chen-kang

作者机构:太原理工大学信息与计算机学院山西晋中030600 

基  金:山西省应用基础研究计划基金项目(201901D111094) 山西省留学回国人员科技活动择优基金项目(20200017) 山西省应用基础研究计划基金项目(青年基金20210302124544) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2023年第44卷第8期

页      码:2454-2458页

摘      要:为提高说话人识别的准确率,提出一种双模态融合特征的算法。提取韵律特征和伽玛通滤波倒谱系数两种声学特征,计算其统计特性;提取舌、唇和下颌分别相对于鼻梁的发音动作参数,获得参考点发音动作特征;将声学特征和参考点发音动作特征进行融合,对其进行嵌入式特征选择,获得双模态融合特征;通过支持向量机、高斯混合模型-支持向量机进行分类。实验结果表明,参考点发音动作特征识别效果优于传统发音动作特征识别效果,双模态融合特征识别率明显高于单模态特征的识别率,验证了所提方法的有效性。

主 题 词:韵律特征 伽玛通滤波倒谱系数 发音动作特征 特征融合 特征选择 高斯混合模型-支持向量机 说话人识别 

学科分类:0711[理学-心理学类] 07[理学] 

D O I:10.16208/j.issn1000-7024.2023.08.028

馆 藏 号:203123439...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分