看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度神经网络的语音驱动发音器官的运动合成 收藏
基于深度神经网络的语音驱动发音器官的运动合成

基于深度神经网络的语音驱动发音器官的运动合成

作     者:唐郅 侯进 TANG Zhi;HOU Jin

作者机构:西南交通大学信息科学与技术学院成都611756 

基  金:成都市科技项目(科技惠民技术研发项目)(2015-HM01-00050-SF) 四川省动漫研究中心2015年度科研项目(DM201504) 西南交通大学2015年研究生创新实验实践项目(YC201504109)资助 

出 版 物:《自动化学报》 (Acta Automatica Sinica)

年 卷 期:2016年第42卷第6期

页      码:923-930页

摘      要:实现一种基于深度神经网络的语音驱动发音器官运动合成的方法,并应用于语音驱动虚拟说话人动画合成.通过深度神经网络(Deep neural networks,DNN)学习声学特征与发音器官位置信息之间的映射关系,系统根据输入的语音数据估计发音器官的运动轨迹,并将其体现在一个三维虚拟人上面.首先,在一系列参数下对比人工神经网络(Artificial neural network,ANN)和DNN的实验结果,得到最优网络;其次,设置不同上下文声学特征长度并调整隐层单元数,获取最佳长度;最后,选取最优网络结构,由DNN输出的发音器官运动轨迹信息控制发音器官运动合成,实现虚拟人动画.实验证明,本文所实现的动画合成方法高效逼真.

主 题 词:深度神经网络 语音驱动 运动合成 虚拟说话人 

学科分类:0711[理学-心理学类] 12[管理学] 1201[管理学-管理科学与工程类] 07[理学] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.16383/j.aas.2016.c150726

馆 藏 号:203178005...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分