文献详情 >基于深度神经网络的语音驱动发音器官的运动合成收藏

基于深度神经网络的语音驱动发音器官的运动合成

作者：唐郅侯进 TANG Zhi;HOU Jin

基　　金：成都市科技项目(科技惠民技术研发项目)(2015-HM01-00050-SF) 四川省动漫研究中心2015年度科研项目(DM201504) 西南交通大学2015年研究生创新实验实践项目(YC201504109)资助

出版物：《自动化学报》 (Acta Automatica Sinica)

年卷期：2016年第42卷第6期

页码：923-930页

摘要：实现一种基于深度神经网络的语音驱动发音器官运动合成的方法,并应用于语音驱动虚拟说话人动画合成.通过深度神经网络(Deep neural networks,DNN)学习声学特征与发音器官位置信息之间的映射关系,系统根据输入的语音数据估计发音器官的运动轨迹,并将其体现在一个三维虚拟人上面.首先,在一系列参数下对比人工神经网络(Artificial neural network,ANN)和DNN的实验结果,得到最优网络;其次,设置不同上下文声学特征长度并调整隐层单元数,获取最佳长度;最后,选取最优网络结构,由DNN输出的发音器官运动轨迹信息控制发音器官运动合成,实现虚拟人动画.实验证明,本文所实现的动画合成方法高效逼真.

主题词：深度神经网络语音驱动运动合成虚拟说话人

学科分类：0711[理学-心理学类] 12[管理学] 1201[管理学-管理科学与工程类] 07[理学] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类]

核心收录：

D　O　I：10.16383/j.aas.2016.c150726

馆藏号：203178005...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度神经网络的语音驱动发音器官的运动合成

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度神经网络的语音驱动发音器官的运动合成

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：