看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的图片问答系统设计研究 收藏
基于深度学习的图片问答系统设计研究

基于深度学习的图片问答系统设计研究

作     者:周远侠 于津 Zhou Yuanxia;Yu Jin

作者机构:汕头大学工学院计算机科学与技术系广东汕头515000 

出 版 物:《计算机应用与软件》 (Computer Applications and Software)

年 卷 期:2018年第35卷第12期

页      码:199-208页

摘      要:对VQA(Visual Question Answering)数据集进行统计分析,得到相应统计特征,在此基础上提出数据预处理方法:仿聚类法。局部修改VGGNet提取的图像特征,与使用LSTM获取的问题特征连接后通过多层感知器,连接以K个可能输出的softmax分类器构成模型LcVMS。经过低频剔除法与仿聚类法预处理后,LcVMS在数据集上准确率从43. 21%提高到44. 45%。实验表明,以LcVMS模型为系统应答逻辑的图片问答系统能较好地分辨物体、数量、颜色和位置等信息,在一定程度上可媲美幼儿智商,具备一定的实用价值。

主 题 词:视觉问答 对话系统 自然语言处理 卷积神经网络 循环神经网络 

学科分类:08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1000-386x.2018.12.038

馆 藏 号:203424196...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分