看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于场景词分析的可纠错视觉问答方法 收藏
基于场景词分析的可纠错视觉问答方法

基于场景词分析的可纠错视觉问答方法

作     者:肖婧文 姜士玲 温俊芳 胡艺馨 王秋艳 宋庆增 XIAO Jing-wen;JIANG Shi-ling;WEN Jun-fang;HU Yi-xin;WANG Qiu-yan;SONG Qing-zeng

作者机构:天津工业大学计算机科学与技术学院天津300387 

基  金:天津市高等学校基本科研业务费基金项目(2019KJ019) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2022年第43卷第12期

页      码:3521-3528页

摘      要:现有的方法不进行语义及场景理解,直接进行匹配并回答问题,因此会导致结果与用户预期产生偏差。基于场景词分析,提出可纠错的视觉问答方法。如果第一次回答的反馈为答案错误,则进行场景词分析,即通过分析图片中所有目标是否可能出现在场景中,重新选取潜在的匹配图片,提高整体回答的准确率。在MemexQA数据集和Visual7w数据集上的实验结果表明,相比现有方法,该方法准确率更高。

主 题 词:视觉问答 计算机视觉 自然语言处理 场景词 相似度匹配 

学科分类:08[工学] 080203[080203] 0802[工学-机械学] 

D O I:10.16208/j.issn1000-7024.2022.12.028

馆 藏 号:203115643...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分