限定检索结果

检索条件"作者=刘润知"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于视觉-语言特征编码的跨模态融合视觉问答方法
收藏 引用
《西南科技大学学报》2024年 第3期39卷 86-95页
作者:刘润知 陈念年 曾芳西南科技大学计算机科学与技术学院四川绵阳621010 
现有的视觉问答方法采用相同编码器编码视觉-语言特征,忽略了视觉-语言模态之间的差异,从而在编码视觉特征时引入与问题无关的视觉干扰特征,导致对关键视觉特征关注不足。提出一种基于视觉-语言特征编码的跨模态融合视觉问答方法:采用...
来源:详细信息评论
聚类工具 回到顶部