限定检索结果

检索条件"作者=宋井宽"
2 条 记 录,以下是1-10 订阅
视图:
排序:
基于视觉区域聚合与双向协作的端到端图像描述生成
收藏 引用
《软件学报》2023年 第5期34卷 2152-2169页
作者:宋井宽 曾鹏鹏 顾嘉扬 朱晋 高联丽电子科技大学计算机科学与工程学院四川成都611731 
近几年,基于Transformer的预训练模型展现了强大的模态表征能力,促使了多模态的下游任务(如图像描述生成任务)正朝着完全端到端范式的趋势所转变,并且能够使得模型获得更好的性能以及更快的推理速度.然而,该技术所提取的网格型视觉特征...
来源:详细信息评论
面向视觉对话的自适应视觉记忆网络
收藏 引用
《电子科技大学学报》2021年 第5期50卷 749-753页
作者:赵磊 高联丽 宋井宽电子科技大学计算机科学与工程学院成都611731 
视觉对话中最具挑战的难点是视觉共指消解问题,该文针对此问题设计了一种自适应视觉记忆网络(AVMN)。该方法直接将视觉信息存储于外部记忆库,整合了文本和视觉定位过程,进而有效缓解了在这两个过程中所产生的误差。此外在很多场景下,仅...
来源:详细信息评论
聚类工具 回到顶部