限定检索结果

检索条件"主题词=视觉区域聚合"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于视觉区域聚合与双向协作的端到端图像描述生成
收藏 引用
《软件学报》2023年 第5期34卷 2152-2169页
作者:宋井宽 曾鹏鹏 顾嘉扬 朱晋宽 高联丽电子科技大学计算机科学与工程学院四川成都611731 
近几年,基于Transformer的预训练模型展现了强大的模态表征能力,促使了多模态的下游任务(如图像描述生成任务)正朝着完全端到端范式的趋势所转变,并且能够使得模型获得更好的性能以及更快的推理速度.然而,该技术所提取的网格型视觉特征...
来源:详细信息评论
聚类工具 回到顶部