限定检索结果

检索条件"主题词=端到端训练"
4 条 记 录,以下是1-10 订阅
视图:
排序:
基于视觉区域聚合与双向协作的端到端图像描述生成
收藏 引用
《软件学报》2023年 第5期34卷 2152-2169页
作者:宋井宽 曾鹏鹏 顾嘉扬 朱晋宽 高联丽电子科技大学计算机科学与工程学院四川成都611731 
近几年,基于Transformer的预训练模型展现了强大的模态表征能力,促使了多模态的下游任务(如图像描述生成任务)正朝着完全端到端范式的趋势所转变,并且能够使得模型获得更好的性能以及更快的推理速度.然而,该技术所提取的网格型视觉特征...
来源:详细信息评论
基于跨模态相似度学习的端到端不规则文本检索方法
收藏 引用
《无线电工程》2023年 第3期53卷 501-507页
作者:李岩 张敏艺 宿汉辰 李芳芳 李斌阳国际关系学院网络空间安全学院北京100191 中国传媒大学广告学院北京100024 中南大学计算机学院湖南长沙410083 
场景文本检索是指从场景中搜索并定位与给定文本相同或相似的文本实例。通过计算机视觉方法实现文本检索可以辅助用户在指定场景中自动找到感兴趣文本,因此被广泛应用于图像安全性审核、图书检索等领域。然而,在某些场景中文本时常呈现...
来源:详细信息评论
基于语义分割-对抗的图像语义分割模型
收藏 引用
《计算机仿真》2019年 第2期36卷 191-195页
作者:王鑫 于重重 马先钦 陈秀新北京工商大学计算机与信息工程学院北京100048 
图像语义分割对场景理解等具有重要的作用,是当前计算机视觉领域研究的一个热点问题。针对当前图像语义分割方法存在的精度低等问题,提出语义分割-对抗模型(Semantic Segmentation Generative Adversarial Networks, SSGAN)。模型采用De...
来源:详细信息评论
基于自适应特征融合的红外与可见光图像融合算法
收藏 引用
《信息技术与信息化》2021年 第6期 278-280页
作者:高元浩 罗晓清 张战成江南大学江苏无锡214028 苏州科技大学江苏苏州215009 
当下流行的基于自编码网络的图像融合算法不仅需要对提取到的特征设计复杂的融合规则以解码出融合图像,设计的融合策略也无法适用于多样化的场景。针对以上问题,提出了一种自适应特征融合的红外与可见光图像融合算法以端到端的方式输出...
来源:详细信息评论
聚类工具 回到顶部