限定检索结果

检索条件"作者=何世阳"
1 条 记 录,以下是1-10 订阅
视图:
排序:
基于跨模态信息过滤的视觉问答网络
收藏 引用
《计算机科学》2024年 第5期51卷 85-91页
作者:何世阳 王朝晖 龚声蓉 钟珊苏州大学计算机科学与技术学院江苏苏州215008 苏州大学东吴学院江苏苏州215006 常熟理工学院计算机科学与工程学院江苏苏州215500 
视觉问答作为多模态任务,瓶颈在于需要解决不同模态间的融合问题,这不仅需要充分理解图像中的视觉和文本,还需具备对齐跨模态表示的能力。注意力机制的引入为多模态融合提供了有效的路径,然而先前的方法通常将提取的图像特征直接进行注...
来源:详细信息评论
聚类工具 回到顶部