看过本文的还看了

相关文献

该作者的其他文献

文献详情 >视觉Transformer在低级视觉领域的研究综述 收藏
视觉Transformer在低级视觉领域的研究综述

视觉Transformer在低级视觉领域的研究综述

作     者:朱凯 李理 张彤 江晟 别一鸣 ZHU Kai;LI Li;ZHANG Tong;JIANG Sheng;BIE Yiming

作者机构:长春理工大学物理学院长春130022 长春理工大学中山研究院光电/生物纳米检测与制造中心广东中山528437 长春理工大学电子信息工程学院长春130022 吉林大学交通学院长春130012 

基  金:吉林省科技发展计划重点研发项目(20210203214SF) 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2024年第60卷第4期

页      码:39-56页

摘      要:Transformer是一种革命性的神经网络模型架构,最初为自然语言处理而设计,但其由于卓越的性能,在计算机视觉领域获得了广泛的应用。虽然关于Transformer在自然语言处理领域的应用有大量的研究和文献,但针对低级视觉任务的综述相对匮乏。简要介绍了Transformer的原理并分析归纳了几种变体。在低级视觉任务的应用方面,将重点放在图像恢复、图像增强和图像生成这三个关键领域。通过详细分析不同模型在这些任务中的表现,探讨了它们在常用数据集上的性能差异。对Transformer在低级视觉领域的发展趋势进行了总结和展望,提出了未来的研究方向,以进一步推动Transformer在低级视觉任务中的创新和发展。这一领域的迅猛发展将为计算机视觉和图像处理领域带来更多的突破,为实际应用提供更加强大和高效的解决方案。

主 题 词:Transformer 深度学习 注意力机制 计算机视觉 低级视觉任务 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 081203[081203] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1002-8331.2304-0139

馆 藏 号:203125943...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分