文献详情 >位置敏感Transformer航拍图像目标检测模型收藏

位置敏感Transformer航拍图像目标检测模型

作者：李大湘辛嘉妮刘颖 LI Daxiang;XIN Jiani;LIU Ying

基　　金：国家自然科学基金资助项目(No.62071379) 陕西省自然科学基金资助项目(No.2019JM-604) 西安邮电大学研究生创新基金资助项目(No.CXJJZL2022003)

出版物：《光学精密工程》 (Optics and Precision Engineering)

年卷期：2024年第32卷第5期

页码：727-739页

摘要：针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。

主题词：目标检测无人机图像位置敏感Transformer 多尺度特征融合注意力机制

学科分类：08[工学] 081203[081203] 082503[082503] 0835[0835] 0825[工学-环境科学与工程类] 0812[工学-测绘类]

核心收录：

D　O　I：10.37188/OPE.20243205.0727

馆藏号：203127211...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

位置敏感Transformer航拍图像目标检测模型

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

位置敏感Transformer航拍图像目标检测模型

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：