看过本文的还看了

相关文献

该作者的其他文献

文献详情 >位置敏感Transformer航拍图像目标检测模型 收藏
位置敏感Transformer航拍图像目标检测模型

位置敏感Transformer航拍图像目标检测模型

作     者:李大湘 辛嘉妮 刘颖 LI Daxiang;XIN Jiani;LIU Ying

作者机构:西安邮电大学通信与信息工程学院陕西西安710121 

基  金:国家自然科学基金资助项目(No.62071379) 陕西省自然科学基金资助项目(No.2019JM-604) 西安邮电大学研究生创新基金资助项目(No.CXJJZL2022003) 

出 版 物:《光学精密工程》 (Optics and Precision Engineering)

年 卷 期:2024年第32卷第5期

页      码:727-739页

摘      要:针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。

主 题 词:目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 

学科分类:08[工学] 081203[081203] 082503[082503] 0835[0835] 0825[工学-环境科学与工程类] 0812[工学-测绘类] 

核心收录:

D O I:10.37188/OPE.20243205.0727

馆 藏 号:203127211...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分