看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于注意力机制与深度多尺度特征融合的自然场景文本检测 收藏
基于注意力机制与深度多尺度特征融合的自然场景文本检测

基于注意力机制与深度多尺度特征融合的自然场景文本检测

作     者:李雨 闫甜甜 周东生 魏小鹏 LI Yu;YAN Tian-tian;ZHOU Dong-sheng;WEI Xiao-peng

作者机构:大连大学软件工程学院计算机辅助设计国家地方联合工程实验室辽宁大连116622 大连理工大学计算机科学与技术学院辽宁大连116024 

基  金:国家自然科学基金重点项目(U21A20491) 辽宁省中央引导地方科技发展专项(2021JH6/10500140) 辽宁省高等学校创新团队支持计划项目(LT2020015) 大连市重点领域创新团队支持计划项目(2021RT06) 

出 版 物:《图学学报》 (Journal of Graphics)

年 卷 期:2023年第44卷第3期

页      码:473-481页

摘      要:针对现有场景文本检测方法不能深入挖掘并充分融合多尺度文本实例判别性特征的问题,提出一种基于注意力机制与深度多尺度特征融合的自然场景文本检测方法。首先采用带有注意力增强的ResNeSt50作为骨干网络,提取文本实例在不同尺度上更具判别力的特征表示;然后设计深度多尺度特征融合模块,将不同尺度的特征信息进行交互,自适应地学习不同尺度特征图对应的权重矩阵,用于融合文本实例在不同尺度特征图上具有判别力的特征信息,从而获得更具鲁棒性的多尺度融合特征图;最后利用自适应的二值化后处理模块生成更加精确的文本区域边界框。为评估其有效性,大量实验在ICDAR2015,ICDAR2013和CTW1500数据集上进行验证,结果表明该方法相较于其他先进的检测方法取得了有竞争力的检测结果,展现出良好的鲁棒性和泛化能力。

主 题 词:自然场景文本检测 注意力机制 多尺度特征融合 二值化 自适应 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.11996/JG.j.2095-302X.2023030473

馆 藏 号:203122441...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分