看过本文的还看了

相关文献

该作者的其他文献

文献详情 >自然场景盲文图像数据集及盲文段检测方法 收藏
自然场景盲文图像数据集及盲文段检测方法

自然场景盲文图像数据集及盲文段检测方法

作     者:卢利琼 陈长江 吴东 熊建芳 LU Liqiong;CHEN Changjiang;WU Dong;XIONG Jianfang

作者机构:岭南师范学院计算机与智能教育学院广东湛江524048 广东省特殊儿童发展与教育重点实验室广东湛江524048 

基  金:广东省教育厅特色创新项目(2021KTSCX065) 广东省特殊儿童发展与教育重点实验室项目(TJ202011) 广东省湛江市科技发展专项资金竞争性分配项目(2022A01005) 

出 版 物:《计算机工程》 (Computer Engineering)

年 卷 期:2023年第49卷第10期

页      码:171-177页

摘      要:盲文检测是利用人工智能技术自动检测出图像中的盲文位置,是盲文书籍电子化、盲文自动阅卷以及加强正常人与盲人无障碍交流的关键技术。然而现有盲文检测研究领域缺乏自然场景盲文图像数据集和盲文段检测方法。为此,利用手机拍摄、网络下载等手段构建包含554幅图像的自然场景盲文图像数据集,并对数据集中每一幅图像的盲文段位置进行手动标记。从亮度、对比度和柔和度变化的角度设计图像增强策略来扩充自然场景盲文图像数据集,以辅助卷积神经网络(CNN)训练。在此基础上,分析自然场景盲文段在书写形式和结构上的特点,基于Faster R-CNN算法的思想,提出一种自然场景盲文段检测方法。以ResNet50作为主干网络,通过设计多尺寸CNN特征融合策略挖掘不同尺寸盲文段的特征,设计从32到512的多种锚框参数,以适应自然场景图像中盲文段高度变化小而宽度变化大以及存在较多小尺寸盲文段的特点。实验结果表明,与经典目标检测算法Faster R-CNN和SSD相比,该方法 Hmean值分别从0.793 5和0.800 1提升至0.887 9,检测性能提升明显。

主 题 词:自然场景图像 盲文段检测 卷积神经网络 Faster R-CNN算法 SSD算法 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.19678/j.issn.1000-3428.0065874

馆 藏 号:203124163...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分