看过本文的还看了

相关文献

该作者的其他文献

文献详情 >自然场景文本检测与识别的深度学习方法 收藏
自然场景文本检测与识别的深度学习方法

自然场景文本检测与识别的深度学习方法

作     者:刘崇宇 陈晓雪 罗灿杰 金连文 薛洋 刘禹良 Liu Chongyu;Chen Xiaoxue;Luo Canjie;Jin Lianwen;Xue Yang;Liu Yuliang

作者机构:华南理工大学电子与信息学院广州510640 

基  金:国家自然科学基金项目(61936003,61771199) 广东省自然科学基金项目(2017A030312006,2021A1515011870) 

出 版 物:《中国图象图形学报》 (Journal of Image and Graphics)

年 卷 期:2021年第26卷第6期

页      码:1330-1367页

摘      要:许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和技术发展路线。此外,列举说明了部分主流公开数据集,对比了各个模型方法在代表性数据集上的性能情况。最后总结了目前不同场景数据下的自然场景文本检测、识别及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。

主 题 词:自然场景文本检测 自然场景文本识别(STR) 端到端自然场景文本检测与识别 深度学习 光学字符识别(OCR) 综述 

学科分类:1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 0835[0835] 081101[081101] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.11834/jig.210044

馆 藏 号:203103569...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分