看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于可微分架构搜索的端到端场景文字检测及识别算法 收藏
基于可微分架构搜索的端到端场景文字检测及识别算法

基于可微分架构搜索的端到端场景文字检测及识别算法

作     者:刘嘉艺 曹冬平 钟勇 LIU Jiayi;CAO Dongping;ZHONG Yong

作者机构:中国科学院成都计算机应用研究所成都610041 中国科学院大学北京100049 

基  金:四川省科技成果转化计划项目(2020ZHZY0002) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2023年第43卷第S1期

页      码:81-87页

摘      要:在自然场景文字检测和识别任务中,现有大多数方法的文字检测和文字识别过程相对独立,导致这些方法处理速度较慢;此外,这些方法的训练和推理过程较为复杂,并且手工设计合理的架构比较困难。针对以上这些问题,基于可微分架构搜索方法提出了多分支自动选择网络(MBASNet),该网络由数个多分支自动选择块(MBASB)组成。MBASB能在不显著增加计算量的情况下通过自动搜索检测和识别性能较优的子分支结构,组合多个MBASB得到整个检测和识别网络。所提出的MBASNet可以同时训练检测子网络和识别子网络,降低文字检测和识别任务中网络的训练和推理难度,提高对文字的检测和识别速度。MBASNet在ICDAR2013数据集上取得了89.4%的精确率和91.4%的召回率,在ICDAR15数据集上取得了80.5%的精确率和86.8%的召回率,并且计算速度达到了每秒68帧。

主 题 词:深度学习 卷积神经网络 文本检测 文字识别 可微分架构搜索 

学科分类:08[工学] 080203[080203] 0802[工学-机械学] 

D O I:10.11772/j.issn.1001-9081.2022081138

馆 藏 号:203122435...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分