看过本文的还看了

相关文献

该作者的其他文献

文献详情 >中英文混合文章识别问题 收藏
中英文混合文章识别问题

中英文混合文章识别问题

作     者:王恺 王庆人 WANG Kai;Wang Qing-ren

作者机构:南开大学机器智能研究所天津300071 

基  金:国家自然科学基金天元基金 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2005年第16卷第5期

页      码:786-798页

摘      要:当前,已经有大量为单一字符集(或语种)而设计的OCR(optical character recognition)分类器.同时,随着全球一体化,多语文档的出现越来越普遍.因此,设计多语文档处理系统势在必行.提出了一般性的解决方案:两项OCR技术、一个系统和语言判断.为了使研究工作具体化,实现了一个中英文混合文章处理系统.其中主要涉及了3个关键问题:系统流程控制、汉英语言区域分离和英文字符切分.与以往的系统相比,该系统增加了汉英语言区域分离模块,并将基于等间距性的新方法应用于该模块.为了验证本系统的有效性,综合以往的方法实现了另一个系统.实验结果表明,该系统的性能明显优于另一个系统,在杂志样和书籍样上的识别率分别从98.48%和98.68%提高到99.13%和99.25%.

主 题 词:系统设计 语言判别 字符切分 多语光学字符识别系统 文档图像处理 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.1360/jos160786

馆 藏 号:203372489...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分