看过本文的还看了

相关文献

该作者的其他文献

文献详情 >针对无切分维吾尔文文本行识别的字符模型优化 收藏
针对无切分维吾尔文文本行识别的字符模型优化

针对无切分维吾尔文文本行识别的字符模型优化

作     者:姜志威 丁晓青 彭良瑞 JIANG Zhiwei;DING Xiaoqing;PENG Liangrui

作者机构:清华大学电子工程系智能技术与系统国家重点实验室清华信息科学与技术国家实验室北京100084 

基  金:国家"九七三"重点基础研究项目(2013CB329403) 

出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))

年 卷 期:2015年第55卷第8期

页      码:873-877,883页

摘      要:基于隐含Markov模型(hidden Markov model,HMM)的无切分文本行识别方法能够利用概率图的思想,同步完成文本行图像的切分与识别,避免因字符预切分失败而导致的识别错误,但对字符模型的设计与训练要求很高,并且在多字体融合问题中难以提高模型泛化性能。该文通过分析模型状态在图像层面的聚类意义,先提出基于观测合理聚类的模型结构优化方法,再提出结构与参数相结合的字符模型优化策略,最后将其应用于多字体维吾尔文文本行的无切分识别系统。实验结果表明,该方法能够改善模型的状态分配合理性,并且在多字体融合问题中提高了模型泛化性能和状态利用效率。

主 题 词:信息处理 文字识别 隐含Markov模型 统计学习 维吾尔文 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.16511/j.cnki.qhdxxb.2015.08.010

馆 藏 号:203147389...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分