看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于门控卷积和堆叠自注意力的离线手写汉字识别算法研究 收藏
基于门控卷积和堆叠自注意力的离线手写汉字识别算法研究

基于门控卷积和堆叠自注意力的离线手写汉字识别算法研究

作     者:罗序良 吴毅良 刘翠媚 郭凤婵 

作者机构:广东电网有限责任公司江门供电局广东 江门 

出 版 物:《计算机科学与应用》 (Computer Science and Application)

年 卷 期:2024年第14卷第5期

页      码:48-60页

摘      要:针对离线手写文本识别(HTR)在自然语言处理领域中的重要性以及其广泛应用于帮助视障用户、人机交互和自动录入等方面的实际需求,本研究提出了一个全新的模型。该模型在门控卷积网络的基础上引入了堆叠自注意力编码器–解码器,用于离线识别手写的汉字文本。由于书写风格的多样性、不同字符之间的视觉相似性、字符重叠以及原始文档中的噪音等挑战,设计准确且灵活的HTR系统具有相当大的难度,特别是当处理较为复杂、包含大量字符的文本时,算法的学习能力显得不足。为了解决这一问题,我们提出的模型包括特征提取层、编码器层和解码器层。其中,特征提取层从输入的手写图像中提取高纬度的不变特征图,而编码器和解码器层则相应地转录出文本。实验结果显示,该模型在HCTD数据集上的字符错误率(CER)为6.72,单词错误率(WER)为11.11;在HCWD数据集上的实验结果CER为6.22和WER为7.17。相对于其他研究者的模型,本文设计的模型在手写汉字识别率上提升了11%。

主 题 词:汉字识别 自注意力编码器–解码器 门控卷积 离线手写文本识别 

学科分类:08[工学] 0812[工学-测绘类] 

D O I:10.12677/csa.2024.145113

馆 藏 号:203128199...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分