看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于神经网络和多样化特征的表格单元格分类方法 收藏
基于神经网络和多样化特征的表格单元格分类方法

基于神经网络和多样化特征的表格单元格分类方法

作     者:彭滢 吴杰 齐伟钢 PENG Ying;WU Jie;QI Weigang

作者机构:卫士通信息产业股份有限公司四川成都610041 

出 版 物:《通信技术》 (Communications Technology)

年 卷 期:2022年第55卷第9期

页      码:1146-1152页

摘      要:在大数据时代,电子表格无处不在,它们的结构样式多变、语义丰富。为了自动化地理解电子表格的逻辑结构,一项关键的步骤是对表格单元格分类,区分出标题单元格和内容单元格。为完成表格单元格分类,首先抽取来自表格的结构、样式和语义的6种特征,其次基于深度学习的方法对多样化的特征进行编码和融合,最后构建了一个U-Net结构的神经网络模型来学习特征与单元格类型间的关系。实验结果显示了特征选择和模型结构设计的合理性,证明了所提方法的有效性。

主 题 词:电子表格 表格单元格分类 深度学习 特征融合 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1002-0802.2022.09.006

馆 藏 号:203114542...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分