看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向地址数据基于ISM理论构建数据清洗规则链方法研究 收藏
面向地址数据基于ISM理论构建数据清洗规则链方法研究

面向地址数据基于ISM理论构建数据清洗规则链方法研究

作     者:殷滋伟 张伟 王佳慧 马利民 YIN Ziwei;ZHANG Wei;WANG Jiahui;MA Limin

作者机构:北京信息科技大学计算机学院北京100101 北京信息科技大学北京材料基因工程高精尖创新中心北京100101 国家信息中心信息与网络安全部北京100045 

基  金:北京材料基因工程高精尖创新中心项目 

出 版 物:《北京信息科技大学学报(自然科学版)》 (Journal of Beijing Information Science and Technology University)

年 卷 期:2021年第36卷第6期

页      码:87-92页

摘      要:针对传统顺序执行数据清洗规则因忽略规则逻辑关系导致数据清洗效率低的问题,提出基于解析结构模型(interpretative structural modeling method,ISM)理论构建数据清洗规则链的方法。该方法将规则之间的二元关系基于ISM理论进行推导,转化为规则之间的多元关系矩阵,来构造满足规则之间约束关系的最小冲突规则链,从而提升了数据清洗效率。针对非规范地址数据,构建规则库,通过ISM理论进行建模,设计和构建简约的数据清洗规则链,缩短数据清洗时间,提高数据清洗的效率和正确率。实验结果表明,基于解析结构模型理论构建的规则链相对于顺序执行规则重复比更低,执行时间更少,平均匹配率更高。

主 题 词:数据清洗 地址数据 解析结构模型 规则链 数据关联 

学科分类:08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.16508/j.cnki.11-5866/n.2021.06.016

馆 藏 号:203107109...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分