看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于蚁群特征选择的相似重复记录分类检测 收藏
基于蚁群特征选择的相似重复记录分类检测

基于蚁群特征选择的相似重复记录分类检测

作     者:曹建军 刁兴春 杜鹢 王芳潇 张潇毅 CAO Jian-jun;DIAO Xing-chun;DU Yi;WANG Fang-xiao;ZHANG Xiao-yi

作者机构:总参第63研究所江苏南京210007 中国电子系统工程公司网管中心北京100036 

基  金:中国博士后科学基金资助项目(20090461425) 江苏省博士后科研资助计划资助项目(0901014B) 

出 版 物:《兵工学报》 (Acta Armamentarii)

年 卷 期:2010年第31卷第9期

页      码:1222-1227页

摘      要:为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法。将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测;建立了以召回率、准确率和特征规模综合最优的特征选择多目标优化模型,并根据问题特点将多目标模型转化为单目标模型,应用蚁群算法设计了模型求解算法。最后,用欧氏距离分类法和支持向量机2种分类器验证了该方法的有效性。

主 题 词:信息处理技术 数据清洗 相似重复记录 蚁群算法 特征选择 支持向量机 

学科分类:08[工学] 0802[工学-机械学] 0835[0835] 0801[工学-力学类] 081202[081202] 0812[工学-测绘类] 

核心收录:

馆 藏 号:203127171...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分