看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于邻域视角的关联关系挖掘方法 收藏
基于邻域视角的关联关系挖掘方法

基于邻域视角的关联关系挖掘方法

作     者:成红红 钱宇华 胡治国 梁吉业 Honghong CHENG;Yuhua QIAN;Zhiguo HU;Jiye LIANG

作者机构:山西大学大数据科学与产业研究院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006 

基  金:国家重点研发计划(批准号:2018YFB1004300) 国家自然科学基金(批准号:61672332,61872226) 山西省重点研发计划(国际科技合作)(批准号:201903D421003) 山西省海外归国人员研究项目(批准号:2017023) 山西省自然科学基金计划资助项目(批准号:201701D121052) 山西省高等学校科技创新项目(批准号:201802013)资助项目 

出 版 物:《中国科学:信息科学》 (Scientia Sinica(Informationis))

年 卷 期:2020年第50卷第6期

页      码:824-844页

摘      要:识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,称为最大邻域系数.人造数据集和真实数据集实验从不同角度验证了本文所提方法的有效性和优越性.最后指出了实验中发现的有趣现象和有待解决的理论问题,以引起对该领域更深入的思考和研究.

主 题 词:大数据 复杂关联关系挖掘 关联度量 数据驱动 粒计算 k-NN粒 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 

核心收录:

D O I:10.1360/SSI-2020-0009

馆 藏 号:203935789...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分