看过本文的还看了

相关文献

该作者的其他文献

文献详情 >M2LSH:基于LSH的高维数据近似最近邻查找算法 收藏
M2LSH:基于LSH的高维数据近似最近邻查找算法

M2LSH:基于LSH的高维数据近似最近邻查找算法

作     者:李灿 钱江波 董一鸿 陈华辉 LI Can;QIAN Jiang-bo;DONG Yi-hong;CHEN Hua-hui

作者机构:宁波大学信息科学与工程学院浙江宁波315211 

基  金:国家自然科学基金(No.61472194 No.61572266) 浙江省自然科学基金(No.LY13F020040 No.LY16F020003) 宁波市自然科学基金(No.2014A610023 No.2015A610119) 

出 版 物:《电子学报》 (Acta Electronica Sinica)

年 卷 期:2017年第45卷第6期

页      码:1431-1442页

摘      要:在许多应用中,LSH(Locality Sensitive Hashing)以及各种变体,是解决近似最近邻问题的有效算法之一.虽然这些算法能够很好地处理分布比较均匀的高维数据,但从设计方案来看,都没有针对数据分布不均匀的情况做相应的优化.针对这一问题,本文提出了一种新的基于LSH的解决方案(M2LSH,2 Layers Merging LSH),对于数据分布不均匀的情况依然能得到一个比较好的查询效果.首先,将数据存放到具有计数功能的组合哈希向量表示的哈希桶中,然后通过二次哈希将这些桶号投影到一维空间,在此空间根据各个桶中存放的数据个数合并相邻哈希桶,使得新哈希桶中的数据量能够大致均衡.查询时仅访问有限个哈希桶,就能找到较优结果.本文给出了详细的理论分析,并通过实验验证了M2LSH的性能,不仅能减少访问时间,也可提高结果的正确率.

主 题 词:近似最近邻 KNN查询 局部敏感哈希 高维数据 

学科分类:08[工学] 0835[0835] 0812[工学-测绘类] 081202[081202] 

核心收录:

D O I:10.3969/j.issn.0372-2112.2017.06.022

馆 藏 号:203236851...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分