看过本文的还看了

相关文献

该作者的其他文献

文献详情 >横向联邦学习中差分隐私聚类算法 收藏
横向联邦学习中差分隐私聚类算法

横向联邦学习中差分隐私聚类算法

作     者:徐雪冉 杨庚 黄喻先 XU Xueran;YANG Geng;HUANG Yuxian

作者机构:南京邮电大学计算机学院、软件学院、网络空间安全学院南京210023 江苏省大数据安全与智能处理重点实验室南京210023 

基  金:国家自然科学基金资助项目(61872197 61972209) 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2024年第44卷第1期

页      码:217-222页

摘      要:聚类分析能够挖掘出数据间隐藏的内在联系并对数据进行多指标划分,从而促进个性化和精细化运营。然而,数据孤岛造成的数据碎片化和孤立化严重影响了聚类分析的应用效果。为了解决数据孤岛问题的同时保护相关数据隐私,提出本地均分扰动联邦K-means算法(ELFedKmeans)。针对横向联邦学习模式,设计了一种基于网格的初始簇心选择方法和一种隐私预算分配方案。在ELFedKmeans算法中,各站点联合协商随机种子,以较小的通信代价生成相同的随机噪声,保护了本地数据的隐私。通过理论分析证明了该算法满足差分隐私保护,并将该算法与本地差分隐私K-means(LDPKmeans)算法和混合型隐私保护K-means(HPKmeans)算法在不同的数据集上进行了对比实验分析。实验结果表明,随着隐私预算不断增大,三个算法的F-measure值均逐渐升高;误差平方和(SSE)均逐渐减小。从整体上看,ELFedKmeans算法的F-measure值比LDPKmeans算法和HPKmeans算法分别高了1.7945%~57.0663%和21.2452%~132.0488%;ELFedKmeans算法的Log(SSE)值比LDPKmeans算法和HPKmeans算法分别减少了1.2042%~12.8946%和5.6175%~27.5752%。在相同的隐私预算下,ELFedKmeans算法在聚类质量和可用性指标上优于对比算法。

主 题 词:横向联邦聚类 差分隐私 本地扰动 可用性 K-means算法 

学科分类:0839[0839] 08[工学] 081201[081201] 0812[工学-测绘类] 

D O I:10.11772/j.issn.1001-9081.2023010019

馆 藏 号:203125856...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分