看过本文的还看了

相关文献

该作者的其他文献

文献详情 >混洗差分隐私下的多维类别数据的收集与分析 收藏
混洗差分隐私下的多维类别数据的收集与分析

混洗差分隐私下的多维类别数据的收集与分析

作     者:刘艺菲 王宁 王志刚 谷峪 魏志强 张啸剑 于戈 LIU Yi-Fei;WANG Ning;WANG Zhi-Gang;GU Yu;WEI Zhi-Qiang;ZHANG Xiao-Jian;YU Ge

作者机构:中国海洋大学信息科学与工程学部山东青岛266100 河南财经政法大学计算机与信息工程学院河南郑州450046 东北大学计算机科学与工程学院辽宁沈阳110819 

基  金:国家自然科学基金(61902365,61902366,62072156) 中央高校基本科研业务费(202042008) 中国博士后基金(2019M652473,2019M652474,2020T130623) 青岛市自主创新重点研发(20-3-2-12-xx) 青岛市博士后应用项目 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2022年第33卷第3期

页      码:1093-1110页

摘      要:随着大数据时代的到来,如何在保护用户隐私的前提下完成多维类别数据上的频率分布估计问题成为研究热点.已有的工作主要是基于中心化差分隐私模型或本地化差分隐私模型完成安全算法的设计.鉴于上述两种模型在隐私保护程度或发布结果可用性方面的弊端,基于新兴的混洗差分隐私模型,设计用户数据收集策略,进而提供高安全、高可用的频率分布估计服务.考虑到多维类别属性的多维特征以及不同属性上取值域大小不等的异构特点,从扰动算法以及洗牌方式等角度出发,设计了基于单洗牌者以及多洗牌者的数据发布方案ARR-SS和SRR-MS.此外,结合上述两种方案的优势,通过填补技术消除属性间异构问题,提出了基于取值域填补的单洗牌者数据发布方案PSRR-SS.从理论上分析了3种策略的隐私保护程度以及误差级别,并利用4个真实数据集验证所提出方案在频率估计问题上的有效性.此外,将所提方案作为带噪数据库生成技术的加噪组件,评估随机梯度下降算法在生成带噪数据上的训练结果的可用性.实验结果展现了所提方案优于当前同类算法.

主 题 词:混洗差分隐私 隐私保护 多维类别数据 频率估计 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.13328/j.cnki.jos.006450

馆 藏 号:203108233...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分