基于敏感属性值语义桶分组的t-closeness隐私模型被引量：14

A t-closeness Privacy Model Based on Sensitive Attribute Values Semantics Bucketization

下载PDF

导出

摘要 t-closeness模型是数据发布领域中用于抵御相似性攻击和偏斜攻击的一种有效方法,但其采用的EMD(earth mover's distance)距离没有考虑等价类与数据表间敏感属性分布的稳定性,不能全面地衡量分布间距离,在分布间稳定差异过大时会大大提高隐私泄露的风险.针对这种局限,提出了一种SABuk t-closeness模型,它在传统t-closeness模型的基础上,为更加准确地度量分布间距离,以EMD距离与KL散度(kullback-leibler divergence)结合构建距离度量标准.同时,根据敏感属性的层次树结构,对数据表进行语义相似性桶分组划分,然后采用贪心思想生成满足要求的最小等价类,并且运用k-近邻的思想来选取QI(quasi-identifiers)值相似的元组生成等价类.实验结果表明,SABuk t-closeness模型在牺牲少量时间的前提下减少了信息损失,能在有效地保护敏感信息不泄露的同时保持较高的数据效用. The t-closeness model is an effective model to prevent the data sets from skewness attack and similarity attack. But the EMD （earth mover＇s distance）, which t-closeness used to measure the distance between distributions, is not well considering the stability between distributions, so it is hardly to entirely measure the distance between distributions. When the stability between distributions is too large, it will greatly increase the risk of privacy. Aim to address these limitations and accurately measure the distance between distributions, based on traditional t-closeness, the model of SABuk t-closeness which combined the EMD with KL divergence to construct a new distance measurement is proposed. At the same time, according to the hierarchy of sensitive attribute （SA）, it partitions a table into buckets based on the semantic similarity of SA values, and then uses greedy algorithm for generating the minimum groups which is satisfied with the requirement of the distance between distributions. At the end, it has adopted the k-nearest neighbour algorithm to choose similar quasi-identifiers （QI） values. Experimental results indicate that SABuk t-closeness model can bring down the information loss on the premise of consuming a little time, and it can preserve privacy of sensitive data well meanwhile maintaining high data utility.

作者张健沛谢静杨静张冰

机构地区哈尔滨工程大学计算机科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2014年第1期126-137,共12页 Journal of Computer Research and Development

基金国家自然科学基金项目(61073041 61073043) 教育部高等学校博士学科点专项科研基金项目(20112304110011 20122304110012) 哈尔滨市科技创新人才研究专项资金项目(优秀学科带头人)(2011RFXXG015)

关键词隐私保护桶分组 t-closeness模型 EMD KL散度 privacy preserving bucket grouping t-closeness model earth mover＇s distance （EMD） KL divergence

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1刘玉葆,黄志兰,傅慰慈,印鉴.基于有损分解的数据隐私保护方法[J].计算机研究与发展,2009,46(7):1217-1225. 被引量：21
2童云海,陶有东,唐世渭,杨冬青.隐私保护数据发布中身份保持的匿名方法[J].软件学报,2010,21(4):771-781. 被引量：45
3杨晓春,王雅哲,王斌,于戈.数据发布中面向多敏感属性的隐私保护方法[J].计算机学报,2008,31(4):574-587. 被引量：59
4王智慧,许俭,汪卫,施伯乐.一种基于聚类的数据匿名方法[J].软件学报,2010,21(4):680-693. 被引量：49

二级参考文献43

1葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
2杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
3张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
4Sweeney L.Achieving k-anonymity privacy protection using generalization and suppression[J].International Journal on Uncertainty,Fuzziness and Knowldege-Based Systems,2002,10(5):571-588.
5Agrawal R,Srikant R.Privacy-preserving data mining[C]// Proc of SIGMOD 2000.New York:ACM.2000:439-450.
6Wong R,Li J,Fu A,et al.(alpha,k)-anonymity,An enhanced k-anonymity model for privacy-preserving data publishing[C] aProc of KDD2006.New York:ACM,2006:754-759.
7Aggrawal G,Feder T,Kenthapadi K,et al.Anomyrnizing tables[C] //Proc of ICDT 2005.Berlin:Springer,2005:236-258.
8Machanavajjhala A,Gehrke J.Kifer D.1-diversity:Privacy beyond k-anonymity[C] //Proc of ICDE 2006.Los Alamitoa,CA:IEEE Computer Society,2006:24-35.
9Lefevre K,Dewht D J.Ramakrishnan R.Incognhn: Efficient full domain k anonymity[C] //Proc of SIGMOD 2005.New York:ACM.2005:49-60.
10Fung BC M,Wang K,Yu P S.Top-down specialization for information and privacy preservation[C] //Proc of ICDE 2005.Los Alamitos.CA:IEEE Computer Society.2005:205-216.

共引文献142

1程林,丰江帆.多维敏感属性流数据发布的隐私保护方法[J].中国科技论文在线精品论文,2021(2):212-219.
2武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
3李太勇,唐常杰,吴江,周敏.基于两次聚类的k-匿名隐私保护[J].吉林大学学报（信息科学版）,2009,27(2):173-178. 被引量：1
4滕金芳,钟诚.基于匿名方法的数据发布隐私泄露控制技术研究进展[J].广西科学院学报,2009,25(4):273-277.
5张利敏.试题库题型难易度多维分组技术组合研究[J].武汉理工大学学报,2010,32(12):137-139. 被引量：1
6刘腾腾,倪巍伟,崇志宏,张勇.多维数值敏感属性隐私保护数据发布方法[J].东南大学学报（自然科学版）,2010,40(4):699-703. 被引量：6
7张坤,李庆忠,史玉良.面向SaaS应用的数据组合隐私保护机制研究[J].计算机学报,2010,33(11):2044-2054. 被引量：35
8王平水.基于聚类的匿名化隐私保护技术研究[J].现代图书情报技术,2010(11):53-58. 被引量：2
9韩建民,于娟,虞慧群,贾泂.面向数值型敏感属性的分级l-多样性模型[J].计算机研究与发展,2011,48(1):147-158. 被引量：23
10徐龙琴,刘双印.语义相似和多维加权的联合敏感属性隐私保护[J].计算机应用,2011,31(4):999-1002. 被引量：2

同被引文献117

1武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
2赵克勤.集对分析对不确定性的描述和处理[J].信息与控制,1995,24(3):162-166. 被引量：150
3张枝令.结构化数据及非结构化数据的分类方法[J].宁德师专学报（自然科学版）,2007,19(4):417-420. 被引量：14
4Bhagat S,Cormode G,Krishnamurthy B,et al.Class-based graph anonymization for social network data[C] //Proc of the35th Int’l Conf on Very Large Databases,2009:766-777.
5Gao J,Xu JY,Jin R,et al.Neighborhood-privacy protected shortest distance computing in cloud[C] //Proc of the ACM SIGMOD Int’l Conf on Management of Data,2011:409-420.
6杨俊,刘向宇,杨晓春,等.基于图自同构的k-Secure社会网络隐私保护方法[C] //第29届中国数据库学术会议论文集,2012:264-271.
7Zhelea E,Getdoor L.Preserving the privacy of sensitive relationships in graph data[C] //Proceedings of the 1st ACM SIGKDD Workshop on Privacy,Security,and Trust in KDD,2007.
8Li J,Han J M,Luo F W,et al.K-Sensitive edge anonymity model for sensitive relationship preservation on publishing social network[C] //The 3rd International Conference on Information Technology and Computer Science,2011:146-149.
9Zheleva E,Getoor L.Preserving the privacy of sensitive relationships in graph data[C] //Proc of the 1st ACM SIGKDD Workshop on Privacy,Security,and Trust in KDD,2007:153-171.
10Campan A,Truta T M,Cooper N.P-sensitive K-anonymity with generalization constraints[J] .Transactions on Data Privacy Journal,2010,3(2):65-89.

引证文献14

1申艳光,闫晶星,买建英,范永健.基于敏感关系的社会网络隐私保护方法[J].计算机工程与设计,2015,36(2):355-362. 被引量：4
2谢静,张健沛,杨静,张冰.相异敏感度下最小信息损失增量优先的隐私保护方法[J].中南大学学报（自然科学版）,2015,46(12):4548-4555. 被引量：1
3刘志军,张艳丽,闫晶星,范永健,席爱萍.面向多敏感属性的个性化分级(l,α,m)-多样性匿名方法[J].科技通报,2016,32(1):123-127. 被引量：2
4龚卫华,兰雪锋,裴小兵,杨良怀.基于k-度匿名的社会网络隐私保护方法[J].电子学报,2016,44(6):1437-1444. 被引量：11
5王静,闫仁武,刘亚梅.多敏感属性K-匿名模型的实现[J].计算机与数字工程,2017,45(7):1368-1372. 被引量：3
6赵皎,沈明玉,胡学钢,王正彬.一种面向多次发布的隐私保护模型[J].合肥工业大学学报（自然科学版）,2017,40(10):1338-1342.
7熊金波,王敏燊,田有亮,马蓉,姚志强,林铭炜.面向云数据的隐私度量研究进展[J].软件学报,2018,29(7):1963-1980. 被引量：21
8马哲,鹿方凯.基于差分隐私的RDPk-means聚类方法[J].软件导刊,2018,17(8):205-207. 被引量：1
9刘慧婷,程雷,郭孝雪,赵鹏.实时个性化微博推荐系统[J].计算机科学,2018,45(9):253-259. 被引量：1
10武绍欣.基于属性分区的(α_i,k)-p隐私保护算法[J].软件导刊,2019,18(8):63-65. 被引量：1

二级引证文献58

1王进茂,郑均宝,高秀丽,徐振华,张法勇.花烛组织培养的研究[J].河北林果研究,2000,15(1):69-74. 被引量：24
2王洪均,谢国君.高压水除鳞系统改进[J].四川冶金,2000,22(2):48-50. 被引量：4
3张荣庆,徐光侠.面向多敏感属性的匿名隐私保护方法[J].重庆邮电大学学报（自然科学版）,2017,29(4):542-549. 被引量：2
4张静,苗水清,李显峰.社会网络隐私信息研究[J].无线互联科技,2017,14(22):28-29. 被引量：2
5黄锐诚.网络用户隐私信息保护仿真研究[J].计算机仿真,2017,34(11):308-311. 被引量：1
6王秋月,葛丽娜,耿博,王利娟.基于多敏感属性分级的(α_(ij),k,m)-匿名隐私保护方法[J].计算机应用,2018,38(1):67-72. 被引量：4
7刘爽英,朱勇华.针对社交网络边权重的差分隐私保护[J].计算机工程与设计,2018,39(1):44-48. 被引量：3
8周倩伊,王亚民,王闯.基于互联网大数据的脱敏分析技术研究[J].数据分析与知识发现,2018,2(2):58-63. 被引量：14
9王平水,朱新峰.基于大数据分析的移动社交网络用户隐私信息关联关系研究[J].赤峰学院学报（自然科学版）,2018,34(8):49-51. 被引量：8
10李奕麟.试论我国隐私权保护的不足及其完善[J].祖国,2018,0(7):89-89.

1余江,杨晓青,罗成.浅谈位置隐私保护技术[J].电子制作,2012,20(12X):13-13.
2杨静,张冰,张健沛,谢静.基于敏感等级划分的(l,t)-相近性匿名算法[J].华中科技大学学报（自然科学版）,2014,42(8):12-17. 被引量：2
3Lose It![J].科技创业,2010(4):18-18.
4蒋云良,杨章显,刘勇.不协调信息系统快速属性分布约简方法[J].自动化学报,2012,38(3):382-388. 被引量：15
5陈凤娟.基于数据流的频繁闭项集挖掘[J].电子商务,2014,15(11):68-69.
6江开忠,李路,王昭宗.基于语料库的潜语义信息度量[J].计算机应用,2009,29(9):2450-2453.
7赵爽,陈力.基于敏感度的个性化(α,l)-匿名方法[J].计算机工程,2015,41(1):115-120. 被引量：7
8孙艳正,陈伟鹤,詹永照.基于分类敏感属性语义距离的隐私保护模型[J].计算机应用研究,2011,28(10):3823-3827.
9王平水,王建东.一种基于聚类的个性化(l,c)-匿名算法[J].计算机工程与应用,2012,48(23):16-20. 被引量：4
10谭瑛.数据挖掘中匿名化隐私保护研究进展[J].科技导报,2013,31(1):75-79. 被引量：5

计算机研究与发展

2014年第1期

浏览历史

内容加载中请稍等...

基于敏感属性值语义桶分组的t-closeness隐私模型被引量：14

参考文献4

二级参考文献43

共引文献142

同被引文献117

引证文献14

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

基于敏感属性值语义桶分组的t-closeness隐私模型 被引量：14

参考文献4

二级参考文献43

共引文献142

同被引文献117

引证文献14

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

基于敏感属性值语义桶分组的t-closeness隐私模型被引量：14