基于隐私保护的序列模式挖掘被引量：3

Mining Sequential Patterns Based on Privacy Preserving

下载PDF

导出

摘要基于隐私保护的数据挖掘是信息安全和知识发现相结合的产物.提出一种基于隐私保护的序列模式挖掘算法PP-SPM.算法以修改原始数据库中的敏感数据来降低受限序列模式的支持度为原则,首先构建SPAM序列树,根据一定的启发式规则,从中获得敏感序列,再进一步在原始数据库中找到敏感数据,对其做布尔操作,实现数据库的清洗.实验表明,该算法在完全保护隐私的情况下,对于D6C10T2.5S4I4数据集,当修改3.5%的原始数据后,其序列模式丢失率为2%. Data mining based on privacy preserving is the combination of information security technology and knowledge discovery technology. An algorithm of mining sequential pattern based on privacy preserving （PP-SPM） is proposed in this paper. It focuses on minimizing the support of restrictive sequential patterns by modifying the sensitive data of the original database. The tree called SPAM is built and the sensitive sequences are found from the tree firstly. Then the sensitive data is chosen from the original database and removed from the transactions by heuristic rules. The algorithm of PP-SPM not only completely protects the privacy but also hardly affects the sequential pattern mining. The experimental results show that the loss ratio of sequential patterns is 2% for the dataset of D6C10T2.5S4I4 after 3.5% data being modified.

作者燕彩蓉朱明史有群

机构地区东华大学计算机学院

出处《小型微型计算机系统》 CSCD 北大核心 2008年第7期1241-1244,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(90612006)资助

关键词隐私保护序列模式挖掘敏感数据受限序列模式 privacy preserving sequential pattern mining sensitive data restrictive sequential pattern

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Agrawal R, Srikant R. Privacy-preserving data mining[C]. Proceedings of ACM SIGMOD, 2000, 439-450.
2Du W L, Zhan Z J. Using randomized response techniques for privacy-preserving data mining[C]. Proceedings of ACM SIGKDD, 2003, 24-27.
3葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
4Oliveira S R M, Zaiane O R. Achieving privacy preservation when sharing data for clustering[C]. Proceedings of the International Workshop on Secure Data Management in a Connected World (SDM'04), 2004, 67-82.
5Evfimievski A, Srikant R, Agrawal R, et al. Privacy preserving mining of association rules [C]. Proceedings of 8th ACM SIGKDD, 2002, 217-228.
6Oliveira S R M, Zaiane O R. Privacy preserving frequent itemset mining[C]. Proceedings of the IEEE ICDM Workshop on Privacy, Security, and Data Mining, 2002, 43-54.
7Oliveira S R M,Zaiane O R, Saygin Y. Secure association rule sharing[C]. Proceedings of PAKDD, 2004, 74-85.
8Ayres J, Flannick J, Gehrke J, et al. Sequential pattern mining using a bitmap representation [C]. Proceedings of ACM SIGKDD, 2002, 429-435.
9宋世杰,胡华平,周嘉伟,金士尧.一种基于大项集重用的序列模式挖掘算法[J].计算机研究与发展,2006,43(1):68-74. 被引量：10
10Srikant R, Agrawal R. Mining sequential patterns: generalizations and performance improvements [C3. Proceedings of Extending Database Technology (EDBTI 96), 1996, 3-17.

二级参考文献21

1R.Agrawal,R.Srikant.Mining sequential patterns.ICDE 1995,Taipei,Taiwan,1995.
2R.Srikant,R.Agrawal.Mining sequential patterns:Generalizations and performance improvements.EDBT 1996,Avignon,France,1996.
3J.Pei,J.Han,B.Mortazavi-Asl,et al.PrefixSpan mining sequential patterns efficiently by prefix projected pattern growth.ICDE 2001,Heidelberg,Germany,2001.
4M.Garofalakis,R.Rastogi,K.Shim.SPIRIT:Sequential pattern mining with regular expression constraints.In:Proc.VLDB 1999,San Francisco:Morgan Kaufmann.,1999.223～234.
5C.Bettini,X.S.Wang,S.Jajodia.Mining temporal relationships with multiple granularities in time sequences.Data Engineering Bulletin,1998,21 (1):32 ～ 38.
6J.Han,G.Dong,Y.Yin.Efficient mining of partial periodic patterns in time series database.ICDE 1999,Sydney,Australia,1999.
7H.Mannila,H.Toivonen,A.I.Verkamo.Discovering frequent episodes in sequences.KDD 1995,Montreal,Quebec,Canada,1995.
8Rakesh Agrawal.Data mining:Crossing the chasm.The 5th Int'l Conf.Knowledge Discovery in Databases and Data Mining,San Diego,California,1999.
9Rakesh Agrawal,Ramakrishnan Srikant.Privacy-preserving data mining.The ACM SIGMOD Conf.Management of Data,Dallas,Texas,2000.
10Yehuda Lindell,Benny Pinkas.Privacy preserving data mining.In:Advances in Cryptology-Crypto.Berlin:Springer-Verlag,2000.36～ 54.

共引文献28

1张长海,胡孔法,陈凌.序列模式挖掘算法综述[J].扬州大学学报（自然科学版）,2007,10(1):41-46. 被引量：5
2李玉华,陈云开,卢正鼎.基于质量的数据挖掘服务选择[J].计算机科学,2007,34(8):159-164. 被引量：2
3肖仁财,薛安荣,段西强.带数据项约束的序列模式挖掘[J].计算机工程与设计,2008,29(12):3013-3015.
4王晗,孔令富,练秋生.基于二进制表示的事务属性挖掘方法[J].计算机工程,2008,34(18):48-50.
5周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
6熊国华.数据挖掘中的隐私保护策略[J].科技信息,2009(13):47-48.
7刘玉葆,黄志兰,傅慰慈,印鉴.基于有损分解的数据隐私保护方法[J].计算机研究与发展,2009,46(7):1217-1225. 被引量：21
8李光,王亚东,苏小红.隐私保持的决策树分类挖掘[J].电子学报,2010,38(1):204-212. 被引量：9
9童咏昕,张媛媛,袁玫,马世龙,余丹,赵莉.一种挖掘压缩序列模式的有效算法[J].计算机研究与发展,2010,47(1):72-80. 被引量：8
10张长海,胡孔法,陈崚,宋爱波.一种高效的基于位图序列模式挖掘算法[J].高技术通讯,2010,20(2):133-137. 被引量：1

同被引文献7

1郭宇红,童云海,唐世渭,杨冬青.基于FP-Tree的反向频繁项集挖掘[J].软件学报,2008,19(2):338-350. 被引量：20
2朱玉全,胡天寒,陈耿,常鹏.序列模式挖掘中的隐私保护方法研究[J].计算机应用研究,2009,26(7):2489-2491. 被引量：4
3徐维江,黄刘生,罗永龙,荆巍巍,姚亦飞.保护私有信息的范围搜索算法[J].小型微型计算机系统,2009,30(10):1972-1979. 被引量：1
4华蓓,钟诚,黄肇明,杨柳.通过计算影响权值实现敏感序列模式隐藏[J].小型微型计算机系统,2010,31(8):1647-1651. 被引量：3
5钱萍,吴蒙,刘镇.面向云计算的同态加密隐私保护方法[J].小型微型计算机系统,2015,36(4):840-844. 被引量：11
6卢成浪,刘明雍,吴宗大,郭均纺.针对网络信息系统的个人隐私保护方案[J].小型微型计算机系统,2015,36(6):1291-1295. 被引量：4
7林少聪,叶阿勇,许力.基于坐标变换的k匿名位置隐私保护方法[J].小型微型计算机系统,2016,37(1):119-123. 被引量：9

引证文献3

1华蓓,钟诚,黄肇明,杨柳.通过计算影响权值实现敏感序列模式隐藏[J].小型微型计算机系统,2010,31(8):1647-1651. 被引量：3
2张莹,钟诚.隐私保护的多数据源高投票率序列模式挖掘[J].小型微型计算机系统,2015,36(1):100-105. 被引量：1
3李宗峰,黄刘生,沈瑶,许杨,聂熠文,杨威.一种隐私保护的序列数据马尔可夫分类方案[J].小型微型计算机系统,2018,39(2):197-201. 被引量：3

二级引证文献7

1林瑞,钟诚,华蓓.隐私保护的一站多表跨多表频繁项集挖掘[J].计算机应用,2013,33(12):3437-3440. 被引量：1
2张莹,钟诚.隐私保护的多数据源高投票率序列模式挖掘[J].小型微型计算机系统,2015,36(1):100-105. 被引量：1
3田兴邦,华蓓,吕颖,钟诚,吴昆明.基于动态冲突度计算的敏感规则清洗算法[J].计算机技术与发展,2015,25(2):126-130. 被引量：2
4张莹,钟诚,李秋霞.增量式的多源序列模式挖掘隐私保护算法[J].合肥工业大学学报（自然科学版）,2016,39(4):481-485. 被引量：1
5王林景,许玉龙,康玉伟.云计算下节点级数据隐私保护挖掘方法仿真[J].计算机仿真,2020,37(10):433-436. 被引量：2
6高媛媛.基于多特征融合和机器学习的疾病基因检测大数据分类模型[J].微型电脑应用,2023,39(3):25-27. 被引量：4
7杜鹏懿,熊婧,张来平,李匀祎.面向大规模海量数据的数据挖掘隐私保护方法研究[J].电子产品可靠性与环境试验,2024,42(1):1-7. 被引量：1

1谢琛羚.WEB2.0时代网络隐私保护的数据挖掘方法研究[J].中国电子商务,2014(12):82-82. 被引量：2
2王利兴,梁建勇.隐私保护关联规则挖掘的研究[J].硅谷,2011,4(19):91-91. 被引量：1
3陈文捷,蔡立志.大数据安全及其评估[J].计算机应用与软件,2016,33(4):34-38. 被引量：23
4朱玉全,胡天寒,陈耿,常鹏.序列模式挖掘中的隐私保护方法研究[J].计算机应用研究,2009,26(7):2489-2491. 被引量：4
5华蓓,钟诚,黄肇明,杨柳.通过计算影响权值实现敏感序列模式隐藏[J].小型微型计算机系统,2010,31(8):1647-1651. 被引量：3
6李学国,冯刚.面向社交网络隐私保护的数据挖掘方法研究[J].科技通报,2013,29(1):128-131. 被引量：7
7杨珺,王映龙.集中式环境下面向隐私保护的数据挖掘技术的方法研究[J].科技信息,2011(8):22-23. 被引量：1
8饶兰香.基于隐私保护的数据挖掘研究[J].计算机与现代化,2011(12):109-111.
9马廷淮,唐美丽.基于隐私保护的数据挖掘[J].计算机工程,2008,34(9):78-80. 被引量：1
10杨铭,李春光.基于隐私保护的数据挖掘技术研究[J].山东工业技术,2014(22):163-163.

小型微型计算机系统

2008年第7期

浏览历史

内容加载中请稍等...

基于隐私保护的序列模式挖掘被引量：3

参考文献10

二级参考文献21

共引文献28

同被引文献7

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于隐私保护的序列模式挖掘 被引量：3

参考文献10

二级参考文献21

共引文献28

同被引文献7

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于隐私保护的序列模式挖掘被引量：3