一种半监督K均值多关系数据聚类算法被引量：22

Semi-Supervised K-Means Clustering Algorithm for Multi-Type Relational Data

下载PDF

导出

摘要提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. A semi-supervised K-means clustering algorithm for multi-type relational data is proposed, which extends traditional K-means clustering by new methods of selecting initial clusters and similarity measures, so that it can semi-supervise cluster multi-type relational data. In order to achieve high performance, in the algorithm, besides attribute information, both labeled data and relationship information are employed. Experimental results on Movie database show the effectiveness of this method.

作者高滢刘大有齐红刘赫

机构地区吉林大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室

出处《软件学报》 EI CSCD 北大核心 2008年第11期2814-2821,共8页 Journal of Software

基金 Supported by the National Natural Science Foundation of China under Grant Nos.60496321 60773099 60573073(国家自然科学基金) the National High-Tech Research and Development Plan of China under Grant Nos.2006AA10Z244 2006AA10A309(国家高技术研究发展计划(863)) the Science and Technology Development Plan of Jilin Province of China under Grant No.20030523(吉林省科技发展计划) the European Commission under Grant No.TH/Asia Link/010(111084)(欧盟项目)

关键词数据挖掘半监督学习聚类算法多关系数据 K均值聚类 data mining semi-supervised learning clustering algorithm multi-type relational data K-means clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1Dzeroski S. Multi-Relational data mining: An introduction. ACM SIGKDD Explorations Newsletter, 2003,5(1):1-16.
2Dzeroski S, Lavrac N. Relational Data Mining. Berlin: Springer-Verlag, 2001. 339-364.
3Domingos P. Prospects and challenges for multi-relational data mining. ACM SIGKDD Explorations Newsletter, 2003,5(1):80-83.
4Bouchachia A. Learning with partly labeled data. Neural Computing and Applications, 2007,16(3):267-293.
5Zhu XJ. Semi-Supervised learning literature survey. Technical Report, Computer Sciences TR 1530, University of Wisconsin- Madison, 2007. 1-42.
6Chapelle O, Seholkopf B, Zien A. Semi-Supervised Learning. Cambridge: MIT Press, 2006. 3-14.
7Long B, Zhang F, Wu XY, Yu PS. Spectral clustering for multi-type relational data. In: Cohen WW, Moore A, eds. Proc. of the 23rd Int'l Conf. on Machine Learning. New York: ACM Press, 2006. 585-592.
8Marques de Sa JP, Wrote; Wu YF, Trans. Pattern Recognition Concepts, Methods and Applications. 2nd ed., Beijing: Tsinghua University Press, 2002.51-74 (in Chinese).
9http://archive.ics.uci.edu/ml/datasets.html
10Yin XX, Han JW, Yu PS. CrossClus: User-Guided multi-relational clustering. Data Mining Knowledge Discovery, 2007,15(3): 321-348.

共引文献4

1涂淑琴,张义青,王美华,万华.一种量子神经网络模型及改进学习算法[J].现代计算机,2010,16(11):3-6. 被引量：1
2陆慧娟,张金伟,马小平,杨小兵.基于特征选择的过抽样算法的研究[J].电信科学,2012,28(1):87-91. 被引量：1
3胡德敏,赵瑞可.一种改进的最大频繁项集挖掘算法[J].计算机应用与软件,2012,29(12):186-188. 被引量：2
4何进荣,丁立新,胡庆辉,李照奎.高维数据空间的性质及度量选择[J].计算机科学,2014,41(3):212-217. 被引量：9

同被引文献185

1李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
2张平庸,欧阳为民,万志华.基于密度的购物篮数据聚类方法[J].计算机工程与设计,2005,26(1):180-181. 被引量：1
3孙晓鹏,李华.三维网格模型的分割及应用技术综述[J].计算机辅助设计与图形学学报,2005,17(8):1647-1655. 被引量：49
4陈宗海,文锋,聂建斌,吴晓曙.基于节点生长k-均值聚类算法的强化学习方法[J].计算机研究与发展,2006,43(4):661-666. 被引量：13
5彭喜元,俞洋.基于变游程编码的测试数据压缩算法[J].电子学报,2007,35(2):197-201. 被引量：33
6吕强,高彦明,钱培德.共享信息素矩阵:一种新的并行ACO方法[J].自动化学报,2007,33(4):418-421. 被引量：11
7Wagstaff K, Cardie C, Rogers S, et al. Constrained K-Means Clustering with Background Knowledge[ C] //Brodley CE, Danyluk AP,eds. Proc.of the 18th lnt'l Conf. on Machine Learning. Williamstown: Morgan Kaufmann Publishers, 2001 : 577 - 584.
8Mathias M, Adankon, Mohamed Cheriet. Learning Semi- Supervised SVM with Genetic Algorithm[ C]//Proceedings of International Joint Conference on Neural Networks, 2007:1825 - 1830.
9Noureddine G L, Farid M. Semi-Supervised Muhitemporal Classification with Support Vector Machines and Genetic Algorithms [ C ] // International Geoscience and Remote Sensing Symposium. Spain, 2007 : 2577 - 2580.
10Brian Kulis, Sugato Basu, Inderjit Dhillon, et al. Semi-Supervised Graph Clustering: A Kernel Approach [ J ]. Machine LearnInz, 2009,1 (74) : 1 - 22.

引证文献22

1孙雪,李昆仑,胡夕坤,赵瑞.基于半监督K-means的K值全局寻优算法[J].北京交通大学学报,2009,33(6):106-109. 被引量：11
2孙晓鹏,张琪,魏小鹏.半监督的三维网格模型层次分割[J].计算机辅助设计与图形学学报,2010,22(4):592-598. 被引量：5
3袁利永.基于不完备标签数据的半监督聚类算法[J].计算机系统应用,2011,20(2):182-185.
4李小展.基于半监督的K-means聚类改进算法[J].东莞理工学院学报,2011,18(1):29-32. 被引量：1
5杨南海,黄明明,赫然,王秀坤.基于最大相关熵准则的鲁棒半监督学习算法[J].软件学报,2012,23(2):279-288. 被引量：8
6芦世丹,崔荣一.基于主动学习策略的半监督聚类算法研究[J].计算机应用研究,2013,30(6):1718-1720. 被引量：1
7梅松青.基于自适应图的半监督学习方法[J].计算机系统应用,2014,23(2):173-177. 被引量：2
8于重重,吴子珺,谭励,涂序彦,杨扬,王璐.多元时序模糊聚类分段挖掘算法[J].北京科技大学学报,2014,36(2):260-265. 被引量：3
9文翰,肖南峰.基于强类别特征近邻传播的半监督文本聚类[J].模式识别与人工智能,2014,27(7):646-654. 被引量：10
10黄少滨,程媛,万庆生,刘国峰,申林山.一种基于IDEF1x模型的层次多关系聚类算法[J].自动化学报,2014,40(8):1740-1753. 被引量：1

二级引证文献67

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2关胜,罗一鸣.模糊聚类算法与多级图在推荐系统中的应用[J].计算机产品与流通,2020,0(8):229-229.
3贾丽,乔权根.社区发现算法在超市货架布局中的应用[J].经济统计学（季刊）,2018(1):193-205.
4田森平,吴文亮.自动获取k-means聚类参数k值的算法[J].计算机工程与设计,2011,32(1):274-276. 被引量：18
5袁利永,王基一.一种改进的半监督K-Means聚类算法[J].计算机工程与科学,2011,33(6):138-143. 被引量：13
6张广斌,束洪春,于继来.利用广义电流模量的行波实测数据半监督聚类筛选[J].中国电机工程学报,2012,32(10):150-159. 被引量：14
7王刚.上海电视台新闻中心系统[J].工业器材．广播电视网络技术,2000(2):44-47.
8李翔宇,王开军,郭躬德.挑选聚类算法的网格连通图方法[J].计算机系统应用,2012,21(9):103-107.
9姜骁,马文涛,曲桦.时域和酉空间中基于最大相关熵准则的非线性噪声处理[J].计算机应用,2012,32(12):3287-3290. 被引量：2
10陈圣国,孙正兴,周杰,李毅.结合SSFCM与随机游走的半监督图像分割算法[J].计算机辅助设计与图形学学报,2013,25(7):1074-1082. 被引量：2

1过云燕,王宏志,张玮奇.社交网络中基于分类属性的好友推荐[J].计算机工程与应用,2015,51(12):99-106. 被引量：4
2陈应显.基于模糊集的蚁群空间聚类方法研究[J].计算机工程与应用,2011,47(2):5-7. 被引量：1
3韩开旭,任伟建.基于改进Fisher核函数的支持向量机在推特数据库情感分析中的应用[J].自动化技术与应用,2015,34(11):30-36. 被引量：4
4宋玲,马军,连莉,张志军.文档相似度综合计算研究[J].计算机工程与应用,2006,42(30):160-163. 被引量：43
5沈洁,林颖,陈志敏,赵敏涯.基于增量式蚁群聚类的用户访问模式挖掘[J].计算机应用,2005,25(7):1654-1657. 被引量：4
6张丽,吉根林.基于点面包含关系的GML空间聚类算法[J].小型微型计算机系统,2010,31(4):702-705. 被引量：1
7徐占,董洪伟.基于CGR的蛋白质相似性比较[J].计算机工程,2010,36(14):233-234.
8张丽,吉根林.一种基于线面包含关系的GML空间聚类算法[J].山东大学学报（工学版）,2009,39(2):21-25. 被引量：3

软件学报

2008年第11期

浏览历史

内容加载中请稍等...

一种半监督K均值多关系数据聚类算法被引量：22

参考文献12

共引文献4

同被引文献185

引证文献22

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

一种半监督K均值多关系数据聚类算法 被引量：22

参考文献12

共引文献4

同被引文献185

引证文献22

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

一种半监督K均值多关系数据聚类算法被引量：22