邻域粗糙协同分类模型被引量：12

A Neighborhood Rough Sets-Based Co-Training Model for Classification

下载PDF

导出

摘要 Pawlak粗糙集理论是一种有监督学习模型,只适合处理离散型数据.但在一些现实问题中存在着大量的连续型数据,并且有标记数据很有限,更多的是无标记数据.结合邻域粗糙集和协同学习理论,提出了适合处理连续型数据并可有效利用无标记数据提升分类性能的邻域粗糙协同分类模型.该模型首先构建了邻域粗糙半监督约简算法,并利用该算法提取两个差异性较大的约简构造基分类器,然后迭代地在无标记数据上交互协同学习.UCI数据集实验对比分析表明,与其他同类模型相比,该模型有较好的性能. Pawlak＇s rough set theory, as a supervised learning model, is only applicable for discrete data. However it is often the case that practical data sets are continuous and involve both few labeled and abundant unlabeled data, which is outside the realm of Pawlak＇s rough set theory. In this paper, a neighborhood rough sets based co-training model for classification is proposed, which could deal with continuous data and utilize the unlabeled and labeled data to achieve better performance than the classifier learned only from few labeled data. Firstly, a heuristic algorithm based on neighborhood mutual information is put forward to compute the reduct of partially labeled continuous data. Then two diverse reducts are generated. The model employs the two reducts to train two base classifiers on the labeled data, and makes the two base classifiers teach each other on the unlabeled data to boot the their performance iteratively. The experimental results on selected UCI datasets show that the proposed model are more effective to deal with partially labeled continuous data than some representative ones in learning accuracy.

作者张维苗夺谦高灿岳晓冬

机构地区同济大学电子与信息工程学院上海电力学院计算机科学与技术学院嵌入式系统与服务计算教育部重点实验室(同济大学) 中联重科股份有限公司上海大学计算机工程与科学学院

出处《计算机研究与发展》 EI CSCD 北大核心 2014年第8期1811-1820,共10页 Journal of Computer Research and Development

基金国家自然科学基金项目(61075056 61273304 61202170 61103067) 中央高校基本科研业务费专项资金项目

关键词邻域粗糙集邻域互信息半监督约简协同学习连续型数据 neighborhood rough sets neighborhood mutual information semi-supervised reduction co-training continuous data

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献33

1Pawlak Z. Rough sets [J]. International Journal of Computer and Information Science, 1982, 11(5): 341-356.
2Pawlak Z. Rough sets: Theoretical Aspects of Reasoning about Data [M]. Dordrecht, Netherlands: Kluwer Academic Publishers, 1991.
3王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246. 被引量：370
4Ching J Y, Wong A K C, Chan K C C. Class-dependent discretization for inductive learning from continuous and mixed mode data [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1995, 17(7): 641-651.
5苗夺谦.Rough Set理论中连续属性的离散化方法[J].自动化学报,2001,27(3):296-302. 被引量：139
6于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程学报,2004,24(6):205-210. 被引量：70
7谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量：134
8Jensen R, Shen Q. Semantics-Preserving dimensionality reduction: rough and fuzzy-rough-based approaches [J]. IEEE Trans on Knowledge and Data Engineering, 2004, 16 (12): 1457-1471.
9胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：291
10Zhu Xiaojin. Semi-Supervised learning survey, TR1530 [R]. Madison: Department of Computer Sciences, University of Wisconsin, 2008.

二级参考文献123

1庞发虎,庞振凌,杜瑞卿.粗糙集理论对湖泊生态系统健康评定指数法的评价[J].生物数学学报,2008,23(2):337-344. 被引量：4
2龙军,殷建平,祝恩,赵文涛.主动学习研究综述[J].计算机研究与发展,2008,45(z1):300-304. 被引量：31
3王明慧.粗糙集理论在铁路行车调度指挥系统中应用的研究[J].中国铁道科学,2004,25(4):103-107. 被引量：13
4于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程学报,2004,24(6):205-210. 被引量：70
5陈真诚,张锋,蒋大宗,倪利莉,王红艳.利用多分辨率分析的胸部X线数字图像粗糙集滤波增强[J].中国生物医学工程学报,2004,23(6):486-489. 被引量：7
6唐焕玲,孙建涛,陆玉昌.文本分类中结合评估函数的TEF-WA权值调整技术[J].计算机研究与发展,2005,42(1):47-53. 被引量：26
7朱永利,吴立增,李雪玉.贝叶斯分类器与粗糙集相结合的变压器综合故障诊断[J].中国电机工程学报,2005,25(10):159-165. 被引量：82
8张文修,魏玲,祁建军.概念格的属性约简理论与方法[J].中国科学（E辑）,2005,35(6):628-639. 被引量：195
9王珏,袁小红,石纯一,郝继刚.关于知识表示的讨论[J].计算机学报,1995,18(3):212-224. 被引量：54
10胡峰,黄海,王国胤,吴渝.不完备信息系统的粒计算方法[J].小型微型计算机系统,2005,26(8):1335-1339. 被引量：18

共引文献1315

1马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：11
2林耀进,白盛兴,赵红,李绍滋,胡清华.基于标签关联性的分层分类共有与固有特征选择[J].软件学报,2022,33(7):2667-2682. 被引量：6
3侯贤宇,陈玉明,吴克寿.多采样近似粒集成学习[J].南京大学学报（自然科学版）,2024,60(1):118-129.
4程凤伟,王文剑,张珍珍.面向高维小样本数据的层次子空间ReliefF特征选择算法[J].南京大学学报（自然科学版）,2023,59(6):928-936.
5黄丹,蓝家新,吴发乾.多源信息系统基于信息粒化的不确定性度量[J].模糊系统与数学,2023,37(2):165-174.
6陈长利,李勇,冯坤,张景辉.大数据在电厂远程诊断中的应用研究[J].河南电力,2019,47(S01):96-98. 被引量：2
7杨臻,邱保志.混合信息系统的动态变精度粗糙集模型[J].控制与决策,2020,35(2):297-308. 被引量：10
8丁广林.监理企业安全信用评价体系研究[J].建筑经济,2020(S01):41-45. 被引量：4
9孙泽金,赵荣珍.基于EEMD能量矩与邻域粗糙集的转子故障数据集分类方法[J].计算机应用研究,2020,37(2):460-464. 被引量：5
10王思.应用属性约简算法实现运动员伤病影响因素评估的研究[J].电子测量技术,2020,43(11):10-15.

同被引文献37

1袁修久,杨合俊,张小水.广义决策约简同相对约简的关系[J].空军工程大学学报（自然科学版）,2005,6(1):44-47. 被引量：4
2李道国,苗夺谦,俞冰.决策树剪枝算法的研究与改进[J].计算机工程,2005,31(8):19-21. 被引量：30
3邓大勇,黄厚宽,李向军.不一致决策系统中约简之间的比较[J].电子学报,2007,35(2):252-255. 被引量：28
4胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：291
5刘勇,熊蓉,褚健.Hash快速属性约简算法[J].计算机学报,2009,32(8):1493-1499. 被引量：35
6丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10. 被引量：919
7曾凡智,卢炎生,黄国顺,文翰.基于D-S证据理论直接求代数约简和代数核[J].中山大学学报（自然科学版）,2011,50(5):54-58. 被引量：2
8吴伟志,米据生,李同军.无限论域中的粗糙近似空间与信任结构[J].计算机研究与发展,2012,49(2):327-336. 被引量：5
9朱鹏飞,胡清华,于达仁.基于随机化属性选择和邻域覆盖约简的集成学习[J].电子学报,2012,40(2):273-279. 被引量：26
10杨习贝,杨静宇.邻域系统粗糙集模型[J].南京理工大学学报,2012,36(2):291-295. 被引量：19

引证文献12

1李智远,杨习贝,徐苏平,陈向坚,王平心.邻域决策一致性的属性约简方法研究[J].河南师范大学学报（自然科学版）,2017,45(5):68-73. 被引量：11
2张艳芹,窦慧莉.基于邻域分类AUC的属性选择方法[J].科技与创新,2017(24):43-45.
3王长宝,杨习贝,窦慧莉,陈向坚,王平心.邻域决策错误率的局部约简方法研究[J].计算机工程与应用,2018,54(6):95-99. 被引量：2
4张艳芹.基于邻域分类AUC的属性选择方法[J].天津理工大学学报,2018,34(3):30-33. 被引量：1
5余思成,杨习贝,陈向坚,窦慧莉,王平心.邻域决策的随机约简与集成分类研究[J].小型微型计算机系统,2018,39(6):1163-1167. 被引量：2
6吴伟志,杨丽,谭安辉,徐优红.广义不完备多粒度标记决策系统的粒度选择[J].计算机研究与发展,2018,55(6):1263-1272. 被引量：21
7郑娜,王加阳.不同信任结构下约简的证据特征及其一致性[J].模式识别与人工智能,2018,31(6):569-580.
8王轩,刘福伦,张林,王宏杰,闵帆.邻域覆盖分类的两种加权策略[J].计算机应用,2018,38(A01):1-5. 被引量：1
9高灿,周杰,高天宇,赖志辉.不完备弱标记数据的粗糙协同学习模型[J].模式识别与人工智能,2018,31(10):950-957. 被引量：4
10沈林.基于随机抽样的变精度邻域粗糙集特征选择[J].廊坊师范学院学报（自然科学版）,2019,19(2):14-17. 被引量：1

二级引证文献44

1金铭,陈锦坤,孙亚超.基于边界域条件熵的最优尺度约简[J].南京大学学报（自然科学版）,2023,59(6):1034-1047.
2傅凡,李京政,窦慧莉.邻域粗糙集属性约简方法研究[J].电子设计工程,2018,26(15):11-14.
3吴伟志.多粒度粗糙集数据分析研究的回顾与展望[J].西北大学学报（自然科学版）,2018,48(4):501-512. 被引量：9
4王光琼.基于邻域组合熵的属性约简算法[J].计算机应用与软件,2018,35(12):269-273. 被引量：12
5李智远,杨习贝,陈向坚,王平心.类别近似质量约束下的属性约简方法研究[J].河南师范大学学报（自然科学版）,2018,46(3):112-118. 被引量：5
6王怡博,文辉祥,窦慧莉.一种基于邻域距离的分类方法研究[J].电子设计工程,2019,27(4):21-24.
7董杰,王逊,张文冬,王平心,杨习贝.面向局部多约束的属性约简方法研究[J].计算机科学与探索,2019,13(5):875-883.
8张龙波,李智远,杨习贝,王怡博.决策代价约简求解中的交叉验证策略[J].南京大学学报（自然科学版）,2019,55(4):601-608. 被引量：3
9王光琼.不完备系统中一种增量式属性约简算法[J].计算机与现代化,2019,0(8):69-73.
10孙印杰,张新乐,孙林.基于EK-medoids聚类和邻域距离的特征选择方法[J].计算机应用研究,2019,36(8):2279-2283. 被引量：1

1张维,苗夺谦,李峰.WilsonTh数据剪辑在邻域粗糙协同分类中的应用[J].计算机科学与探索,2014,8(9):1092-1100. 被引量：2
2徐久成,徐天贺,孙林,任金玉.基于邻域粗糙集和粒子群优化的肿瘤分类特征基因选取[J].小型微型计算机系统,2014,35(11):2528-2532. 被引量：13
3徐天贺,马媛媛,徐久成.一种基于邻域互信息最大化和粒子群优化的特征基因选择方法[J].小型微型计算机系统,2016,37(8):1775-1779. 被引量：4
4吴克寿,陈玉明,曾志强.基于邻域关系的决策表约简[J].山东大学学报（工学版）,2012,42(2):7-10. 被引量：7
5林俊伟,叶东毅.基于邻域辨识矩阵的属性约简增量式算法[J].计算机应用,2009,29(B06):119-121. 被引量：9
6陈仕涛,陈国龙,郭文忠,刘延华.基于粒子群优化和邻域约简的入侵检测日志数据特征选择[J].计算机研究与发展,2010,47(7):1261-1267. 被引量：44
7李晓光,谭建豪.邻域互信息在磁共振颅脑图像配准的应用[J].计算机工程与应用,2009,45(10):154-156. 被引量：2
8王晨曦,林耀进,刘景华,林梦雷.基于最近邻互信息的特征选择算法[J].计算机工程与应用,2016,52(18):74-78. 被引量：8
9陈玉明,谢斐星,吴克寿,唐朝辉.基于邻域关系的网络入侵检测特征选择[J].常州大学学报（自然科学版）,2014,26(3):1-5. 被引量：6
10唐寅,闵凉宇.连续值属性约简算法改进[J].时代金融,2016(24).

计算机研究与发展

2014年第8期

浏览历史

内容加载中请稍等...

邻域粗糙协同分类模型被引量：12

参考文献33

二级参考文献123

共引文献1315

同被引文献37

引证文献12

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

邻域粗糙协同分类模型 被引量：12

参考文献33

二级参考文献123

共引文献1315

同被引文献37

引证文献12

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

邻域粗糙协同分类模型被引量：12