数据集动态重构的集成迁移学习被引量：5

Ensemble transfer learning algorithm based on dynamic dataset regroup

下载PDF

导出

摘要目前很多数据挖掘和机器学习方法都有一个基本假设:训练数据和测试数据必须服从相同的分布。但是在很多情况下这种假设不成立,没有考虑分布差异的传统机器学习方法就不能正确分类了。提出了一种新的迁移学习方法DRTAT,对原训练数据进行动态分割重组,适时地淘汰冗余数据,并进行分类器的集成。通过在多个文本数据集和UCI数据集上进行测试,并与TrAdaboost算法进行比较,表明了算法的先进性。 There is a basic assumption in many existing data mining and machine learning techniques,that training and test data must be governed by the same distribution.However,this assumption does not hold in many cases,then traditional machine learning methods not aware of the difference of distribution may fail.This paper proposes a novel transfer-learning algorithm called DRTAT,which dynamically regroups the primary training data sets and eliminates the redundancy data timely,then makes classifiers ensemble.The experiments are performed on many text data sets and the UCI benchmark data sets,and DRTAT is compared with TrAdaboost algorithm,the results show the superiority of DRTAT.

作者刘伟张化祥

机构地区山东师范大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第12期126-128,共3页 Computer Engineering and Applications

基金山东省中青年科学家科研奖励基金(博士基金)(No.2006BS01020) 山东省高新技术自主创新工程专项计划(No.2007ZZ17) 山东省自然科学基金No.Y2007G16 山东省科技攻关计划No.2008GG10001015 山东省教育厅科技计划项目No.J07YJ04~~

关键词分布差异知识迁移动态数据集重组冗余数据淘汰分类器集成 distribution difference knowledge transfer dynamic dataset regroup eliminating the redundancy data classifier ensemble

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Dai Wen-yuan,Yang Qiang,Xue Gui-rong,et al.Transferring Naive Bayes classifiers for text classification[J].Association for the Advance-ment of Artificial Intelligence,2007:540-545.
2Daum'eIII H,Marcu D.Domain adaptation for statistical classifiers[J].Journal of Artificial Intelligence Research,2006,26:101-126.
3Torrey L,Shavlik J,Natarajan S,et al.Transfer in reinforcement learn ing via Markov logic-networks[J].Association for the Advancement of Artificial Intelligence,2008.
4Dai Wen-yuan,Yang Qiang,Xue Cui-rong,et al.Boosting for trana-fer learning[C]//ACM International Conference Proceeding Series,2007,227:193-200.
5Li Cen.Classifying imbalanced data using a bagging ensemble varia-tion(BEV)[C]//ACM Southeast Regional Conference,2007:203-208.
6Witten I H,Frank E.数据挖掘实用机器学习技术[M].2版.北京:机械工业出版社,2006:212-215.
7Freund Y,Schapire R E.A decision theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
8Mitchell T M.机器学习[M].北京:机械工业出版社,2006:166-167.

共引文献3

1王晓芹,张化祥,柴青.基于级联结构的不平衡数据集分类研究[J].计算机工程与应用,2010,46(13):115-117. 被引量：3
2彭莉芬,陈俊生,胡学钢.基于粗糙集决策树算法的研究[J].安庆师范学院学报（自然科学版）,2012,18(1):75-78.
3王海涛,张广,卢恒志,王亚林,宋振兴.战伤救治模拟人技术体系研究现状与发展展望[J].医疗卫生装备,2015,36(2):119-121. 被引量：11

同被引文献71

1李秋洁,茅耀斌,叶曙光,王执铨.代价敏感Boosting算法研究[J].南京理工大学学报,2013,37(1):19-24. 被引量：3
2李鹏飞,吴太成.桥梁健康监测技术研究综述[J].建筑监督检测与造价,2010(7):24-27. 被引量：3
3L Rigutini, M Maggini, B Liu. An EM based training algorithm for cross-language text categorization [ A ]. IEEE International Conference on Web Intelligence[ C ]. University of Technology of Compiegne, France,2005.282- 287.
4W Dai,Q Yang, G-R Xue,Y Yu. Boosting for transfer learning A ]. Proceedings of the Twenty-Fourth International Conference on Machine Learning[C]. Orvallis, Oregon, USA, 2007. 193 - 200.
5W Dai, Y Chen, G-R Xue, Q Yang, Y Yu. Translated learning: Transfer learning across different feature spaces[A]. Advances in Neural Information Processing Systems 21 [C]. Vancouver, British Columbia, Canada, 2009.786 - 791.
6Y Liu,P Stone. Value-function-based transfer for reinforcement learning using structure map-ping [ A ]. Proceedings of the Twenty-First National Conference on Artificial Intelligence [ C]. Boston, Massachusetts, 2006.877 - 882.
7Sinno J Pan, Qiang Yang. A survey on transfer learning[ A ]. IEEE Transactions on Knowledge and Data Engineering [ C ]. Los Alamitos, CA, USA, 2009.556 - 562.
8R Raina,A Battle,H l_ee,B Packer,A Y Ng. Self-taught learning: Transfer learning from unlabeled data[A]. The Twenty-fourth International Conference on Machine Learning[ C]. Corvallis, Oregon, USA, 2007.759 - 766.
9W Dai, G.-R. Xue, Q Yang, Y Yu. Transferring naive bayes classifiers for text classification[A]. The Twenty-Second National Conference on Artificial Intelligence[ C ]. Corvallis, Oregon, USA, 2007. 540 - 545.
10戴文渊.基于实例和特征的迁移学习算法研究[D].上海:上海交通大学,2010.6.

引证文献5

1于重重,田蕊,谭励,涂序彦.非平衡样本分类的集成迁移学习算法[J].电子学报,2012,40(7):1358-1363. 被引量：27
2于重重,吴子珺,谭励,涂序彦,田蕊.非平衡集成迁移学习模型及其在桥梁结构健康监测中的应用[J].智能系统学报,2013,8(1):46-51. 被引量：4
3吴陈,汤莹.基于选择迁移的bagging文本分类算法[J].计算机工程与设计,2015,36(7):1808-1812. 被引量：4
4崔晓萍,刘丽,周家琪,李方方.基于稀疏表达的图像自动标注[J].山东师范大学学报（自然科学版）,2016,31(3):21-27.
5王军,刘三民,刘涛.面向概念漂移的数据流分类研究分析[J].绵阳师范学院学报,2017,36(5):80-89.

二级引证文献35

1于重重,吴子珺,谭励,涂序彦,田蕊.非平衡集成迁移学习模型及其在桥梁结构健康监测中的应用[J].智能系统学报,2013,8(1):46-51. 被引量：4
2于重重,商利利,谭励,涂序彦,杨扬.半监督学习在不平衡样本集分类中的应用研究[J].计算机应用研究,2013,30(4):1085-1089. 被引量：8
3蒋亦樟,邓赵红,王士同.0阶L2型TSK迁移学习模糊系统[J].电子学报,2013,41(5):897-904. 被引量：12
4胡胜来,汪国权.桥梁设计中的仿生学应用[J].华东科技（学术版）,2013(10):92-92.
5许敏,王士同,史荧中.一种新的面向迁移学习的L_2核分类器[J].电子与信息学报,2013,35(9):2059-2065. 被引量：1
6蒋亦樟,邓赵红,王骏,葛洪伟,王士同.基于知识利用的迁移学习一般化增强模糊划分聚类算法[J].模式识别与人工智能,2013,26(10):975-984. 被引量：16
7于重重,刘宇,谭励,商利利,马萌.组合标记的多视图半监督协同分类算法[J].计算机应用,2013,33(11):3090-3093. 被引量：3
8皋军,黄丽莉.最大局部加权均值差异嵌入[J].电子学报,2013,41(8):1462-1468. 被引量：4
9倪彤光,王士同,应文豪,邓赵红.迁移组概率学习机[J].电子学报,2013,41(11):2207-2215. 被引量：2
10刘余霞,刘三民,刘涛,王忠群.一种新的过采样算法DB_SMOTE[J].计算机工程与应用,2014,50(6):92-95. 被引量：12

1于重重,田蕊,谭励,涂序彦.非平衡样本分类的集成迁移学习算法[J].电子学报,2012,40(7):1358-1363. 被引量：27
2许瑞军.用VB6类模块打造控件——窗体动态分割条[J].程序员（CSDN开发高手）,2004(7):30-34.
3何心远,邱名卿.空间数据的表示与动态分割技术[J].计算机系统应用,1997,6(6):33-36. 被引量：5
4夏利民,谷士文,沈新权.基于活动轮廓的运动目标的动态分割[J].中国图象图形学报（A辑）,1999,4(8):631-634. 被引量：7
5梁善林,李小坚.基于CAMSHIFT算法和形态学的人手动态分割[J].影像技术,2007,19(3):23-26. 被引量：1
6李正祥,顾其威,陈兵.无线网络中基于差错率的数据分割[J].数据采集与处理,2004,19(3):302-306.
7梁善林,李小坚.基于CAMSHIFT算法和形态学的人手动态分割[J].信息技术,2007,31(5):58-60. 被引量：1
8余志鹏.带自适应整定参数的机器人达尔文粒子群优化算法[J].自动化仪表,2015,36(3):81-85.
9李薇,李明东,刘万钱.运用自适应球体模型实现肤色动态分割[J].计算机工程与应用,2012,48(22):179-183. 被引量：1
10魏良,杨宜民.一种中型组机器人足球系统的任务分解方法[J].电脑与电信,2011(3):41-43.

计算机工程与应用

2010年第12期

浏览历史

内容加载中请稍等...

数据集动态重构的集成迁移学习被引量：5

参考文献8

共引文献3

同被引文献71

引证文献5

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

数据集动态重构的集成迁移学习 被引量：5

参考文献8

共引文献3

同被引文献71

引证文献5

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

数据集动态重构的集成迁移学习被引量：5