多源域分布下优化权重的迁移学习Boosting方法被引量：1

Transfer Learning Boosting for Weight Optimization Under Multi-source Domain Distribution

下载PDF

导出

摘要深度决策树迁移学习Boosting方法(DTrBoost)仅能适应一个源域与一个目标域的训练数据,无法适应多个不同分布的源域的样本。此外,DTrBoost方法同步地从源域中学习数据至目标域模型,并没有根据重要程度量化学习知识的权重。在实践中,对于某数据集的数据按照某一或某些特征划分出来的数据往往分布不一致,并且这些不同分布的数据对于最终模型的重要性也不一致,知识迁移的权重也因此不平等。针对这一问题,提出了多源域优化权重的迁移学习方法,主要思想是根据不同分布的源域空间计算出到目标域的KL距离,利用KL距离的比值计算出不同分布的源域样本的学习权重比例,从而优化整体梯度函数,使学习方向朝着梯度下降最快的方向进行。使用梯度下降算法能使模型较快收敛,在确保迁移学习效果的同时,也能确保学习的速度。实验结果表明,提出的算法在整体上实现了更好的性能并且对于不同的训练数据能够实现自适应效果,分类错误率平均下降0.013,在效果最好的OCR数据集上下降0.030。 The deep decision tree transfer learning Boosting method(DTrBoost)can only adapt to the training data of one source domain and one target domain,and can not adapt to the samples of several different distribution source domains.In addition,the DTrBoost method synchronously learns data from the source domain to the target domain model,and does not quantify the weight of the learned knowledge according to the degree of importance.In practice,the distribution of data divided according to one or some characteristics of a certain dataset is often inconsistent,the importance of these different distributions to the final model is also inconsistent,and the weight of knowledge transfer is therefore not equal.To solve this problem,a transfer learning method of multi-source domain weight optimization is proposed.The main idea is to calculate the KL divergence distance to the target domain according to the source domain space of different distributions,and calculate the learning weight proportion parameters of the source domain samples of different distributions by using the ratio of KL divergence,so as to optimize the overall gradient function and make the learning direction towards the direction of the fastest gradient decline.The gradient descent algorithm can make the model converge quickly,and ensure the learning speed as well as the transfer learning effect.Experimental results show that the algorithm proposed in this paper adaptively achieves better average performance on the whole.The average classification error rate on all the adopted datasets decreases by 0.013 and even 0.030 on OCR dataset.

作者李赟波王士同 LI Yunbo;WANG Shitong(School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi,Jiangsu 214122,China;Jiangsu Key Construction Laboratory of IoT Application Technology,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区江南大学人工智能与计算机学院江南大学江苏省物联网应用技术重点建设实验室

出处《计算机科学与探索》 CSCD 北大核心 2023年第6期1441-1452,共12页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金(61972181)。

关键词深度决策树迁移学习Boosting方法(DTrBoost) 多源域迁移学习 KL距离决策树 deep decision tree transfer learning Boosting method(DTrBoost) multi-source domain transfer learning KL divergence decision tree

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1周晶雨,王士同.对不平衡数据的多源在线迁移学习算法[J].计算机科学与探索,2023,17(3):687-700. 被引量：3
2徐光生,王士同.基于潜在的低秩约束的不完整模态迁移学习[J].计算机科学与探索,2022,16(12):2775-2787. 被引量：3
3林佳伟,王士同.用于无监督域适应的深度对抗重构分类网络[J].计算机科学与探索,2022,16(5):1107-1116. 被引量：2

二级参考文献10

1杨昌健,邓赵红,蒋亦樟,王士同.基于迁移学习的癫痫EEG信号自适应识别[J].计算机科学与探索,2014,8(3):329-337. 被引量：9
2刘建伟,孙正康,罗雄麟.域自适应学习研究进展[J].自动化学报,2014,40(8):1576-1600. 被引量：28
3毛发贵,李碧雯,沈备军.基于实例迁移的跨项目软件缺陷预测[J].计算机科学与探索,2016,10(1):43-55. 被引量：7
4程旸,蒋亦樟,钱鹏江,王士同.知识迁移的极大熵聚类算法及其在纹理图像分割中的应用[J].智能系统学报,2017,12(2):179-187. 被引量：6
5孙勇,谭文安,谢娜,蒋文明.面向大规模服务性能预测的在线学习方法[J].计算机科学与探索,2017,11(12):1922-1930. 被引量：6
6吴春梅,胡军浩,尹江华.利用改进生成对抗网络进行人体姿态识别[J].计算机工程与应用,2020,56(8):96-103. 被引量：12
7许鹏,邓赵红,王骏,王士同.基于联合信息保持的异构领域自适应[J].计算机科学与探索,2020,14(7):1183-1193. 被引量：1
8赵鹏飞,李艳玲,林民.面向迁移学习的意图识别研究进展[J].计算机科学与探索,2020,14(8):1261-1274. 被引量：7
9任豪,刘柏嵩,孙金杨.面向知识迁移的跨领域推荐算法研究进展[J].计算机科学与探索,2020,14(11):1813-1827. 被引量：8
10周晶雨,王士同.对不平衡目标域的多源在线迁移学习[J].智能系统学报,2022,17(2):248-256. 被引量：2

共引文献5

1周玉,岳学震,孙红玉.考虑不平衡指数的不平衡数据集分类设计方法[J].计算机应用研究,2023,40(12):3566-3571.
2宁保斌,王士同.采用快速迁移模型的集成特征选择方法[J].计算机科学与探索,2024,18(2):496-505.
3丁炎炎,冯建航,叶玲,郑少秋,刘凡.人机混合智能决策范式及作战应用研究[J].计算机科学,2024,51(6):272-281. 被引量：1
4王兵,徐裴,张兴鹏.傅里叶增强的无偏跨域目标检测研究[J].计算机科学与探索,2024,18(9):2436-2448.
5申燕萍,韩少勇,顾苏杭,郇战.鲁棒多视角潜在低秩表示的图像分类方法[J].石河子大学学报（自然科学版）,2024,42(5):652-660.

同被引文献4

1叶明全,高凌云,伍长荣,万春圆.基于对称不确定性和SVM递归特征消除的信息基因选择方法[J].模式识别与人工智能,2017,30(5):429-438. 被引量：14
2杨春,郭健,张磊,陈庆伟.采用卡方检验的模糊自适应无迹卡尔曼滤波组合导航算法[J].控制与决策,2018,33(1):81-87. 被引量：35
3梁令羽,孙铭堃,何为,李凤荣.Bagging-SVM集成分类器估计头部姿态方法[J].计算机科学与探索,2019,13(11):1935-1944. 被引量：7
4徐光生,王士同.基于潜在的低秩约束的不完整模态迁移学习[J].计算机科学与探索,2022,16(12):2775-2787. 被引量：3

引证文献1

1宁保斌,王士同.采用快速迁移模型的集成特征选择方法[J].计算机科学与探索,2024,18(2):496-505.

1李赟波,王士同.多源域分布下优化权重的无监督迁移学习Boosting方法[J].计算机应用研究,2023,40(2):365-370. 被引量：2
2田晨,张金龙,金义蓉,董世元,王彬,张乃祥.一种利用贝叶斯优化的蓝藻遥感分类方法[J].自然资源遥感,2023,35(1):49-56. 被引量：2
3薛艳锋,刘继华,张翔,薛志文.基于梯度下降的不可微损失函数优化算法[J].软件工程,2023,26(6):46-49. 被引量：2
4鲁夕瑶,张成彬,皋军,徐燕萍,邵星.基于卷积神经网络与CatBoost的轴承故障诊断算法[J].机电工程,2023,40(5):715-722. 被引量：2
5王壮壮,姚凯文,张丹.基于GRA-KL-TOPSIS法的三峡外迁移民社会适应性评价[J].中国农村水利水电,2023(4):279-284. 被引量：1
6焦阳阳,黄润才.基于改进纹理特征与迁移学习的人脸表情识别[J].智能计算机与应用,2023,13(5):181-186.
7张明杰,肖奇荣,朱烨行.基于XGBoost模型的融合多特征微博信息传播预测方法[J].科学技术与工程,2023,23(10):4279-4285. 被引量：3
8重力、磁法、电法勘探[J].中国石油文摘,2022,38(5):53-53.
9秦亚杰,刘梦赤,胡婕,冯嘉美.基于认知诊断与XGBoost的学生表现预测研究[J].华南师范大学学报（自然科学版）,2023,55(1):55-64. 被引量：1
10蔡新元,王康.灯光节重塑城市形象的路径[J].创意与设计,2023(2):22-28. 被引量：2

计算机科学与探索

2023年第6期

浏览历史

内容加载中请稍等...

多源域分布下优化权重的迁移学习Boosting方法被引量：1

参考文献3

二级参考文献10

共引文献5

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

多源域分布下优化权重的迁移学习Boosting方法 被引量：1

参考文献3

二级参考文献10

共引文献5

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

多源域分布下优化权重的迁移学习Boosting方法被引量：1