面向小样本数据的机器学习方法研究综述被引量：22

Survey on Machine Learning Methods for Small Sample Data

下载PDF

导出

摘要小样本学习是面向小样本数据的机器学习,旨在利用较少的有监督样本数据去构建能够解决实际问题的机器学习模型。小样本学习能够解决传统机器学习方法在样本数据不充分时性能严重下降的问题,可以为新型小样本任务实现低成本和快速的模型部署,缩小人类智能与人工智能之间的距离,对推动发展通用型人工智能具有重要意义。从小样本学习的概念、基础模型和实际应用入手,系统梳理当前小样本学习的相关工作,将小样本学习方法分类为基于模型微调、基于数据增强、基于度量学习和基于元学习,并具体阐述这4大类方法的核心思想、基本模型、细分领域和最新研究进展,以及每一类方法在科学研究或实际应用中存在的问题,总结目前小样本学习研究的常用数据集和评价指标,整理基于部分典型小样本学习方法在Omniglot和Mini-ImageNet数据集上的实验结果。最后对各种小样本学习方法及其优缺点进行总结,分别从数据层面、理论研究和应用研究3个方面对小样本学习的未来研究方向进行展望。 Few-shot learning is a type of machine learning method for small sample data that operates by using less supervised sample data to build machine learning models that can solve practical problems.Therefore,few-shot learning can be used to solve the serious performance degradation problem in traditional machine learning methods when a small sample data is used,and can achieve low-cost and rapid model deployment for new few-sample tasks,which has the potential of narrowing the distance between human intelligence and artificial intelligence and promote the general importance of artificial intelligence development.This paper systematically sorts out the existing related studies on fewshot learning and classifies the methods on few-shot learning into model-based fine-tuning,data augmentation,metricbased learning,and meta-learning based on the concept,basic model,and practical application of few-shot learning.Moreover,the core ideas,basic models,subdivision fields,and latest research progress in these four method categories are specifically expounded,and the problems existing in the scientific research and practical application of each method category are outlined. Data sets and evaluation indicators are also obtained,and the experimental results are organized based on typical few-shot learning methods with Omniglot and Mini-ImageNet datasets.Additionally,the advantages and disadvantages of various few-shot learning methods are summarized.Finally,data-level theoretical and applied research approaches,and potential future research directions of few-shot learning,are determined.

作者陈良臣傅德印 CHEN Liangchen;FU Deyin(Department of Computer,China University of Labor Relations,Beijing 100048,China;Department of Applied Statistics,China University of Labor Relations,Beijing 100048,China;Key Laboratory of Network Assessment Technology,Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093,China;College of Computer Science&Technology,Wuhan University of Technology,Wuhan 430063,China)

机构地区中国劳动关系学院计算机教研室中国劳动关系学院应用统计学教研室中国科学院信息工程研究所武汉理工大学计算机科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第11期1-13,共13页 Computer Engineering

基金国家统计局全国统计科学研究项目(2022LY005) 中国劳动关系学院科研项目(22XYJS021) 中国劳动关系学院教改项目(JG22080) 中国科学院网络测评技术重点实验室课题(KFKT2022-003)。

关键词小样本学习小样本数据机器学习深度学习数据增强 few-shot learning small sample data machine learning deep learning data augmentation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：146
2宋闯,赵佳佳,王康,梁欣凯.面向智能感知的小样本学习研究综述[J].航空学报,2020(S01):15-28. 被引量：16
3葛轶洲,刘恒,王言,徐百乐,周青,申富饶.小样本困境下的深度学习图像识别综述[J].软件学报,2022,33(1):193-210. 被引量：55
4刘嘉政.基于卷积神经网络的小样本树皮图像识别方法[J].西北林学院学报,2019,34(4):230-235. 被引量：11
5孙存威,文畅,谢凯,贺建飚.深度迁移模型下的小样本声纹识别方法[J].计算机工程与设计,2018,39(12):3816-3822. 被引量：5
6程林,袁慊,王瑜,冯伟,孙凤军,戴晓天.自体支气管基底层细胞治疗慢性阻塞性肺疾病的小样本探索性研究[J].重庆医学,2019,48(23):4012-4016. 被引量：4
7何喜军,马珊,武玉英,蒋国瑞.小样本下多维指标融合的电商产品销量预测[J].计算机工程与应用,2019,55(15):177-184. 被引量：16
8陈龙,张峰,蒋升.小样本条件下基于深度森林学习模型的典型军事目标识别方法[J].中国电子科学研究院学报,2019,14(3):232-237. 被引量：11
9陈武锦.半监督学习研究综述[J].电脑知识与技术,2011,7(6):3887-3889. 被引量：4
10安晨,汪成亮,廖超,肖诗童.基于注意力关系网络的无线胶囊内镜图像分类方法[J].计算机工程,2021,47(10):252-259. 被引量：5

二级参考文献97

1张庆林,王永明.元学习能力及其培养[J].中国教育学刊,1996(3):34-37. 被引量：47
2ZHU X J.Semi--supervised Learning Literature Survey[R].Madison:University of Wisconsin,2008.
3Joaehims T.Transductive Inference for Text Classification using Support vector Machines [C].Proeeedings of the Sixteenth International Conference on Maehine l_eaminh.Morgan Kaufmann Publisherslne,1999.
4Zhu X J,Ghahramani Z,Lafferty J.Semi,supervised learning using Gaussian fields and harmonic functions [C]//Proceedings of Twentieth International Conference on Machine Learning.Washington DC:AAAI,2003:912-919.
5Zhou D Y,Bousquet O,Lal T,et al.Learning with local and global consistency [C].Advances in Neural Information Processing ',System 16. USA:MIT Press,2004:321-328.
6Du W,Urahama K.Semi "superviSed Classification with spectral projection of muhiplicative!y.modulated similarity data [J].IEICE Transaetionson Information and Systems,2007,E90D(9):1456-1459.
7Gui J,Huang D S,You Z H.An Improvement on Learning with Local and Global Consistency [C].Thel9tb International Conference on Pattern Reeognition(iCPR 2008),Tampa,FL,2008.
8Gong Y C,Chen C L.Semi-supervised Method for Gene Expression Data Classification with Gaussian Fields and Harmonic Functions [C].Thel9th International Conference on Pattern Recognition(ICPR 2008),Tampa,FL,2008.
9Blum A,Mitchell T.Combining labeled and unlabeled data with co-training[C].Proeeedings of the 1 lth Annual Conference on Computational Learning Theory(COLT98)Wisconsin,M1,1998.
10Camps-vails G,Marsheva T V B, Zhou D Y.Semi'supervised graph - based Hyperspectral image classifieation [C].Internaiional Geoseience and Remote Sensing SymPosium,Denver, CO,2006.

共引文献372

1徐惠灵,尚政国,董胜波,苏琪雅.面向深度神经网络应用的小样本学习技术研究[J].南京航空航天大学学报,2022,54(S01):80-86.
2李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：5
3尤庆丽,李国勇.基于孪生网络的离线手写签名鉴别算法[J].计算机应用,2023,43(S01):45-48.
4郭军成,万刚,胡欣杰,王帅,严发宝.基于少样本的太阳射电爆发事件检测研究[J].计算机科学,2022,49(S02):597-603.
5王召义,刘玉林,薛晨杰,黄义兵.电商平台信息对商家营销决策优化研究——基于天猫平台数据的检验[J].价格理论与实践,2022(7):134-137. 被引量：4
6史律,唐鸣.深度学习在目标识别中的应用研究[J].舰船科学技术,2019,0(22):82-84. 被引量：1
7苏翎菲,化永朝,董希旺,任章.人与无人机集群多模态智能交互方法[J].航空学报,2022,43(S01):129-142. 被引量：4
8张烈平,李智浩,唐玉良.基于迁移学习的轻量化YOLOv2口罩佩戴检测方法[J].电子测量技术,2022,45(10):112-117. 被引量：9
9王春艳,金鹏,桂琪皓.区间二型模糊神经网络遥感图像分割方法[J].测绘科学,2024,49(5):84-98.
10郭楠馨,林宏刚,张运理,陈麟.基于元学习的僵尸网络检测研究[J].成都信息工程大学学报,2022,37(6):615-621.

同被引文献293

1宫文峰,陈辉,张美玲,张泽辉.基于深度学习的电机轴承微小故障智能诊断方法[J].仪器仪表学报,2020,41(1):195-205. 被引量：86
2杨顺辉,郭珍珍,张洪宝,高明亮.基于集成迁移学习的机械钻速预测[J].计算机系统应用,2022,31(10):270-278. 被引量：5
3魏丹,李渊,黄丹.极化SAR图像地物分类方法综述[J].计算机系统应用,2020(11):29-39. 被引量：6
4陈娜,蔺志刚,刘瑾程,董珊,包闯.基于智能视频监控系统的河湖四乱巡检技术研究[J].水利水电技术（中英文）,2022,53(S02):455-462. 被引量：4
5杨本臣,裴欢菲.灰狼优化支持向量机的推荐算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(6):552-557. 被引量：3
6陈保家,陈学力,肖文荣,陈法法,肖能齐,刘强.小样本下滚动轴承故障的多源域迁移诊断方法[J].电子测量与仪器学报,2022,36(2):219-228. 被引量：12
7陈剑,阚东,孙太华,张磊.基于SVD-VMD和SVM滚动轴承故障诊断方法[J].电子测量与仪器学报,2022,36(1):220-226. 被引量：14
8王毅,李曙,李松浓,李杰,杨芾藜,郑可.瞬时特征下极限学习机在接地故障诊断中的应用[J].电子测量与仪器学报,2022,36(1):212-219. 被引量：5
9李红月,高英杰,朱文昌.IAO优化SVM的电机滚动轴承故障诊断[J].电子测量技术,2022,45(10):126-132. 被引量：17
10许翔,毛婕.数据清理技术在软件开发中的应用研究[J].计算机时代,2004(8):25-26. 被引量：4

引证文献22

1王晓兰.基于灰色马尔可夫的小样本路面性能预测[J].运输经理世界,2023(33):25-27. 被引量：1
2吴永飞,王彦博,杨璇,徐奇.量子SVM算法在小样本学习智能风控领域的应用[J].银行家,2023(2):116-119.
3杜锋,汪博威,汪奥杰,王凯,王玮.基于机器学习的安全大数据技术课程实验教学设计[J].实验技术与管理,2023,40(4):181-186. 被引量：6
4谭昊.基于自适应提升算法的慢性肾病预测模型研究[J].长江信息通信,2023,36(5):59-62.
5赵浩辉,高永彬,杨淑群,胡小军,范应方.基于条件卷积与注意力的肝脏分割算法[J].中国医学物理学杂志,2023,40(6):701-708.
6李根生,宋先知,祝兆鹏,田守嶒,盛茂.智能钻完井技术研究进展与前景展望[J].石油钻探技术,2023,51(4):35-47. 被引量：27
7唐志共,朱林阳,向星皓,何磊,赵暾,王岳青,钱炜祺,袁先旭.智能空气动力学若干研究进展及展望[J].空气动力学学报,2023,41(7):1-35. 被引量：2
8刘会家,肖懂,滕杰,冯铃.基于CBAM-ResNet和多域特征融合的配电网故障选线方法[J].国外电子测量技术,2023,42(8):10-18. 被引量：4
9刘蕾,王蕾,王晨,王云,高清.临床医学专业课程学习者画像模型构建[J].中华医学教育探索杂志,2023,22(10):1466-1471.
10巩晓赟,智泽恒,杜文辽,韩明,胡亚凯,罗双强.面向回转机组电机小样本复合故障的多源异构自适应迁移学习[J].机床与液压,2024,52(3):209-216.

二级引证文献46

1刘慕臣,宋先知,李大钰,朱硕,付利,祝兆鹏,张诚恺,潘涛.钻柱摩阻扭矩智能预测模型与解释[J].煤田地质与勘探,2023,51(9):89-99. 被引量：1
2李邝,金世存,李建章.木材科学与工程专业课程教学改革探讨[J].造纸装备及材料,2023,52(8):227-229.
3郭建春,任文希,曾凡辉,罗扬,李宇麟,杜肖泱.非常规油气井压裂参数智能优化研究进展与发展展望[J].石油钻探技术,2023,51(5):1-7. 被引量：5
4李华洋,邓金根,谭强,冯永存,董保宏,曹志鹏,严科.智能钻井技术应用体系构建及研究进展[J].现代化工,2023,43(10):41-45. 被引量：1
5毛光黔,宋先知,丁燕,崔猛,刘雨龙,祝兆鹏.基于梯度提升决策树算法的钻井工况识别方法[J].石油钻采工艺,2023,45(5):532-539. 被引量：1
6韩仁坤,杜焦喜,刘子扬,李立,陈刚.基于深度神经网络的含运动边界非定常流场预测方法研究[J].航空科学技术,2023,34(12):37-42. 被引量：1
7陈改霞.基于机器学习的煤与瓦斯突出预测指标贡献的定量评价研究[J].煤炭技术,2024,43(1):162-165.
8聂臻,夏朝辉,吴波鸿,黄雪琴.中东地区碳酸盐岩油藏钻井工程技术现状及发展趋势[J].石油钻探技术,2024,52(1):8-16. 被引量：1
9毕闯,刘伟,孙丽,冯硕,杨乐乐,于冲.海上水平裸眼井分舱防砂与智能分采完井技术[J].石油机械,2024,52(3):10-17.
10张家璇,鄢文苗,毛祥虎,靳专,胥焘,熊彪.香溪河消落带土壤重金属的生态及健康风险评价及预测[J].武汉大学学报（理学版）,2024,70(1):87-95. 被引量：1

1赵安新,杨金桥,史新国,刘帅,师文,李学文.视觉行人重识别研究方法分析及评价指标探讨[J].西安科技大学学报,2022,42(5):1003-1012. 被引量：2
2史屹琛,封筠,肖立轩,贺晶晶,胡晶晶.领域外人脸活体检测综述[J].计算机科学与探索,2022,16(11):2471-2486. 被引量：1
3任佳兴,曹玉东,曹睿,闫佳.一种采用动态子空间的小样本图像分类算法[J].西安电子科技大学学报,2022,49(5):166-174. 被引量：2
4李国强,王天雷,龚宁,王俊妍.基于空间注意力和类协方差度量的小样本学习[J].高技术通讯,2022,32(8):801-810. 被引量：1
5周金坤,王先兰,穆楠,王晨.基于多视角多监督网络的无人机图像定位方法[J].计算机应用,2022,42(10):3191-3199. 被引量：2
6欧阳静,杨吕,尹康,赵宇航,潘国兵.基于ALIF-LSTM多任务学习的综合能源系统短期负荷预测[J].太阳能学报,2022,43(9):499-507. 被引量：13

计算机工程

2022年第11期

浏览历史

内容加载中请稍等...

面向小样本数据的机器学习方法研究综述被引量：22

参考文献14

二级参考文献97

共引文献372

同被引文献293

引证文献22

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

面向小样本数据的机器学习方法研究综述 被引量：22

参考文献14

二级参考文献97

共引文献372

同被引文献293

引证文献22

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

面向小样本数据的机器学习方法研究综述被引量：22