基于机器学习的用户窃电行为预测被引量：9

Prediction of User Stealing Behavior Based on Machine Learning

下载PDF

导出

摘要新型智能电表普及后,为了准确检测出电网中的窃电用户,可以结合机器学习的方法.为此,选择了支持向量机、随机森林和迭代决策树3种机器学习中较常用的大数据算法进行分析,通过不断调整试验数据集的大小,对3种算法的效率和准确率进行测试.对比分析结果发现,随机森林算法运行的时间和数据量的大小基本呈线性关系,效率较高,且准确率稳定在86%以上,表现较好. Accurate detection of the power grid users can be combined with the machine learning method after the popularity of new smart meters. For this purpose, three kinds of machine learning more commonly used in large data algorithm are chosen for analysis：random forest, support vector machine and gradient boosting decision tree. The efficiency and accuracy of the three algorithms are tested by constantly adjusting the size of the test data set. Analysis of the results shows that the ran- dom forest algorithm runs in a linear relationship with the amount of time and the amount of data, while the accuracy rate of stability is higher than 86% ,with better performances.

作者许智李红娇陈晶晶

机构地区上海电力学院计算机科学与技术学院

出处《上海电力学院学报》 CAS 2017年第4期389-393,共5页 Journal of Shanghai University of Electric Power

基金国家自然科学基金(61403247) 上海市信息安全综合管理技术研究重点实验室开放课题项目(AGK2015 005) 上海市科学技术委员会地方能力建设项目(15110500700)

关键词窃电智能电表随机森林支持向量机迭代决策树 stealing electricity smart meter random forest support vector machine gradient boosting decision tree

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TM715 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献7

1刘强.用电监察中窃电和反窃电探析[J].通讯世界（下半月）,2015(7):156-157. 被引量：3
2杨志友.用电监察中窃电与反窃电技术分析[J].电子世界,2015(15):193-194. 被引量：10
3贺宁.智能电表故障大数据分析探究[J].中小企业管理与科技,2016(19):142-145. 被引量：13
4丁全.基于数据挖掘的电力信息分类及搜索技术探析[J].通讯世界,2016,22(10):149-150. 被引量：1
5向涛,李涛,赵雪专,李旭冬.基于随机森林的精确目标检测方法[J].计算机应用研究,2016,33(9):2837-2840. 被引量：10
6李欣海.随机森林模型在分类与回归分析中的应用[J].应用昆虫学报,2013,50(4):1190-1197. 被引量：362
7王媛媛.智能电表通信测试系统分析与研究[J].现代工业经济和信息化,2016,6(9):98-99. 被引量：3

二级参考文献37

1Archer KJ, Kirnes RV, 2008. Empirical characterization of random forest variable importance measures. Comput. Stat. Data Anal. ,52(4):2249-2260.
2Biau G, 2012. Analysis of a random forests model. J. Mach. Learn. Res. , 13: 1063 -1095.
3Breiman L, 2001a. Random forests. Mach. Learn. , 45:5 - 32.
4Breiman L, 2001b. Statistical modeling: The two cultures. Stat. Sci., 16:199-215.
5Breiman L, Friedman JH, O lshen RA, Stone CJ, 1984.Classification and Regression Trees. Chapman and Hall. 1 -359.
6Cutler DR, Edwards TC, Jr., Beard KH, Cutler A, Hess KT, 2007. Random forests for classification in ecology. Ecology, 88 (11) :2783 - 2792.
7Deng H, Runger G, Tuv E, 2011. Bias of importance measures for multi-valued attributes and solutionsl I Proceedings of the 21 st International Conference on Artificial Neural Networks (ICANN).
8Elith J, Graham CH, 2009. Do they? How do they? Why do they differ? On finding reasons for differing performances of species distribution models. Ecography, 32 ( 1 ) : 66 - 77 .
9Genuer R, Poggi JM, Tuleau-Malot C, 2010. Variable selection using random forests. Pattern Recogn. Lett., 31 (14) :2225 - 2236.
10Groemping U, 2009. Variable importance assessment in regression.: linear regression versus random forest. Am. Stat. , 63(4) :308 -319.

共引文献394

1陈文明.色谱重叠峰的解析方法概论[J].中国水运（下半月）,2020(5):69-71. 被引量：4
2刘志君,崔丽娟,李伟,窦志国,左雪燕,雷茵茹,潘旭,李晶,赵欣胜,翟夏杰.基于高光谱的辽河口盐地碱蓬生态化学计量特征反演研究[J].遥感技术与应用,2023,38(1):239-250.
3杨龙,王闻娟,覃哲,古悦璇.中国大学生气候认知与低碳行为及其影响因素研究——基于随机森林模型分析[J].文化与传播,2022,11(2):6-15. 被引量：1
4孙诗睿,赵艳玲,王亚娟,王鑫,张硕.基于无人机多光谱遥感的冬小麦叶面积指数反演[J].中国农业大学学报,2019,24(11):51-58. 被引量：25
5付旭东,王金艳,李龙燕,陈金车,苏士翔,常伟,王明.基于随机森林算法的风场预报[J].兰州大学学报（自然科学版）,2021,57(4):503-509. 被引量：6
6李宁,王晓东,惠雨乔,刘长青.排水管道阻塞辨识定位和供水管网漏损技术及应用现状分析[J].给水排水,2022,48(S01):1074-1082. 被引量：5
7成方龙,赵冠伟,杨木壮,刘月亮,李芳.集成地理探测器与随机森林模型的城市人口分布格网模拟[J].测绘通报,2020(1):76-81. 被引量：12
8王雪冬,张超彪,王翠,朱永东,王海鹏.基于Logistic回归与随机森林的和龙市地质灾害易发性评价[J].吉林大学学报（地球科学版）,2022,52(6):1957-1970. 被引量：27
9徐华东,尚小民.基于准确计量法的电网窃电辨识与反窃电应用技术研究[J].区域治理,2017,0(4):47-48.
10鲁如坤,时正元,赖庆旺.红壤长期施肥养分的下移特征[J].土壤,2000,32(1):27-29. 被引量：37

同被引文献83

1苏静,赵毅强,何家骥,刘沈丰.旁路信号主成分分析的欧式距离硬件木马检测[J].微电子学与计算机,2015,32(1):1-4. 被引量：13
2张春明,许心.防窃电系统的应用[J].高电压技术,2005,31(8):88-89. 被引量：13
3肖文兵,费奇.基于支持向量机的个人信用评估模型及最优参数选择研究[J].系统工程理论与实践,2006,26(10):73-79. 被引量：47
4林峰浩,李金喜.基于高压电能表的配电网防窃电系统设计[J].水电能源科学,2008,26(6):186-188. 被引量：4
5廖小芳,向兵,谢峰竹,王楚义.移动通信基站能耗分析与综合节能解决方案[J].电信工程技术与标准化,2010,23(4):53-57. 被引量：13
6秦婷.通信基站能耗分析[J].西安邮电学院学报,2011,16(2):76-78. 被引量：20
7曹峥,杨镜非,刘晓娜.BP神经网络在反窃电系统中的研究与应用[J].水电能源科学,2011,29(9):199-202. 被引量：32
8刘华锋,罗宏伟,王力纬.硬件木马综述[J].微电子学,2011,41(5):709-713. 被引量：14
9王明生,吕希奎.改进的LM神经网络工程地质综合评价模型[J].计算机工程与应用,2011,47(36):234-237. 被引量：3
10于明,艾月乔.基于人工蜂群算法的支持向量机参数优化及应用[J].光电子．激光,2012,23(2):374-378. 被引量：52

引证文献9

1安强强,李赵兴,张峰,张雅琼.基于机器学习的通信网络非结构化大数据分析算法[J].电子设计工程,2018,26(14):53-56. 被引量：20
2张方建,江泽鑫.时间序列和机器学习在通信基站能耗建模的对比分析[J].电信技术,2019,0(9):66-70.
3赵文仓,陈聪聪,郑鸿磊.基于LM算法的用户窃漏电行为预测[J].电子测量技术,2018,41(24):119-122. 被引量：4
4徐冬,肖莹慧.基于机器学习技术的网站用户行为预测[J].现代电子技术,2019,42(4):94-96. 被引量：4
5郑楷洪,徐兵,肖勇,杨劲锋,周密,蔡梓文.交互式电能量大数据人工智能平台构建[J].南方电网技术,2019,13(8):52-58. 被引量：12
6左一鹏,陈辉.基于Scikit Learn的SVM分类器算法优化[J].上海电力大学学报,2020,36(3):259-264. 被引量：1
7王真,李鑫.基于随机森林的硬件木马检测方法[J].上海电力大学学报,2020,36(5):511-516. 被引量：3
8胡一伟,刘珊,黄浩.基于ARIMA和递归贝叶斯的窃电用户识别算法[J].电测与仪表,2022,59(6):196-200. 被引量：9
9杜子焓.基于虚拟仪器的窃电预警系统设计[J].电力与能源进展,2018,6(4):152-160.

二级引证文献53

1陶洪铸,翟明玉,许洪强,季学纯,刘金波,徐丽燕.适应调控领域应用场景的人工智能平台体系架构及关键技术[J].电网技术,2020,44(2):412-419. 被引量：36
2陆晓,刘翌,齐敬先,霍雪松,蒋宇.基于大数据的电网设备监控信息自动分类方法[J].电子设计工程,2019,27(11):119-122. 被引量：18
3王俊,程显生,王寿东.基于机器学习的数据库小数据集并行集成方法[J].科学技术与工程,2019,19(16):239-244. 被引量：7
4程俊夕,周茗如.砂柱微生物注浆的水力渗透性质试验研究[J].科学技术与工程,2019,19(16):313-318. 被引量：1
5朱发财.车联网中应急通信网络动态信道分配方法[J].西安工程大学学报,2019,33(3):296-301. 被引量：13
6李泰,韩强,黄银龙,王宗宏.基于kNN算法的红外测温图谱的温度数字识别研究[J].电力信息与通信技术,2019,17(6):14-19. 被引量：6
7李晓明,应毅,曾岳.基于Java的微服务技术在构建企业智能大数据平台下的应用与开发研究[J].现代电子技术,2019,42(15):165-169. 被引量：9
8赵川,赵明,路学刚,叶华,陶思钰.基于大数据技术的多能源系统能量控制研究[J].电子设计工程,2019,27(17):68-71. 被引量：5
9李互刚.基于机器学习的配网设备状态自动检修方法研究[J].自动化与仪器仪表,2019,0(10):148-152. 被引量：3
10康素成.无线通信系统电波覆盖定量计算仿真研究[J].计算机仿真,2019,36(9):202-205. 被引量：6

1周沙.无位置传感器无刷直流电机三段式启动技术[J].科教导刊（电子版）,2017,0(19):166-166.
2曾俊蓉,申丽珍,窦继涛.算子优化遗传算法的插画艺术设计模型[J].科技通报,2017,33(8):166-169. 被引量：1
3崔艳玲,金蓓弘,张扶桑.基于数据融合的高速公路交通状况检测[J].计算机学报,2017,40(8):1798-1812. 被引量：14
4陈鸿俊.基于数据挖掘技术的移动互联网业务研究[J].计算机与数字工程,2017,45(8):1597-1600. 被引量：3
5陈毅,黄妙华,王树坤.基于数据驱动的锂电池剩余容量估计[J].自动化与仪表,2017,32(8):69-73. 被引量：8
6东红明,刘媛,刘可可,邓燕.纳米金修饰乙酰胆碱酯酶生物传感器快速检测农药马拉松研究[J].包装学报,2017,9(1):53-58. 被引量：2
7周迪贵,刘强.企业级管理信息系统性能优化模式探讨及应用[J].广西电力,2017,40(4):49-51. 被引量：3

上海电力学院学报

2017年第4期

浏览历史

内容加载中请稍等...

基于机器学习的用户窃电行为预测被引量：9

参考文献7

二级参考文献37

共引文献394

同被引文献83

引证文献9

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于机器学习的用户窃电行为预测 被引量：9

参考文献7

二级参考文献37

共引文献394

同被引文献83

引证文献9

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于机器学习的用户窃电行为预测被引量：9