基于改进快速密度峰值算法的电力负荷曲线聚类分析被引量：24

An improved density peaks clustering algorithm for power load profiles clustering analysis

下载PDF

导出

摘要为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法。首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作。然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵。最后以KNN矩阵代替原算法的距离矩阵作为输入数据。在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析。通过实验和算例分析验证了所提改进算法的实用性和有效性。 Aiming at the problems of poor stability of clustering results,poor effectiveness in clustering,slow speed and high memory consumption when making traditional clustering analysis for a large dimensionality huge number of load profiles with huge difference between the clusters under the background of the big data,an improved density peaks clustering algorithm is proposed.Firstly,principle components analysis method is used to reduce dimensions of load curves after normalization in order to reduce the calculation of the Euclidean distance between the sample vectors and to speed up the subsequent operations.Then,the kd tree algorithm is used to carry out the fast k-nearest neighbor search to generate KNN matrix.Finally,the KNN matrix is used to replace the original distance matrix as the input data.Based on the KNN improved local density and distance calculation criterion,the density peaks clustering algorithm is used to cluster the load profiles.Experiments and case analysis show that the proposed method is practicable and effective.

作者陈俊艺丁坚勇田世明卜凡鹏朱炳翔黄事成周凯 CHEN Junyi;DING Jianyong;TIAN Shiming;BU Fanpeng;ZHU Bingxiang;HUANG Shicheng;ZHOU Kai(School of Electrical Engineering,Wuhan University,Wuhan 430072,China;China Electric Power Research Institute,Beijing 100192,China)

机构地区武汉大学电气工程学院中国电力科学研究院

出处《电力系统保护与控制》 EI CSCD 北大核心 2018年第20期85-93,共9页 Power System Protection and Control

基金国家高技术研究发展计划(863计划)(2015AA050203) 国家电网公司科技项目"智能配用电大数据应用关键技术深化研究"~~

关键词电力大数据负荷曲线聚类快速密度峰值算法主成分分析 KD树 KNN算法 power big data load profiles clustering density peaks clustering algorithm PCA kd tree KNN algorithm

分类号 TM714 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献17

1惠晓林,孙振权.智能配电网与物联网的融合[J].物联网技术,2011,1(8):31-35. 被引量：13
2刘科研,盛万兴,张东霞,贾东梨,胡丽娟,何开元.智能配电网大数据应用需求和场景分析研究[J].中国电机工程学报,2015,35(2):287-293. 被引量：273
3王继业,季知祥,史梦洁,黄复鹏,朱朝阳,张东霞.智能配用电大数据需求分析与应用研究[J].中国电机工程学报,2015,35(8):1829-1836. 被引量：182
4林顺富,郝朝,汤晓栋,李东东,符杨.基于数据挖掘的楼宇短期负荷预测方法研究[J].电力系统保护与控制,2016,44(7):83-89. 被引量：36
5陈明照,毛坚,杜宗林,刘军志.基于聚类法的工业用户需求侧管理(DSM)方案分析与研究[J].电力系统保护与控制,2017,45(7):84-89. 被引量：20
6田力,向敏.基于密度聚类技术的电力系统用电量异常分析算法[J].电力系统自动化,2017,41(5):64-70. 被引量：66
7李朝晖,尹晓博,杨海晶,马瑞,石光,赵文沛.基于改进的k-means聚类算法的季节性负荷特性分析[J].电网与清洁能源,2018,34(2):53-59. 被引量：12
8王红斌,陈扬,高雅,耿大庆.基于数据挖掘的预警技术在一体化输电设备监测中的应用研究[J].电网与清洁能源,2014,30(1):55-58. 被引量：8
9王桂兰,周国亮,赵洪山,米增强.大规模用电数据流的快速聚类和异常检测技术[J].电力系统自动化,2016,40(24):27-33. 被引量：51
10李芬,李春阳,闫全全,赵晋斌,段善旭.基于变分贝叶斯学习的光伏功率波动特性研究[J].电力自动化设备,2017,37(8):99-104. 被引量：7

二级参考文献236

1刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,49(S1):26-31. 被引量：170
2孙璞玉,李家睿,王承民,连鸿波,付大伟,张焰.基于负荷特征向量的负荷分类与预测方法研究及其应用[J].电气应用,2013,0(S1):234-238. 被引量：4
3王玉龙,崔玉,李鹏,李锐.基于小波分析改进的神经网络模型电力系统负荷预测[J].电网与清洁能源,2015,31(2):16-20. 被引量：32
4庄绪强.基于云计算技术的用户用电智能分析技术研究[J].自动化与仪器仪表,2016(2):187-189. 被引量：8
5康重庆,夏清,张伯明.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2004,28(17):1-11. 被引量：499
6牛东晓,邢棉,孟明.基于联合数据挖掘技术的神经网络负荷预测模型研究(英文)[J].电工技术学报,2004,19(9):62-68. 被引量：11
7白莉媛,胡声艳,刘素华.一种基于模拟退火和遗传算法的模糊聚类方法[J].计算机工程与应用,2005,41(9):56-58. 被引量：11
8谭亲跃,王少荣,程时杰.电力需求侧管理(PDSM)综述[J].继电器,2005,33(17):79-84. 被引量：20
9王志勇,郭创新,曹一家.基于模糊粗糙集和神经网络的短期负荷预测方法[J].中国电机工程学报,2005,25(19):7-11. 被引量：53
10刘志峰,张宏海,王建华,杨文通,吴喜文.基于RFID技术的EPC全球网络的构建[J].计算机应用,2005,25(B12):14-15. 被引量：23

共引文献942

1张春辉,白翠芝,张蔓娴.基于小波的电力负荷异常检测[J].云南大学学报（自然科学版）,2020,42(S02):49-54. 被引量：11
2俞伟,陈晨.基于大数据的配电网运行状态评估与预警[J].企业管理,2018,0(S01):410-411. 被引量：1
3晋远,燕达,安晶晶,张行星,韩梦捷.基于自编码算法聚类的城镇住宅建筑日用电典型模式分析[J].建筑科学,2020,36(2):1-7. 被引量：6
4夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
5杨柳林,胡贺骏.基于改进GMM算法的综合能源数据清洗研究[J].电子测量技术,2023,46(4):78-83. 被引量：3
6肖勇,郑楷洪,余忠忠,周密,李森,马千里.基于三次指数平滑模型与DBSCAN聚类的电量数据异常检测[J].电网技术,2020,44(3):1099-1104. 被引量：61
7宋军英,崔益伟,李欣然,钟伟,邹鑫,李培强.基于欧氏动态时间弯曲距离与熵权法的负荷曲线聚类方法[J].电力系统自动化,2020(15):87-98. 被引量：33
8施勇,陆勋,林诚,赵新娅,邢云峰.远程非常规用电检测系统在低压台区环境污染治理中的应用研究[J].环境科学与管理,2021,46(1):73-76. 被引量：1
9肖琦敏,方志坚,孙浩淞,罗义旺,林翰,刘积娟.含分布式电源的智能电网负荷预测研究[J].国外电子测量技术,2020,0(2):77-82. 被引量：12
10谢润生.基于智能配电网大数据分析的状态监测与故障处理方法[J].探索科学,2018,0(5):109-110. 被引量：1

同被引文献322

1陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量：228
2邓带雨,李坚,张真源,滕予非,黄琦.基于EEMD-GRU-MLR的短期电力负荷预测[J].电网技术,2020,44(2):593-602. 被引量：135
3王德文,杨凯华.基于生成式对抗网络的窃电检测数据生成方法[J].电网技术,2020,44(2):775-782. 被引量：52
4宋军英,崔益伟,李欣然,钟伟,邹鑫,李培强.基于欧氏动态时间弯曲距离与熵权法的负荷曲线聚类方法[J].电力系统自动化,2020(15):87-98. 被引量：33
5李慧,杨明皓.小波分析在电力系统不良数据辨识中的应用[J].继电器,2005,33(3):10-14. 被引量：8
6杨力俊,郭联哲,谭忠富.几种发电商市场力评估指标的对比分析[J].电网技术,2005,29(2):28-33. 被引量：29
7崔万照,朱长纯,保文星,刘君华.基于模糊模型支持向量机的混沌时间序列预测[J].物理学报,2005,54(7):3009-3018. 被引量：29
8张文霖.主成分分析在SPSS中的操作应用[J].市场研究,2005(12):31-34. 被引量：313
9张集,张粒子,于亮.电力市场中的市场力分层评价指标体系[J].中国电机工程学报,2006,26(6):123-128. 被引量：21
10杨力俊,赵云,谭忠富.一种评估电力市场中卖方市场力的新指标[J].电网技术,2006,30(7):26-31. 被引量：7

引证文献24

1夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
2王华勇,韩松,肖孝天,杨超.改进的电力负荷曲线集成K-medoids聚类算法[J].电力科学与工程,2019,35(2):38-43. 被引量：3
3罗慧,刘梅招,周钰山,张宸,潘文文,刘阳,卫志农.基于长短期记忆网络的智能用电数据甄别方法[J].广东电力,2019,32(2):47-56. 被引量：5
4刘季昂,刘友波,程明畅,余莉娜.基于分位数半径动态K-means的分布式负荷聚类算法[J].电力系统保护与控制,2019,47(24):15-22. 被引量：27
5朱清智,董泽,马宁.基于即时学习算法的短期负荷预测方法[J].电力系统保护与控制,2020,48(7):92-98. 被引量：23
6梁京章,黄星舒,吴丽娟,熊小萍.基于KPCA和改进K-means的电力负荷曲线聚类方法[J].华南理工大学学报（自然科学版）,2020,48(6):143-150. 被引量：23
7朱天怡,艾芊,贺兴,李昭昱,孙东磊,李雪亮.基于数据驱动的用电行为分析方法及应用综述[J].电网技术,2020,44(9):3497-3507. 被引量：59
8李东东,段维伊,周波,林顺富,周冠廷.基于主成分分析的电力市场供应侧主体竞争潜力指数研究[J].电力系统保护与控制,2020,48(19):1-8. 被引量：15
9李特,张家驹,赵炜,侯泽鹏.基于机器学习的用电数据分析[J].河北电力技术,2020,39(5):17-21. 被引量：2
10周堃,韩号,陈伟,夏泽举.应用于电力营销的数据分析模型[J].计算机与数字工程,2020,48(12):3034-3041. 被引量：3

二级引证文献238

1杨婧,辛明勇,付卿卿.基于数据挖掘判别用电类别异常的分析与研究[J].科技通报,2023,39(1):49-52. 被引量：2
2赵鋆,艾远高,向强铭,夏国强,黄家志.适用于电流源型逆变器的SVPWAM调制策略及其损耗分析[J].电器与能效管理技术,2022(12):61-69. 被引量：2
3赵一鸣,吉月辉,刘俊杰,陈嘉齐.基于EMD-IPSO-LSTM模型的短期电力负荷预测[J].国外电子测量技术,2023,42(1):132-137. 被引量：7
4葛琼宇,王致杰.基于ISSA-ELM的短期电力负荷预测研究[J].国外电子测量技术,2022,41(4):119-125. 被引量：5
5胡聪,徐敏,洪德华,刘翠玲,薛晓茹,王海鑫.基于改进K-medoids聚类和SVM的异常用电模式在线检测方法[J].国外电子测量技术,2022,41(2):53-59. 被引量：8
6河伯.“注意”后续营销[J].行为科学,2000(5):54-54.
7张俊华.某厂内设科套取现金私分该定何罪?[J].中国刑事法杂志,2000(1):66-66.
8江剑峰,张垠,田书欣,杨喜军.基于云理论的智能电能表故障数据分析[J].电力科学与技术学报,2020,35(2):163-169. 被引量：36
9周明飞,刘亚鹏,王璟,毛进,胡特立,刘贵栋.电渗析浓缩多离子体系溶液数学模型研究[J].热力发电,2020,49(7):123-129.
10刘畅,滕予非,唐伟,靳旦,李赋兴.基于电力数据的居民人口流动情况评估[J].四川电力技术,2020,43(3):33-37.

1王颖,杨余旺.基于堆和邻域共存信息的KNN相似图算法[J].计算机科学,2018,45(5):196-200. 被引量：1
2张禄,孙舟,王伟贤,李香龙,周杨,黄其进,陈雁.应用曲线分群预测的电动汽车充电设施规划方法[J].现代电力,2018,35(4):21-26. 被引量：5
3孙晔.加快视频业务发展推动报纸融合转型[J].新闻战线,2018(6):68-69. 被引量：3
4麦伯良.集装箱：人类伟大的创造[J].发现,2018,0(12):96-96.
5李建锋,谭耀华,廖胜辉.用于光线跟踪的高并行度表面积启发式(SAH)KD树构建[J].湖南大学学报（自然科学版）,2018,45(10):148-154. 被引量：3
6章天爱.区域教育水平差异情况分析——以浙江省为例[J].统计与管理,2018,33(7):65-68.
7周昭文.网络舆情模糊C均值并行聚类方法研究[J].情报探索,2018(5):33-38.
8陈向阳,杨洋,向云飞.欧氏聚类算法支持下的点云数据分割[J].测绘通报,2017(11):27-31. 被引量：39
9吴霜,季聪,孙国强.基于CUDA技术的海量电力负荷曲线聚类算法[J].电力工程技术,2018,37(4):65-70. 被引量：8
10王帅,杜欣慧,姚宏民,王凤萍.面向含多种用户类型的负荷曲线聚类研究[J].电网技术,2018,42(10):3401-3412. 被引量：41

电力系统保护与控制

2018年第20期

浏览历史

内容加载中请稍等...

基于改进快速密度峰值算法的电力负荷曲线聚类分析被引量：24

参考文献17

二级参考文献236

共引文献942

同被引文献322

引证文献24

二级引证文献238

相关作者

相关机构

相关主题

浏览历史

基于改进快速密度峰值算法的电力负荷曲线聚类分析 被引量：24

参考文献17

二级参考文献236

共引文献942

同被引文献322

引证文献24

二级引证文献238

相关作者

相关机构

相关主题

浏览历史

基于改进快速密度峰值算法的电力负荷曲线聚类分析被引量：24