基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制被引量：19

Automatic generation control of ubiquitous power Internet of Things integrated energy system based on deep reinforcement learning

原文传递

导出

摘要包含超大规模分布式能源、负荷以及冷热电联产的泛在电力物联网的综合能源系统是未来发展趋势.由于泛在物联将给电网带来强的随机扰动问题,传统的自动发电控制(automatic generation control,AGC)方法已无法满足如此大规模复杂综合能源系统的频率稳定.机器学习是解决复杂能源系统AGC强随机扰动的一种有效方法.然而这种超大规模的泛在物联将给AGC求解带来维数灾问题.本文针对DDQN-AD(double deep Q networkaction discovery)算法中经验缓存机制构建问题,提出了一种基于比例优先级采样机制的深度强化学习算法PRDDQN-AD(prioritized replay DDQN-AD),以解决机器学习中多维状态-动作对的维数灾问题,进而解决泛在电力物联网综合能源系统模式下的随机扰动问题.对源网荷储协同的两区域综合能源系统模型和集成了大量源、网、荷、储及冷热电联产的多区域泛在电力物联网综合能源系统模型进行仿真.结果表明,与改进前的DDQNAD算法相比,PRDDQN-AD能够提升训练样本的质量,具有良好的学习效率和泛化性能,能够解决维数灾问题;与其他智能算法相比,其收敛速度和控制性能均有明显提升,可获得区域最优协同控制. The integrated energy systems are developing in the direction of ubiquitous power Internet of Things(IoT).The main feature is the large-scale integration of distributed energies,loads,and cogenerations,which usually brings random disturbances to the systems,thus causing frequency stability control problems,where cannot be effectively addressed by the traditional automatic generation control methods.The recently developed machine learning approach provides potential solutions for complex systems with random disturbances.However,when this approach is applied to the ultra-large-scale ubiquitous power IoT systems,the dimensionality related problem arises,and it should be solved.In this paper,a deep reinforcement learning algorithm is developed for the frequency stability control of the ultra-large-scale ubiquitous power IoT systems with random disturbances.The developed algorithm is based on the idea of a proportional priority sampling mechanism and the prioritized replay DDQN-AD(PRDDQN-AD)strategy.In this work,both the two-region integrated energy system model and the multi-regional ubiquitous power IoT integrated energy system model are adopted in simulation and analysis;these models include a large number of sources,loads,energy-storage units,and grids.Simulation and comparison results show that the training quality of samples,learning efficiency,and generalization performance of the strategy are improved by using PRDDQN-AD.The strategy has a fast convergence speed,and thus can successfully solve the dimensionality problem.

作者席磊余璐张弦胡伟 XI Lei;YU Lu;ZHANG Xian;HU Wei(College of Electrical Engineering and New Energy,Three Gorges University,Yichang 443002,China;School of Electrical Engineering and Automation,Guilin University of Electronic Technology,Guilin 541004,China;Department of Electrical Engineering,Tsinghua University,Beijing 100084,China)

机构地区三峡大学电气与新能源学院桂林电子科技大学电子工程与自动化学院清华大学电机工程与应用电子技术系

出处《中国科学：技术科学》 EI CSCD 北大核心 2020年第2期221-234,共14页 Scientia Sinica(Technologica)

基金国家自然科学基金(批准号:51707102)资助项目.

关键词泛在电力物联网综合能源系统深度强化学习自动发电控制 ubiquitous power internet of things integrated energy system deep reinforcement learning automatic generation control

分类号 TM73 [电气工程—电力系统及自动化] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献18

1余涛,胡细兵,刘靖.基于多步回溯Q(λ)学习算法的多目标最优潮流计算[J].华南理工大学学报（自然科学版）,2010,38(10):139-145. 被引量：7
2高宗和,滕贤亮,张小白.互联电网CPS标准下的自动发电控制策略[J].电力系统自动化,2005,29(19):40-44. 被引量：74
3孙舶皓,汤涌,仲悟之,叶林,李智,蓝海波.基于分布式模型预测控制的包含大规模风电集群互联系统超前频率控制策略[J].中国电机工程学报,2017,37(21):6291-6302. 被引量：23
4席磊,陈建峰,黄悦华,薛田良,张涛,张赟宁.基于具有动作自寻优能力的深度强化学习的智能发电控制[J].中国科学：信息科学,2018,48(10):1430-1449. 被引量：12
5余涛,周斌.基于强化学习的互联电网CPS自校正控制[J].电力系统保护与控制,2009,37(10):33-38. 被引量：18
6周文吉,俞扬.分层强化学习综述[J].智能系统学报,2017,12(5):590-594. 被引量：20
7孔小兵,刘向杰,韩梅.风光互补发电系统的分级递阶分布式预测控制[J].中国科学：信息科学,2018,48(10):1316-1332. 被引量：16
8胡鹏龙,于强,周昊,马孝纯,崔成云,祝令昆,季鹏,舒振杨.燃煤耦合生物质气化发电技术研究[J].锅炉制造,2018(6):32-36. 被引量：8
9马吉明,张楚汉,朱守真,金勇,栗楠.水电对风能太阳能间歇性电力的支持与协调运行[J].中国科学：技术科学,2015,45(10):1089-1097. 被引量：13
10谢平平,李银红,刘晓娟,石东源,段献忠.基于社会学习自适应细菌觅食算法的互联电网AGC最优PI/PID控制器设计[J].中国电机工程学报,2016,36(20):5440-5448. 被引量：35

二级参考文献194

1贺德馨.对中国风能可持续发展的几点思考[J].风能,2011(4):14-16. 被引量：3
2张新敬,陈海生,刘金超,李文,谭春青.压缩空气储能技术研究进展[J].储能科学与技术,2012,1(1):26-40. 被引量：146
3王先甲,全吉,刘伟兵.有限理性下的演化博弈与合作机制研究[J].系统工程理论与实践,2011,31(S1):82-93. 被引量：154
4唐跃中,张王俊,张健,陈明.基于CPS的AGC控制策略研究[J].电网技术,2004,28(21):75-79. 被引量：61
5张健,唐跃中,章渊.OPEN2000AGC系统在上海电网的应用[J].电力系统自动化,2004,28(19):96-99. 被引量：2
6高宗和,滕贤亮,张小白.互联电网CPS标准下的自动发电控制策略[J].电力系统自动化,2005,29(19):40-44. 被引量：74
7冯志兵,金红光.燃气轮机冷热电联产系统与蓄能变工况特性[J].中国电机工程学报,2006,26(4):25-30. 被引量：46
8达庆利,张骥骧.有限理性条件下进化博弈均衡的稳定性分析[J].系统工程理论方法应用,2006,15(3):279-284. 被引量：41
9段献忠,何飞跃.考虑通信延迟的网络化AGC鲁棒控制器设计[J].中国电机工程学报,2006,26(22):35-40. 被引量：21
10黄强,范荣生,沈晋,薛松贵,常炳炎,席家治.黄河干流水库联合调度规则模型研究[J].西安理工大学学报,1996,12(3):218-225. 被引量：3

共引文献364

1孙晓霞,桂中华,王星,赵毅锋,李文,张新敬,陈海生.进气室作用下压缩空气储能轴流涡轮弯导叶流动特性[J].中国电机工程学报,2022,42(S01):156-166. 被引量：1
2罗颖.含风光发电的互联电力系统自动发电控制[J].黑龙江电力,2020,42(2):142-147. 被引量：1
3张娟,李俊午.全时空量测环境下基于双向长短期记忆网络的电力物联网损耗计算[J].电子器件,2022,45(2):408-414. 被引量：1
4平洋,刘文斌,缪正元,葛品,黄琮凯,庄正浩.智能无人艇研究现状及关键问题发展趋势[J].船舶工程,2023,45(2):61-69. 被引量：4
5许杨子,强文,刘俊,孙鸿雁,胡成刚.基于改进深度强化学习算法的电力市场监测模型研究[J].国外电子测量技术,2020,39(1):82-87. 被引量：5
6蔡杰,张世旭,廖爽,杨明,李姚旺,苗世洪.考虑AA-CAES装置热电联储/供特性的微型综合能源系统优化运行策略[J].高电压技术,2020,46(2):480-490. 被引量：25
7闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17
8刘梅招,杨莉,甘德强,汪德星,高伏英,陈琰.存在均匀通信时滞的AGC稳定极限计算[J].电力系统自动化,2006,30(19):7-12. 被引量：7
9辛阔.基于CPS标准的南方电网频率质量分析[J].贵州电力技术,2006,9(12):22-25.
10陈慧坤,卢恩,王仁明.电网联络线功率与频率偏差的控制及考核分析[J].三峡大学学报（自然科学版）,2007,29(1):29-32. 被引量：3

同被引文献349

1程乐峰,杨汝,刘贵云,王建晖,陈洋,王晓刚,张杰,余涛.多群体非对称演化博弈动力学及其在智能电网电力需求侧响应中的应用[J].中国电机工程学报,2020,40(S01):20-36. 被引量：24
2黄南天,包佳瑞琦,蔡国伟,赵树野,刘德宝,王俊生,王盼盼.多主体联合投资微电网源–储多策略有限理性决策演化博弈容量规划[J].中国电机工程学报,2020,40(4):1212-1225. 被引量：36
3王育飞,付玉超,薛花.计及太阳辐射和混沌特征提取的光伏发电功率DMCS-WNN预测法[J].中国电机工程学报,2019,39(S01):63-71. 被引量：31
4徐甜甜,韩光洁,邹岩,朱宏博,王敏,林川.基于混合机器学习的电磁功率谱密度预测模型[J].太赫兹科学与电子信息学报,2021,19(4):623-627. 被引量：2
5刘鑫,胡以怀,王富伟.石墨烯在光催化制氢中的应用研究[J].炭素技术,2020,0(1):12-18. 被引量：5
6苟星,陈群,孙勇,马欢,贺克伦,李振元.微能源系统中多能传输、存储与转换过程的影响机制[J].全球能源互联网,2020,3(3):280-290. 被引量：2
7高镇,崔琪楣,张雪菲,王晓飞.区块链在物联网系统中的应用探讨[J].物联网学报,2020(2):10-17. 被引量：10
8Rui Wang,Qiuye Sun,Dehao Qin,Yushuai Li,Xiangke Li,Peng Wang.Steady-state Stability Assessment of AC-busbar Plug-in Electric Vehicle Charging Station with Photovoltaic[J].Journal of Modern Power Systems and Clean Energy,2020,8(5):884-894. 被引量：4
9杨伟伟,吴建德,李武华,何湘宁.应用于电力电子变换器的实时调试系统[J].电力电子技术,2020,54(1):82-86. 被引量：3
10程超,滕俊杰,赵艳领,宋梅.一种基于多智能体强化学习的流量分配算法[J].北京邮电大学学报,2019,42(6):43-48. 被引量：4

引证文献19

1席磊,张乐,黄悦华,陈曦,徐艳春.基于贪婪策略的多层自动发电控制[J].中国电机工程学报,2020,40(16):5204-5216. 被引量：11
2刘俊勇,潘力,何迈.能源物联网及其关键技术[J].物联网学报,2020,4(4):9-16. 被引量：11
3李争,张蕊,孙鹤旭,张文达,梅春晓.可再生能源多能互补制-储-运氢关键技术综述[J].电工技术学报,2021,36(3):446-462. 被引量：82
4席磊,刘宗静,孙梦梦,武俊男.面向多区域能源互联的多智能体协同AGC策略[J].中国科学：技术科学,2021,51(6):673-683. 被引量：5
5郭敏,夏明超,陈奇芳.基于能源自组织的能源-信息-交通-社会耦合网络研究综述[J].中国电机工程学报,2021,41(16):5521-5539. 被引量：11
6席磊,孙梦梦,陈宋宋,朱继忠,孙秋野,刘宗静.面向分布式电网的多区域协同控制方法研究[J].电机与控制学报,2021,25(12):75-86. 被引量：3
7张朝辉,杨家豪,苏杰和.直流互联异步电网的HVDC与AGC协同功率分配[J].电测与仪表,2022,59(1):162-167. 被引量：4
8董慧.基于强化学习的网络数据流异常检测数学建模[J].电子设计工程,2022,30(4):106-109. 被引量：5
9温柏坚,刘晔,蒋道环,伍江瑶.电力行业智能化综合管控系统设计[J].自动化与仪器仪表,2022(6):149-153. 被引量：3
10王睿,胡旌伟,孙秋野,姜文涛,孙城皓.电动汽车车—车能量互济控制策略研究[J].中国科学：技术科学,2022,52(6):957-970. 被引量：1

二级引证文献144

1钱来,王伟.一种基于IDOA-RBF神经网络的正常流量过滤方法[J].电子测量技术,2023,46(13):132-138.
2李文君.物联网技术在智慧机场中的应用分析[J].数字通信世界,2021(3):170-171. 被引量：3
3韩青,高昆仑,赵婷,陈江琦,杨新宇,杨树森.边云协同智能技术在电力领域的应用[J].物联网学报,2021,5(1):62-71. 被引量：14
4韩朝阳.浅谈能源多能互补综合利用评估技术分析[J].中国设备工程,2021(8):166-167. 被引量：3
5骈松,赵燕晓,杨泽鹏,刘涛,王晓威.可再生能源大规模制氢前景概述[J].清洗世界,2021,37(3):3-5. 被引量：6
6李建林,李光辉,马速良,王含.碳中和目标下制氢关键技术进展及发展前景综述[J].热力发电,2021,50(6):1-8. 被引量：84
7郝亮亮,胡启昊,张扬,任仰凯,宗卫晶,汪南华.多相环形无刷励磁系统的运行特性分析[J].电机与控制学报,2021,25(7):30-39. 被引量：5
8李娜,李萌.科技期刊专题出版的选题挖掘和统筹规划[J].新闻研究导刊,2021,12(11):213-215. 被引量：4
9席磊,刘宗静,孙梦梦,武俊男.面向多区域能源互联的多智能体协同AGC策略[J].中国科学：技术科学,2021,51(6):673-683. 被引量：5
10刘贵洲,窦立荣,黄永章,邹才能,许昕.氢能利用的瓶颈分析与前景展望[J].天然气与石油,2021,39(3):1-9. 被引量：31

1张栩源,李军.自动驾驶汽车路径规划技术[J].汽车工程师,2020(5):35-39. 被引量：3
2姜文啸.基于区域链技术的城市智慧教育平台构建探讨[J].中国教育信息化,2020,26(9):30-32. 被引量：1
3杨军平.浅谈财务风险管理的企业内控体系构建[J].中外企业家,2020,0(3):64-65. 被引量：7
4刘思奇,白俊强.结合动态滑翔技术的小型太阳能无人机飞行能量变化分析[J].西北工业大学学报,2020,38(1):48-57. 被引量：2
5杨春玲,裴翰奇.基于残差学习的多阶段图像压缩感知神经网络[J].华南理工大学学报（自然科学版）,2020,48(5):82-91. 被引量：3
6周云飞,赛云秀,闫莉.复杂机电系统制造过程项目化管理目标构建分析[J].兵器装备工程学报,2020,41(4):226-231. 被引量：1
7朱德群.高校基建工程新型预算模式构建与完善[J].上饶师范学院学报,2020,40(3):92-97. 被引量：1
8Yan Zheng,Jian-Ye Hao,Zong-Zhang Zhang,Zhao-Peng Meng,Xiao-Tian Hao.Efficient Multiagent Policy Optimization Based on Weighted Estimators in Stochastic Cooperative Environments[J].Journal of Computer Science & Technology,2020,35(2):268-280. 被引量：1
9陈天君.“建制议程”中乡村秩序的构建——读《中国现代国家的起源》[J].法制与社会（旬刊）,2020,0(1):161-162.
10陈双,李龙,罗海南.基于神经网络的强化学习在服务机器人导航中的研究[J].现代计算机,2020,26(12):62-67.

中国科学：技术科学

2020年第2期

浏览历史

内容加载中请稍等...

基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制被引量：19

参考文献18

二级参考文献194

共引文献364

同被引文献349

引证文献19

二级引证文献144

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制 被引量：19

参考文献18

二级参考文献194

共引文献364

同被引文献349

引证文献19

二级引证文献144

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制被引量：19