基于SARSA算法的水库长期随机优化调度研究被引量：12

Research on Long-term Stochastic Optimal Operation of Reservoir Based on SARSA Algorithm

导出

摘要针对水库长期随机调度的维数灾问题,在描述来水随机过程的基础上,提出基于强化学习理论的水库长期随机优化调度模型。采用机器学习中有模型的SARSA算法,且考虑入库随机变量的马尔可夫特性,通过贪婪决策与近似值迭代,调整学习参数,求解出近似最优决策序列。实例分析表明,对比随机动态规划(SDP)方法,SARSA算法在获得高质量解的同时,计算时间约减少41%,该算法高效求解能力与较少计算时长为水库长期随机调度问题提供了一种新的求解思路。 Aiming at the problem of the curse of dimensionality in long-term random scheduling of reservoir, based on describing the random process of inflow, a reinforcement learning method based SARSA algorithm was applied. The model considered the uncertainty of the runoff which was taken as simple Markov Decision Process （MDP）. By greedy decision-making and approximate value iteration, the learning parameters were adjusted to determine the near-optimal decision-making sequence. Compared with stochastic dynamic programming （SDP） method, the example shows that the model based SARSA algorithm achieves a high quality solutions and the computation time is reduced by approximately 41 %. Its efficient solution and short calculation time provide a new solution idea for long-term stochastic operation of reservoir.

作者李文武张雪映 Daniel Eliote Mbanze 吴巍 LI Wen-wu 1,2, ZHANG Xue-ying 1,2,DANIEL Eliote Mbanze 1,2,WU Wei 1,2(1. Hubei Key Laboratory of Cascaded Hydropower Stations Operation ＆ Control;2. College of Electrical Engineering ＆ New Energy,China Three Gorges University, Yichang 443002, Chin)

机构地区三峡大学梯级水电站运行与控制湖北省重点实验室三峡大学电气与新能源学院

出处《水电能源科学》北大核心 2018年第9期72-75,共4页 Water Resources and Power

基金湖北省技术创新专项(重点项目)(2017AAA132)

关键词水库调度随机动态规划强化学习值迭代 SARSA reservoir operation SDP reinforcement learning value iteration SARSA

分类号 TM612 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献2

1梁振成,韦化,李凌,田君杨.中长期发电计划的值函数近似动态规划方法[J].中国电机工程学报,2015,35(20):5199-5209. 被引量：11
2李文武,吴稀西,黄进,马强,郭希海.基于随机动态规划的混合式抽水蓄能电站水库中长期优化调度研究[J].电力系统保护与控制,2013,41(9):86-93. 被引量：18

二级参考文献31

1徐鼎甲,戴国瑞.梯级水电站的长期优化调度[J].水利学报,1989,21(5):43-48. 被引量：4
2陈雪青,陈刚,张炜,王浩宇.电力系统长、中、短期能源调度管理系统的研究[J].中国电机工程学报,1994,14(6):41-48. 被引量：14
3丘文千.抽水蓄能电站运行优化的动态规划模型[J].水电自动化与大坝监测,2005,29(6):6-10. 被引量：19
4崔继纯,刘殿海,梁维列,谢枫,陈宏宇.抽水蓄能电站经济环保效益分析[J].中国电力,2007,40(1):5-10. 被引量：26
5Ferrero R W,Rivera J F,Shahidehpour S M.A dynamic programming two-stage algorithm for long-term hydrothermal scheduling of multireservoir systems[J].IEEE Transactions on Power Systems,1998,13(4):1534-1540.
6Zambelli M,Siqueira T G,Cicogna M,et al.Deterministic versus stochastic models for long term hydrothermal scheduling[C]//IEEE Power Engineering Society General Meeting.Montreal,Que:IEEE,2006.
7Pinto R J,Borges C L T,Maceira M E P.An efficient parallel algorithm for large scale hydrothermal system operation planning[J].IEEE Transactions on Power Systems,2013,28(4):4888-4896.
8Baslis C G,Papadakis S E,Bakirtzis A G.Simulation of optimal medium-term hydro-thermal system operation by grid computing[J].IEEE Transactions on Power Systems,2009,24(3):1208-1217.
9Bertsekas D P.Dynamic Programming and Optimal Control[M].Belmont,MA:Athena Scientific,2005.
10Powell W B.Approximate Dynamic Programming:Solving the Curses of Dimensionality[M].2nd ed.New York:JOHN WILEY&SONS,INC.,2011.

共引文献27

1王晓晖,张粒子,程世军.多元电力系统中抽水蓄能的经济性问题研究[J].电力系统保护与控制,2014,42(4):8-15. 被引量：8
2李文武,熊小翠,吴稀西.含混合式抽水蓄能电站的梯级水库长期随机优化调度研究[J].水电能源科学,2014,32(9):55-58. 被引量：2
3王森,武新宇,程春田,李保健.梯级水电站群长期发电优化调度多核并行机会约束动态规划方法[J].中国电机工程学报,2015,35(10):2417-2427. 被引量：14
4符芳明,钟平安,徐斌,王玉华,陈宇婷.金沙江下游与三峡梯级水库群协同消落方式研究[J].河南水利与南水北调,2016,45(4):29-35. 被引量：10
5郭乐,徐斌.三峡梯级水库群联合优化调度增发电量分析[J].水力发电,2016,42(12):90-93. 被引量：5
6焦钰,王建群,贾洋洋.基于狼群算法的水电站优化调度模型参数优选[J].南水北调与水利科技,2017,15(2):58-64. 被引量：3
7朱涛,朱建全,刘明波,赵文猛.含风电场电力系统的动态经济调度分散随机优化方法[J].电力系统自动化,2017,41(11):48-54. 被引量：10
8杨国清,付菁,王德意,罗航.非合作博弈下风-火-抽蓄区域电网调度研究[J].水力发电学报,2017,36(9):21-30. 被引量：7
9裴哲义,元博,宗瑾,张晋芳,焦冰琦,张富强.定、变速抽水蓄能机组调度决策关键技术研究[J].水力发电,2018,44(4):86-91. 被引量：12
10周永峰,吴倩楠,吴德榆,范建国,金佳明,陈金昌.基于层次分析法的抽水蓄能电站环境影响评价[J].中国水土保持,2018(8):65-68. 被引量：3

同被引文献103

1支悦,艾学山,董祚,陈森林.水库发电优化调度模型的快速求解算法及应用[J].水力发电学报,2020(6):49-61. 被引量：16
2李承军,陈毕胜,张高峰.水电站双线性调度规则研究[J].水力发电学报,2005,24(1):11-15. 被引量：20
3陈洋波.水库群隐性随机优化调度研究[J].葛洲坝水电工程学院学报,1994,16(2):45-52. 被引量：1
4徐刚,马光文,梁武湖,陈建春,吴世勇.蚁群算法在水库优化调度中的应用[J].水科学进展,2005,16(3):397-400. 被引量：80
5陶春华,马光文,涂扬举,徐刚,左幸.实码退火遗传算法在厂内经济运行中的应用[J].四川大学学报（工程科学版）,2005,37(6):38-41. 被引量：19
6路洪海,章程.中国西南地区岩溶水资源的特点及可持续利用对策[J].西华师范大学学报（自然科学版）,2006,27(2):139-142. 被引量：8
7陈利群,刘昌明,杨聪,郝芳华.黄河源区基流估算[J].地理研究,2006,25(4):659-665. 被引量：28
8高仕春,滕燕,陈泽美.黄柏河流域水库水电站群多目标短期优化调度[J].武汉大学学报（工学版）,2008,41(2):15-18. 被引量：4
9李小芹,李延频,赵梦蝶,张泽中.梯级水库群发电优化调度评述[J].人民黄河,2008,30(4):78-80. 被引量：6
10程春田,唐子田,李刚,杨斌斌.动态规划和粒子群算法在水电站厂内经济运行中的应用比较研究[J].水力发电学报,2008,27(6):27-31. 被引量：25

引证文献12

1支悦,艾学山,董祚,陈森林.水库发电优化调度模型的快速求解算法及应用[J].水力发电学报,2020(6):49-61. 被引量：16
2喀迪尔·麦麦提.基于蝙蝠算法不同频率乌克塔斯水库防洪优化调度研究[J].陕西水利,2019,0(8):62-64. 被引量：1
3王炜,胡一鸣,石强.梯度下降法在水库调度函数优化中的应用[J].电子科技,2020,33(1):68-72. 被引量：1
4王安义,李萍,张育芝.基于SARSA算法的水声通信自适应调制[J].科学技术与工程,2020,20(16):6505-6509. 被引量：4
5李文武,郑凯新,刘江鹏,贺中豪.基于SARSA算法的风电——抽蓄联合系统日随机优化研究[J].水电能源科学,2020,38(11):72-76. 被引量：7
6李文武,刘江鹏,蒋志强,裴本林,李黄强.基于HSARSA(λ)算法的水库长期随机优化调度研究[J].水电能源科学,2020,38(12):53-57. 被引量：5
7童华敏,王炜,文昌斌,吴永华,刘江鹏,徐康.基于随机动态规划的水库生态优化调度研究[J].计算机与数字工程,2021,49(9):1924-1929. 被引量：2
8胡鹤轩,尹苏明,胡强,张晔,胡震云,义崇政.基于强化学习算法的水库优化调度研究[J].水电能源科学,2022,40(1):73-77. 被引量：9
9孙桂凯,石锐,刘思怡,王国帅,赵荣娜,莫崇勋.基于长期与中长期嵌套的水库优化调度[J].长江科学院院报,2022,39(8):23-28. 被引量：4
10胡鹤轩,钱泽宇,胡强,张晔.离散四水库问题基准下基于n步Q-learning的水库群优化调度[J].中国水利水电科学研究院学报（中英文）,2023,21(2):138-147. 被引量：4

二级引证文献48

1赵珍玉,张一,李刚,李秀峰,蒋燕,周彬彬,程春田.风电并网条件下的梯级水电站长期优化调度[J].水力发电学报,2020,39(12):62-75. 被引量：17
2贾本军,周建中,陈潇,何中政,张勇传,田梦琦.水电站变出力系数的神经网络估计方法[J].水力发电学报,2021,40(1):88-96. 被引量：6
3朱静茹,张育芝,王安义,李萍.基于Q-学习算法的矿井自适应OFDM调制研究[J].工矿自动化,2021,47(6):109-115. 被引量：1
4郝翠萍.基于多元线性回归模型的考试评价与预测研究[J].电子设计工程,2021,29(15):142-145. 被引量：9
5邱逸凡,李爽,童峰.一种浅海信道自适应调制水声通信方案[J].舰船科学技术,2021,43(10):158-162. 被引量：3
6张忠波,张双虎,耿思敏,何晓燕,李辉,田雨.大清河流域水工程联合防洪调度研究[J].中国水利水电科学研究院学报,2021,19(6):550-556. 被引量：5
7李文武,马浩云,贺中豪,徐康.基于n步Q-learning算法的风电抽水蓄能联合系统日随机优化调度研究[J].水电能源科学,2022,40(1):206-210. 被引量：5
8艾学山,穆振宇,郭佳俊,陈森林,杨百银,高志云.考虑余留效益的水库长期优化调度图集及应用[J].水力发电学报,2022,41(2):20-30. 被引量：8
9郭成威,田书,张腾飞.基于分布鲁棒优化的多源发电系统联合调度[J].电力系统及其自动化学报,2022,34(3):109-115. 被引量：5
10雷源,潘永旗,武新宇,罗锡斌,刘本希,程春田.季调节水电站日水位控制的多目标优选方法——以重庆市江口水电站为例[J].人民长江,2022,53(5):232-238.

1付悦,郭冀戈,高玉潼.基于卷积神经网络的人脸识别研究[J].科学大众（智慧教育）,2018(8):193-193.
2江西省：高位推动,高效联动,有序应对[J].中国防汛抗旱,2018,28(8):7-7. 被引量：1
3谷守信,张建成.基于电价型需求响应的微电网两阶段随机调度方法[J].华北电力大学学报（自然科学版）,2018,45(2):39-46. 被引量：5
4苏锑,杨明,王春香,唐卫,王冰.一种基于分类回归树的无人车汇流决策方法[J].自动化学报,2018,44(1):35-43. 被引量：16
5陈建平,杨正霞,刘全,吴宏杰,徐杨,傅启明.基于值函数迁移的启发式Sarsa算法[J].通信学报,2018,39(8):37-47. 被引量：2
6蒋彧琛,方鹏程.放射性可视化算法在车间生产数据分析中的应用[J].现代信息科技,2018,2(2):176-178.
7夏洋,黄治华.基于NFV和SDN的通信资源虚拟化及调度研究[J].信息与电脑,2018,30(17):141-142. 被引量：1
8Zhenge Guo,Xueguang Gao,Qiang Ma,Jizhong Zhao.Secure Device Pairing via Handshake Detection[J].Tsinghua Science and Technology,2018,23(5):621-633.
9项协宣.项城市政协举行庆祝建党97周年主题活动[J].协商论坛,2018,0(7):61-61.
10雷德明,潘子肖,张清勇.多目标低碳并行机调度研究[J].华中科技大学学报（自然科学版）,2018,46(8):104-109. 被引量：12

水电能源科学

2018年第9期

浏览历史

内容加载中请稍等...

基于SARSA算法的水库长期随机优化调度研究被引量：12

参考文献2

二级参考文献31

共引文献27

同被引文献103

引证文献12

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

基于SARSA算法的水库长期随机优化调度研究 被引量：12

参考文献2

二级参考文献31

共引文献27

同被引文献103

引证文献12

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

基于SARSA算法的水库长期随机优化调度研究被引量：12