期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进DDPG算法的WSN优化策略研究
1
作者
李泽山
郭改枝
《重庆科技学院学报(自然科学版)》
CAS
2024年第3期63-67,共5页
DDPG算法是Actor-Critic和DQN算法的结合体,作为目前深度强化学习中最为经典的算法之一,被广泛应用于WSN。针对DDPG算法训练效率低、收敛速度慢、同步误差大等问题,提出一种基于加权信息熵的深度确定性策略梯度算法。该算法提前对训练...
DDPG算法是Actor-Critic和DQN算法的结合体,作为目前深度强化学习中最为经典的算法之一,被广泛应用于WSN。针对DDPG算法训练效率低、收敛速度慢、同步误差大等问题,提出一种基于加权信息熵的深度确定性策略梯度算法。该算法提前对训练数据进行权重分配,根据权重比例训练数据,并将结果通过神经网络集成。实验结果表明,相较于DQN和DDPG算法,WIE-DDPG算法的训练效率较高、收敛速度较快、同步误差较小。
展开更多
关键词
DDPG
Actor-Critic
DQN
深度强化学习
WSN
wie-ddpg
下载PDF
职称材料
题名
基于改进DDPG算法的WSN优化策略研究
1
作者
李泽山
郭改枝
机构
国家林业和草原局信息中心
内蒙古师范大学计算机科学技术学院
出处
《重庆科技学院学报(自然科学版)》
CAS
2024年第3期63-67,共5页
基金
内蒙古自治区自然科学基金项目“面向邮政行业大数据云端存储及多结构数据转换技术研究”(2020MS06029)
“基于大数据的邮政行业监管系统与服务平台建设”(2020LH06009)
+1 种基金
“无线传感器网络定位技术关键问题研究”(2021LHMS06013)
内蒙古自治区关键技术攻关计划项目“远程控制地下供水管道漏水监测系统的实现”(2020GG0165)。
文摘
DDPG算法是Actor-Critic和DQN算法的结合体,作为目前深度强化学习中最为经典的算法之一,被广泛应用于WSN。针对DDPG算法训练效率低、收敛速度慢、同步误差大等问题,提出一种基于加权信息熵的深度确定性策略梯度算法。该算法提前对训练数据进行权重分配,根据权重比例训练数据,并将结果通过神经网络集成。实验结果表明,相较于DQN和DDPG算法,WIE-DDPG算法的训练效率较高、收敛速度较快、同步误差较小。
关键词
DDPG
Actor-Critic
DQN
深度强化学习
WSN
wie-ddpg
Keywords
DDPG
Actor-Critic
DQN
deep reinforcement learning
WSN
wie-ddpg
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进DDPG算法的WSN优化策略研究
李泽山
郭改枝
《重庆科技学院学报(自然科学版)》
CAS
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部