-
题名基于深度强化学习的无人机辅助弹性视频多播机制
- 1
-
-
作者
成昭炜
沈航
汪悦
王敏
白光伟
-
机构
南京工业大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2021年第9期271-277,共7页
-
基金
国家自然科学基金项目(61502230)
江苏省自然科学基金项目(BK20201357)
+3 种基金
江苏省“六大人才高峰”高层次人才资助项目(RJFW-020)
计算机软件新技术国家重点实验室资助项目(KFKT2017B21)
江苏省研究生科研与实践创新计划项目(KYCX20_1079,SJCX20_0351)
国家教育部2019年第二批产学合作协同育人项目(201902182003)。
-
文摘
文中提出了一个异构网络下无人机基站辅助的弹性视频多播机制。结合SVC编码,将无人机动态部署和资源分配问题联合考虑,目的是最大化用户整体的视频质量。考虑到宏基站覆盖范围内用户的移动会使网络拓扑结构发生改变,传统的启发式算法难以应对用户移动的复杂性。对此,采用基于深度强化学习的DDPG算法训练神经网络来决策无人机的最佳部署位置和带宽资源分配比重。在模型收敛后,学习代理可以在较短的时间内找到最优的无人机部署和带宽分配策略。仿真结果表明,所提方案达到了预期目标并且优于现有的基于Q-learning的方案。
-
关键词
可伸缩视频编码
多播
深度强化学习
无人机
移动互联网
-
Keywords
Scalable video coding(SVC)
Multicast
Deep reinforcement learning
Unmanned aerial vehicles
Mobile Internet
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名移动群智感知中基于强化学习的双赢博弈
被引量:5
- 2
-
-
作者
蔡威
白光伟
沈航
成昭炜
张慧丽
-
机构
南京工业大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第10期41-47,共7页
-
基金
国家自然科学基金(61502230)
江苏省自然科学基金(BK20150960)
+1 种基金
江苏省“六大人才高峰”高层次人才资助项目(RJFW-020)
计算机软件新技术国家重点实验室(南京大学)资助项目(KFKT2017B21)。
-
文摘
移动群智感知系统需要为用户提供个性化隐私保护,以吸引更多用户参与任务。然而,由于恶意攻击者的存在,用户提升隐私保护力度会导致位置可用性变差,降低任务分配效率。针对该问题,提出了一种基于强化学习的用户与平台共赢的博弈机制。该机制首先通过可信第三方的两个虚拟实体分别模拟用户并与平台进行交互,一个模拟用户选择隐私预算为位置数据添加噪声,另一个模拟平台根据用户的扰动位置分配任务;然后,将交互过程构建为博弈,并推导出均衡点,其中交互的两个虚拟实体就是博弈双方;最后,使用强化学习方法不断尝试不同的位置扰动策略,输出一个最优的位置扰动方案。实验结果表明,该机制能在优化任务分配效用的同时,尽可能地提高用户的整体效用,使用户与平台达成双赢。
-
关键词
移动群智感知
任务分配
个性化隐私保护
博弈论
强化学习
-
Keywords
Mobile crowdsensing
Task allocation
Personalized privacy-preserving
Game theory
Reinforcement learning
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-