检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于竞争双深度Q网络的频谱感知和接入: 1; 作者梁燕胡垚林惠莹《电讯技术》北大核心 2023年第11期1661-1669,共9页; 认知用户通过频谱感知和接入过程识别频谱状态并占用空闲频谱,可有效利用频谱资源。针对频谱感知中存在感知错误和频谱接入中存在用户碰撞的问题,首先建立多用户多信道模型,设计频谱感知和频谱接入过程;然后通过结合双深度Q网络和竞争Q... 展开更多; 关键词频谱感知频谱接入深度强化学习竞争双深度q网络; 下载PDF 职称材料

基于竞争双深度Q网络的动态频谱接入被引量：2: 2; 作者梁燕惠莹《电讯技术》北大核心 2022年第12期1715-1721,共7页; 针对多信道动态频谱接入问题,建立了存在感知错误与接入碰撞的复杂信道场景,提出了一种结合双深度Q网络和竞争Q网络的竞争双深度Q网络学习框架。双深度Q网络将动作的选择和评估分别用不同值函数实现,解决了值函数的过估计问题,而竞争Q... 展开更多; 关键词认知无线电频谱感知动态频谱接入深度强化学习竞争双深度q网络; 下载PDF 职称材料

基于深度强化学习的图书分拣车的路径规划: 3; 作者陈玥《现代电子技术》北大核心 2024年第19期161-168,共8页; 针对图书智能分拣系统中的分拣车路径规划问题,提出一种基于深度强化学习框架和竞争双深度Q网络路径规划算法。将分拣车的路径规划问题构建成马尔可夫决策过程,然后通过结合竞争Q网络和双深度Q网络构建竞争双深度Q网络(D3QN),进而在避... 展开更多; 关键词自动分拣机器人路径规划深度强化学习竞争双深度q网络马尔可夫决策; 下载PDF 职称材料

面向B5G多业务场景基于D3QN的双时间尺度网络切片算法被引量：6: 4; 作者陈赓齐书虎 +1 位作者沈斐曾庆田《通信学报》 EI CSCD 北大核心 2022年第11期213-224,共12页; 为了有效满足不同切片的差异化服务质量需求,面向B5G多业务场景提出了一种基于竞争双深度Q网络(D3QN)的双时间尺度网络切片算法。研究了联合资源切片和调度问题,以归一化处理后的频谱效率和不同切片用户服务质量指数的加权和作为优化目... 展开更多; 关键词双时间尺度资源分配网络切片竞争双深度q网络系统效用; 下载PDF 职称材料

车联网中时延感知的计算卸载和资源分配策略被引量：3: 5; 作者江帆李妍宋琦琳《西安邮电大学学报》 2023年第1期1-8,共8页; 对车联网中多个车辆用户设备(Vehicle User Equipment,VUE)卸载过程中的资源分配问题进行研究,提出一种时延感知的计算卸载和资源分配策略。采用支持向量机将卸载任务根据时延和能耗的要求选择移动边缘计算(Mobile Edge Computing,MEC)... 展开更多; 关键词车联网移动边缘计算计算卸载资源分配支持向量机深度竞争双q网络; 下载PDF 职称材料

混合交通流环境下基于改进强化学习的可变限速控制策略被引量：7: 6; 作者韩磊张轮郭为安《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第3期110-122,共13页; 现有的可变限速(VSL)控制策略灵活性较差,响应速度较慢,对驾驶人遵从度和交通流状态预测模型的依赖性较高,且单纯依靠可变限速标志(VMS)向驾驶人发布限速值,难以在智能网联车辆(CAVs)与人工驾驶车辆(HDVs)混行的交通环境中实现较好的控... 展开更多; 关键词智能交通可变限速控制改进竞争双深度q网络混合交通流智能网联车辆深度强化学习; 下载PDF 职称材料

基于对手动作预测的智能博弈对抗算法被引量：1: 7; 作者韩润海陈浩 +1 位作者刘权黄健《计算机工程与应用》 CSCD 北大核心 2023年第7期190-197,共8页; 智能博弈对抗场景中,多智能体强化学习算法存在“非平稳性”问题,智能体的策略不仅取决于环境,还受到环境中对手(其他智能体)的影响。根据对手与环境的交互信息,预测其策略和意图,并以此调整智能体自身策略是缓解上述问题的有效方式。... 展开更多; 关键词对手动作预测竞争双深度q网络(D3qN) 智能博弈对抗深度强化学习; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部