期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
认知无线网络中基于无休止多臂赌博机模型的多用户频谱接入机制 被引量:5
1
作者 朱江 韩超 +1 位作者 杨浩磊 彭著勋 《计算机应用》 CSCD 北大核心 2014年第10期2782-2786,共5页
针对如何协调多个认知用户择机接入多段空闲频域信道的问题,提出了一种基于无休止多臂赌博机(RMAB)模型的动态频谱接入机制。首先,考虑到实际环境下认知用户的信道感知误差,推导出能有效处理感知误差的Whittle索引值算法,该算法通过历... 针对如何协调多个认知用户择机接入多段空闲频域信道的问题,提出了一种基于无休止多臂赌博机(RMAB)模型的动态频谱接入机制。首先,考虑到实际环境下认知用户的信道感知误差,推导出能有效处理感知误差的Whittle索引值算法,该算法通过历史经验积累给予每个信道一定的信任值,并综合考虑在当前信任值下选择每个信道的立即收益与未来收益的多少,选择出需要感知接入的信道;其次,对于多个认知用户接入相同信道时产生冲突的问题,提出了基于多标拍卖的协调机制,通过多标拍卖的方式处理认知用户之间的冲突。仿真结果表明,在相同的环境中,所提出的频谱接入机制与未处理误差的或者未采用多标拍卖的接入机制相比,认知用户获得的吞吐量更大。 展开更多
关键词 多用户多信道 无休止多臂赌博机模型 多标拍卖 Whittle索引值算法
下载PDF
基于多臂赌博机模型的信道选择 被引量:4
2
作者 朱江 陈红翠 熊加毫 《电讯技术》 北大核心 2015年第10期1094-1100,共7页
在择机频谱接入系统中,为解决未知信道环境先验知识下的信道选择问题,提出了一种基于多臂赌博机(MAB)模型的改进UCB(Upper Confidence Bound)索引选择策略。该策略是通过在UCB索引的置信因子中引入收益方差值来调整对未知信道环境的探... 在择机频谱接入系统中,为解决未知信道环境先验知识下的信道选择问题,提出了一种基于多臂赌博机(MAB)模型的改进UCB(Upper Confidence Bound)索引选择策略。该策略是通过在UCB索引的置信因子中引入收益方差值来调整对未知信道环境的探索过程,以降低探索成本。结合理论证明了本策略有较快的收敛速度,还证明了本策略下的学习后悔值曲线与时隙呈近似对数关系而较缓慢增长。仿真结果表明,与原UCB策略以及贪心算法相比,所提策略更能自适应地选择可用性较好的信道,有效降低学习后悔值并加快其收敛速度,从而提高了系统吞吐量。 展开更多
关键词 认知无线电 择机频谱接入 信道选择 多臂赌博机模型 UCB索引
下载PDF
基于赌博机模型的非时隙信道选择机制
3
作者 朱江 陈红翠 熊加毫 《电子技术应用》 北大核心 2016年第1期91-94,共4页
针对未知信息环境网络中信道资源的选择与分配问题,提出了一种新的信道选择机制。借助于无休止多臂赌博机模型搭建网络系统模型,通过最大期望算法(EMA)实现了未知环境下对非时隙信道使用情况的初步学习,借助Q学习算法实现无休止多臂赌... 针对未知信息环境网络中信道资源的选择与分配问题,提出了一种新的信道选择机制。借助于无休止多臂赌博机模型搭建网络系统模型,通过最大期望算法(EMA)实现了未知环境下对非时隙信道使用情况的初步学习,借助Q学习算法实现无休止多臂赌博机模型下的Gittins索引值的求解,同时确定出在一定干扰约束下的最优信道选择策略,最后通过借助拍卖机制实现系统内认知用户之间信道选择的冲突。经仿真实现验证,提出的新信道选择机制能够很好地避免认知用户对主用户的干扰,使系统中的信道得到高效利用,系统通信量得到大幅提高。 展开更多
关键词 干扰约束 Gittins索引值 Q学习 无休止多臂赌博机
下载PDF
基于鲁棒Restless Bandits模型的多水下自主航行器任务分配策略 被引量:2
4
作者 李鑫滨 章寿涛 +1 位作者 闫磊 韩松 《计算机应用》 CSCD 北大核心 2019年第10期2795-2801,共7页
针对水下监测网络中多自主航行器(AUV)协同信息采集任务分配问题进行了研究。首先,为了同时考虑系统中目标传感器的节点状态与声学信道状态对AUV任务分配问题的影响,构建了水声监测网络系统的综合模型;其次,针对水下存在的多未知干扰因... 针对水下监测网络中多自主航行器(AUV)协同信息采集任务分配问题进行了研究。首先,为了同时考虑系统中目标传感器的节点状态与声学信道状态对AUV任务分配问题的影响,构建了水声监测网络系统的综合模型;其次,针对水下存在的多未知干扰因素并考虑了模型产生不精确的情况,基于强化学习理论将多AUV任务分配系统建模为鲁棒无休止赌博机问题(RBP)。最后,提出鲁棒Whittle算法求解所建立的RBP,从而求解得出多AUV的任务分配策略。仿真结果表明,在干扰环境下与未考虑干扰因素的分配策略相比,在系统分别选择1、2、3个目标时,鲁棒AUV分配策略对应的系统累计回报值参数的性能分别提升了5.5%、12.3%和9.6%,验证了所提方法的有效性。 展开更多
关键词 水声监测网络 水下自主航行器任务分配 鲁棒控制 不确定模型 无休止赌博机问题
下载PDF
基于Whittle索引的RFID多阅读器信道资源分配算法 被引量:5
5
作者 石静 郑嘉利 +2 位作者 袁源 王哲 李丽 《计算机科学》 CSCD 北大核心 2019年第10期122-127,共6页
针对无线射频识别(RFID)系统中多标签-多阅读器环境下标签与信道资源的分配问题,提出了一种基于Whittle索引的多阅读器信道资源分配算法。在RFID多阅读器信道分配问题中建立无休止多臂赌博机(RMAB)模型,并采用Whittle索引算法进行求解... 针对无线射频识别(RFID)系统中多标签-多阅读器环境下标签与信道资源的分配问题,提出了一种基于Whittle索引的多阅读器信道资源分配算法。在RFID多阅读器信道分配问题中建立无休止多臂赌博机(RMAB)模型,并采用Whittle索引算法进行求解。该算法依据信道前期的忙、闲状态,将信道空闲概率作为信任值赋予每个信道,并根据信道当前的信任值计算其Whittle索引值。标签选择索引值最大的信道作为可能感知接入的信道,随后根据每个时隙数据发送成功与否来动态更新信道信任值。对信道分配过程中可能出现的标签碰撞问题,采用等待一个时隙后再根据识别反馈信息重新选择接入信道的方式来解决。将文中所提算法从两个方面与典型的DiCa算法和Gentle算法进行比较:一是在阅读器数量固定的前提下,其系统吞吐量随待识别标签数量的变化情况;二是在待识别标签数量固定的前提下,其系统吞吐量随阅读器数量的变化情况。仿真结果表明,所提算法在上述两种情况下的系统吞吐量均优于DiCa算法和Gentle算法,其吞吐量在阅读器数量固定的前提下分别平均提高了150.34%和23.98%,在待识别标签数量固定的前提下分别平均提高了205.01%和43.37%。随着阅读器和待识别标签数量的增多,所提算法在系统吞吐量方面的优势更加明显。因此,采用提出的算法可以对有限的信道资源进行合理的动态分配,有效提高RFID多阅读器系统的识别效率。 展开更多
关键词 无线射频识别 多标签-多阅读器 无休止多臂赌博机模型 Whittle索引算法
下载PDF
结合聚类与CMAB的群智感知车联网任务分配方法 被引量:1
6
作者 冯心欣 郭丹颖 +1 位作者 柳泽烽 郑海峰 《物联网学报》 2021年第3期86-96,共11页
基于车联网(IoV,Internet of vehicles)用户的群智感知网络具有节点覆盖广泛、数据全面及时等优点。该技术实现的一大难点在于,如何通过充分挖掘和利用车联网用户的信息(如用户地理位置等)来选择合适的感知任务参与者,以合理地进行任务... 基于车联网(IoV,Internet of vehicles)用户的群智感知网络具有节点覆盖广泛、数据全面及时等优点。该技术实现的一大难点在于,如何通过充分挖掘和利用车联网用户的信息(如用户地理位置等)来选择合适的感知任务参与者,以合理地进行任务分配,进而提高感知任务的完成质量和任务发布者收益。为此提出了一种结合车辆用户轨迹特征与组合多臂赌博机(CMAB,combinatorial multi-armed bandits)算法的群智感知用户任务分配机制。首先,基于用户历史行车轨迹的相似程度,将用户聚类。然后,利用CMAB模型,将轨迹聚类信息作为用户任务分配的依据,求解最佳工作者组合。最后,利用真实出租车轨迹数据集对上述算法进行了验证。实验结果表明,考虑轨迹特征信息的任务分配算法具有更高的准确率,并能使任务发布者获得高收益。同时,所选出的工作者集合有相近的行车轨迹,对于同一地点的任务具有高的完成质量,能有效提高感知数据质量和任务发布者收益,适用于实际应用场景。 展开更多
关键词 群智感知 车联网 组合多臂赌博机模型 轨迹聚类 任务分配
下载PDF
衰减信道下具有严格时延的P2P实时通信传输策略 被引量:3
7
作者 田世坤 唐胜达 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第6期122-130,共9页
本文考虑衰减信道下点对点(P2P)的实时通信问题,具体地,设大小已知的传输任务随机到达系统,每个传输任务具有严格时延,考虑系统在随机衰减信道下的实时最优传输策略,使系统贴现总期望收益达到最大。将通信模型转换成Markov决策过程(MDP)... 本文考虑衰减信道下点对点(P2P)的实时通信问题,具体地,设大小已知的传输任务随机到达系统,每个传输任务具有严格时延,考虑系统在随机衰减信道下的实时最优传输策略,使系统贴现总期望收益达到最大。将通信模型转换成Markov决策过程(MDP),考虑到基于MDP架构下的维数灾难,基于无休止赌博机模型(RBP)分析P2P实时传输问题,证明衰减信道下P2P实时通信系统的可索引性,同时给出传输策略的Whittle索引封闭解。本文理论上保证衰减信道下P2P实时传输策略Whittle索引的存在性,并可由Whittle索引封闭解设计低时间复杂度的传输调度算法,对衰减信道下P2P实时通信的设计与优化具有指导意义。 展开更多
关键词 点对点通信 传输策略 无休止赌博机模型 Whittle索引
下载PDF
基于Bandit学习的航空集群认知抗干扰信道选择 被引量:3
8
作者 仇启明 黎海涛 +1 位作者 张昊 罗佳伟 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第5期20-25,共6页
为解决航空集群网络(ASNET)利用认知抗干扰频谱接入时会发生信道碰撞从而降低通信性能问题,研究了基于多臂赌博机(MAB)理论的航空认知抗干扰频域信道选择技术.首先,构建航空集群网络抗干扰信道选择MAB博弈模型,给出了准确估算动态集群... 为解决航空集群网络(ASNET)利用认知抗干扰频谱接入时会发生信道碰撞从而降低通信性能问题,研究了基于多臂赌博机(MAB)理论的航空认知抗干扰频域信道选择技术.首先,构建航空集群网络抗干扰信道选择MAB博弈模型,给出了准确估算动态集群网络电台数量的算法;然后,基于此先验信息提出碰撞规避(CA)的klUCB++抗干扰信道选择策略,并进一步推导出信道碰撞次数的理论上界.仿真结果表明:所提出的CA kl-UCB++抗干扰信道选择策略降低了电台频谱接入的碰撞概率和累积悔值(regret),能够有效提高航空集群网络的频域抗干扰通信性能. 展开更多
关键词 航空集群网络 信道选择 认知抗干扰 kl-UCB++算法 多臂赌博机模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部