为求解高维优化问题,提出基于反向学习和衰减因子的灰狼优化算法(grey wolf algorithm based on opposition learning and reduction factor,ORGWO).设计一种灰狼反向学习模型,模型考虑问题搜索边界信息和种群历史搜索信息,初始种群阶...为求解高维优化问题,提出基于反向学习和衰减因子的灰狼优化算法(grey wolf algorithm based on opposition learning and reduction factor,ORGWO).设计一种灰狼反向学习模型,模型考虑问题搜索边界信息和种群历史搜索信息,初始种群阶段增加反向学习,增强种群多样性.根据算法各个阶段不同特征引入衰减因子,平衡全局和局部勘探能力.选取8个高维函数和23个不同特征的优化函数对算法性能进行测试,进一步使用收敛性分析,寻优成功率,CPU时间,Wilcoxon秩和检验来评估改进算法,实验结果表明,ORGWO算法在求解高维问题上具有较好的精度,鲁棒性和更快的收敛速度.展开更多
从众多用户收集的高维数据可用性越来越高,庞大的高维数据涉及用户个人隐私,如何在使用高维数据的同时保护用户的隐私极具挑战性。文中主要关注本地差分隐私下的高维数据发布问题。现有的解决方案首先构建概率图模型,生成输入数据的一...从众多用户收集的高维数据可用性越来越高,庞大的高维数据涉及用户个人隐私,如何在使用高维数据的同时保护用户的隐私极具挑战性。文中主要关注本地差分隐私下的高维数据发布问题。现有的解决方案首先构建概率图模型,生成输入数据的一组带噪声的低维边缘分布,然后使用它们近似输入数据集的联合分布以生成合成数据集。然而,现有方法在计算大量属性对的边缘分布构建概率图模型,以及计算概率图模型中规模较大的属性子集的联合分布时存在局限性。基于此,提出了一种本地差分隐私下的高维数据发布方法PrivHDP(High-dimensional Data Publication Under Local Differential Privacy)。首先,该方法使用随机采样响应代替传统的隐私预算分割策略扰动用户数据,提出自适应边缘分布计算方法计算成对属性的边缘分布构建Markov网。其次,使用新的方法代替互信息度量成对属性间的相关性,引入了基于高通滤波的阈值过滤技术缩减概率图构建过程的搜索空间,结合充分三角化操作和联合树算法获得一组属性子集。最后,基于联合分布分解和冗余消除,计算属性子集上的联合分布。在4个真实数据集上进行实验,结果表明,PrivHDP算法在k-way查询和SVM分类精度方面优于同类算法,验证了所提方法的可用性与高效性。展开更多
针对数据维度与规模的不断增加,高维空间下异常检测愈发困难的问题,以Web of Science核心合集数据库为样本数据,通过可视化软件CiteSpace生成可视化图谱进行文献计量。结果表明:高维数据异常检测领域自1999年起,整体呈稳定上升趋势,中...针对数据维度与规模的不断增加,高维空间下异常检测愈发困难的问题,以Web of Science核心合集数据库为样本数据,通过可视化软件CiteSpace生成可视化图谱进行文献计量。结果表明:高维数据异常检测领域自1999年起,整体呈稳定上升趋势,中国发文数量最多但成果质量不如英国和日本。随着机器学习和深度学习等新兴智能技术的革新发展,将优化后的算法技术应用到具体场景,将会是该领域的未来发展趋势。展开更多
高维因子模型在超高维度的大型数据集降维处理中发挥了重要作用。目前,高维因子模型有两种主成分估计方法,分别是基于协方差的主成分估计PCE和基于滞后自协方差的主成分估计LPCE。本文以S & P 500公司股票数据的高维因子建模为例,...高维因子模型在超高维度的大型数据集降维处理中发挥了重要作用。目前,高维因子模型有两种主成分估计方法,分别是基于协方差的主成分估计PCE和基于滞后自协方差的主成分估计LPCE。本文以S & P 500公司股票数据的高维因子建模为例,比较了PCE和LPCE在高维股票数据降维中的实际表现,其中因子个数通过信息准则法和特征值比值估计法确定。结果表明,在高维非平稳序列因子模型中,PCE的均方根误差和预测误差都比LPCE小,PCE得到的因子也比LPCE更能捕捉高维非平稳序列变化特征。在高维平稳序列因子模型中,PCE和LPCE的估计误差相同,两者的估计因子均能还原高维平稳序列的变化特征。此外,在确定因子个数时,信息准则倾向于高估因子个数,表现出严重的过拟合。特征值比值估计法的估计结果相对更准确和稳定,在PCE中倾向于放弃相对弱势的主成分,在LPCE中则倾向于将弱势的主成分视为因子。展开更多
针对基本正弦余弦算法(sine cosine algorithm,SCA)求解高维复杂优化问题时存在精度低、收敛慢和易陷入局部最优等缺点,提出一种改进的SCA(improved sine cosine algorithm,iSCA)。首先,该算法设计出一种基于倒S形函数的非线性转换参数...针对基本正弦余弦算法(sine cosine algorithm,SCA)求解高维复杂优化问题时存在精度低、收敛慢和易陷入局部最优等缺点,提出一种改进的SCA(improved sine cosine algorithm,iSCA)。首先,该算法设计出一种基于倒S形函数的非线性转换参数规则替代原有线性策略,从而实现从全局搜索到局部搜索的良好过渡;其次,嵌入个体历史最佳信息修改位置搜索方程以指导寻优过程,进一步改善算法的解精度和加快收敛;最后,引入翻筋斗觅食机制生成新的位置以增加群体多样性,从而降低算法陷入局部最优的概率。选取10个高维基准测试函数、10个UCI高维数据集和2个风电机组故障数据集进行仿真实验,并与基本SCA、MSCA(memoryguided SCA)和I-GWO(improved grey wolf optimizer)算法比较,结果表明,iSCA算法在精度和收敛指标上均优于其他比较方法。展开更多
文摘为求解高维优化问题,提出基于反向学习和衰减因子的灰狼优化算法(grey wolf algorithm based on opposition learning and reduction factor,ORGWO).设计一种灰狼反向学习模型,模型考虑问题搜索边界信息和种群历史搜索信息,初始种群阶段增加反向学习,增强种群多样性.根据算法各个阶段不同特征引入衰减因子,平衡全局和局部勘探能力.选取8个高维函数和23个不同特征的优化函数对算法性能进行测试,进一步使用收敛性分析,寻优成功率,CPU时间,Wilcoxon秩和检验来评估改进算法,实验结果表明,ORGWO算法在求解高维问题上具有较好的精度,鲁棒性和更快的收敛速度.
文摘从众多用户收集的高维数据可用性越来越高,庞大的高维数据涉及用户个人隐私,如何在使用高维数据的同时保护用户的隐私极具挑战性。文中主要关注本地差分隐私下的高维数据发布问题。现有的解决方案首先构建概率图模型,生成输入数据的一组带噪声的低维边缘分布,然后使用它们近似输入数据集的联合分布以生成合成数据集。然而,现有方法在计算大量属性对的边缘分布构建概率图模型,以及计算概率图模型中规模较大的属性子集的联合分布时存在局限性。基于此,提出了一种本地差分隐私下的高维数据发布方法PrivHDP(High-dimensional Data Publication Under Local Differential Privacy)。首先,该方法使用随机采样响应代替传统的隐私预算分割策略扰动用户数据,提出自适应边缘分布计算方法计算成对属性的边缘分布构建Markov网。其次,使用新的方法代替互信息度量成对属性间的相关性,引入了基于高通滤波的阈值过滤技术缩减概率图构建过程的搜索空间,结合充分三角化操作和联合树算法获得一组属性子集。最后,基于联合分布分解和冗余消除,计算属性子集上的联合分布。在4个真实数据集上进行实验,结果表明,PrivHDP算法在k-way查询和SVM分类精度方面优于同类算法,验证了所提方法的可用性与高效性。
文摘针对数据维度与规模的不断增加,高维空间下异常检测愈发困难的问题,以Web of Science核心合集数据库为样本数据,通过可视化软件CiteSpace生成可视化图谱进行文献计量。结果表明:高维数据异常检测领域自1999年起,整体呈稳定上升趋势,中国发文数量最多但成果质量不如英国和日本。随着机器学习和深度学习等新兴智能技术的革新发展,将优化后的算法技术应用到具体场景,将会是该领域的未来发展趋势。
文摘高维因子模型在超高维度的大型数据集降维处理中发挥了重要作用。目前,高维因子模型有两种主成分估计方法,分别是基于协方差的主成分估计PCE和基于滞后自协方差的主成分估计LPCE。本文以S & P 500公司股票数据的高维因子建模为例,比较了PCE和LPCE在高维股票数据降维中的实际表现,其中因子个数通过信息准则法和特征值比值估计法确定。结果表明,在高维非平稳序列因子模型中,PCE的均方根误差和预测误差都比LPCE小,PCE得到的因子也比LPCE更能捕捉高维非平稳序列变化特征。在高维平稳序列因子模型中,PCE和LPCE的估计误差相同,两者的估计因子均能还原高维平稳序列的变化特征。此外,在确定因子个数时,信息准则倾向于高估因子个数,表现出严重的过拟合。特征值比值估计法的估计结果相对更准确和稳定,在PCE中倾向于放弃相对弱势的主成分,在LPCE中则倾向于将弱势的主成分视为因子。
文摘针对基本正弦余弦算法(sine cosine algorithm,SCA)求解高维复杂优化问题时存在精度低、收敛慢和易陷入局部最优等缺点,提出一种改进的SCA(improved sine cosine algorithm,iSCA)。首先,该算法设计出一种基于倒S形函数的非线性转换参数规则替代原有线性策略,从而实现从全局搜索到局部搜索的良好过渡;其次,嵌入个体历史最佳信息修改位置搜索方程以指导寻优过程,进一步改善算法的解精度和加快收敛;最后,引入翻筋斗觅食机制生成新的位置以增加群体多样性,从而降低算法陷入局部最优的概率。选取10个高维基准测试函数、10个UCI高维数据集和2个风电机组故障数据集进行仿真实验,并与基本SCA、MSCA(memoryguided SCA)和I-GWO(improved grey wolf optimizer)算法比较,结果表明,iSCA算法在精度和收敛指标上均优于其他比较方法。