期刊文献+
共找到5,620篇文章
< 1 2 250 >
每页显示 20 50 100
基于特征选择及ISSA-CNN-BiGRU的短期风功率预测 被引量:2
1
作者 王瑞 徐新超 逯静 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第3期228-239,共12页
针对风电功率随机性大、平稳性低,以及直接输入预测模型往往难以取得较高精度等问题,提出了一种基于特征选择及改进麻雀搜索算法(ISSA)优化卷积神经网络-双向门控循环单元(CNN-BiGRU)的短期风电功率预测方法。首先,利用变分模态分解(VMD... 针对风电功率随机性大、平稳性低,以及直接输入预测模型往往难以取得较高精度等问题,提出了一种基于特征选择及改进麻雀搜索算法(ISSA)优化卷积神经网络-双向门控循环单元(CNN-BiGRU)的短期风电功率预测方法。首先,利用变分模态分解(VMD)将原始功率分解为一组包含不同信息的子分量,以降低原始功率序列的非平稳性,提升可预测性,同时通过观察中心频率方式确定模态分解数。其次,对每一分量采用随机森林(RF)特征重要度的方法进行特征选择,从风速、风向、温度、空气密度等气象特征因素中,选取对各个分量预测贡献度较高的影响因素组成输入特征向量。然后,建立各分量的CNN-BiGRU预测模型,针对神经网络算法参数难调、手动配置参数随机性大的问题,利用ISSA对模型超参数寻优,自适应搜寻最优参数组合。最后,叠加各分量的预测值,得到最终的预测结果。以中国内蒙古某风电场实际数据进行仿真实验,与多种单一及组合预测方法进行对比,结果表明,本文所提方法相比于其他方法具有更高的预测精度,其平均绝对百分比误差值达到2.644 0%;在其他4个数据集上进行的模型准确性及泛化性验证结果显示,模型平均绝对百分比误差值分别为4.385 3%、3.174 9%、1.576 1%和1.358 8%,均保持在5.000 0%以内,证明本文所提方法具有较好的预测精度及泛化能力。 展开更多
关键词 短期风功率预测 变分模态分解 特征选择 改进麻雀搜索算法 卷积神经网络 双向门控循环单元
下载PDF
采用进化计算的高维多模态特征选择
2
作者 丁转莲 胡曦 +3 位作者 曹略 孙登第 张兴义 王晨旭 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第9期117-128,共12页
针对特征选择问题中的多模态特性和高维特性,引入新的种群初始化策略对大规模多模态多目标优化算法进行改进,提出了一种基于进化多目标优化的高维多模态特征选择算法。对原始的连续优化算法进行离散化处理,用于评价离散优化问题中的个体... 针对特征选择问题中的多模态特性和高维特性,引入新的种群初始化策略对大规模多模态多目标优化算法进行改进,提出了一种基于进化多目标优化的高维多模态特征选择算法。对原始的连续优化算法进行离散化处理,用于评价离散优化问题中的个体,并在6个高维特征选择数据集上进行验证。结果表明:所提算法提升了初始种群的质量并加快了算法的收敛;相比于其他同类算法,所提算法获得了更优的帕累托前沿,其超体积指标值整体最优,并且在不影响分类精度的前提下可获得平均2.53个等效特征子集,表明所提算法具有最好的分类精度和最多样化的等效特征子集。 展开更多
关键词 分类 特征选择 进化计算 多模态多目标优化 高维多模态特征选择
下载PDF
面向特征选择任务的改进蜣螂优化算法 被引量:1
3
作者 李珺 徐秦 《电子测量技术》 北大核心 2024年第1期79-86,共8页
蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:... 蜣螂优化算法是一种基于蜣螂不同行为模式的新型启发式算法,与其他算法相比的收敛速度更快,逃脱局部最优的能力更强。针对蜣螂优化算法不能进行特征选择的问题,在蜣螂优化算法的基础上提出了蜣螂灰狼融合算法。该算法基于3种改进策略:精英初始化种群策略、灰狼蜣螂融合策略、运行加速策略,进一步提高蜣螂优化算法在特征选择任务上的性能,并给出了算法整体的伪代码。实验结果表明,比较其他改进型启发式算法,蜣螂灰狼融合优化算法在12个分类数据集中能够得到更高精度、更低维度的特征子集,同时兼备收敛速度、运行速度更快的优点。 展开更多
关键词 特征选择 蜣螂优化算法 分类
原文传递
基于不一致近邻的模糊粗糙集特征选择
4
作者 赵洁 叶文浩 +2 位作者 梁周扬 陈建新 董振宁 《计算机工程》 CSCD 北大核心 2024年第1期110-119,共10页
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个... 模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率。同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度。通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序。在此基础上,提出新的模糊粗糙集特征选择算法。在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%。 展开更多
关键词 模糊粗糙集 特征选择 水平截集 不一致近邻 属性重要度
下载PDF
增强学习标签相关性的多标签特征选择方法
5
作者 滕少华 卢建磊 +1 位作者 滕璐瑶 张巍 《计算机应用研究》 CSCD 北大核心 2024年第7期2079-2086,共8页
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合... 针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。 展开更多
关键词 多标签学习 特征选择 标签相关性 聚类
下载PDF
具有潜在表示和动态图约束的多标签特征选择
6
作者 李坤 刘婧 齐赫 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1188-1202,共15页
针对现有嵌入式方法忽略实例相关性的潜在表示对伪标记学习的影响以及固定的图矩阵导致计算误差随迭代的加深而不断增大的问题,提出一种具有潜在表示和动态图约束的多标签特征选择方法.该方法首先利用实例相关性的潜在表示构造伪标签矩... 针对现有嵌入式方法忽略实例相关性的潜在表示对伪标记学习的影响以及固定的图矩阵导致计算误差随迭代的加深而不断增大的问题,提出一种具有潜在表示和动态图约束的多标签特征选择方法.该方法首先利用实例相关性的潜在表示构造伪标签矩阵,并将其与线性映射和最小化伪标签与真实标签之间的Friedman范数距离相结合,从而保证伪标签与真实标签之间具有较高的相似性.其次,利用伪标签的低维流形结构构建动态图,以缓解固定图矩阵导致的随迭代深度增加计算误差的问题.在12个数据集上与7种先进方法的对比实验结果表明,该方法的整体分类性能优于现有先进方法,能较好地处理多标记特征选择问题. 展开更多
关键词 多标签学习 特征选择 潜在表示 动态图 流形学习
下载PDF
基于轻量化特征选择的镜片多尺度缺陷检测系统研究
7
作者 许桢英 杨钰峂 +3 位作者 雷英俊 王匀 武子乾 韩丽玲 《计量学报》 CSCD 北大核心 2024年第6期786-794,共9页
为解决对镜片缺陷识别和定位困难的问题,设计了一种基于轻量化特征选择(LFSN)的镜片多尺度缺陷检测系统。首先通过四步相移栅格光成像系统采集缺陷图像,基于傅里叶变换对图像进行融合以提高图像质量;然后,LFSN使用自动特征层选择结构,... 为解决对镜片缺陷识别和定位困难的问题,设计了一种基于轻量化特征选择(LFSN)的镜片多尺度缺陷检测系统。首先通过四步相移栅格光成像系统采集缺陷图像,基于傅里叶变换对图像进行融合以提高图像质量;然后,LFSN使用自动特征层选择结构,在训练过程中计算无锚框分支损失,获得最优特征层信息,更新参数,从而优化模型对不同缺陷大小信息的学习能力;还使用了深度分离可变卷积,通过双线性插值增加像素点在平面的偏移量,从而提升模型对缺陷形貌的主动学习能力,并一定程度减少模型训练参数量,降低检测时间,同时优化回归定位损失明确各阶段训练任务,利用一次惩罚项指导前期预测框中心距离回归;利用归一化二次项,指导后期预测框大小比例回归,使预测框更接近真实值;最后,通过实验采集镜片缺陷图像,并构建数据集进行对比实验。实验结果表明:识别和定位镜片的缺陷的准确率为96.3%,单幅检测时间为24.9 ms。 展开更多
关键词 光学计量 镜片 缺陷检测 栅格光成像 轻量化特征选择 混合交并比
下载PDF
基于LightGBM-VIF-MIC-SFS的风电机组故障诊断输入特征选择方法
8
作者 马良玉 程东炎 +2 位作者 梁书源 耿妍竹 段新会 《热力发电》 CAS CSCD 北大核心 2024年第1期154-164,共11页
针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有... 针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有特征的重要性计算,确定初步特征空间;其次,根据方差膨胀因子(VIF)和最大信息系数(MIC)构建相关性判别阵,据此评估一次筛选中重要性相近的特征,舍弃相似性高的输入特征;最后,使用序列前向搜索法对特征进行第3次处理,逐个输入前2次特征选择获得的特征,保留能提升系统性能的特征,从而实现最终特征的选取。在完成了模型的建立后,使用风电场真实SCADA系统数据进行性能评估,将所提方法与2种对比算法在6个数据集上进行对比,结果显示所提出的LightGBM-VIF-MIC-SFS相较2种对比特征选择算法有显著优势。对所提方法内部的3个模块进行了消融实验,有效验证了所提特征选取方法内部各个模块的有效性以及基于所提方法得到的最优特征空间的合理性及准确性。 展开更多
关键词 风电机组 特征选择 LightGBM 方差膨胀因子 最大信息系数 序列前向搜索
下载PDF
基于特征选择的LightGBM算法预测钠离子电池剩余寿命
9
作者 史永胜 翟欣然 +1 位作者 栾飞 胡玙珺 《陕西科技大学学报》 北大核心 2024年第2期174-181,共8页
钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相... 钠离子电池剩余使用寿命(RUL)的准确预测对于可再生能源系统中的大规模储能设备具有重要意义.提出了一种基于特征选择的LightGBM方法来预测钠离子电池的剩余使用寿命.通过结合Pearson相关系数和灰色关联度,选择了四个与电池寿命高度相关且不同特征之间自相关程度较低的最佳特征.采用LightGBM模型,并结合网格搜索(GridSearchCV)算法对其超参数进行优化,以达到最佳的预测性能.通过钠离子电池数据验证了预测模型的优越性,并与使用GridSearchCV算法的GBRD和RF模型在相同条件下进行比较.结果表明,该方法能够显著加快模型运算速度,并相比传统算法具有更高的可靠性和更好的预测性能,预测的最大MAE、MSE、RMSE分别不超过3.0、17.7、4.2. 展开更多
关键词 钠离子电池 剩余使用寿命 LightGBM 特征选择
下载PDF
基于特征选择和ELM神经网络的轴承可靠性预测
10
作者 高淑芝 陈国庆 +1 位作者 张义民 陈一丹 《机械设计与制造》 北大核心 2024年第8期170-173,共4页
针对滚动轴承可靠性预测问题,提出了基于特征选择和ELM网络的可靠性预测方法。首先,对振动信号提取特征,构成特征参数初选集;其次,引入单调性、相关性、鲁棒性三个特征评价指标对特征参数初选集进行特征评价,并定义了一种新的限制性指标... 针对滚动轴承可靠性预测问题,提出了基于特征选择和ELM网络的可靠性预测方法。首先,对振动信号提取特征,构成特征参数初选集;其次,引入单调性、相关性、鲁棒性三个特征评价指标对特征参数初选集进行特征评价,并定义了一种新的限制性指标,得到可以反映轴承退化过程的参数,构成退化特征参数集;再次,对退化特征参数集进行维数约简,构成低维特征向量集;最后,以退化特征参数集和特征向量集分别为输入数据和标签带入ELM网络中做可靠性预测。通过西安交通大学轴承振动信号数据集证明了该方法的有效性。 展开更多
关键词 特征评价指标 特征选择 ELM神经网络 可靠性预测
下载PDF
基于生物入侵的特征选择算法
11
作者 张健 张博 《计算机工程》 CAS CSCD 北大核心 2024年第9期46-53,共8页
在自然界中,生物入侵以其发展的迅速和巨大的生态影响而受到关注,所引入种群对合适栖息地的寻找过程往往有其内在的逻辑,种群之间的交流和种群的扩张也在这个过程中起到了重要作用。通过探究种群对适宜栖息地的寻找原理,提出一种基于生... 在自然界中,生物入侵以其发展的迅速和巨大的生态影响而受到关注,所引入种群对合适栖息地的寻找过程往往有其内在的逻辑,种群之间的交流和种群的扩张也在这个过程中起到了重要作用。通过探究种群对适宜栖息地的寻找原理,提出一种基于生物入侵的特征选择(BIAFS)算法。在BIAFS算法中,生物入侵过程分为种群建立、种群迁移、种群交流和扩张、种群发展4个阶段。在实验验证过程中,在9个数据集上将BIAFS算法与8种高性能算法进行实验比较。实验结果显示,BIAFS算法在7个数据集上的分类准确率(CA)和降维(DR)率均超过了对比算法。此外,适应度标准偏差的比较实验也证实了BIAFS算法的高稳定性,表明其在多个数据集上能更加稳健地寻找最优解。上述实验结果证明了BIAFS算法在特征选择任务中的有效性和优越性。 展开更多
关键词 生物入侵 特征选择 入侵动态 差分进化 精英策略
下载PDF
进化计算在大规模高维特征选择中的应用综述
12
作者 叶志伟 王巧 +3 位作者 周雯 王明威 蔡婷 何其祎 《北方工业大学学报》 2024年第2期8-19,共12页
随着大数据时代的到来,数据的规模和特征维度呈现爆炸式增长,这给数据处理带来了前所未有的挑战。特征选择作为数据预处理的关键环节,在处理大规模高维数据时显得尤为重要。而进化计算方法因其出色的全局搜索能力和高效的优化性能,越来... 随着大数据时代的到来,数据的规模和特征维度呈现爆炸式增长,这给数据处理带来了前所未有的挑战。特征选择作为数据预处理的关键环节,在处理大规模高维数据时显得尤为重要。而进化计算方法因其出色的全局搜索能力和高效的优化性能,越来越多的研究者开始对其进行研究,其在大规模高维特征选择中得到了广泛的应用。本文首先介绍了大规模高维数据处理的重要性;然后简单介绍了部分经典和较新的进化计算方法,并详细介绍了其在大规模高维特征选择中的应用情况;最后对目前进化计算在大规模高维特征选择中存在的问题进行总结,并展望了其未来的发展方向。 展开更多
关键词 特征选择 进化计算 全局搜索 数据预处理 机器学习
下载PDF
采用动态相关度权重的特征选择算法
13
作者 许华杰 刘冠霆 +1 位作者 张品 秦远卓 《计算机工程与应用》 CSCD 北大核心 2024年第4期89-98,共10页
基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对... 基于互信息的特征选择算法在考虑候选特征提供的新分类信息时,通常忽略了候选特征的加入会使得已选特征和类标签的相关性发生变化而带来额外的新增信息量,以及在计算冗余信息时采用累加求和的形式可能导致低估候选特征的冗余程度。针对以上问题,提出动态相关度权重的定义,以更全面地考虑候选特征带来的新信息量成分;提出改进冗余项的定义,采用取最大值和归一化策略,以解决传统算法存在的低估冗余问题;在此基础上提出一种采用动态相关度权重的特征选择算法(feature selection using dynamic relevance weight,FSDRW)。选取五种当前主流的基于互信息的过滤式特征选择算法进行对比实验,在来自加州大学尔湾分校UCI和亚利桑那州立大学ASU的机器学习测试数据集上的实验表明,所提出的算法在分类准确率及综合性能方面具有较好的表现。最后将所提出算法应用于广西某水库工程的微震、爆破信号识别中,算法选取出的特征用于微震信号识别可达到98.86%的分类准确率,验证了算法在实际应用中的有效性。 展开更多
关键词 特征选择 互信息 信息熵 动态相关度权重
下载PDF
面向高维不平衡数据的特征选择算法
14
作者 王振飞 袁佩瑶 +1 位作者 曹中亚 张利莹 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1839-1846,共8页
针对传统高维不平衡数据集的分类算法存在偏向多数类、忽视少数类等问题,本文提出一种基于密度聚类和重要性度量的特征选择算法(DBIM).首先通过随机降采样的方法构造出多个平衡子集,使用DBSCAN密度聚类方法作为基分类器生成初始特征子空... 针对传统高维不平衡数据集的分类算法存在偏向多数类、忽视少数类等问题,本文提出一种基于密度聚类和重要性度量的特征选择算法(DBIM).首先通过随机降采样的方法构造出多个平衡子集,使用DBSCAN密度聚类方法作为基分类器生成初始特征子空间.然后按照重要度对特征进行排序选择出较强分类的特征.最后,为了避免特征之间的冗余性,设计基于类分布的权重指标与冗余性评价指标相结合的方法进行计算,生成高质量的特征子集.在8个公开数据集上的实验结果表明,本文提出DBIM算法可以生成高相关度且低冗余度的特征子集,对高维不平衡数据集进行有效降维,提高分类性能. 展开更多
关键词 高维不平衡数据集 密度聚类 特征选择 相关性 冗余性
下载PDF
二进制鼠群优化算法的特征选择及数据分类
15
作者 鲍美英 申晋祥 《计算机与数字工程》 2024年第6期1612-1616,1675,共6页
针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,... 针对特征选择技术中提高分类准确率和降低特征选取个数随着数据维度增加而难度加大的问题,对新型仿生优化算法的鼠群优化算法进行改进,在算法中引入转换函数,使用K近邻法作为分类器,提出二进制鼠群优化算法,用于特征选择,进行数据分类,对特征进行有效的降维并减少数据分类的错误率。在UCI的10个数据集上进行测试,并与遗传算法、粒子群算法、樽海鞘群算法和正余弦算法进行比较,实验结果表明,所提算法能够提高数据分类准确率并有效降低特征维度,算法具有较好的收敛性和鲁棒性。 展开更多
关键词 鼠群优化算法 特征选择 数据分类 K近邻
下载PDF
融合对比学习和特征选择的入侵检测模型
16
作者 陈虹 程明佳 +2 位作者 金海波 武聪 姜朝议 《信息安全研究》 CSCD 北大核心 2024年第5期453-461,共9页
入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature sele... 入侵检测系统可以主动识别恶意流量,是保护网络安全的重要工具.针对网络流量中存在的冗余特征以及现有的入侵检测算法在特征选择过程中存在的不足,提出一种融合对比学习和特征选择的入侵检测模型(contrastive learning and feature selection,CL-FS).利用皮尔逊相关系数(Pearson correlation coefficient,PCCs)对预处理后的网络流量进行相关性分析,过滤掉相似特征;使用自编码器(autoencoder,AE)进行深度特征提取,在提取阶段融入对比学习,减少类间相似性,将提取的新特征和过滤后的特征融合,得到表征能力更强的特征集;利用改进的鸽群算法进行包裹特征选择,根据贝叶斯分类器的性能选择最优特征子集,提高分类精度.在NSL-KDD,UNSW-NB15这2个数据集的实验结果表明,CL-FS模型可以提升分类精度并减少处理时间,在2个数据集上的2分类实验准确率分别为90.45%和88.52%,分类处理时间大约减少为原来的一半. 展开更多
关键词 对比学习 皮尔逊相关系数 鸽群算法 特征提取 特征选择
下载PDF
机器学习特征选择法挖掘子宫内膜癌死亡风险基因
17
作者 陈容前 贲培玲 +1 位作者 苏日娜 周明月 《长治医学院学报》 2024年第5期329-333,339,共6页
目的:基于机器学习特征选择法挖掘子宫内膜癌的死亡风险基因并评估其作为预后和治疗标志物的潜力。方法:从癌症基因组图谱(TCGA)数据库下载TCGA-UCEC获取子宫体腺瘤和腺癌基因表达数据。利用edgeR和DESeq法筛选肿瘤组织与正常组织的差... 目的:基于机器学习特征选择法挖掘子宫内膜癌的死亡风险基因并评估其作为预后和治疗标志物的潜力。方法:从癌症基因组图谱(TCGA)数据库下载TCGA-UCEC获取子宫体腺瘤和腺癌基因表达数据。利用edgeR和DESeq法筛选肿瘤组织与正常组织的差异表达基因。采用特征选择SelectKBest单因素选择法、PCA降维法及决策树模型特征重要性法筛选死亡风险基因,结合逻辑回归、决策树、随机森林、支持向量机、K-近邻算法的预测综合表现筛选关键基因。使用Metascape在线工具进行基因注释及功能富集分析,使用Kaplan-Meier plotter(KM plotter)进行单基因生存分析及Log-Rank检验,使用TIMER2.0进行单基因单因素或多因素COX回归分析。结果:最终筛选出15个子宫内膜癌死亡相关风险基因,包括6个良好预后基因和1个不良预后基因,其中独立死亡风险基因为RPP40(P<0.001)。结论:机器学习特征选择法可有效挖掘子宫内膜癌标志物,RPP40为潜在预测性标志物。 展开更多
关键词 机器学习 特征选择 子宫内膜癌 标志物
下载PDF
改进麻雀搜索算法的入侵检测特征选择
18
作者 刘涛 蒙学强 《计算机工程与设计》 北大核心 2024年第4期989-996,共8页
针对网络入侵检测所处理数据存在特征维数高、检测效率低、准确率不高的问题,提出一种改进麻雀搜索算法的特征选择方法,旨在减少特征冗余的同时提高分类准确率。利用改进Circle映射初始化种群;结合秃鹰搜索算法中的螺旋搜索方式更新发... 针对网络入侵检测所处理数据存在特征维数高、检测效率低、准确率不高的问题,提出一种改进麻雀搜索算法的特征选择方法,旨在减少特征冗余的同时提高分类准确率。利用改进Circle映射初始化种群;结合秃鹰搜索算法中的螺旋搜索方式更新发现者位置;采用单纯形法和小孔成像法优化适应度较差和最优麻雀的位置,提升算法的寻优能力。将该算法与其它算法在6个经典基准函数上进行对比测试,其在收敛速度、精度等方面均有提升。使用数据集CIC-IDS2017进行特征选择实验,平均保留了7.6个特征,准确率达到了99.5%,结果表明,该算法可以在保证准确率的同时有效降低特征维度。 展开更多
关键词 麻雀搜索算法 Circle映射 螺旋搜索 单纯形法 小孔成像 入侵检测 特征选择
下载PDF
基于互信息与萤火虫算法的网络入侵特征选择
19
作者 王新胜 杨锐 《计算机应用与软件》 北大核心 2024年第4期306-312,320,共8页
为减少网络入侵检测数据中的冗余特征,提出一种结合互信息和萤火虫算法的特征选择方法。针对互信息不能精确计算特征间冗余度,提出类内特征冗余互信息特征选择方法。针对萤火虫算法步长因子固定易使算法陷入局部最优等问题,提出自适应... 为减少网络入侵检测数据中的冗余特征,提出一种结合互信息和萤火虫算法的特征选择方法。针对互信息不能精确计算特征间冗余度,提出类内特征冗余互信息特征选择方法。针对萤火虫算法步长因子固定易使算法陷入局部最优等问题,提出自适应步长萤火虫算法特征选择。以上方法分别选取特征子集后利用投票策略选取最优子集,对该子集基于C4.5和贝叶斯网络分类器分类。实验结果表明,使用10个特征检测能有效提高入侵检测率、误报率和F-measure,同时还缩短训练和检测时间。此外,与现有的几种方法相比,该方法在准确率、检测率和F-measure都获得不错效果。 展开更多
关键词 网络入侵检测 特征选择 投票策略 互信息 萤火虫算法
下载PDF
基于模糊邻域判别指数的在线流组特征选择
20
作者 徐久成 孙元豪 韩子钦 《计算机工程与设计》 北大核心 2024年第3期806-813,共8页
在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数... 在线流组特征选择可以充分利用特征流中原始的组结构信息,以在线的方式处理特征选择问题。然而,现有方法大多无法处理具有模糊性和不确定性的数据。为此,提出一种基于模糊邻域判别指数的在线流组特征选择算法。设计一种模糊邻域判别指数,用于描述模糊邻域粒的判别信息,扩展相关的不确定性度量方法。在此基础上,用组内特征选择和组间特征选择两种策略选择具有强近似能力且非冗余的特征。在8个公共数据集上进行对比实验,验证了该算法具有更优且稳定的分类性能。 展开更多
关键词 特征选择 特征选择 流组 模糊粗糙集 模糊邻域熵 邻域判别指数 不确定性度量
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部