期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
轻梯度提升机算法的发展与应用
1
作者 魏佳妹 袁书娟 +2 位作者 孔闪闪 杨爱民 赵晨颖 《计算机工程与应用》 北大核心 2025年第5期32-42,共11页
轻梯度提升机算法(light gradient boosting machine,LightGBM)是机器学习领域中比较强大的算法之一,LightGBM采用高效的树学习算法,以更快地训练模型,其独特的直方图分桶方法和基于梯度的单边叶子生长技术降低了内存的使用和计算成本。... 轻梯度提升机算法(light gradient boosting machine,LightGBM)是机器学习领域中比较强大的算法之一,LightGBM采用高效的树学习算法,以更快地训练模型,其独特的直方图分桶方法和基于梯度的单边叶子生长技术降低了内存的使用和计算成本。LightGBM被广泛应用于医疗、自然语言处理、金融、工业制造等领域。然而,LightGBM在高维数据处理、类别特征处理、模型解释性等方面仍面临许多挑战。目前,解决这些问题的方法主要集中在特征工程、可视化、模型混合等方面,并取得了很好的效果。介绍了决策树家族的相关算法原理和变体研究;对LightGBM的原理、优缺点进行梳理,归纳出算法所面临的挑战,并指出LightGBM未来的研究热点和难点;对LightGBM的发展进行了总结和展望。 展开更多
关键词 轻梯度提升机算法 决策树 集成学习 机器学习
下载PDF
基于相对隶属度的三支决策模型及应用
2
作者 李宝霖 杨亚锋 +1 位作者 闫珊珊 李丽红 《西华师范大学学报(自然科学版)》 2025年第2期147-155,共9页
针对现行三支决策过程对信息量变与质变的演化考虑不充分的问题,将可变集理论与三支决策思想结合,构建基于相对隶属度的三支决策模型。将相对隶属度作为模型的评价函数,构造新的三支决策规则,再将该模型应用于哈尔滨市水资源承载力系统... 针对现行三支决策过程对信息量变与质变的演化考虑不充分的问题,将可变集理论与三支决策思想结合,构建基于相对隶属度的三支决策模型。将相对隶属度作为模型的评价函数,构造新的三支决策规则,再将该模型应用于哈尔滨市水资源承载力系统决策。研究结果显示,哈尔滨市的水资源承载力为Ⅲ级水平,处于边界域,而需要紧急优化的指标有Remanenko潜在蒸发量、森林覆盖率等,与障碍度诊断模型和基于可拓关联度比的三支决策模型得到的优化指标基本一致。研究改善了以往三支决策模型在对动态性考虑不足方面存在的问题,为水资源承载力决策提供了一种新的思路。 展开更多
关键词 可变模糊集 相对隶属度 三支决策 水资源承载力 模型评价
下载PDF
基于数据模糊化处理的数据脱敏研究 被引量:4
3
作者 罗长银 陈学斌 《软件》 2019年第10期6-10,共5页
随着大数据产业的飞速发展,数据泄露和信息泄露事件也越来越多,基于这种情况下,如何对数据有力的保护成为我们研究的重点内容,本文利用简单替换加密和维吉尼亚两种传统的算法对数据进行加密,利用模糊集里面的隶属函数的方法,对数据进行... 随着大数据产业的飞速发展,数据泄露和信息泄露事件也越来越多,基于这种情况下,如何对数据有力的保护成为我们研究的重点内容,本文利用简单替换加密和维吉尼亚两种传统的算法对数据进行加密,利用模糊集里面的隶属函数的方法,对数据进行简单的模糊化处理,并且运用匹配度公式和模糊量词的方法,对数据信息进行进一步的泛化处理,对单数据源的信息的保护起到了预期的效果。 展开更多
关键词 数据泄露 简单替换算法 维吉尼亚算法 模糊量词
下载PDF
基于联邦集成算法对不同脱敏数据的研究
4
作者 罗长银 陈学斌 +3 位作者 张淑芬 尹志强 石义 李风军 《应用科学学报》 CAS CSCD 北大核心 2024年第1期94-102,共9页
针对联邦学习中存在梯度更新导致本地数据可能泄露的问题,提出基于本地脱敏数据上的联邦集成算法。该算法用变异率与适应度阈值的不同取值对原始数据进行脱敏,且使用不同类型的模型在经不同程度脱敏的数据上进行本地模型训练,以确定适... 针对联邦学习中存在梯度更新导致本地数据可能泄露的问题,提出基于本地脱敏数据上的联邦集成算法。该算法用变异率与适应度阈值的不同取值对原始数据进行脱敏,且使用不同类型的模型在经不同程度脱敏的数据上进行本地模型训练,以确定适合的联邦集成算法参数。实验结果表明,与联邦平均算法和传统集中式训练相比,stacking联邦集成算法与voting联邦集成算法的准确率要优于基线准确率。在实际应用中,可根据不同的需求设置不同的脱敏参数来保护数据,以此提升数据的安全性。 展开更多
关键词 联邦学习 梯度更新 联邦集成算法 集成算法
下载PDF
MSHC:一种多阶段超图聚类算法
5
作者 张春英 王静 +2 位作者 刘璐 兰思武 张庆达 《深圳大学学报(理工版)》 北大核心 2025年第1期68-76,共9页
超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hyper... 超图作为普通图的高维推广,能够更加灵活地反映节点间的高阶复杂关系.超图聚类旨在发现超图结构中复杂的高阶关联关系.针对目前超图聚类结果不稳定、容易陷入局部最优等问题,结合超图划分思想,提出一种多阶段超图聚类(multi-stage hypergraph clustering,MSHC)算法,该算法将超图聚类过程分为超图约简、超图初始聚类以及优化迁移3个阶段.在超图约简阶段,提出一种不改变超图结构的快速约简方法,降低了后续算法的复杂度;提出基于集对分析理论的超图节点间相似性度量方法,并采用层次聚类方法对超图进行初始聚类,采用4种不同的类簇合并计算方法,增加聚类方案的多样性;将遗传算法应用于优化超图聚类方案的研究中,以此获得最优超图聚类方案.在3个不同规模的数据集上与4个经典的超图聚类方法进行对比实验,结果表明,MSHC算法在Songs_genres数据集和Papers_keywords数据集上超图模块度指数分别提高了0.0797和0.0777,在Movies_genres数据集上仅降低0.0060. 展开更多
关键词 数据处理 超图聚类 遗传算法 集对分析理论 超图约简 多阶段聚类 超图模块度
下载PDF
融合机器学习与动态模型优化的雪崩预测及防治策略
6
作者 金永超 王志坚 +3 位作者 贾慧爽 杜云天 胡鑫婷 陈学斌 《应用科学学报》 北大核心 2025年第1期35-50,共16页
爆破是防止雪崩的有效方法,但合适的爆破时间、爆破位置和爆破能量很难确定。本文首先收集、爬取了关于雪崩的指标数据,并对数据进行预处理。然后对数据进行探索性数据分析,重点分析时间与雪崩发生的关系,发现雪崩具有明显的季节性。以... 爆破是防止雪崩的有效方法,但合适的爆破时间、爆破位置和爆破能量很难确定。本文首先收集、爬取了关于雪崩的指标数据,并对数据进行预处理。然后对数据进行探索性数据分析,重点分析时间与雪崩发生的关系,发现雪崩具有明显的季节性。以数据的80%为训练集,20%为测试集,建立支持向量机、随机森林和感知器神经网络模型,并利用贝叶斯优化算法对模型进行参数寻优,结果显示感知器神经网络的准确率最高。最后根据损失度对3个模型进行集成,对3个集成策略进行对比,结果显示SVM-RF-MLP模型的准确率最高为0.952。此后,建立基础的爆破能量模型,考虑山体高度、雪层密度随时间的变化,再基于历史数据寻找雪层稳定性的分布规律,构建动态雪崩稳定性爆破能量模型。通过对数据进行模拟验证以及对其进行三维山体可视化分析,获得最佳的爆破时机、爆破位置和爆破能量。 展开更多
关键词 贝叶斯优化算法 SVM-RF-MLP模型 动态雪崩稳定性爆破能量模型
下载PDF
基于雷达数据的飞行受限区形变及方位预测
7
作者 樊立艳 赵鹤宇 +1 位作者 常锦才 李印凤 《华东交通大学学报》 2023年第2期71-78,共8页
强对流天气是影响飞机飞行的重要原因之一。为了有效减少飞机改航的经济浪费,同时降低遇到危险的概率,需要准确划设飞行受限区并进行预测。首先提取出影响飞机飞行的雷雨点数据,采用Graham算法划设静态飞行限制区的初始多边形,提出距离... 强对流天气是影响飞机飞行的重要原因之一。为了有效减少飞机改航的经济浪费,同时降低遇到危险的概率,需要准确划设飞行受限区并进行预测。首先提取出影响飞机飞行的雷雨点数据,采用Graham算法划设静态飞行限制区的初始多边形,提出距离均值方法对飞行限制区的几何形状变化进行预测。然后引入Markov思想通过类状态转移矩阵预测飞行限制区的中心点位置变化,提出角度增量的方法预测飞行限制区中心点角度变化。实例结果表明,对于时间分辨率较低的雷达气象数据,该方法预测精确度较高且偏差度较低,并且可以实时更新预测区域。在静态飞行限制区的基础上实现了动态预测,使预测结果更贴近实际变化情况。 展开更多
关键词 飞行受限区 Graham算法 Markov理论 动态预测
下载PDF
基于遗传算法和支持向量机的XSS攻击检测方法 被引量:1
8
作者 马征 陈学斌 +1 位作者 张国鹏 翟冉 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第6期686-693,共8页
针对现有基于过滤器、动态分析、静态分析等的解决方案在检测未知XSS攻击方面效果不佳的问题,利用机器学习方法可高效检测出未知XSS攻击的特点,提出一种基于遗传算法和支持向量机的XSS攻击检测模型.通过模糊测试生成XSS攻击预样本,利用... 针对现有基于过滤器、动态分析、静态分析等的解决方案在检测未知XSS攻击方面效果不佳的问题,利用机器学习方法可高效检测出未知XSS攻击的特点,提出一种基于遗传算法和支持向量机的XSS攻击检测模型.通过模糊测试生成XSS攻击预样本,利用遗传算法搜索特征空间,迭代生成最优测试用例,从而扩充数据集、丰富XSS攻击向量库.给出了基于遗传算法和支持向量机的攻击检测模型,确定了XSS测试用例编码规则.进行了适应度函数设计,完成了选择算子、交叉算子、变异算子的设计.从准确率、召回率、误报率和F_(1)值来评价分类器的检测效果,结果表明:该模型准确率达到了99.5%;对比其他检测方法,该检测模型具有更好的检测效果,并且召回率和误报率也有明显改善. 展开更多
关键词 跨站脚本攻击 模糊测试 遗传算法 支持向量机 特征向量化
下载PDF
基于差分隐私的非等距直方图发布算法
9
作者 单丽洋 陈学斌 郭如敏 《应用科学学报》 CAS CSCD 北大核心 2024年第6期1052-1063,共12页
针对直方图隐私泄露与分组数难以确定的问题,提出一种基于差分隐私的非等距直方图数据发布算法。首先,提出一种改进的定量化的综合评价指标,将直方图的分组评判标准定量化为特定的计算公式,以确定直方图最优分组数。然后,利用经验分布... 针对直方图隐私泄露与分组数难以确定的问题,提出一种基于差分隐私的非等距直方图数据发布算法。首先,提出一种改进的定量化的综合评价指标,将直方图的分组评判标准定量化为特定的计算公式,以确定直方图最优分组数。然后,利用经验分布函数设计隐私预算分配方案,计算得出分组边界,从而构建非等距直方图。最后,根据非等距边界划分的分组,统计组内频数,对频数进行加噪,发布满足差分隐私的非等距直方图。实验结果表明,分组数的最优计算及非等距的实现,保证了直方图发布数据的准确性和隐私性,同时仍能保证直方图的分布特征不受影响,该文所提发布算法的均方误差与同类精确的直方图发布(accurate histogram publication, AHP)算法相比降低了99%。 展开更多
关键词 非等距 直方图分组 差分隐私 隐私预算
下载PDF
基于层析分析改进的联邦平均算法 被引量:6
10
作者 罗长银 陈学斌 +1 位作者 马春地 张淑芬 《计算机科学》 CSCD 北大核心 2021年第8期32-40,共9页
联邦平均(Fedavg)算法采用权重更新来更新全局模型,该算法在权重更新时仅考虑每个客户端数据量的大小,未考虑数据质量对模型的影响。针对该问题,文中提出了基于层次分析改进的联邦平均算法,首次从数据质量的角度来处理多源数据。首先采... 联邦平均(Fedavg)算法采用权重更新来更新全局模型,该算法在权重更新时仅考虑每个客户端数据量的大小,未考虑数据质量对模型的影响。针对该问题,文中提出了基于层次分析改进的联邦平均算法,首次从数据质量的角度来处理多源数据。首先采用熵权法计算数据中各属性的重要度,并将其作为层次分析中准则层的数值,计算每个客户端数据的质量,然后结合客户端数据量的大小,重新计算全局模型中的权重。仿真实验的结果表明,对于中小型数据集而言,使用支持向量机训练的模型准确度最高,达到了85.7152%;对于大型数据集而言,采用随机森林训练的模型准确率最高,达到了91.9321%。与传统联邦平均方法相比,所提方法在中小数据集上准确率提升了3.5%,在大数据集上提升了1.3%,能够在提升模型准确率的同时提高数据与模型的安全性。 展开更多
关键词 联邦平均(Fedavg) 熵权法 层析分析 权重更新
下载PDF
投资组合对非系统性风险的发散作用——基于单调非增次模集函数的证明 被引量:3
11
作者 陈奕延 李晔 《首都师范大学学报(自然科学版)》 2018年第6期1-4,共4页
风险是客观存在且无法灭失的,有效降低投资中的风险程度是当前研究投资问题的热点之一.通过扩展单调非增次模集函数的性质,利用该性质可证明含多个资产的投资组合对投资中的非系统性风险有发散作用,并用标准差成功对其进行检验.得到结论... 风险是客观存在且无法灭失的,有效降低投资中的风险程度是当前研究投资问题的热点之一.通过扩展单调非增次模集函数的性质,利用该性质可证明含多个资产的投资组合对投资中的非系统性风险有发散作用,并用标准差成功对其进行检验.得到结论:含有多个资产的投资组合的非系统性风险比投资多个资产的非系统性风险的组合更低. 展开更多
关键词 投资组合 风险偏好 非系统性风险 单调非增次模集函数 标准差
下载PDF
平衡态分子动力学 Green-Kubo 方法计算氮化硼单层结构热导率的模型尺寸效应研究 被引量:2
12
作者 陈奕延 李晔 张淑芬 《集成技术》 2018年第2期1-11,共11页
分子动力学模拟可以直接表征体系原子的行为,因此成为研究氮化硼(BN)相关材料微观导热机理的重要工具,但目前尚没有关于氮化硼材料模型尺寸对其热传导相关性质影响规律的研究。该文采用平衡态分子动力学(Equilibrium Molecular Dyn... 分子动力学模拟可以直接表征体系原子的行为,因此成为研究氮化硼(BN)相关材料微观导热机理的重要工具,但目前尚没有关于氮化硼材料模型尺寸对其热传导相关性质影响规律的研究。该文采用平衡态分子动力学(Equilibrium Molecular Dynamics,EMD)并结合 Green-Kubo 方法,研究了纯净氮化硼单层结构热导率、声子色散关系以及态密度随模拟尺寸的变化规律,并解释了其内部机理。实验发现,氮化硼单层材料热导率随着模拟尺寸的增大而减小,并在单层面积约 4.1 nm×4.1 nm 时收敛于(349±22)W/(m?K),此收敛值远小于 EMD 计算中石墨烯热导率的收敛尺寸(10 nm×10 nm),这说明氮化硼单层中声子之间的散射大于石墨烯。此外,不同于热导率,氮化硼单层结构的声子色散曲线、态密度几乎不受模拟尺寸的影响。该研究结果可为采用平衡态分子动力学研究氮化硼相关材料的微观导热机理提供重要参考。 展开更多
关键词 氮化硼 平衡态分子动力学(EMD) Green-Kubo 方法 热导率
下载PDF
基于平均极值包络线的地下管线去噪算法 被引量:1
13
作者 邹佳丽 李志猛 +1 位作者 阎少宏 张俊卿 《华北理工大学学报(自然科学版)》 CAS 2023年第4期66-75,共10页
地下管道位置信息的真实性对管道安全检测具有决定性影响。在测量过程中由于受检测设备和管道内环境的影响,管道三维姿态测量仪会产生测量误差。针对此问题,提出一种基于平均极值包络线的地下管线去噪算法,该算法的核心思想是先提取局... 地下管道位置信息的真实性对管道安全检测具有决定性影响。在测量过程中由于受检测设备和管道内环境的影响,管道三维姿态测量仪会产生测量误差。针对此问题,提出一种基于平均极值包络线的地下管线去噪算法,该算法的核心思想是先提取局部极值点并采用三次B样条插值极值点形成极值包络线,再逐点平均包络线,最后通过迭代得到降噪后的曲线。实验结果表明,该算法可以保持数据原貌,有效解决数据偏移和曲线收缩等问题,对三维离散曲线去噪效果显著。用于地下管线去噪,可提高测量位置信息的真实性。 展开更多
关键词 地下管道检测 三维离散曲线 去噪 滤波 平均极值包络线
下载PDF
基于深度学习的联邦集成算法
14
作者 罗长银 陈学斌 +2 位作者 宋尚文 张淑芬 刘之瑜 《应用科学学报》 CAS CSCD 北大核心 2022年第3期493-510,共18页
联邦学习是多源隐私数据保护领域研究的热点,其框架在满足数据不出本地的情况下,可以训练出多方均满意的共同模型,但存在本地模型参数难以整合且无法在安全的情况下将多源数据充分使用的问题,因此提出基于深度学习的联邦集成算法,将深... 联邦学习是多源隐私数据保护领域研究的热点,其框架在满足数据不出本地的情况下,可以训练出多方均满意的共同模型,但存在本地模型参数难以整合且无法在安全的情况下将多源数据充分使用的问题,因此提出基于深度学习的联邦集成算法,将深度学习与集成学习应用到联邦学习的框架下,通过优化本地模型的参数,提高了本地模型准确率;使用不同的集成算法来整合本地模型参数,在提升模型准确率的同时兼顾了多源数据的安全性。实验结果表明:与传统多源数据处理技术相比,该算法在mnist、digits、letter、wine数据集训练模型的准确率依次提升1%、8%、-1%、1%,在保证准确率的同时也提升多源数据与模型的安全性,具有很重要的应用价值。 展开更多
关键词 联邦学习 联邦集成算法 深度神经网络模型 集成算法 深度学习
下载PDF
Lovász延拓权值下的伪泊松混合分布的风险期望模型
15
作者 陈奕延 李晔 《首都师范大学学报(自然科学版)》 2019年第1期1-7,共7页
本文在风险损失量为自然数且服从泊松分布的条件下,将泊松分布进行截断和均化的处理生成伪泊松分布,然后根据有限可数混合分布的表达式,利用从集函数转换而来的多线性形式的Pseudo-Boolean函数的Lovász延拓得到新的权值并构建伪泊... 本文在风险损失量为自然数且服从泊松分布的条件下,将泊松分布进行截断和均化的处理生成伪泊松分布,然后根据有限可数混合分布的表达式,利用从集函数转换而来的多线性形式的Pseudo-Boolean函数的Lovász延拓得到新的权值并构建伪泊松混合分布,最后根据期望的定义和性质得到相应的伪泊松混合分布的风险期望模型.该模型为今后研究混合分布在风险分析中的应用提供了依据. 展开更多
关键词 风险损失额 有限可数混合分布 Pseudo-Boolean 函数 Lovász 延拓
下载PDF
设施蔬菜病害识别中的CNN池化选择
16
作者 刘之瑜 张淑芬 +2 位作者 张振斌 董燕灵 罗长银 《新一代信息技术》 2021年第22期11-19,共9页
设施蔬菜的病虫害是影响设施蔬菜产量和质量的主要因素之一,对设施蔬菜病虫害的实时监控和快速识别至关重要。近年来设施蔬菜产业发展迅速,对设施蔬菜病虫害的精准识别要求越来越高,卷积神经网络因其较高的分类精度在图像识别领域应用广... 设施蔬菜的病虫害是影响设施蔬菜产量和质量的主要因素之一,对设施蔬菜病虫害的实时监控和快速识别至关重要。近年来设施蔬菜产业发展迅速,对设施蔬菜病虫害的精准识别要求越来越高,卷积神经网络因其较高的分类精度在图像识别领域应用广泛,是一种高精度的设施蔬菜病虫害检测工具。本文对卷积神经网络在植物病害识别和分类过程中的应用进行了介绍,针对在训练过程中最大池化和平均池化的选择进行了研究,通过计算图像梯度的变异系数来衡量图像适合最大池化还是平均池化,进而将数据集划分为最大池化部分和平均池化部分进行训练,经实验在VGG16模型中划分后再训练比单独使用最大池化和平均池化10次平均准确率分别提高了0.94%和1.21%。 展开更多
关键词 卷积神经网络 图像梯度 池化 设施蔬菜 图像识别 变异系数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部