期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
1
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS聚类 特征空间增强 mixup算法
下载PDF
基于标签相关性的标签特定特征多标签学习
2
作者 王进 梁晨 +2 位作者 孙开伟 陈乔松 邓欣 《江苏大学学报(自然科学版)》 CAS 北大核心 2023年第5期554-563,576,共11页
针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specifi... 针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations,LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果. 展开更多
关键词 标签学习 标签特定特征 聚类集成 标签相关性 无向完全图 最小生成树
下载PDF
基于特征集重构与多标签分类模型的谐波源定位方法
3
作者 邵振国 林潇 +2 位作者 张嫣 陈飞雄 林洪洲 《电力自动化设备》 EI CSCD 北大核心 2024年第2期147-154,共8页
传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量... 传统基于谐波状态估计的谐波源定位方法需要专门的同步相量量测装置,工程应用受到限制。为此,基于电能质量监测装置所采集的非同步量测数据,提出了基于特征集重构与多标签分类模型的谐波源定位方法。利用监测数据的充分统计量来挖掘量测时段的谐波信息,同时利用标签特定特征学习算法重构特征集,从而消除冗余特征以及无关特征对于谐波源定位精度的影响;提出基于邻接矩阵以及灵敏度分析的测点配置方法,结合电路网络拓扑信息实现测点的优化配置;提出基于改进极限学习机的谐波源定位方法,该方法以重构特征集为输入,建立多标签分类模型,实现谐波源定位。通过仿真与算例分析,验证了所提方法的可行性及有效性。 展开更多
关键词 电能质量 谐波源定位 非同步谐波监测数据 极限学习 标签特定特征学习算法
下载PDF
基于高置信度伪标签数据选择算法的临床事件抽取方法
4
作者 罗媛媛 杨春明 +2 位作者 李波 张晖 赵旭剑 《太原理工大学学报》 北大核心 2024年第1期204-213,共10页
【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为... 【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为实体识别模型,提出一种融合多特征的中文医学事件抽取方法:BERT-MCRF.该方法使用BERT构建模型的嵌入和特征提取部分,在CRF层加入多个字的滑动窗口特征,然后将BERT-MCRF作为半监督实验的基实验,提出一种高置信度伪标签数据选择算法作为筛选数据的条件,得到较高质量的300条数据与原始数据合并,最终构建了1700条语料,并重新训练模型。【结果】BERT-MCRF模型在3种属性实体上的整体F1值达到80.21%,比经典的BiLSTM-CRF模型提升15.11%;通过半监督思路重新训练的模型最终F1值达到81.56%,较原始BERT-MCRF提升了1.35%. 展开更多
关键词 临床医学事件抽取 实体识别 特征 半监督学习 高置信度伪标签选择算法
下载PDF
基于协同过滤的学习资源推荐算法
5
作者 刘晓蒙 《信息与电脑》 2023年第1期63-65,共3页
为了全面分析用户兴趣数据,提升用户对推荐结果的满意度,提出一种基于协同过滤的学习资源推荐算法。分别将课程偏好、知识范围度以及教师偏好作为特征参数,结合用户的历史行为数据,对其进行全面提取。根据提取结果,以特征参数为基础,为... 为了全面分析用户兴趣数据,提升用户对推荐结果的满意度,提出一种基于协同过滤的学习资源推荐算法。分别将课程偏好、知识范围度以及教师偏好作为特征参数,结合用户的历史行为数据,对其进行全面提取。根据提取结果,以特征参数为基础,为学习资源构建属性标签,通过计算标签与用户兴趣特征的相似度,确定最终的推荐结果。测试结果表明,用户对设计算法推荐的图书资源、视频资源以及线上课程资源学习程度均高于对照组,也对资源推荐结果表现了较高的满意度。 展开更多
关键词 协同过滤 学习资源 推荐算法 兴趣特征 属性标签 相似度
下载PDF
基于聚类提升树的多标签学习 被引量:2
6
作者 王进 余薇 +1 位作者 孙开伟 邓欣 《江苏大学学报(自然科学版)》 CAS 北大核心 2021年第4期428-437,共10页
为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树... 为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树来挖掘数据样本之间的相关性,以树形结构保存数据的内在关联;通过引入随机子集训练每个标签的若干分类树来学习标签特定特征,增强特征对单个标签表达,提升分类性能.将所提出的方法在flag、emotions等11个数据集上与经典的特定特征领域多标签学习方法(LIFT、LLSF、REEL、LLSF-DL)进行对比试验.结果表明:新方法在各评估指标(Hamming Loss、One-error、Ranking Loss、Average Precision、Micro-averaged F-Measure)上均具有明显的性能提升,且方法具备简单灵活性. 展开更多
关键词 标签学习 标签特定特征 特征构建 聚类特征 聚类提升树
下载PDF
一种改进的随机森林Boost多标签文本分类算法 被引量:1
7
作者 邵孟良 齐德昱 《计算机应用与软件》 北大核心 2022年第11期215-221,303,共8页
针对目前Boosting算法计算成本高、学习时间长的问题,提出一种改进的随机森林提升(RF-Boost)算法(IRF-Boost)。对训练特征进行排序;在每个Boosting轮中,过滤并使用排序靠前特征的较小子集;根据权重选择一个特征构建新的弱假设,弱假设搜... 针对目前Boosting算法计算成本高、学习时间长的问题,提出一种改进的随机森林提升(RF-Boost)算法(IRF-Boost)。对训练特征进行排序;在每个Boosting轮中,过滤并使用排序靠前特征的较小子集;根据权重选择一个特征构建新的弱假设,弱假设搜索空间的大小从k降低至1。实验检验并分析了信息增益、卡方、GSS系数、互信息、优势比、F1得分和准确度共7种特征排序方法。实验结果表明:在所评价的特征排序法中,互信息最适用于RF-Boost;IRF-Boost的效率优于RF-Boost及AdaBost.MH,即IRF-Boost是解决实践应用和专家系统中分类问题的较好选择。 展开更多
关键词 BOOSTING算法 特征排序 标签学习 文本分类 弱假设
下载PDF
基于可变形部件模型及稀疏特征的行人检测 被引量:2
8
作者 甘鹏坤 陶凌 龙伟 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2015年第6期563-570,共8页
针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行... 针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行训练得到部件模型,再结合级联检测算法对人体目标进行识别检测.实验结果显示,混合模型结合级联方法的检测耗时约是混合模型和语义模型平均检测耗时的1/4,与目前其他已有算法比较,所提方法更加鲁棒和具有识别力. 展开更多
关键词 图像处理 人体检测 稀疏特征 部件模型 标签隐藏变量支持向量机学习算法 级联检测
下载PDF
一种基于Laplacian的半监督特征选择模型 被引量:1
9
作者 吴锦华 万家山 +1 位作者 伍祥 霍清华 《重庆科技学院学报(自然科学版)》 CAS 2019年第1期85-89,共5页
针对LASSO算法及有关扩展模型忽略样本数据间关联信息的问题,以及有标签样本难以获取的实际情况,提出了一种半监督学习的特征选择模型。引入LASSO稀疏项,去除冗余特征,选择有效特征;引入Laplacian正则项,用于保留同类有标签和无标签样... 针对LASSO算法及有关扩展模型忽略样本数据间关联信息的问题,以及有标签样本难以获取的实际情况,提出了一种半监督学习的特征选择模型。引入LASSO稀疏项,去除冗余特征,选择有效特征;引入Laplacian正则项,用于保留同类有标签和无标签样本内在的几何分布信息,帮助模型选出更具有判别能力的特征集;通过相似矩阵来重构半监督特征选择模型。在UCI数据集上的分类试验结果表明,这种方法能有效提高分类性能,同时也说明样本的几何分布信息是不应被忽略的。 展开更多
关键词 学习算法 特征选择 标签样本 LASSO算法 正则化项 半监督
下载PDF
基于多标签k近邻方法实现元启发式算法的排名推荐
10
作者 崔建双 尚天泽 +1 位作者 杨帆 蔚婧文 《控制与决策》 EI CSCD 北大核心 2022年第5期1289-1298,共10页
设计并研究一种基于多标签k近邻方法(multi-label k-nearest neighbor,ML-k NN)推荐元启发式算法的实现框架.应用多标签k近邻分类学习技术,实现最佳元启发式算法的排名推荐.为了验证效果,以多模式资源约束项目调度问题(MRCPSP)为优化对... 设计并研究一种基于多标签k近邻方法(multi-label k-nearest neighbor,ML-k NN)推荐元启发式算法的实现框架.应用多标签k近邻分类学习技术,实现最佳元启发式算法的排名推荐.为了验证效果,以多模式资源约束项目调度问题(MRCPSP)为优化对象,选取不同规模的数百个算例分别提取问题基本特征和地标特征;选用遗传、粒子群、禁忌搜索、蜂群和蚁群5种元启发式算法,使用ML-k NN建立元推荐模型;利用海明损失、单错误率、覆盖率、排位损失和平均准确率5个指标对推荐效果做出分析和评价.实验结果表明,基于ML-k NN方法推荐元启发式算法效果突出,其中基于地标特征的单错误率指标为18.4%,平均准确率达到88.9%.相对于k NN方法,MLk NN取得了更好的推荐结果.此外,ML-k NN方法可以实现对所有备选算法的排名推荐,该研究结论有望推广应用于其他组合优化问题的优化算法推荐. 展开更多
关键词 标签k近邻 元启发式算法 学习 问题特征 地标特征 算法推荐
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部