针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specifi...针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations,LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果.展开更多
多目标回归旨在使用一组共同的输入变量来预测多个连续变量,其现有方法可归类为问题转换法和算法适应法.它的主要挑战在于如何对输入与输出空间的复杂关系进行建模,以及如何有效利用目标间的相关性.然而,现有的问题转换法很少同时考虑...多目标回归旨在使用一组共同的输入变量来预测多个连续变量,其现有方法可归类为问题转换法和算法适应法.它的主要挑战在于如何对输入与输出空间的复杂关系进行建模,以及如何有效利用目标间的相关性.然而,现有的问题转换法很少同时考虑到这两方面.基于此,本文构建了一种问题转换法同时应对这两大挑战,提出了一种结合目标特定特征和目标相关性的多目标回归方法(Multi-Target Regression via Specific Features and Inter-Target Correlations,TSF-TC).TSF-TC通过对分箱后的样本进行聚类分析构建目标特定特征从而对输入与输出空间的复杂关系进行建模,通过有选择性地堆叠单目标预测值揭示目标间的相关性.本文使用TSF-TC在18个多目标回归数据集上与现有多目标回归方法进行了对比实验,实验结果充分表明了TSF-TC的优势.展开更多
为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树...为了探索多标签数据集中每个标签所具有的特定特征,针对标签特定特征进行有效的利用,提出基于聚类提升树的多标签学习方法(multi-label leaning based on boosting clustering trees,MLL-BCT).建立MLL-BCT整体框架,通过引入聚类特征树来挖掘数据样本之间的相关性,以树形结构保存数据的内在关联;通过引入随机子集训练每个标签的若干分类树来学习标签特定特征,增强特征对单个标签表达,提升分类性能.将所提出的方法在flag、emotions等11个数据集上与经典的特定特征领域多标签学习方法(LIFT、LLSF、REEL、LLSF-DL)进行对比试验.结果表明:新方法在各评估指标(Hamming Loss、One-error、Ranking Loss、Average Precision、Micro-averaged F-Measure)上均具有明显的性能提升,且方法具备简单灵活性.展开更多
多目标回归(Multi-target Regression,MTR)是一种同时预测多个相互关联的连续型输出目标的机器学习问题。在多目标回归中,多个输出目标共享同一个特征表示,其主要挑战在于如何有效地发掘和利用输出目标之间的关联,以提高所有输出目标的...多目标回归(Multi-target Regression,MTR)是一种同时预测多个相互关联的连续型输出目标的机器学习问题。在多目标回归中,多个输出目标共享同一个特征表示,其主要挑战在于如何有效地发掘和利用输出目标之间的关联,以提高所有输出目标的预测准确性。文中提出了一种基于超网络的多目标回归方法(Multi-target Regression Method based on Hypernetwork,MTR-HN)。首先采用k-means算法对每个连续型输出目标进行一维聚类,然后根据聚类结果将多目标回归问题转化成多类别多标签分类问题,最后采用超网络模型对多类别多标签分类问题进行建模,构建最终的多目标回归预测模型。MTR-HN方法的优点在于:1)对输出空间离散化,能够降低模型过拟合的风险;2)采用超网络模型,能更有效地对输出目标之间的关联进行建模。在18个多目标回归数据集上进行的对比实验表明,文中提出的MTR-HN方法能够取得比现有方法更高的预测准确性。展开更多
文摘针对标签特定特征多标签学习算法(multi-label learning with label-specific features,LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations,LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果.
文摘多目标回归旨在使用一组共同的输入变量来预测多个连续变量,其现有方法可归类为问题转换法和算法适应法.它的主要挑战在于如何对输入与输出空间的复杂关系进行建模,以及如何有效利用目标间的相关性.然而,现有的问题转换法很少同时考虑到这两方面.基于此,本文构建了一种问题转换法同时应对这两大挑战,提出了一种结合目标特定特征和目标相关性的多目标回归方法(Multi-Target Regression via Specific Features and Inter-Target Correlations,TSF-TC).TSF-TC通过对分箱后的样本进行聚类分析构建目标特定特征从而对输入与输出空间的复杂关系进行建模,通过有选择性地堆叠单目标预测值揭示目标间的相关性.本文使用TSF-TC在18个多目标回归数据集上与现有多目标回归方法进行了对比实验,实验结果充分表明了TSF-TC的优势.
文摘多目标回归(Multi-target Regression,MTR)是一种同时预测多个相互关联的连续型输出目标的机器学习问题。在多目标回归中,多个输出目标共享同一个特征表示,其主要挑战在于如何有效地发掘和利用输出目标之间的关联,以提高所有输出目标的预测准确性。文中提出了一种基于超网络的多目标回归方法(Multi-target Regression Method based on Hypernetwork,MTR-HN)。首先采用k-means算法对每个连续型输出目标进行一维聚类,然后根据聚类结果将多目标回归问题转化成多类别多标签分类问题,最后采用超网络模型对多类别多标签分类问题进行建模,构建最终的多目标回归预测模型。MTR-HN方法的优点在于:1)对输出空间离散化,能够降低模型过拟合的风险;2)采用超网络模型,能更有效地对输出目标之间的关联进行建模。在18个多目标回归数据集上进行的对比实验表明,文中提出的MTR-HN方法能够取得比现有方法更高的预测准确性。