期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种新的过采样算法DB_SMOTE 被引量:12
1
作者 刘余霞 刘三民 +1 位作者 刘涛 王忠群 《计算机工程与应用》 CSCD 2014年第6期92-95,共4页
针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样... 针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB SMOTE算法是可行的。 展开更多
关键词 非平衡数据学习 过采样 数据分类
下载PDF
基于Bagging集成学习的字符识别方法 被引量:7
2
作者 刘余霞 吕虹 +1 位作者 胡涛 孙小虎 《计算机工程与应用》 CSCD 2012年第33期194-196,211,共4页
针对字符识别对象的多样性,提出了一种基于Bagging集成的字符识别模型,解决了识别模型对部分字符识别的偏好现象。采用Bagging采样策略形成不同的数据子集,在此基础上用决策树算法训练形成多个基分类器,用多数投票机制对基分类器预测结... 针对字符识别对象的多样性,提出了一种基于Bagging集成的字符识别模型,解决了识别模型对部分字符识别的偏好现象。采用Bagging采样策略形成不同的数据子集,在此基础上用决策树算法训练形成多个基分类器,用多数投票机制对基分类器预测结果集成输出。理论分析与仿真实验结果表明,所提模型相比其他分类方法具有更好的分类能力。 展开更多
关键词 BAGGING 字符识别 集成学习 决策树 ADABOOST
下载PDF
一种基于分类器相似性集成的数据流分类研究 被引量:2
3
作者 刘余霞 吕虹 刘三民 《计算机科学》 CSCD 北大核心 2012年第12期208-210,共3页
数据流分类已成为当前研究热点之一,如何解决其中的概念漂移和噪声是关键问题,为此提出了一种新的基于分类器相似性的动态集成算法。由于数据流中相邻数据具有相同概念的概率较大,因此用最新基分类器代表数据流中即将出现的概念,同时基... 数据流分类已成为当前研究热点之一,如何解决其中的概念漂移和噪声是关键问题,为此提出了一种新的基于分类器相似性的动态集成算法。由于数据流中相邻数据具有相同概念的概率较大,因此用最新基分类器代表数据流中即将出现的概念,同时基于此分类器求出基分类器之间的相似性作为权值进行加权多数投票,并根据相似性大小淘汰较弱基分类器以适应概念漂移和噪声。在标准仿真数据集上进行了仿真实验,结果表明该算法相比其他集成方法在抗噪性能和分类准确性方面均得到显著提高。 展开更多
关键词 概念漂移 相似性 集成学习 数据流分类 加权多数投票
下载PDF
高校国家奖助学金育人功能探析 被引量:2
4
作者 刘余霞 苏伟刚 赵恒芳 《赤峰学院学报(哲学社会科学版)》 2015年第10期234-235,共2页
国家奖助学金具有资助和育人的两大功能。但就现状来看,各大高校普遍重视奖助学金的发放工作,而忽视或淡化其育人功能,导致国家奖助学金的潜在育人功能没有得到充分的挖掘。在新时期,各高校应当根据大学生思想政治教育的特点,以国家奖... 国家奖助学金具有资助和育人的两大功能。但就现状来看,各大高校普遍重视奖助学金的发放工作,而忽视或淡化其育人功能,导致国家奖助学金的潜在育人功能没有得到充分的挖掘。在新时期,各高校应当根据大学生思想政治教育的特点,以国家奖助学金的评审和发放等环节为载体和契机,推进对大学生的爱国主义教育、立志成才教育,诚信教育以及反哺社会的感恩教育。 展开更多
关键词 高校 大学生 国家奖助学金 育人功能
下载PDF
基于特征加权模板快速提升的AdaBoost车牌字符识别算法
5
作者 刘余霞 吕虹 +1 位作者 胡涛 孙小虎 《安徽工程大学学报》 CAS 2012年第4期45-48,共4页
针对国内车牌字符的多样性和识别效率不高的现状,文中利用模板匹配和集成学习思想设计了一种新颖的识别算法.该算法由特征加权模板的方法构建弱分类器,经AdaBoost快速提升成强分类器,利用图像的整体灰度信息,缩短大量Haarlike特征的训... 针对国内车牌字符的多样性和识别效率不高的现状,文中利用模板匹配和集成学习思想设计了一种新颖的识别算法.该算法由特征加权模板的方法构建弱分类器,经AdaBoost快速提升成强分类器,利用图像的整体灰度信息,缩短大量Haarlike特征的训练时间,克服单一特征弱分类器的不稳定性.仿真实验表明,该算法能够获得较好的字符识别率和稳定性. 展开更多
关键词 模板匹配 ADABOOST算法 特征加权 字符识别
下载PDF
基于水平垂直灰度开运算的车牌字符分割算法 被引量:7
6
作者 胡涛 吕虹 +1 位作者 孙小虎 刘余霞 《电子技术应用》 北大核心 2012年第10期109-111,共3页
采用Hough变换检测车牌的倾斜角度进行车牌的矫正。提出了一种基于水平垂直结构元素开运算的数学形态学方法,对字符分割前的车牌进行预处理。该方法能够在车牌定位不精确的情况下有效地去除车牌边框、铆钉及其他噪声,消除干扰突出字符... 采用Hough变换检测车牌的倾斜角度进行车牌的矫正。提出了一种基于水平垂直结构元素开运算的数学形态学方法,对字符分割前的车牌进行预处理。该方法能够在车牌定位不精确的情况下有效地去除车牌边框、铆钉及其他噪声,消除干扰突出字符。运用传统的投影法以及车牌的先验知识进行字符间的分割,有效地提高了字符分割的效果。实验结果证明,该方法有效可行。 展开更多
关键词 车牌 HOUGH变换 开运算 灰度数学形态学 投影法
下载PDF
基于K均值集成和SVM的P2P流量识别研究 被引量:8
7
作者 刘三民 孙知信 刘余霞 《计算机科学》 CSCD 北大核心 2012年第4期46-48,74,共4页
提出基于K均值集成和支持向量机相结合的P2P流量识别模型,以保证流量识别精度和稳定性,克服聚类识别模型中参数值难以确定、复杂性高等缺点。对少量标签样本采用随机簇中心的K均值算法训练基聚类器,按最大后验概率分配簇标签,无标签样... 提出基于K均值集成和支持向量机相结合的P2P流量识别模型,以保证流量识别精度和稳定性,克服聚类识别模型中参数值难以确定、复杂性高等缺点。对少量标签样本采用随机簇中心的K均值算法训练基聚类器,按最大后验概率分配簇标签,无标签样本与其最近簇标签一致;按投票机制集成无标签样本标签信息,并结合原标签样本训练支持向量机识别模型。该模型利用了集成学习稳定性和SVM在小样本集上的良好泛化性能。理论分析和仿真实验结果证明了方案的可行性。 展开更多
关键词 流量识别 支持向量机 K均值 集成学习
下载PDF
基于决策树集成的P2P流量识别研究 被引量:4
8
作者 刘三民 孙知信 刘余霞 《计算机科学》 CSCD 北大核心 2011年第11期26-29,共4页
为提高分类模型的稳定性,提出基于决策树分类器集成方案用以识别流量。模型首先利用特征选择方法(FCBF)提取最优分类特征信息,按Bagging随机抽样原理形成5个子分类器,依少数服从多数原则生成决策模型。利用两种实验方案在公开数据集上... 为提高分类模型的稳定性,提出基于决策树分类器集成方案用以识别流量。模型首先利用特征选择方法(FCBF)提取最优分类特征信息,按Bagging随机抽样原理形成5个子分类器,依少数服从多数原则生成决策模型。利用两种实验方案在公开数据集上进行测试,结果表明提出的方案比贝叶斯、基于核密度估计贝叶斯方案具有更好的稳定性、模型分类准确率和P2P流量识别准确率,并对此现象进行了解释。 展开更多
关键词 流量识别 集成学习 决策树 贝叶斯分类 稳定性
下载PDF
融合分类器可信度的数据流集成分类 被引量:1
9
作者 刘三民 刘涛 +3 位作者 王忠群 修宇 刘余霞 孟超 《应用科学学报》 CAS CSCD 北大核心 2017年第2期226-232,共7页
提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果的不确定性,建立分类器可信度与样本之间的关系,进而给出分类... 提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果的不确定性,建立分类器可信度与样本之间的关系,进而给出分类器可信度的定量计算方法.最后结合动态数据流分类需求和概念漂移特点,借助批量学习和时间遗忘策略构建基于分类器可信度的动态加权集成分类模型.理论分析和实验结果表明该分类方案可行,相比传统集中方法具有一定的优势. 展开更多
关键词 数据流分类 集成学习 可信度 概念漂移
下载PDF
在线合成增量式数据流分类算法
10
作者 刘三民 刘余霞 《系统仿真学报》 CAS CSCD 北大核心 2018年第6期2315-2319,2327,共6页
在线学习是解决数据流分类挖掘样本不可再现性的有效手段,如何解决在线学习过程中样本量不足问题是提高在线学习质量的关键点。基于分类模型参数估计的均方误差分解理论,结合聚类思想利用类中心和样本线性合成样本,增加样本分布信息,降... 在线学习是解决数据流分类挖掘样本不可再现性的有效手段,如何解决在线学习过程中样本量不足问题是提高在线学习质量的关键点。基于分类模型参数估计的均方误差分解理论,结合聚类思想利用类中心和样本线性合成样本,增加样本分布信息,降低参数估计的下界值;在此基础上进行在线合成增量学习,并根据样本系列信息不断修正类中心位置。经理论分析与仿真实验结果表明所提方案是有效的,在噪声环境内相比其他算法更具优势。 展开更多
关键词 在线学习 数据流分类 聚类 增量学习
原文传递
基于Matlab的m序列的产生和相关性能仿真 被引量:4
11
作者 刘余霞 吕虹 《电子技术(上海)》 2011年第9期9-10,共2页
伪随机序列在流密码、信道编码和扩频通信等领域有着广泛的应用,m序列是重要的伪随机序列。文中首先对m序列的原理、结构及性质进行分析,然后通过matlab仿真实现m序列,并对其相关特性进行仿真,结果表明该方法的正确性和可行性。
关键词 伪随机序列 M序列 自相关 MATLAB
原文传递
基于实例迁移的数据流分类挖掘方法 被引量:8
12
作者 刘三民 刘余霞 《信息与控制》 CSCD 北大核心 2019年第3期380-384,共5页
为解决数据流分类过程中样本标注和概念漂移问题,提出了一种基于实例迁移的数据流分类挖掘模型.首先,该模型用支持向量机作学习器,用所得分类模型中的支持向量构建源领域,待分类的当前数据块为目标域.然后,借助互近邻思想在源域中挑选... 为解决数据流分类过程中样本标注和概念漂移问题,提出了一种基于实例迁移的数据流分类挖掘模型.首先,该模型用支持向量机作学习器,用所得分类模型中的支持向量构建源领域,待分类的当前数据块为目标域.然后,借助互近邻思想在源域中挑选目标域中样本的真邻居进行实例迁移,避免发生负迁移.最后,通过合并目标域和迁移样本形成训练集,提高标注样本数量,增强模型的泛化能力.理论分析和实验结果表明,所提方法具有可行性,相比其它学习方法在分类准确性方面更具优势. 展开更多
关键词 互近邻 迁移学习 数据流分类 增量学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部