期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于特征信息增益权重的文本分类算法 被引量:19
1
作者 李文斌 刘椿年 陈嶷瑛 《北京工业大学学报》 EI CAS CSCD 北大核心 2006年第5期456-460,共5页
为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有... 为了在分类精度不受损失的情况下提高训练速度,设计了3种基于信息增益(information gain,简称IG) 特征权重的分类算法,分别被命名为:IG-C1、IG-C2、IG-C.它们根据特征对IG贡献的大小及在新文本中出现的次数进行分类.这3种算法都具有较低的时间复杂度和实现简单的特点.实验结果表明,其中IG-C的分类效果最为理想. 展开更多
关键词 文本处理 信息分类 特征提取
下载PDF
基于数据挖掘的垃圾E-mail过滤方法 被引量:7
2
作者 李文斌 刘椿年 黄佳进 《北京工业大学学报》 CAS CSCD 北大核心 2003年第2期237-240,共4页
分析了己有的垃圾E-mail过滤规则的算法的本质,给出了将邮件表示成事务的方法。在将垃圾邮件的训练集表示成事务集后,可以用FP-Tree算法从训练集中挖掘出频繁特征集。同时探讨了如何将一个频繁特征集表示成规则及如何使用规则的问题。
关键词 垃圾邮件 邮件过滤 FP-树 规则学习 数据挖掘
下载PDF
个性化E-mail分类器的设计与实现 被引量:1
3
作者 李文斌 黄佳进 +1 位作者 欧创新 刘椿年 《北京工业大学学报》 CAS CSCD 北大核心 2002年第4期487-490,共4页
详细讨论了一个基于朴素贝叶斯方法的个性化E-mail分类器的设计,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法.试验结果表明,结合Odds Ratio特征子集提取算法和仆素贝叶斯方法对邮件进行分类具有较... 详细讨论了一个基于朴素贝叶斯方法的个性化E-mail分类器的设计,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法.试验结果表明,结合Odds Ratio特征子集提取算法和仆素贝叶斯方法对邮件进行分类具有较好的分类精度.应用朴素贝叶斯方法在新邮件到达的同时对其进行分类,具有较好的分类速度. 展开更多
关键词 E-mail分类器 设计 朴素贝叶斯方法 特征提取 个性化设计 电子邮件
下载PDF
基于模糊描述逻辑的PNL网络问答系统
4
作者 高明霞 刘椿年 《计算机工程》 EI CAS CSCD 北大核心 2006年第21期52-54,共3页
将现有网络搜索引擎过渡到网络问答系统是WI的基本目标之一,模糊问答系统是网络问答系统研究的重要问题。基于模糊描述逻辑,该文特化了PNL过程,提出了PNL式模糊网络问答系统。该系统将模糊描述逻辑规则作为PNL推理过程中用到的原型语言... 将现有网络搜索引擎过渡到网络问答系统是WI的基本目标之一,模糊问答系统是网络问答系统研究的重要问题。基于模糊描述逻辑,该文特化了PNL过程,提出了PNL式模糊网络问答系统。该系统将模糊描述逻辑规则作为PNL推理过程中用到的原型语言规则中的计算部分,推理出原型语言规则中的知识符号,并以一个具体的问答实例,介绍了PNL式问答系统的工作流程。 展开更多
关键词 模糊描述逻辑 精确的自然语言 问答系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部