-
题名一种基于模糊熵的模糊分类算法
被引量:4
- 1
-
-
作者
翟俊海
王华超
张素芳
-
机构
河北大学数学与计算机学院、河北省机器学习与计算智能重点实验室
河北省信息工程学校数学教研室
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第20期176-180,共5页
-
基金
国家自然科学基金No.60903088
河北省自然科学基金No.F2008000323,No.F2008000635,No.F2009000227
+1 种基金
河北省应用基础研究重点项目(No.08963522D)
河北省教育厅科学研究计划项目No.2009312,No.2009410~~
-
文摘
在模糊ID3算法中,用模糊分类熵选择扩展属性,以自顶向下的方式递归地构建模糊决策树,对数据进行分类。提出了一种基于属性模糊熵的模糊分类算法,不同于模糊ID3算法,模糊条件属性的模糊熵作为权值用来对相对模糊频率进行加权,综合考虑各个模糊条件属性对分类的贡献。实例分析和实验结果表明了这一算法的有效性。
-
关键词
模糊信息系统
模糊决策树
模糊ID3算法
模糊熵
模糊条件属性
模糊决策属性
-
Keywords
fuzzy information system
fuzzy decision tree
fuzzy ID3
fuzzy entropy
fuzzy condition attributes
fuzzy decision attributes
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于主题本体扩展特征的短文本分类
被引量:4
- 2
-
-
作者
湛燕
陈昊
-
机构
河北大学数学与计算机学院、河北省机器学习与计算智能重点实验室
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2014年第3期307-311,共5页
-
基金
国家自然科学基金资助项目(60903088)
河北省自然科学基金资助项目(F2013201064
+2 种基金
A2010000188)
河北大学自然科学研究计划青年基金资助项目(2010Q23)
河北省软科学研究计划项目(14450318D)
-
文摘
短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性.
-
关键词
短文本分类
主题本体
案例维护
-
Keywords
short text categorization
theme ontology
case-base maintenance
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-