期刊文献+

基于ESVM的科技政策文本标签分类研究 被引量:1

Research on text label classification of science and technology policy based on ESVM
下载PDF
导出
摘要 文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘。本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM科技政策文本标签分类方法。最后,对比SVM和ESVM两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性。 Text label is a kind of text keywords,can simplify extraction of effective information from science and technology policy.For science and technology policy,this paper divides text label into four kinds,such as science and technology investment,intellectual property rights,rural science and technology,tax.Aimed at the shortcoming of the traditional SVM algorithm’s label data unbalance,this paper provides a text label classification method of science and technology policy,which combines the Euclidean distance algorithm and ESVM algorithm with penalty factor.Finally,with comparing SVM and ESVM,the validity of the propose method on science and technology policy text label is verified.
作者 吴峰 李银生 聂永川 范通让 赵文彬 张博 WU Feng;LI Yin-sheng;NIE Yong-chuan;FAN Tong-rang;ZHAO Wen-bin;ZHANG Bo(Institute of Scientific and Technical Information of Hebei Province,Shijiazhuang Hebei 050021,China;School of Information Science and Technology,Shijiazhuang Tiedao University,Shijiazhuang Hebei 050043,China)
出处 《河北省科学院学报》 CAS 2018年第1期1-10,共10页 Journal of The Hebei Academy of Sciences
基金 国家自然科学基金(#61373160) 河北省科技厅科技支撑计划项目(17210113D),(179676334D)
关键词 文本标签分类 科技政策 SVM 不平衡数据 Text label classification Science and technology policy SVM Unbalanced data
  • 相关文献

参考文献5

二级参考文献34

  • 1陈丽,陈静.基于支持向量机和k-近邻分类器的多特征融合方法[J].计算机应用,2009,29(3):833-835. 被引量:14
  • 2娄震,金忠,杨静宇.基于类条件置信变换的后验概率估计方法[J].计算机学报,2005,28(1):18-24. 被引量:6
  • 3业宁,王迪,窦立君.信息熵与支持向量的关系[J].广西师范大学学报(自然科学版),2006,24(4):127-130. 被引量:10
  • 4施建宇,潘泉,张绍武,邵壮超,姜涛.基于多特征融合的蛋白质折叠子预测[J].北京生物医学工程,2006,25(5):482-485. 被引量:2
  • 5Poyhonen S, Negrea M, Arkkio A, et o2. Support vector classificationfor fault diagnostics of an electrical machine[A]. Proc. of InL Conf. OnSignal Processing (ICSP'02)[C]. Beijing, August, 2002: 26-30.
  • 6Vapnik V 张学工译.统计学习理论的本质[M].北京:清华大学出版社,2000..
  • 7Shin K S, Lee T S, Kim H J. An Application of Support Vector Machines in Bankruptcy Prediction Model[J]. Expert Systems with Applications, 2005, 28(1): 127-135.
  • 8Holger K Olivier C, Bernhard S. Feature Selection for Support Vector Machines by Means of Genetic Algorithms[EB/OL]. (2003-03-30). http://ieeexplore.ieee.org/ie15/8840/27974/01250182. pdf.
  • 9Vapnik V, Chapelle O. Bounds on Error Expectation for Support Vector Machines[J]. Neural Computation, 2000, 12(9): 2013-2016.
  • 10Altman E, Haldeman R, Narayanan R Zeta Analysis: A New Model to Identify Bankruptcy Risk of Corporations[J]. Journal of Banking & Finance, 1977, 1(1): 29-54.

共引文献192

同被引文献20

引证文献1

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部