摘要
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
Based on the review of text classification and news categorization, the features of news text and the characteristics of news categorization are concluded. The applications of Chinese news categorization on news site navigation, topic detection and tracking, and personalized news recommendation are summarized. Finally, this paper puts forward corresponding measures to solve existing problems about Chinese news categorization, such as low authenticity of news, idealization of classification system, and single dimension of classification.
出处
《图书情报工作》
CSSCI
北大核心
2013年第14期134-139,共6页
Library and Information Service
基金
江苏省社会科学基金项目"数字报纸的自动标引研究"(项目编号:09TQC011)
教育部人文社会科学研究项目"电子报纸内容深加工研究"(项目编号:09YJC870014)研究成果之一
关键词
新闻分类
文本分类
机器学习
中文信息处理
news categorization
text classification
machine learning
Chinese information processing