摘要
在分析文献在不同研究阶段用词时间特征的倾向性基础上,提出一种基于主题模型的研究发展阶段识别方法。重点阐述该方法的构建过程,包括时间特征抽取、发展阶段界定、主题冷热变化分析等步骤。为验证该方法的有效性,针对词频统计法和主题模型方法在主题演化分析中的效果进行比较分析。结果表明,该方法能在识别主题热点和发展趋势的同时,有效地区分不同主题所反映的研究发展阶段。
After analyzing the temporal characteristics of literature in different themes evolution periods, this paper raises a method for identifying research period of a theme based on topic model. It emphasizes the construct process of the method, including temporal expression extraction, research period identification and hot and cold topic description. It tests the effectiveness of this method by comparing the word frequency method and topic model method for research evolution analysis. Experiment results show that the proposed method is an effective solution to depict the implied research period of a theme while describing the hotspot and research tendency.
出处
《图书情报工作》
CSSCI
北大核心
2013年第7期81-88,共8页
Library and Information Service
基金
江苏省2012年度普通高校研究生科研创新计划项目"基于异构社会网络数据的信息集成与检索研究"(项目编号:CXZZ12_0073)
国家社会科学基金项目"基于语言特征的中文意见挖掘研究"(项目编号:11CYY031)研究成果之一
关键词
主题模型
文献时间特征
主题演化分析
时间抽取
topic model temporal information of literature theme evolution analysis temporal expression extraction