准确把握科研领域内文献主题的演化情况,有助于更好的进行科学研究。针对文献语料具有的单一主题时间性强、多个主题间关联性大等特点,本文在标准LDA模型基础上,将语料按照时序关系进行分片,建立动态LDA模型,以此来研究各个主题的强度...准确把握科研领域内文献主题的演化情况,有助于更好的进行科学研究。针对文献语料具有的单一主题时间性强、多个主题间关联性大等特点,本文在标准LDA模型基础上,将语料按照时序关系进行分片,建立动态LDA模型,以此来研究各个主题的强度和内容随时间的变化情况。同时选择目前热门的"Big Data"技术作为实验对象,从Web of Science数据库中抽取引文信息建立训练数据集,利用变分贝叶斯推断法对模型进行了求解,并对结果进行了可视化展示,实验表明,该方法简单有效,可以为把握科研发展趋势提供有效决策支持。展开更多
文摘准确把握科研领域内文献主题的演化情况,有助于更好的进行科学研究。针对文献语料具有的单一主题时间性强、多个主题间关联性大等特点,本文在标准LDA模型基础上,将语料按照时序关系进行分片,建立动态LDA模型,以此来研究各个主题的强度和内容随时间的变化情况。同时选择目前热门的"Big Data"技术作为实验对象,从Web of Science数据库中抽取引文信息建立训练数据集,利用变分贝叶斯推断法对模型进行了求解,并对结果进行了可视化展示,实验表明,该方法简单有效,可以为把握科研发展趋势提供有效决策支持。