摘要
文本聚类是文本信息处理问题中的一个研究热点,LDA主题模型是在语义层面对文本进行建模的一种算法。本文详述了LDA主题模型原理及其在文本聚类中的应用,在英文数据集上进行了文本聚类实验。实验结果表明,LDA主题模型是一种有效的基于语义的文本聚类算法。
Text clustering is one of research focuses in text information processing.Latent Dirichlet Allocation(LDA) is a topic model which can model text in semantic level.The theory and application in text clustering of LDA are elaborated.The experiments on English datasets about LDA are carried out.The result demonstrates that LDA is an effective algorithm for text clustering based on semantic.
出处
《数字技术与应用》
2017年第12期76-77,共2页
Digital Technology & Application