期刊文献+

面向网络论坛话题发现的文本处理技术研究

下载PDF
导出
摘要 论坛、博客、微博、QQ空间等都是重要的网络社交载体,但各自的网页结构和语言风格又有差异.本文根据网络论坛的网页结构和数据特点,阐述了应用于话题检测的网络论坛数据处理的相关技术,包括文本预处理和特征选择技术.介绍了这些技术的发展现状和研究成果,论述了命名实体信息在论坛话题检测中的作用,讨论了论坛中时间信息的识别与规范化处理.
作者 吴伊萍
出处 《赤峰学院学报(自然科学版)》 2011年第11期32-34,共3页 Journal of Chifeng University(Natural Science Edition)
  • 相关文献

参考文献16

  • 1Intemet Forum http://en.wikipedia.org/wiki/Internet_fo- rum.2011-07-24.
  • 2Zhang Zhonghui;Wu Bin, Document similarity measure for topic detection in BBS, FKSD 2010,2354 2357,2010.
  • 3Hila Bechker, Mor Naaman, Luis Gravano. Learning Similarity Metrics for Event Identification in Social Me- dia[C]. WSDM'10, February 4-6,2010,New York City, New York, USA.
  • 4Giridhar Kumaran , James Allan. Text classification and named entities for new event detection [C].Proceedings of the 27th annual international ACM SIGIR confer- ence on Research and development in information re- trieval, July 25-29, 2004, Sheffield, United Kingdom.
  • 5网络论坛.http://zh.wikipedia.org/.维基百科.2011-07-24.
  • 6余军,陈晓鸥.命名实体识别:one-at-a-dmeorAll-at-once?Word-based or Character-based?[C].第七届中文信息处理国际会议.2007.
  • 7吴昊,耿焕同,吴祥.一种基于聚类分析的BBS主题发现算法研究[J].安徽师范大学学报(自然科学版),2009,32(1):9-13. 被引量:7
  • 8Christoper D.Manning, Prabhakar Raghavan, Hinrich Schutze.信息检索导论[M].北京:人民邮电出版社,2010.
  • 9LDC, http://www.ldc.upenn.edu/DataSheets/.2011-07- 24.
  • 10http://code.google.com/p/paoding/.

二级参考文献7

  • 1刘云峰,齐欢,代建民.潜在语义分析在中文信息处理中的应用[J].计算机工程与应用,2005,41(3):91-93. 被引量:18
  • 2蒋凡,高俊波,张敏,王煦法.BBS中主题发现原型系统的设计与实现[J].计算机工程与应用,2005,41(31):151-153. 被引量:19
  • 3JOUNI K S, ELLA B, HEIKKI M. A simple algorithm :for topic identification in 0 - 1 data[C] .PKDD2003.LNAI 2838,2003:423 -434.
  • 4NAOHIRO M, YUKIO O, MITSURU I. Profiling of participants in online-oommunity[J]. American Association for Artificial Intelligence, 2002,27(4) : 171 - 176.
  • 5DUMAIS S T. Improving the retrieval of information from external murces[J ]. Behav Res Methods Instr Comput, 1991,23:229- 236.
  • 6CHRISTOS H P, PRABHAKAR R H, TAMAKI S V. Latent semantic indexing: a probabilistie analysis[J]. Journal of Computer and System Sciences;2000,61(2) : 159 - 168.
  • 7刘昌钰,唐常杰,于中华,杜永萍,郭颖.基于潜在语义分析的BBS文档Bayes鉴别器[J].计算机学报,2004,27(4):566-572. 被引量:17

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部