期刊文献+

大数据环境下的文本挖掘教学内容探讨 被引量:3

Discussion on the content of text mining in big data environment
下载PDF
导出
摘要 文章针对"数据挖掘"课程的文本数据挖掘过程的关键问题,开展大数据环境下的文本挖掘教学内容的探讨。从大数据背景下文本挖掘的应用场景中入手,讨论文本挖掘与数据挖掘的区别和联系,并着重阐释文本数据预处理的分词技术及矩阵表示方法、文本数据分析与挖掘的关联分析、聚类和分类分析等教学内容,帮助学生梳理文本挖掘过程的重点和难点知识以及了解文本挖掘领域的前沿动态。 In view of the key problem of text data mining in the course of“data mining”,this paper discusses the content of text mining in large data environment.Starting from the data mining application scenarios under the background of the text,it discusses the difference and connection between text mining and data mining.It focuses on the teaching content of word segmentation and matrix representation method in the process of text data preprocessing,and association analysis,clustering and classification.It helps students to comb the key and difficult the text process knowledge,and to understand the frontiers of the field of text mining.
作者 白杨 Bai Yang(School of Information Engineering,Eastern Liaoning University,Dandong 118003,China)
出处 《无线互联科技》 2018年第9期86-87,共2页 Wireless Internet Technology
基金 辽东学院科研基金重点培育项目 项目名称:大数据环境下融合情感语义特征的个性化学习模式研究 项目编号:2016ZD001
关键词 文本挖掘 分词 数据预处理 数据挖掘 text mining word segmentation data preprocessing data mining
  • 相关文献

参考文献1

二级参考文献48

  • 1徐妙君,顾沈明.面向Web的文本挖掘技术研究[J].控制工程,2003,10(z1):44-46. 被引量:4
  • 2杨斌,孟志青.一种文本分类数据挖掘的技术[J].湘潭大学自然科学学报,2001,23(4):34-37. 被引量:10
  • 3DavidHand HeikkiMarmila PadhraicSmyth 张银奎 廖丽 宋俊译.数据挖掘原理[M].机械工业出版社,2003..
  • 4TomMMitchell.机器学习[M].北京:机械工业出版社,2003.263-276.
  • 5刘群 张华平 俞鸿魁.基于层次隐马模型的汉语词法分析[Z].,2003..
  • 6Salton G,Wong A,Yang C Sa. Vector Space Model for Automatic Indexing [J]. Communications of the ACM, 1975,18(5 ) : 613-620.
  • 7Bray T, Paoli J, Sperberg-McQaeen C M, Extcnsible Markup Language (XML) 1,0 Specification [EB/OL]. World Wide Web Consortium Recommendation, http://www.w3.org/TR/REC-xml,1998.
  • 8Lassila O, Swick R R. Resource Description Framework Model and Syntax Specification [ EB/OL]. Workt Wide Web Consortium Recommendation, http ://www. w3. org/TR/REC-rdf-syntax/, 1999.
  • 9Koller D, Sahami M. Hierarchically Classifying Documents Using Very Few Words[J]. ICML'97, 1997, 170-178.
  • 10Pirolli P, Schank P,et al. Scatter/Gather Browsing Communicates the Topic Structure of a Very Large Text Collection [C]. Proc. of the ACM Sig. Chi. Conf. on Human Factors in Computing Systems, 1996.

共引文献57

同被引文献24

引证文献3

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部