摘要
文章针对"数据挖掘"课程的文本数据挖掘过程的关键问题,开展大数据环境下的文本挖掘教学内容的探讨。从大数据背景下文本挖掘的应用场景中入手,讨论文本挖掘与数据挖掘的区别和联系,并着重阐释文本数据预处理的分词技术及矩阵表示方法、文本数据分析与挖掘的关联分析、聚类和分类分析等教学内容,帮助学生梳理文本挖掘过程的重点和难点知识以及了解文本挖掘领域的前沿动态。
In view of the key problem of text data mining in the course of“data mining”,this paper discusses the content of text mining in large data environment.Starting from the data mining application scenarios under the background of the text,it discusses the difference and connection between text mining and data mining.It focuses on the teaching content of word segmentation and matrix representation method in the process of text data preprocessing,and association analysis,clustering and classification.It helps students to comb the key and difficult the text process knowledge,and to understand the frontiers of the field of text mining.
作者
白杨
Bai Yang(School of Information Engineering,Eastern Liaoning University,Dandong 118003,China)
出处
《无线互联科技》
2018年第9期86-87,共2页
Wireless Internet Technology
基金
辽东学院科研基金重点培育项目
项目名称:大数据环境下融合情感语义特征的个性化学习模式研究
项目编号:2016ZD001
关键词
文本挖掘
分词
数据预处理
数据挖掘
text mining
word segmentation
data preprocessing
data mining