期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
网页文本分类挖掘的几种算法研究
被引量:
2
下载PDF
职称材料
导出
摘要
文本挖掘应用广泛,是Web挖掘的一个重要分之。介绍了Web文本的定义、一般的文本分类挖掘过程及常见的几种分类算法。
作者
李锐
机构地区
西安石油大学计算机学院
出处
《福建电脑》
2008年第10期36-36,59,共2页
Journal of Fujian Computer
关键词
文本
挖掘
算法
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP311.134 [自动化与计算机技术—计算机软件与理论]
引文网络
相关文献
节点文献
二级参考文献
5
参考文献
1
共引文献
355
同被引文献
12
引证文献
2
二级引证文献
9
参考文献
1
1
韩家炜,孟小峰,王静,李盛恩.
Web挖掘研究[J]
.计算机研究与发展,2001,38(4):405-414.
被引量:356
二级参考文献
5
1
Han J,Data Mining:Concepts and Techniques,2000年
2
Wang K,Proc of VLDB'97,1999年,363页
3
Zaiane O R,Proc Int Workshop Web Information and Data Management(WIDM'98),1998年,9页
4
Mobasher B,Tech Rep:TR96 0 5 0,1996年
5
Zaiane O R,Proc KDD'95,1995年,331页
共引文献
355
1
杨洋.
Web数据挖掘的分析与探讨[J]
.装备制造技术,2006(5):63-64.
被引量:1
2
王志明,沙莎.
Web文本挖掘技术在新闻主题检测中的应用研究[J]
.长沙大学学报,2007,21(5):58-60.
被引量:2
3
阿静.
政企互动打假树维权典范——爱普生打印机胜诉“骗保门”事件[J]
.办公自动化,2006(14):10-11.
4
董德民.
面向电子商务的Web使用挖掘及其应用研究[J]
.中国管理信息化(综合版),2006,9(10):83-85.
被引量:1
5
杜志文,曾文华.
网格计算在文本分类中的应用[J]
.微电子学与计算机,2006,23(z1):221-222.
6
张克君,李伯群,李欣,杨炳儒.
基于DWLMS模型的分布式Web用户访问模式挖掘[J]
.清华大学学报(自然科学版),2005,45(S1):1762-1766.
被引量:2
7
万君,耿东辉.
浅说电子商务中的数据挖掘技术[J]
.东北大学学报(自然科学版),2004,25(z1):194-196.
被引量:1
8
许亮,李明,梁素田,侯耕.
数据挖掘技术在电子商务中的应用[J]
.甘肃科学学报,2002,14(S1):17-20.
被引量:1
9
王丽娜.
Web日志挖掘技术研究[J]
.光盘技术,2008(4):34-36.
被引量:2
10
李慧.
数据挖掘技术探讨及其基于web的应用研究[J]
.硅谷,2008,1(22):71-71.
同被引文献
12
1
金鑫.
电子文件呼唤前端控制[J]
.档案学研究,2004(6):48-51.
被引量:23
2
索传军.
基于信息生命周期的数字馆藏管理研究[J]
.大学图书馆学报,2005,23(1):26-29.
被引量:32
3
赵燕,陈晓云,莫明辉,汤勇.
基于用户群的智能主题爬虫[J]
.广西师范大学学报(自然科学版),2007,25(2):230-233.
被引量:3
4
Suman Tedla B E. Analyzing bias and quality of search engines using HIT. The University of Houston-Clear Lake, 2006 : 2--3.
5
李涛,陈鹏,李哲.
深度Web资源探测系统的研究与实现[J]
.微计算机信息,2007,23(33):185-187.
被引量:7
6
王舜燕,李蕾,吴兵华.
基于ID3分类算法的深度网络爬虫设计[J]
.现代图书情报技术,2008(6):41-45.
被引量:4
7
李铭岳,周军.
基于改进HTML-Tree的中文网页特征向量提取方法[J]
.信息技术,2009,33(1):10-14.
被引量:3
8
索传军.
试论信息生命周期的概念及研究内容[J]
.图书情报工作,2010,54(13):5-9.
被引量:43
9
杨艳.
档案学前端控制思想的学术渊源和实践需求[J]
.北京档案,2012(9):16-18.
被引量:6
10
林彤,江志军.
Internet的搜索引擎[J]
.计算机工程与应用,2000,36(5):160-163.
被引量:23
引证文献
2
1
孙玲芳,黎维良.
基于定题爬虫的网页分类的多级判定算法[J]
.科学技术与工程,2009,9(18):5534-5537.
被引量:1
2
吴硕娜,黄新荣.
Web归档生命周期模型的发展研究[J]
.数字图书馆论坛,2018(10):41-45.
被引量:8
二级引证文献
9
1
焦赛美.
网络爬虫技术的研究[J]
.琼州学院学报,2011,18(5):28-30.
被引量:9
2
周文泓,代林序,杨梓钒,张玉洁,陈怡.
基于数字记忆保存的网络信息存档实践进展研究及启示[J]
.情报理论与实践,2020,43(7):37-42.
被引量:14
3
周文泓,苏依纹,吴琼,黄小宇,张晓宇,文丽君,贺谭涛.
重大公共卫生事件的网络信息存档架构——新冠肺炎疫情的启示[J]
.图书情报工作,2020,64(15):184-193.
被引量:6
4
周文泓,苏依纹,代林序,杨梓钒,张玉洁,陈怡.
进展与展望:面向数字记忆资源建设的网络信息存档[J]
.图书馆论坛,2020,40(9):42-52.
被引量:14
5
周文泓,苏依纹,贺谭涛,黄小宇,李彦可.
重大事件网络信息存档的全球实践进展研究及其启示[J]
.情报理论与实践,2021,44(1):42-49.
被引量:3
6
吴倩,王运彬.
网站时光机:美国网页存档模式探索——以Internet Archive为例[J]
.图书馆,2021(7):91-97.
被引量:5
7
李彩容,王熳莉.
基于Web生命周期管理模型的美国网页归档项目政策分析[J]
.北京档案,2022(2):45-48.
被引量:2
8
初彦伯,王萍,李依凝,李佳恒.
国内外网页存档理论与实践研究历程与特征分析[J]
.现代情报,2022,42(4):153-167.
被引量:2
9
何露彤,林妍歆,王春蕾.
全球网络信息存档:行动全景、基本要素和关键问题[J]
.山西档案,2023(6):125-134.
被引量:3
1
方金城.
分类挖掘算法综述[J]
.沈阳工程学院学报(自然科学版),2006,2(1):73-76.
被引量:8
2
付国瑜.
Web文本分类挖掘[J]
.科学咨询,2008(5):56-56.
被引量:1
3
张如云.
文本配色在网页设计中的应用研究[J]
.办公自动化,2016,21(19):57-58.
4
田苗苗.
基于决策树的文本分类研究[J]
.吉林师范大学学报(自然科学版),2008,29(1):54-56.
被引量:9
5
孙冠楠.
数据挖掘中分类方法简述[J]
.科技资讯,2007,5(30).
6
刘利,刘珍.
决策树分类算法的可扩展性研究[J]
.惠州学院学报,2009,29(3):58-61.
7
软件速递[J]
.大众硬件,2003(8):130-130.
8
树林.
轻松收集网页文本[J]
.软件,2005,26(8):65-65.
9
孙凯,魏海平.
一种改进的文本特征选择方法[J]
.科学技术与工程,2012,20(12):3002-3004.
10
李龙澍,邹武.
基于粗糙集的图像分类挖掘[J]
.计算机技术与发展,2009,19(4):143-145.
福建电脑
2008年 第10期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部