应用多层次聚类方法挖掘图书馆微博数据被引量：3

Application of multilevel clustering in mining library microblog data

下载PDF

导出

摘要使用R语言工具,利用Pamk算法和Kmeans算法相结合的多层次聚类方法,对图书馆新浪微博数据进行子主题聚类和挖掘,发现和摒弃大数据集合中的无用数据,挖掘隐含信息,提高微博信息的利用效率和水平,充分发挥其在图书馆工作中的作用。 The subtopics of library microblog data on Sina website were clustered and mined using the R language tools in combination with the Pamk and Kmeans algoritjm.The non-valid data were discarded from the large data set with the hidden data preserved to improve the access to microblog data and bring them into full play in library service .

作者文炯

机构地区广东药学院图书馆

出处《中华医学图书情报杂志》 CAS 2014年第4期46-49,共4页 Chinese Journal of Medical Library and Information Science

关键词图书馆微博 Pamk算法 Kmeans算法文本聚类数据挖掘 Library microblog Pamk algorithm Kmeans algorithm Text clustering Data mining

分类号 G250.7 [文化科学—图书馆学] R-058 [医药卫生]

引文网络
相关文献

参考文献6

1兰萍,刘亚民.山东地区图书馆微博应用情况调查与分析[J].中华医学图书情报杂志,2012,21(6):45-48. 被引量：15
2黄艳.微博的特点及其在医院图书馆的应用[J].中华医学图书情报杂志,2013,22(6):64-66. 被引量：4
3高俊奎,付永宏,吴素彬.美国情报体制发展趋势研究[J].情报杂志,2010,29(2):27-29. 被引量：10
4朱连江,马炳先,赵学泉.基于轮廓系数的聚类有效性分析[J].计算机应用,2010,30(12):139-141. 被引量：119
5肖凤,郑海健,卢闯.基于聚类分析的银行客户关系管理策略研究[J].技术经济,2010,29(1):87-93. 被引量：14
6郭茜.搜索引擎结果冗余信息消解算法的研究与应用[D].上海:东华大学.2010.

二级参考文献44

1郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(z1):202-206. 被引量：15
2蒙肖莲,蔡淑琴,杜宽旗,寇建亭.商业银行客户流失预测模型研究[J].系统工程,2004,22(12):67-71. 被引量：19
3刘涛,吴功宜,陈正.一种高效的用于文本聚类的无监督特征选择算法[J].计算机研究与发展,2005,42(3):381-386. 被引量：37
4尉景辉,何丕廉,孙越恒.基于K-Means的文本层次聚类算法研究[J].计算机应用,2005,25(10):2323-2324. 被引量：18
5谭元戎,孙剑平.聚类模型在客户关系管理中的应用以及对特征提取的探讨[J].技术经济,2007,26(5):51-56. 被引量：9
6唐志航,杨保安.系统聚类在客户关系管理中的研究与应用[J].计算机工程与应用,2007,43(13):220-223. 被引量：5
7ASPINALL E,NANCARROW C,STONE M. The meaning and measurement of customer retention[J]. Journal of Targeting Measurement and Analysis for Marketing, 2001,10(1) :79-86.
8CARDELL N S,GOLOVNYA M,STEINBERG D. Churn modeling for mobile telecommunications: Winning the Duke/NCR Teradata center for CRM competition[EB/ OL]. 2003 ,http://www. salford-systems.com.
9BREIMAN L, FRIEDMAN J, OLSHEN R, et al. Classification and regression trees [ R]. Pacific Grove: Wadsworth, 1984.
10DAYKJN C D, BERNSTEIN G D. A simulation model to examine questions of solvency in the light of asset and run-off risks[R]. Biarritz: ASTIN Colloquium, 1985.

共引文献153

1陈剑,程明.基于tSNE-ASC特征选择和DSmT融合决策的滚动轴承声振信号故障诊断[J].电子测量与仪器学报,2022,36(4):195-204. 被引量：6
2王云才,孟宪文.国家情报体系变革的动因与内在矛盾[J].北京人民警察学院学报,2013(1):62-64. 被引量：4
3张倩.美国情报机构的历史沿革[J].情报探索,2011(4):44-45. 被引量：2
4吴勇,李仁发,刘钰峰.基于Ant-Tree算法的短文本聚类研究[J].软件,2011,32(4):84-86.
5孙耀,洪璧.基于聚类分析的客户金字塔模型研究[J].中国电子商务,2011(12):101-102.
6吴勇,徐峰.一种适用于短消息文本的聚类算法[J].计算机与现代化,2012(2):31-34.
7高庆德.美国情报界“一体化”的理论与实践[J].情报杂志,2012,31(3):65-69. 被引量：3
8陈悦华,廖造壮.武汉城市圈固定资产投资聚类分析[J].技术经济,2012,31(5):55-59.
9曹永春,邵亚斌,田双亮,蔡正琦.一种基于分组遗传算法的聚类新方法[J].西华大学学报（自然科学版）,2013,32(1):39-43. 被引量：7
10李玉贞,胡勇,熊熙,马晓娟,张敏.微博意见领袖的评估模型[J].信息安全与通信保密,2013,11(2):79-81. 被引量：22

同被引文献38

1卫志华,孔思尹,丁志军,赵才荣.新工科背景下数据挖掘课程综合性实验设计[J].计算机教育,2020(3):127-130. 被引量：18
2微博营销进入“量化时代”——“微博大师(Weibo Master)”准确的微博评估及投放优化[J].广告大观（综合版）,2011(7):94-94. 被引量：4
3廉捷,周欣,曹伟,刘云.新浪微博数据挖掘方案[J].清华大学学报（自然科学版）,2011,51(10):1300-1305. 被引量：120
4杨小云.数据挖掘在图书馆中的应用[J].渭南师范学院学报,2005,20(S2):128-129. 被引量：5
5孔淼.国内图书馆微博服务现状研究——以新浪微博为例[J].农业图书情报学刊,2011,23(12):204-208. 被引量：22
6刘静.我国高校图书馆认证用户微博调查分析——以新浪微博为平台[J].图书馆学研究,2012(1):90-95. 被引量：33
7赵爱琴,朱景焕.企业微博营销效果评估研究[J].江苏商论,2012(1):89-92. 被引量：42
8兰萍,刘亚民.山东地区图书馆微博应用情况调查与分析[J].中华医学图书情报杂志,2012,21(6):45-48. 被引量：15
9杨玫.公共图书馆微博推广实证研究——以杭州图书馆为例[J].情报资料工作,2012,33(4):102-105. 被引量：33
10康琼琼.高校图书馆微博应用调查分析[J].图书馆学刊,2012,34(8):126-128. 被引量：20

引证文献3

1靳爱红.图书馆微博营销评价指标体系的构建[J].中华医学图书情报杂志,2015,24(5):23-27. 被引量：3
2白文秀,孙慧,张桂杰.数据挖掘技术在图书馆远程访问系统中的应用研究[J].吉林师范大学学报（自然科学版）,2015,36(4):149-152. 被引量：5
3张晓川.基于人工智能推理引擎的微博数据挖掘方法研究[J].现代科学仪器,2020(3):193-196.

二级引证文献8

1周慧妮,江文奇.基于前景理论和VIKOR的营销竞争情报评价研究[J].情报杂志,2015,34(10):16-21. 被引量：8
2骆焦煌.数据挖掘技术在入侵检测系统中的应用研究[J].吉林师范大学学报（自然科学版）,2016,37(2):131-135. 被引量：6
3陈芳,刘芳.地方高校图书馆社交媒体互动效果分析——以新浪认证微博为例[J].情报科学,2016,34(12):115-119. 被引量：5
4孙慧.大数据环境下图书馆数据来源与采集研究[J].智能计算机与应用,2017,7(5):140-141. 被引量：2
5崔梦天,吴倩.基于Redis缓存的数字化图书馆应用[J].吉林师范大学学报（自然科学版）,2018,39(2):123-127. 被引量：3
6乔虹.数据挖掘在高校图书馆阅读推广中的应用研究[J].中小企业管理与科技,2018,2(18):70-71.
7钟阳.图书馆信息服务的远程控制应用分析[J].信息与电脑,2019,0(14):23-24.
8马晓庆.图书馆营销研究文献统计与可视化分析[J].图书情报工作,2018,62(S1):119-124. 被引量：3

1粟慧.重视学术期刊隐含信息的开发：近三年《中国科学A辑》分析[J].情报业务研究,1992,9(4):239-242.
2李颖,贺峰涛.引进类科技图书的市场化突围——以“R语言应用系列丛书”为例[J].科技与出版,2015(6):54-56. 被引量：1
3王发生,毛君莲.隐含信息的重组与知识创新[J].情报科学,2000,18(5):394-396. 被引量：9
4马征亚,吕挫挫,郭俊仓.基于WEKA的高校图书馆流通日志的挖掘[J].农业网络信息,2016(3):59-61.
5文炯.图书馆服务质量评价中微博数据的应用研究[J].新世纪图书馆,2014(8):20-23.
6何小兰.丰富电视新闻版面语言的途径[J].新闻大学,1996(3):56-58.
7问书芳.主题聚类式特藏建设初探——兼论西安交通大学“民国高等教育”特藏[J].图书馆学刊,2015,37(6):48-50. 被引量：6
8朱少强,邱均平.文献计量与内容分析——文献群中隐含信息的挖掘[J].图书情报工作,2005,49(6):19-23. 被引量：55
9黄晓斌,谭颖骞.网络信息挖掘方法的效果评价[J].情报理论与实践,2011,34(6):97-101.
10宋忠惠,郑军卫.图书情报类期刊中的智库相关研究评价与分析[J].情报杂志,2016,35(8):145-150. 被引量：9

中华医学图书情报杂志

2014年第4期

浏览历史

内容加载中请稍等...

应用多层次聚类方法挖掘图书馆微博数据被引量：3

参考文献6

二级参考文献44

共引文献153

同被引文献38

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

应用多层次聚类方法挖掘图书馆微博数据 被引量：3

参考文献6

二级参考文献44

共引文献153

同被引文献38

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

应用多层次聚类方法挖掘图书馆微博数据被引量：3