基于数据挖掘的网络购物用户兴趣分类研究被引量：1

Research on Interest Classification of Online Shopping Users Based on Data Mining

下载PDF

导出

摘要对网络购物用户兴趣进行分类研究可以根据网络购物用户的兴趣向其推送可能感兴趣的商品,能够在为用户提供更多的方便同时提高店铺的销售量。当前方法的初始簇中心选择具有随机性,受网络购物用户兴趣数据孤立点的影响较大,分类稳定性和准确性较差。提出一种基于数据挖掘的网络购物用户兴趣分类方法,对网络购物用户兴趣的网页浏览停留时间、兴趣的持续时间、兴趣得分分别进行了分析和计算。通过设定关于网络购物用户兴趣得分的阀值对强兴趣、弱兴趣以及非兴趣进行区分。将网络购物用户兴趣分为短期兴趣和长期兴趣两种,构建了网络购物用户兴趣模型。为了提高分类结果的稳定性以及排除孤立点的影响,对K-Means算法进行了改进,对网络购物用户兴趣数据进行多次采样,最终选取较优的初始簇中心对网络购物用户兴趣进行分类。仿真结果证明,所提方法受网络购物用户兴趣数据孤立点的影响明显降低,且获得的分类结果更加接近实际数据分布,CPU用时和迭代次数较少。 This paper proposed a method of classifying network shopping user interest based on data mining. This method analyzed and calculated the web browsing time, the time of duration and the interest score of network shopping user interest. By setting the threshold value about network shopping user interest score, we distinguished strong inter- est, weak interest and non-interest. Then, we divided network shopping user interests into short-term interest and long-term interest. Meanwhile, we built the model of network shopping user interest. In order to improve the stability of classification result and exclude the influence of isolated point, we improved K-Means algorithm and sampled the network shopping user interest data time after time. Finally, we chose the better initial cluster center to classify the network shopping user interest. Simulation results prove that the influence of isolated point of online shopping user in- terest data on proposed method is significantly reduced. Meanwhile, the classification result is close to the actual data distribution, which needs little time consumption of CUP and number of iterations.

作者韩景灵 HAN Jing-ling(Business College of Shanxi University,Taiyuan Shanxi 030031,China)

机构地区山西大学商务学院

出处《计算机仿真》北大核心 2018年第7期418-421,共4页 Computer Simulation

关键词数据挖掘网络购物用户兴趣分类 Data mining Network shopping User Interest Classification

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1石光莲,杨敏.基于FCA的Folksonomy用户兴趣研究述评[J].现代情报,2017,37(5):172-177. 被引量：5
2王成舜,陈毓芬,郑束蕾,王双.基于眼动数据的网络地图界面用户兴趣分析方法[J].地理与地理信息科学,2017,33(2):57-62. 被引量：8
3陈康,付华峥,陈翀,张宇艺,韦誉.基于DPI的用户兴趣实时分类[J].电信科学,2016,32(12):109-115. 被引量：4
4李辉,梅佩,易军凯.基于混合度量方法的用户兴趣模型[J].计算机工程与设计,2016,37(3):650-654. 被引量：2
5周润物,李智勇,陈少淼,陈京,李仁发.面向大数据处理的并行优化抽样聚类K-means算法[J].计算机应用,2016,36(2):311-315. 被引量：46
6任星怡,宋美娜,宋俊德.基于位置社交网络的上下文感知的兴趣点推荐[J].计算机学报,2017,40(4):824-841. 被引量：63
7吴海涛,应时.基于信息内容和拓扑关系的社会媒体用户兴趣分类[J].计算机科学,2015,42(4):185-189. 被引量：2
8李毓丽.无线网络中对于兴趣数据优化检测研究[J].计算机仿真,2016,33(11):434-437. 被引量：2
9穆桃,陈伟,陈松健.基于多层网络流量分析的用户分类方法[J].计算机应用,2017,37(3):705-710. 被引量：4
10李俊.基于风险数据挖掘追踪的云计算网络漏洞检测技术[J].科技通报,2016,32(5):107-110. 被引量：9

二级参考文献100

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2梁邦勇,李涓子,王克宏.基于语义Web的网页推荐模型[J].清华大学学报（自然科学版）,2004,44(9):1272-1276. 被引量：9
3屠金路,金瑜,王庭照.bootstrap法在合成分数信度区间估计中的应用[J].心理科学,2005,28(5):1199-1200. 被引量：12
4苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：387
5Choudhury M D,Diakopoulos N,Naaman M.Unfolding theevent landscape on twitter:classification and exploration of user categories[C]∥Proceedings of the ACM 2012 Conference on Computer Supported Cooperative Work.2012:241-244.
6Perez-Sola C,Herrera-Joancomarti J.Classifying online socialnetwork users through the social graph[C]∥Proceedings of the 5th international conference on Foundations and Practice of Security.2012,115-131.
7Chu Z,Gianvecchio S,Wang H,et al.Who is tweeting on Twitter:human,bot,or cyborg?[C]∥Proceedings of the 26th Annual Computer Security Applications Conference.2010:21-30.
8Pennacchiotti M,Popescu A-M.Democrats,republicans andstarbucks afficionados:user classification in twitter[C]∥Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.2011:430-438.
9An Exhaustive Study of Twitter Users Across the World-Beevolve,Social Media Analytics Platform[EB/OL].http://www.beevolve.com/twitter-statistics/.
10Xu Z,Ru L,Xiang L,et al.Discovering User Interest on Twitter with a Modified Author-Topic Model[C]∥Proceedings of the 2011 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology.Volume 01,2011:422-429.

共引文献135

1刘潇,党全营,刘颖真,管凌霄.基于标签体系的环境数据推荐系统设计研究[J].网络安全与数据治理,2023,42(S01):91-96.
2王勇,马钰,徐胜华,王艳东,罗安,刘万增,狄琳.兴趣点推荐方法研究进展与展望[J].测绘科学,2023,48(12):217-224. 被引量：1
3张晓婷,李茵,唐晶磊.基于优化聚类算法的大数据分流系统设计仿真[J].计算机仿真,2018,35(12):204-207. 被引量：6
4林晓佳.海量网页模式下的特定数据快速挖掘模型的改进[J].宁德师范学院学报（自然科学版）,2016,28(4):384-389.
5黄泳航,李春英,汤庸.基于社区划分的多线程潜在好友推荐算法[J].计算机应用研究,2017,34(4):1080-1083. 被引量：4
6罗嗣卿,刘璐.改进K-means算法对大兴安岭蓝莓干销售预测的应用[J].黑龙江大学自然科学学报,2017,34(2):139-144. 被引量：2
7王欣,张冬梅.基于科研用户兴趣模型的知识推送服务模式研究[J].图书情报工作,2017,61(7):50-56. 被引量：9
8唐丹,张正军.近邻传播聚类算法的优化[J].计算机应用,2017,37(A01):258-261. 被引量：7
9李星沛,孙霞.多频无线网络通信同步实时维护方法仿真[J].计算机仿真,2017,34(9):382-385. 被引量：3
10肖铮,董祥千,赵文革.Web网络大数据的聚类中心调度技术研究[J].现代电子技术,2017,40(24):25-27. 被引量：8

同被引文献11

1邢邗,石晓达,孙连英,葛娜.时间序列数据趋势转折点提取算法[J].计算机工程,2018,44(1):56-61. 被引量：9
2胡广保,叶世榕,张彦祥,夏朋飞,夏凤雨.GPS/PWV时间序列特征提取方法的研究[J].大地测量与地球动力学,2019,39(1):36-40. 被引量：6
3张旺,尹磊,徐韶光,熊永良.改进奇异谱分析方法的GPS时间序列分析[J].测绘科学,2019,44(3):28-33. 被引量：11
4陆遥,李东生,高杨.基于序列趋势和集合距离的UAV态势相似性度量方法[J].航空学报,2019,40(3):211-222. 被引量：4
5张国豪,刘波.采用CNN和Bidirectional GRU的时间序列分类研究[J].计算机科学与探索,2019,13(6):916-927. 被引量：26
6陈海兰,高学东.基于波动特征的时间序列相似性度量及聚类分析[J].统计与决策,2019,0(11):17-22. 被引量：9
7高腾飞,刘勇琰,汤云波,张垒,陈丹.面向时间序列大数据海量并行贝叶斯因子化分析方法[J].计算机研究与发展,2019,56(7):1567-1577. 被引量：9
8王会青,郭芷榕,白莹莹.基于BP和朴素贝叶斯的时间序列分类模型[J].计算机应用研究,2019,36(8):2271-2274. 被引量：17
9李海林,邬先利.基于时间序列聚类的主题发现与演化分析研究[J].情报学报,2019,38(10):1041-1050. 被引量：18
10张昊,焦克莹.基于多元逆模糊数的模糊时间序列预测方法[J].数学的实践与认识,2019,49(9):147-151. 被引量：2

引证文献1

1李霞.基于连续密度隐马尔可夫的时间序列分类算法[J].计算机仿真,2021,38(1):291-294. 被引量：3

二级引证文献3

1刘绪颖,卢文达,王剑,王雪,王庆.融合多变量序列时空信息的事件早期识别方法[J].计算机工程与应用,2023,59(17):116-122.
2牛红培.基于时间分析法的煤矿瓦斯涌出量预测研究[J].煤炭技术,2023,42(11):148-151.
3张帆,高山.工控网络Modbus TCP协议异常报文检测方法[J].微型电脑应用,2024,40(8):181-184.

1万辛,高圣翔.基于群智感知技术的车联网路径优化问题研究[J].计算机与数字工程,2017,45(9):1765-1769.
2《第27次中国互联网络发展状况统计报告》发布[J].中国信息安全,2011,0(2):14-14.
3赵杰.基于改进用户兴趣模型的个性化图书推荐算法（英文）[J].机床与液压,2018,46(6):193-198. 被引量：9
4魏莹.网络购物环境下的退货物流问题研究[J].经贸实践,2017(14):28-28.
5刘畅,郭伏,刘玮琳.老年人购物网站界面感知可用性评价量表构建[J].信息系统学报,2017,11(1):49-71. 被引量：1
6阮怀伟,吴晓璇,陈艳平.基于用户兴趣模型及能力评估模型的个性化推荐方法研究[J].电脑与电信,2018(5):41-44. 被引量：1
7郁钢,陆海良,单宇翔,高扬华.基于用户兴趣模型的个性推荐算法[J].智能计算机与应用,2018,8(2):55-58.
8张志东.云计算环境下用户兴趣数据准确检测仿真[J].计算机仿真,2017,34(10):410-413. 被引量：3
9王成悦,汪令祥,谢震.全功率风电系统网侧变流器多次采样的并网电流谐波抑制策略[J].电器与能效管理技术,2018(8):70-78. 被引量：4
10高丽平,张锦歌,夏敏捷.基于大数据数字资源的个性化推荐与可视化研究[J].福建电脑,2018,34(8):12-13. 被引量：1

计算机仿真

2018年第7期

浏览历史

内容加载中请稍等...

基于数据挖掘的网络购物用户兴趣分类研究被引量：1

参考文献10

二级参考文献100

共引文献135

同被引文献11

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘的网络购物用户兴趣分类研究 被引量：1

参考文献10

二级参考文献100

共引文献135

同被引文献11

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘的网络购物用户兴趣分类研究被引量：1