融合物品热门因子的协同过滤改进算法被引量：15

Improved Collaborative Filtering Algorithm Based on Popularity of Items

下载PDF

导出

摘要协同过滤算法是推荐系统中比较古老的算法,原理是根据近邻用户或者相似物品对目标进行推荐,因此相似度计算方法是关键部分.由于互联网的高传播性,物品热门周期变短,影响了用户之间相似性度量,传统的协同过滤算法已经不能达到很好的推荐效果.针对相似度改进,在皮尔逊相似度原理上添加物品热门因子,优化皮尔逊相似度计算,提高推荐效果.采用大数据技术并搭建spark分布式平台.在spark大数据平台上使用Movie Lens电影推荐数据集上验证改进后的算法,采用准确率、召回率和平均绝对误差(MAE)等指标来评价改进算法.实验结果表明改进算法在准确率和召回率上都比传统算法有很大的提高,在平均绝对误差上也有所下降. Collaborative filtering algorithm is a relatively old algorithm in recommendation system,which is based on the nearest neighbors or similar objects,so the similarity calculation method is the key part.Due to the high transmission of the Internet,the popular cycle of items becomes shorter,which affects the similarity measurement between users,the traditional collaborative filtering algorithm cannot achieve a good recommendation.In order to improve the similarity,this paper improves the user similarity calculation method based on the Pearson similarity from hot degree of items.Use big data technology and building spark distributed platform.Using MovieLens datasets to verify the improved algorithm on spark distributed platform and using recall,precision and MAE to evaluate the improved algorithm.The experimental results show that the improved algorithm has higher precision and recall than the traditional algorithm,and the MAE is also decreased.

作者孙红韩震 SUN Hong, HAN Zhen(1University of Shanghai for Science and Technology, Shanghai 200093, China ;2 Shanghai Key Lab of Modem Optical System, Shanghai 200093, Chin)

机构地区上海理工大学上海现代光学系统重点实验室

出处《小型微型计算机系统》 CSCD 北大核心 2018年第4期638-643,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61472256 61170277)资助上海市教委科研创新重点项目(12zz137)资助沪江基金项目(C14002)资助

关键词协同过滤皮尔逊相似度 MovieLens数据集 spark平台热门因子 collaborative filtering Pearson similarity MovieLens datasets spark platform popularity factor

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1郝立燕,王靖.基于项目流行度的协同过滤TopN推荐算法[J].计算机工程与设计,2013,34(10):3497-3501. 被引量：18
2陶永才,张宁宁,石磊,卫琳.异构环境下云计算数据副本动态管理研究[J].小型微型计算机系统,2013,34(7):1487-1492. 被引量：18
3孙辉,马跃,杨海波,张红松.一种相似度改进的用户聚类协同过滤推荐算法[J].小型微型计算机系统,2014,35(9):1967-1970. 被引量：27
4马宏伟,张光卫,李鹏.协同过滤推荐算法综述[J].小型微型计算机系统,2009,30(7):1282-1288. 被引量：203
5周海平,黄凑英,刘妮,周洪波.基于评分预测的协同过滤推荐算法[J].数据采集与处理,2016,31(6):1234-1241. 被引量：8
6许海玲,吴潇,李晓东,阎保平.互联网推荐系统比较研究[J].软件学报,2009,20(2):350-362. 被引量：544
7王道平,李志隆,杨岑.基于热门物品惩罚和用户兴趣变化的知识推送算法[J].系统工程,2014,32(1):118-123. 被引量：2

二级参考文献113

1张光卫,康建初,李鹤松,刘常昱,李德毅.面向场景的协同过滤推荐算法[J].系统仿真学报,2006,18(z2):595-601. 被引量：27
2王茜,杨莉云,杨德礼.面向用户偏好的属性值评分分布协同过滤算法[J].系统工程学报,2010,25(4):561-568. 被引量：24
3邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
4张海燕,丁峰,姜丽红.基于模糊聚类的协同过滤推荐方法[J].计算机仿真,2005,22(8):144-147. 被引量：25
5张玉英,孟海东.数据挖掘技术中聚类算法的改进研究[J].包头钢铁学院学报,2005,24(4):338-341. 被引量：4
6王卫平,刘颖.基于客户行为序列的推荐算法[J].计算机系统应用,2006,15(9):35-38. 被引量：12
7游文,叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展,2006,16(9):70-72. 被引量：54
8徐义峰,徐云青,刘晓平.一种基于时间序列性的推荐算法[J].计算机系统应用,2006,15(10):23-25. 被引量：5
9贾丽会,张修如.BP算法分析与改进[J].计算机技术与发展,2006,16(10):101-103. 被引量：48
10陈刚,刘发升.基于BP神经网络的数据挖掘方法[J].计算机与现代化,2006(10):20-22. 被引量：14

共引文献781

1陈晋鹏,李海洋,张帆,李环,魏凯敏.基于会话的推荐方法综述[J].中文信息学报,2023,37(3):1-17. 被引量：4
2崔岩,祁伟,庞海龙,赵辉.融合协同过滤和XGBoost的推荐算法[J].计算机应用研究,2020,37(1):62-65. 被引量：11
3黄梅银,易兰丽,王理达.政务服务中的智能推送:需求、应用模式和实现路径[J].电子政务,2020,0(2):11-20. 被引量：9
4田春波.基于兴趣点的多维度推荐算法研究[J].电脑知识与技术,2020,0(4):171-172.
5冼卓铭.算法推荐下短视频平台版权注意义务司法认定争议与优化[J].东南大学学报（哲学社会科学版）,2024,26(S01):106-111.
6吴飞贤,段华斌,扈乐华,朱珍珠,宋均.基于Spark的商品推荐系统的设计与实现[J].办公自动化,2021,26(3):60-62. 被引量：3
7丁一楠.基于数据驱动的消费者决策预测研究[J].广东经济,2017,0(9X):62-62.
8杨博,赵鹏飞.推荐算法综述[J].山西大学学报（自然科学版）,2011,34(3):337-350. 被引量：87
9宋雅婷,徐天伟.基于用户兴趣的个性化推荐技术综述[J].云南大学学报（自然科学版）,2012,34(S1):20-23. 被引量：6
10王树西,李安渝.基于购物倾向的商品推荐方案研究[J].集成技术,2013,2(3):15-21.

同被引文献109

1许竹.微信用户受“信息茧房”效应影响分析[J].传播力研究,2020(6):9-9. 被引量：1
2王霞.基于项的协同过滤在推荐系统中的应用研究[J].计算机工程与设计,2007,28(7):1719-1722. 被引量：8
3于洪,李转运.基于遗忘曲线的协同过滤推荐算法[J].南京大学学报（自然科学版）,2010,46(5):520-527. 被引量：74
4Kiatichai Treerattanapitak,Chuleerat Jaruskulchai.Exponential Fuzzy C-Means for Collaborative Filtering[J].Journal of Computer Science & Technology,2012,27(3):567-576. 被引量：5
5陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012(17):14-15. 被引量：168
6黄霞,韦素云,业宁,朱健,张硕.基于用户属性和项目类别的协同过滤算法[J].计算机与数字工程,2012,40(10):5-7. 被引量：8
7彭石,周志彬,王国军.基于评分矩阵预填充的协同过滤算法[J].计算机工程,2013,39(1):175-178. 被引量：28
8沈键,杨煜普.基于二阶段相似度学习的协同过滤推荐算法[J].计算机应用研究,2013,30(3):715-719. 被引量：8
9沈西挺,董智佳.反映用户兴趣变化的协同过滤算法[J].计算机应用与软件,2013,30(6):295-297. 被引量：10
10郝立燕,王靖.基于项目流行度的协同过滤TopN推荐算法[J].计算机工程与设计,2013,34(10):3497-3501. 被引量：18

引证文献15

1于建华,童国宇.集散系统在热轧加热炉上的应用[J].四川冶金,2000,22(2):54-56.
2邓存彬,虞慧群,范贵生.融合动态协同过滤和深度学习的推荐算法[J].计算机科学,2019,46(8):28-34. 被引量：26
3李振波,杨晋琪,岳峻.基于协同回归模型的矩阵分解推荐[J].图学学报,2019,40(6):983-990. 被引量：4
4刘超慧,韩传福,陈天成,孔先进.融合惩罚因子和时间权重的协同过滤推荐算法[J].信息技术与网络安全,2020,39(5):17-21. 被引量：10
5张瑞典,钱晓东.用余弦相似度修正评分的协同过滤推荐算法[J].计算机工程与科学,2020,42(6):1096-1105. 被引量：13
6孙红,鹿梅珂.S-SmDAERS模型的深度推荐系统应用研究[J].小型微型计算机系统,2020,41(8):1608-1612.
7傅思维,陈桂芬,赵姗.基于大数据技术的农产品智能推荐方法研究[J].东北农业科学,2020,45(6):140-144.
8赵永生,祁云嵩.基于改进相似度计算方法的协同过滤算法研究[J].计算机与数字工程,2021,49(3):447-450. 被引量：8
9陈乐,余粟.结合对象属性与近似检索的协同过滤算法[J].小型微型计算机系统,2021,42(5):972-976. 被引量：1
10褚宏林,刘其成,牟春晓.针对修正余弦相似度改进的协同过滤推荐算法[J].烟台大学学报（自然科学与工程版）,2021,34(3):330-336. 被引量：4

二级引证文献72

1刘航,李锡祚.基于深度学习的协同过滤推荐算法[J].智能计算机与应用,2020(8):100-104. 被引量：2
2张普.小旋风M-900MK Ⅱ音箱[J].实用影音技术,2000(3):31-32.
3林海.基于SVD高职院校在线教学资源推荐系统[J].电子技术与软件工程,2020(5):48-51. 被引量：1
4卜祥鹏.基于GRU和课程关联关系的推荐模型[J].软件,2020,41(6):137-142. 被引量：2
5宗春梅,张月琴,赵青杉,郝耀军,郭玥鑫.可视化支持下CNN在个性化推荐算法中的应用[J].计算机系统应用,2020,29(6):204-210. 被引量：3
6王莉,徐亮.基于深度学习的协同过滤推荐模型[J].信息技术,2020,44(9):66-69. 被引量：3
7康雁,卜荣景,李浩,杨兵,张亚钏,陈铁.基于增强注意力机制的神经协同过滤[J].计算机科学,2020,47(10):114-120. 被引量：3
8顾明星,黄伟建,黄远,生龙,申超,张梦甜.结合用户聚类与改进用户相似性的协同过滤推荐[J].计算机工程与应用,2020,56(22):185-190. 被引量：21
9宋曼.一种基于用户偏好的协同过滤推荐算法[J].电脑与电信,2020(12):17-21. 被引量：2
10任蓓蓓,徐益强,封丽.基于深度学习的数字图书馆资源个性化推荐模型设计[J].贵阳学院学报（自然科学版）,2021,16(1):32-36. 被引量：7

1窝窝.推·电影之“打”出一片天——甄子丹参演的电影推荐[J].新青年（珍情）,2018,0(1):59-59.
2彭亮,王媛媛,黄涛,安衍茹,赵停,张岗,胡本祥,李静,杨冰月.ICP-MS法测定陕西不同产地野生茜草中9种重金属元素[J].中草药,2018,49(6):1418-1423. 被引量：15
3张中一.基于随机游走的个性化电影推荐系统研究[J].滁州职业技术学院学报,2017,16(4):75-77.
4张永棠.基于代换加密的隐私保护协同过滤推荐算法[J].新疆大学学报（自然科学版）,2017,34(4):446-451. 被引量：14
5何丹,张舒涵,王佳凤,李晋奇,胡远.千年健HPLC指纹图谱研究[J].中草药,2018,49(5):1165-1168. 被引量：10
6臧雪峰,刘天琦,孙小新,冯国忠,张邦佐.一种基于Bhattacharyya系数和项目相关性的协同过滤算法[J].计算机科学,2017,44(12):52-57. 被引量：5
7王波,张菁.基于异步消减群优化的疾病关联LncRNA预测方法[J].现代信息科技,2018,2(1):112-114. 被引量：1
8罗·泰戈尔,吴蕤,石真.海外书简[J].世界文学,1991,0(5):223-241.
9李兵.基于“客户感知”的VDSL网络发展研究[J].信息与电脑,2016,28(22):187-188.
10郑鹏,王应明.基于增强相似度和隐含信任的推荐算法[J].计算机系统应用,2018,27(3):118-124.

小型微型计算机系统

2018年第4期

浏览历史

内容加载中请稍等...

融合物品热门因子的协同过滤改进算法被引量：15

参考文献7

二级参考文献113

共引文献781

同被引文献109

引证文献15

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

融合物品热门因子的协同过滤改进算法 被引量：15

参考文献7

二级参考文献113

共引文献781

同被引文献109

引证文献15

二级引证文献72

相关作者

相关机构

相关主题

浏览历史

融合物品热门因子的协同过滤改进算法被引量：15