基于冷热数据的MongoDB自动分片机制被引量：3

Auto-Sharding Mechanism in MongoDB Based on Cold and Hot Data

下载PDF

导出

摘要 MongoDB数据库中的自动分片(Auto-Sharding)机制仅通过数据量来进行分片迁移,会导致负载不均衡的问题。为此,提出一种基于数据冷热访问特征的Auoto-Sharding优化机制。通过朴素贝叶斯算法对数据的访问特性进行冷热数据判定,将数据分片中热数据的所占比重作为热负载值以确定数据迁移时机,并根据数据片之间的热负载差异建立新的数据迁移策略。实验结果表明,在高并发条件下,该优化机制的数据吞吐量高于原有的AutoShading机制。 The Auto-Sharding mechanism in MongoDB database finishes shard migration only through the data quantity, which causes unbalanced load imbalance. Aiming at this problem, this paper proposes an optimized Auto- Sharding mechanism based on the access characteristics of hot and cold data. It uses the naive Bayes algorithm to determine the data access characteristics of hot and cold data,and takes the proportion of the hot data in a data block as the heat load to determine the data migration time. It establishes new data migration strategy through the heat load differences between data blocks. Experimental results show that the data throughput of the improved mechanism is obviously better than that of the original Auto-Sharding mechanism under high concurrent condition.

作者冯超政蒋溢何军马祥均

机构地区重庆邮电大学计算机科学与技术学院重庆中兴通讯研究所重庆市公安局网络安全保卫总队

出处《计算机工程》 CAS CSCD 北大核心 2017年第3期7-10,17,共5页 Computer Engineering

基金重庆市教委科学技术研究项目(KJ1400414) 工信部2012年物联网发展专项(2-5) 重庆邮电大学博士启动基金(A2015-17)

关键词自动分片机制冷热数据朴素贝叶斯热负载数据迁移 Auto-Sharding mechanism cold and hot data Naive Bayes heat load data migration

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1李彬,张英伟.NoSQL非关系型数据库负载均衡的实现[J].电脑知识与技术,2012,8(2X):1209-1211. 被引量：5
2王鹏程,肖正,刘辉.融合观点倾向的话题热度趋势建模研究[J].计算机工程,2015,41(7):66-70. 被引量：5
3何杭锋.基于FODO算法MongoDB自动分片的改进[J].计算机技术与发展,2013,23(7):127-130. 被引量：9
4王光磊.MongoDB数据库的应用研究和方案优化[J].中国科技信息,2011(20):93-94. 被引量：46
5姚林,张永库.NoSQL的分布式存储与扩展解决方法[J].计算机工程,2012,38(6):40-42. 被引量：26
6魏浩,丁要军.基于属性相关的朴素贝叶斯分类算法[J].河南科学,2014,32(1):42-46. 被引量：6
7邓志飞,应良佳,王军威.基于IODA算法MongoDB负载均衡的改进[J].现代电信科技,2013,43(7):9-13. 被引量：4

二级参考文献59

1吕明育,李小勇.NoSQL数据库与关系数据库的比较分析[J].微型电脑应用,2011(10):55-58. 被引量：21
2严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,2008:81-84.
3CORMEN T H. , LEISERSON C E, RONSLD L. 算法导论[M].北京:机械工业出版社,2006:1-8.
4Cover T M,Thomas J A [著],阮吉寿,张华[译].信息论基础.北京:机械工业出版社,2008.10-11.
5S. Shepier,B. Callaghan.RFC 3530: Network. File System(NFS)version 4Protocol.The lnternet Society, 2003.
6Ghemaw at S, Gobioff H, Leu ng S T . T he google file system/ / Proceedtngs of the 19th ACM Sym pos ium on 0peratingSys terns Principles . Sagamore, 2003:29-43.
7ZHU S, SET IA S, JAJOD IA S. LEAP: efficient securitym ech an ism s for large--scale d is-tributed sensor networks[ C ] / /Proc. of the 10th ACM Con fon Computer and Communications Security, 2003:62-2.
8Thomas Anderson, Michael Dahlin, Jeanna Neefe, David Patterson, Drew Roselli, and Randotph Wang. Serverless networkfil e systems. In Proceedings of the15th ACM Symposium on OPerating SystemPrinciples, pages 109 126, Copper Mountain Resort,Colorado, December 1995.
9KenDunham. TheProblemwithPZP. InformationSeeurit yJournal: AGlobalPerspeetive, 2006, 15(2):5-8.
10Kristina Cbodorow.MongoDB权威指南.

共引文献88

1邓志飞,应良佳,王军威.基于IODA算法MongoDB负载均衡的改进[J].现代电信科技,2013,43(7):9-13. 被引量：4
2张文盛,郑汉华.基于MongoDB构建高性能网站技术研究[J].吉林师范大学学报（自然科学版）,2013,34(1):123-127. 被引量：21
3陈超.Spanner数据库初探[J].计算机与现代化,2013(4):70-72. 被引量：2
4蒋琥.上海市生活垃圾内河集装化转运信息化系统的研究与实现[J].环境卫生工程,2013,21(2):43-47. 被引量：4
5刘代飞,李军,石宪芳,陆明珠.烧结配矿监控与信息管理系统的设计与研发[J].矿冶工程,2013,33(3):83-86.
6何杭锋.基于FODO算法MongoDB自动分片的改进[J].计算机技术与发展,2013,23(7):127-130. 被引量：9
7张华丽,杨帆,于海平.分布式数据监控系统的设计和实现[J].计算机与数字工程,2013,41(8):1298-1301. 被引量：2
8索剑,罗中良.关系数据库中无模式数据存取实现方法[J].中山大学学报（自然科学版）,2013,52(4):83-88. 被引量：3
9郭宁,张新.一致性哈希算法在多处理机进程分配的应用[J].计算机与现代化,2013(9):71-74. 被引量：5
10张天宇,贺金鑫,王阳,付友萍.基于NoSQL数据库的地学大数据高效存储方法[J].吉林大学学报（信息科学版）,2013,31(6):604-608. 被引量：13

同被引文献35

1张志威,王国仁,徐建良,杜小勇.区块链的数据管理技术综述[J].软件学报,2020(9):2903-2925. 被引量：67
2何杭锋.基于FODO算法MongoDB自动分片的改进[J].计算机技术与发展,2013,23(7):127-130. 被引量：9
3郭冰,张宁,徐海霞,韩利峰,陈永忠.TMSR CSS集成开发工具软件的实现与应用[J].核技术,2013,36(11):66-70. 被引量：16
4吴黎兵,党平,聂雷,何炎祥,李飞.一种可分片预留接纳控制算法研究[J].计算机研究与发展,2014,51(6):1199-1205. 被引量：1
5王亚玲,杨超,章名尚.数据库系统应用分片中间件[J].计算机系统应用,2015,24(10):74-79. 被引量：1
6袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,2016,42(4):481-494. 被引量：2706
7王海艳,伏彩航.基于HBase数据分类的压缩策略选择方法[J].通信学报,2016,37(4):12-22. 被引量：8
8张波.国外区块链技术的运用情况及相关启示[J].金融科技时代,2016,24(5):35-38. 被引量：74
9许涛.区块链技术在教育教学中的应用与挑战[J].现代教育技术,2017,27(1):108-114. 被引量：87
10董宁,朱轩彤.区块链技术演进及产业应用展望[J].信息安全研究,2017,3(3):200-210. 被引量：41

引证文献3

1刘雄文.多区块链交易分发和事件处理的系统方案[J].计算机科学,2018,45(B11):580-583. 被引量：1
2马涛,岳敏,袁超,苟世哲,王永平,张玮.基于MongoDB的HIAF Archive Engine设计与实现[J].原子能科学技术,2019,53(9):1724-1728. 被引量：4
3胡宁玉,郝耀军,常建龙,冯丽萍.基于变色龙hash的区块链可扩展存储方案[J].计算机应用研究,2023,40(12):3539-3544. 被引量：3

二级引证文献8

1伦冠民,康辉英,王妞.大规模网络数据存储系统的设计与实现[J].现代电子技术,2020,43(14):62-66. 被引量：3
2段平.基于区块链的非结构化大数据动态安全存储[J].吉林大学学报（信息科学版）,2020,38(5):595-600. 被引量：5
3孙志勇.基于区块链的计算机数据安全保护策略研究[J].电子设计工程,2020,28(24):29-32. 被引量：5
4马亮亮,钟闰禄.一种基于MongoDB的企业内容管理系统实现[J].电脑编程技巧与维护,2021(12):110-112. 被引量：2
5王睿,郭玉辉,王宝嘉,谢念,王报辉,王晶.基于Django的加速器信息管理系统设计[J].核电子学与探测技术,2021,41(6):1013-1020.
6刘炜,李为,黄文婧,郜勇.基于工业互联网和区块链的“健康钱包”数据开放共享模式研究[J].中国数字医学,2024,19(1):11-16. 被引量：2
7徐克圣,王美琦.基于区块链的Gossip协议优化研究[J].计算机与网络,2024,50(4):345-349.
8杨昌霖,牛星宇.编码区块链中存储分配的分布式学习协议[J].计算机应用研究,2024,41(10):2918-2925.

1阮圆.闪存磨损均衡技术分析[J].山东工业技术,2015(21):17-17.
2王结太,许家栋,徐建城.基于蚁群优化算法的无线传感器网络路由协议[J].系统仿真学报,2008,20(18):4898-4901. 被引量：10
3王海艳,伏彩航.基于HBase数据分类的压缩策略选择方法[J].通信学报,2016,37(4):12-22. 被引量：8
4陶双喜,蓝雯飞.移动数据库中基于数据冷热的数据广播[J].软件导刊,2010,9(10):166-167.
5周炜.云环境下提升MongoDB自动分片性能研究[J].科技创新导报,2013,10(29):22-23. 被引量：1
6李川.应用半连接的分布式数据库查询优化算法[J].重庆理工大学学报（自然科学）,2013,27(11):74-77. 被引量：4
7邓志飞,应良佳,王军威.基于IODA算法MongoDB负载均衡的改进[J].现代电信科技,2013,43(7):9-13. 被引量：4
8温朝建,严华.Yaffs2文件系统中对NAND Flash磨损均衡的改进[J].电子技术应用,2015,41(6):16-19. 被引量：5
9牛倩.MongoDB数据库中自动分片技术应用研究[J].数字技术与应用,2016,34(6):112-112. 被引量：2
10田立萍,朱颖峰,魏东红,肖徽山.探测器/杜瓦组件热负载自动测试系统及其应用[J].红外技术,2005,27(3):257-259. 被引量：1

计算机工程

2017年第3期

浏览历史

内容加载中请稍等...

基于冷热数据的MongoDB自动分片机制被引量：3

参考文献7

二级参考文献59

共引文献88

同被引文献35

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于冷热数据的MongoDB自动分片机制 被引量：3

参考文献7

二级参考文献59

共引文献88

同被引文献35

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于冷热数据的MongoDB自动分片机制被引量：3