期刊文献+
共找到247篇文章
< 1 2 13 >
每页显示 20 50 100
Hive数据库在电商销售大数据分析中的应用研究
1
作者 林昕 张艳丽 +1 位作者 康彦 刘闰豪 《电脑编程技巧与维护》 2024年第10期99-101,共3页
随着电商行业的蓬勃发展,电商平台积累了海量的销售数据,如何有效地利用这些数据进行销售分析和业务决策成为电商企业亟待解决的问题之一。研究以大数据Hive数据库为工具,探讨了其在电商销售大数据分析中的应用。研究详细描述了Hive在... 随着电商行业的蓬勃发展,电商平台积累了海量的销售数据,如何有效地利用这些数据进行销售分析和业务决策成为电商企业亟待解决的问题之一。研究以大数据Hive数据库为工具,探讨了其在电商销售大数据分析中的应用。研究详细描述了Hive在电商销售大数据分析中的应用场景和方法,结合实际案例,展示了Hive在电商销售大数据分析中的应用,并提出了未来的研究方向和发展趋势。 展开更多
关键词 hive数据库 HADOOP平台 电商销售 大数据分析
下载PDF
基于HIVE框架的融媒体平台设计与实现
2
作者 高顶 《影视制作》 2024年第10期89-93,共5页
本文通过阐述基于HIVE的框架结构及总体流程等方面设计,实现融媒体平台同多渠道之间的互联互通功能。平台的建设整合了内容资源,提高了资源使用效率,提升了广电融合生产能力,提升了新闻宣传和舆论的引导力、传播力。
关键词 融媒体 hive 互联互通
下载PDF
基于Zeppelin+Hive的数据分析与可视化
3
作者 张玉叶 孙延坤 《现代计算机》 2023年第14期70-73,共4页
随着大数据时代的到来及大数据产业的迅速发展,快速有效地对海量数据进行分析处理及可视化,成为大数据产业从业人员的必备技能。通过对一组房屋销售数据的分析处理,介绍了如何利用Zeppelin和Hive来快速对海量数据进行分析及可视化,并给... 随着大数据时代的到来及大数据产业的迅速发展,快速有效地对海量数据进行分析处理及可视化,成为大数据产业从业人员的必备技能。通过对一组房屋销售数据的分析处理,介绍了如何利用Zeppelin和Hive来快速对海量数据进行分析及可视化,并给出了具体实现方法和代码。 展开更多
关键词 Zeppelin hive 数据分析 数据可视化
下载PDF
基于HIVE配置化自助稽核工具研究 被引量:1
4
作者 肖逸枫 董晓勇 +2 位作者 杨名 杜敏 杨莉 《通信与信息技术》 2023年第4期96-98,共3页
提出一种基于Java后台的自助自动化工具,该工具提供的可配置字段模型更多、更丰富,配置轻量化,模型结果更加准确,计算速度也得到提升。在新上线营销活动或存量营销活动重点稽核时,通过可视化操作界面,支持业务编码、受理时间、受理范围... 提出一种基于Java后台的自助自动化工具,该工具提供的可配置字段模型更多、更丰富,配置轻量化,模型结果更加准确,计算速度也得到提升。在新上线营销活动或存量营销活动重点稽核时,通过可视化操作界面,支持业务编码、受理时间、受理范围等条件,配置基础数据字段和个性化扩展字段构建成专属的个性化数据模型,具有操作便捷,灵活应对市场变化的特点,解决了高峰期人员不够,稽核处理不到位的痛点,从而有效提升营销活动专项稽核提数效率。 展开更多
关键词 hive配置化自助 AI工业革命 字段数据采集 HDFS采集
下载PDF
Hive数据仓库加载数据的技术研究 被引量:2
5
作者 缪华 吴淮北 +1 位作者 张春梅 张艳丽 《电脑编程技巧与维护》 2023年第12期58-61,共4页
Hive数据仓库存储着海量用户数据,如何加载并分析处理这些数据,显得尤为重要。着重介绍了3种技术,即通过查询加载数据、查询语句中创建表并加载数据、import导入Hive表数据加载数据。利用文中技术,可以十分方便地在Hive数据仓库中对数... Hive数据仓库存储着海量用户数据,如何加载并分析处理这些数据,显得尤为重要。着重介绍了3种技术,即通过查询加载数据、查询语句中创建表并加载数据、import导入Hive表数据加载数据。利用文中技术,可以十分方便地在Hive数据仓库中对数据进行加载,进而达到分析处理海量数据的目的。同时,使用Python语言可以编写脚本或者使用调度工具实现自动化操作和批处理任务,这对于Hive数据仓库的维护、数据清洗和报表生成等任务非常有帮助,可以提高工作效率和准确性。 展开更多
关键词 PYTHON语言 hive数据仓库 Hadoop环境 加载数据
下载PDF
基于TEZ引擎和LLAP技术的Hive数据查询能力研究 被引量:1
6
作者 黄健文 丁奕 +2 位作者 欧阳辉 苏丽裕 匡磊怀 《信息与电脑》 2023年第3期138-140,共3页
分布式计算框架(HadoopMapReduce)解决了大数据分布式计算和并发计算问题,具有良好的扩展性和容错性,非常适合超大规模数据处理和分析。Hive基于HadoopMapReduce构建数据仓库分析系统,提供丰富的结构化查询语言(Structured Query Langua... 分布式计算框架(HadoopMapReduce)解决了大数据分布式计算和并发计算问题,具有良好的扩展性和容错性,非常适合超大规模数据处理和分析。Hive基于HadoopMapReduce构建数据仓库分析系统,提供丰富的结构化查询语言(Structured Query Language,SQL)查询能力,可将SQL语句转变成MapReduce任务执行分析数据。但是,MapReduce本身的特点(Map阶段和Reduce阶段)使得其在多表关联和复杂SQL场景时运行较慢。因此,基于真实场景打造了一套通过TEZ引擎和LLAP(Live Long and Process)技术结合来提升Hive查询能力的系统,面对复杂的多表关联查询、使用频率较高的复杂查询时能够快速高效率执行,缩短了用户等待时间。 展开更多
关键词 大数据 hive查询 TEZ引擎 LLAP技术
下载PDF
数据仓库Hive搭建与应用——以网站流量统计分析为例
7
作者 杨小英 《信息与电脑》 2023年第21期70-72,共3页
云计算等技术的发展,推动了海量数据存储和处理技术的发展,从海量数据中快速找到有价值的信息是进行数据挖掘的关键。Hive能够使用Hibernate查询语言(Hibernate Query Language,HQL)语句对数据进行查询和分析,帮助决策者从海量数据中挖... 云计算等技术的发展,推动了海量数据存储和处理技术的发展,从海量数据中快速找到有价值的信息是进行数据挖掘的关键。Hive能够使用Hibernate查询语言(Hibernate Query Language,HQL)语句对数据进行查询和分析,帮助决策者从海量数据中挖掘出更高价值的信息。以网站流量统计分析为例,从Hive的环境搭建、数据仓库构建、数据查询等方面介绍了Hive的应用。 展开更多
关键词 hive 数据仓库 流量统计 Hibernate查询语言(HQL)
下载PDF
利用Insert技术在Hive数据仓库中处理数据的应用研究
8
作者 张艳丽 林昕 +4 位作者 吴淮北 张春梅 张书茂 康彦 缪华 《电脑编程技巧与维护》 2023年第11期110-112,143,共4页
对Hive数据仓库的设计与环境搭建过程进行简单介绍,着重介绍利用Insert技术在Hive数据仓库中对数据进行导入导出的方法。这两种方式在学习Hive数据仓库的技术上和实际生产环境中,都具有重要的意义。
关键词 Insert技术 hive数据仓库 Hadoop环境 分布式文件系统
下载PDF
基于数据仓库的高校岗位业绩管理系统设计
9
作者 金悦奇 《浙江国际海运职业技术学院学报》 2024年第3期15-19,共5页
为解决高校管理中各种信息系统存在的数据冗余、信息孤岛、一致性差等问题,提出基于数据仓库的高校岗位业绩管理系统构建。着眼于集成复用现有信息系统数据,而非简单增加一套信息管理系统,为今后高校类似信息管理系统的数据复用设计提... 为解决高校管理中各种信息系统存在的数据冗余、信息孤岛、一致性差等问题,提出基于数据仓库的高校岗位业绩管理系统构建。着眼于集成复用现有信息系统数据,而非简单增加一套信息管理系统,为今后高校类似信息管理系统的数据复用设计提供一种实践方案。使用基于Apache Hive开源软件的数据仓库构建系统数据存储平台,通过Flume、SeaTunnel等工具采集数据,最后使用Django Web框架来完成高校岗位业绩管理的业务应用。 展开更多
关键词 数据仓库 hive HADOOP DJANGO
下载PDF
先导专项档案管理模式及优化策略研究
10
作者 王雪萍 《档案学刊》 2024年第4期51-60,共10页
近年来,中国科学院战略性先导专项的立项活动日益增多,先导专项档案管理模式呈现出多样化的特点,但在责任划分、监督执行、制度完善及质量控制等多个层面均存在显著短板。为提高先导专项档案管理的质量和水平,文章分析了先导专项档案管... 近年来,中国科学院战略性先导专项的立项活动日益增多,先导专项档案管理模式呈现出多样化的特点,但在责任划分、监督执行、制度完善及质量控制等多个层面均存在显著短板。为提高先导专项档案管理的质量和水平,文章分析了先导专项档案管理的现状,探讨了现行三种先导专项档案管理模式的优劣,提出从管理责任体系、规章制度体系、人才队伍体系、档案资源体系、档案管理平台等方面优化“科研+行政”并轨管理模式,以期双线负责人共同肩负专项责任,共同推进档案管理工作,为先导专项的高效建设提供优质的档案服务支持。 展开更多
关键词 先导专项 “科研+行政”双线并轨 科技档案管理 先导专项档案
原文传递
基于Hadoop/Hive的web日志分析系统的设计 被引量:24
11
作者 刘永增 张晓景 李先毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期314-317,共4页
互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的... 互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算。Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理。但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序。这种程序处于比较低的层次,用户不容易掌握,而且难于维护。Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发。利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度。通过与单机实验的对比,证明系统是有效的和有价值的。 展开更多
关键词 WEB日志 云计算 HADOOP hive
下载PDF
基于Hive的电力设备状态信息数据仓库 被引量:40
12
作者 王德文 肖凯 肖磊 《电力系统保护与控制》 EI CSCD 北大核心 2013年第9期125-130,共6页
随着智能变电站的建设及其状态监测系统的发展,电力设备状态信息数据规模逐渐增大。针对现有电力数据仓库在海量状态数据存储查询和分析处理方面的不足,提出基于Hive的电力设备状态信息数据仓库及其多维数据快速查询与分析方法。通过对... 随着智能变电站的建设及其状态监测系统的发展,电力设备状态信息数据规模逐渐增大。针对现有电力数据仓库在海量状态数据存储查询和分析处理方面的不足,提出基于Hive的电力设备状态信息数据仓库及其多维数据快速查询与分析方法。通过对状态监测系统与生产管理系统(PMS)的分析,将电力设备静态信息与状态监测信息存储到Hive数据仓库中。设计了基于Hive的电力设备状态信息数据仓库的系统架构和海量状态数据存储结构,采用Hadoop分布式文件系统(HDFS)对数据进行分布式存储管理,Map Reduce作为海量数据查询分析的计算模式,HiveQL查询语言作为数据仓库的控制工具,并给出了数据仓库的工作过程。建立一个基于Hive的电力设备状态信息数据仓库实验平台,分别利用5个节点和10个节点的Hadoop集群进行测试,结果表明上述方法具有较好的扩展性,能满足大规模多维电力设备状态数据存储查询的需要。 展开更多
关键词 智能变电站 电力设备状态信息 数据仓库 hive HDFS
下载PDF
基于Hadoop/Hive的乳制品溯源数据计算及性能优化 被引量:4
13
作者 朱淑鑫 李悦 +3 位作者 袁培森 徐焕良 王康 谢忠红 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第4期99-108,共10页
为了提升传统乳制品溯源系统应对大规模企业生产数据的性能,本文分析了乳制品相关企业供应链业务流程、关键溯源单元和溯源信息,结合Hadoop/Hive大数据技术和分布式数据库技术,设计并构建了基于Hadoop/Hive的乳制品溯源框架.搭建模拟大... 为了提升传统乳制品溯源系统应对大规模企业生产数据的性能,本文分析了乳制品相关企业供应链业务流程、关键溯源单元和溯源信息,结合Hadoop/Hive大数据技术和分布式数据库技术,设计并构建了基于Hadoop/Hive的乳制品溯源框架.搭建模拟大数据环境并使用实际生产数据对系统性能进行测试,实验结果表明,引入Hadoop/Hive技术后,系统的平均数据存储速度、平均数据访问速度、平均数据交互速度分别提升了87.43%、27.10%、58.16%.改进后的乳制品溯源系统存储和处理大规模数据的能力明显优于传统的乳制品溯源系统. 展开更多
关键词 Hadoop/hive 乳制品溯源 数据计算 性能优化
下载PDF
QAR数据仓库在Hive中的构建 被引量:6
14
作者 冯兴杰 吴稀钰 +2 位作者 赵杰 贺阳 房戍 《计算机工程与应用》 CSCD 北大核心 2017年第11期90-94,共5页
分析QAR数据是一种非常有效的监控飞机状态的方法。但随着民航领域的快速发展,QAR数据的规模急剧增大,现有基于关系型数据库的QAR数据仓库不足以支撑海量数据下的存储与分析,导致海量的QAR数据因无法处理变成了信息垃圾。因此,针对现有... 分析QAR数据是一种非常有效的监控飞机状态的方法。但随着民航领域的快速发展,QAR数据的规模急剧增大,现有基于关系型数据库的QAR数据仓库不足以支撑海量数据下的存储与分析,导致海量的QAR数据因无法处理变成了信息垃圾。因此,针对现有数据仓库的不足,提出基于Hive的QAR数据仓库。通过对Hive特点及QAR数据结构分析,设计了基于Hive的QAR数据仓库的总体架构和存储结构。通过将现有数据仓库中的数据移植到基于Hive的QAR数据仓库,实现了对已有数据仓库的兼容。实验结果表明基于Hive的QAR数据仓库在面对QAR数据剧增的情况下,处理所需时间依然保持着线性增长。 展开更多
关键词 hive 快速存取记录器(QAR) 数据仓库 数据处理 HADOOP
下载PDF
基于HBase和Hive的航班延误平台的存储方法 被引量:6
15
作者 吴仁彪 刘超 屈景怡 《计算机应用》 CSCD 北大核心 2018年第5期1339-1345,共7页
针对我国目前航班延误平台的移植难、可扩展性差,无法适应民航高速发展所带来的大数据量存储的现状,设计了面向大数据的跨平台、高适用性与高扩展性的航班延误平台。该平台以大数据工具Leaf Let为可视化载体,在地图界面实时显示航班轨... 针对我国目前航班延误平台的移植难、可扩展性差,无法适应民航高速发展所带来的大数据量存储的现状,设计了面向大数据的跨平台、高适用性与高扩展性的航班延误平台。该平台以大数据工具Leaf Let为可视化载体,在地图界面实时显示航班轨迹并将轨迹数据加载至HBase数据库中,并且利用信息摘要算法(MD5)重新设计与优化航班数据表的行键,以解决其递增的飞行时间特性产生的"热点"问题;针对HBase过滤器多级查询的缺陷,提出了基于Solr Cloud的关联查询算法,利用Solr Cloud实现对行键与索引字段的分层存储,从而实现HBase二级快速索引;最后在HBase的历史航班数据与飞行计划数据基础上,构建基于Hive的海量航班信息数据仓库。实验结果显示,航班延误大数据平台的可扩展性与搭建的航班信息数据仓库可以满足民航对数据集中统一存储的需求,而多条件查询的响应速度与无二级索引的集群相比提高了上百倍,并且这种优势随着航班数据量的增长愈发明显。 展开更多
关键词 大数据平台 航班延误 HBASE hive SolrCloud LEAFLET
下载PDF
基于Hive的高可用双引擎数据仓库 被引量:10
16
作者 李翀 张彤彤 +1 位作者 杜伟静 刘学敏 《计算机系统应用》 2019年第9期65-71,共7页
打破信息孤岛,整合异构数据,汇聚共享交换,深度分析挖掘,提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引,设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓... 打破信息孤岛,整合异构数据,汇聚共享交换,深度分析挖掘,提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引,设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓库,支持多种方式OLAP分析,进行了可用性、负载均衡、资源管理的优化设计,为后续进行全院数据汇聚挖掘、知识图谱构建、学科态势分析提供了平台支撑.实验表明,系统灵活高效,高可用可扩展,资源调度科学,负载均衡效果明显. 展开更多
关键词 数据仓库 hive 高可用 OLAP HADOOP
下载PDF
基于Hive的智慧城市数据处理技术研究与实现 被引量:8
17
作者 艾丽蓉 刘云峰 《计算机技术与发展》 2018年第2期9-13,共5页
对智慧城市系统中产生的大量数据进行有效的采集、合理的存储、高效精准的分析,进而对决策的做出提供合理的支持是在智慧城市建设过程中必须要解决的问题。对此,在充分理解智慧园区数据分析系统功能需求、性能需求的基础上,结合当前比... 对智慧城市系统中产生的大量数据进行有效的采集、合理的存储、高效精准的分析,进而对决策的做出提供合理的支持是在智慧城市建设过程中必须要解决的问题。对此,在充分理解智慧园区数据分析系统功能需求、性能需求的基础上,结合当前比较主流的数据分析方面的技术,提出了Kettle+Hive+Tableau的智慧园区数据分析解决方案。该系统具有较高的可用性、稳定性、效率以及非常高的扩展性、可移植性,不仅适合于对智慧园区的数据分析,还普遍适用于对智能化信息系统数据进行分析,具有较高的普适性、通用性。该系统通过ETL工具、数据可视化工具的应用,尽量减少在数据分析系统开发过程中代码的编写,能够适用于绝大部分有数据分析需求并且数据量较大的信息化系统。 展开更多
关键词 智慧城市 hive 数据采集 数据可视化分析
下载PDF
基于数据仓库的高职院校招生管理系统
18
作者 刘发稳 容会 +2 位作者 杨涓海 吴芸 殷洪杰 《现代计算机》 2024年第13期89-94,共6页
招生工作作为高职院校发展的关键,如何招收到更多优秀生源,合理分配招生计划已经成为困扰高职院校发展的突出问题。针对这个问题,设计实现了基于数据仓库的高职院校招生管理系统。以云南省某高职院校2021—2023年的招生信息为数据源,首... 招生工作作为高职院校发展的关键,如何招收到更多优秀生源,合理分配招生计划已经成为困扰高职院校发展的突出问题。针对这个问题,设计实现了基于数据仓库的高职院校招生管理系统。以云南省某高职院校2021—2023年的招生信息为数据源,首先进行数据清洗,通过Hive数据仓库实现数据分层存储,借助Spark数据计算引擎的MLlib机器学习库实现FP-Growth算法挖掘数据的关联规则,进而实现了对学校招生信息数据的管理、分析、决策功能。 展开更多
关键词 招生 hive数据仓库 FP-GROWTH算法 关联规则
下载PDF
基于Hive数据仓库的物流大数据平台的研究与设计 被引量:9
19
作者 张锐 《电子设计工程》 2017年第9期31-35,共5页
针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析,提出物流数据仓库的具体实现方案,该数据仓库结合云平台虚拟化技术,部署了Hadoop和Hive环境,搭建了基... 针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析,提出物流数据仓库的具体实现方案,该数据仓库结合云平台虚拟化技术,部署了Hadoop和Hive环境,搭建了基于虚拟化技术的大数据处理平台。同时从数据ETL和数据查询分析处理两方面对数据仓库的可扩展性Hive数据存储分析、Hive数据前置处理等进行研究设计。通过Hive数据仓库运行效果进行分析,表明该系统能够很好地支持企业管理层决策。 展开更多
关键词 智慧物流大数据平台 hive数据仓库 ETL 查询分析
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部