期刊文献+

《大数据》

作品数634被引量3416H指数29
《大数据(Big Data Research,BDR)》是科技期刊。查看详情>>
  • 主办单位人民邮电出版社有限公司
  • 国际标准连续出版物号2096-0271
  • 国内统一连续出版物号10-1321/G2
  • 出版周期双月刊
共找到634篇文章
< 1 2 34 >
每页显示 20 50 100
数据产品开发与流通 被引量:4
1
作者 朱永敏 张诚 《大数据》 2023年第2期46-55,共10页
数据产品是会计分类中企业“对外交易的数据资源”的实现路径。对数据产品开发和流通的研究可以为与企业数据资源相关的会计处理打下基础。通过案例分析的方法,对A银行数据产品的开发与流通过程进行调研和总结,提炼出了企业从开发到对... 数据产品是会计分类中企业“对外交易的数据资源”的实现路径。对数据产品开发和流通的研究可以为与企业数据资源相关的会计处理打下基础。通过案例分析的方法,对A银行数据产品的开发与流通过程进行调研和总结,提炼出了企业从开发到对外提供数据产品的过程。研究发现,由于数据产品开发是基于企业过去数据和数据能力的积累,单个数据产品的成本计算往往存在较大困难。此外,在数据产品开发与流通中,往往以数据资源的应用场景为单位,数据产品价值的大小取决于它在应用场景中的应用情况。因此,对于数据产品交易数据的采集、加工和共享工作对企业数据资源的会计处理具有重要的意义。 展开更多
关键词 数据产品 会计处理 数据资源应用场景 开发与流通
下载PDF
面向大数据处理的数据流编程模型和工具综述 被引量:2
2
作者 邹骁锋 阳王东 +2 位作者 容学成 李肯立 李克勤 《大数据》 2020年第3期57-72,共16页
利用大数据计算平台对大量的静态数据进行数据挖掘和智能分析助推了大数据和人工智能应用的落地。在面临互联网、物联网产生的日益庞大的实时动态数据的处理需求时,数据流计算被逐步引入目前的一些大数据处理平台中。针对数据流的编程模... 利用大数据计算平台对大量的静态数据进行数据挖掘和智能分析助推了大数据和人工智能应用的落地。在面临互联网、物联网产生的日益庞大的实时动态数据的处理需求时,数据流计算被逐步引入目前的一些大数据处理平台中。针对数据流的编程模型,比较了传统软件工程的面向数据流的分析和设计方法与目前针对大数据处理平台的数据流编程模型提供的结构定义和模型参考,分析了两者的差异和不足,总结了数据流编程模型的主要特征和关键要素。分析了目前数据流编程的主要方式以及与主流编程工具的结合,针对大数据处理的数据流计算业务需求,给出了可视化数据流编程工具的基本框架和编程模式。 展开更多
关键词 数据流 编程模型 大数据处理 编程工具
下载PDF
我国地方大数据政策的扩散模式与转移特征研究 被引量:13
3
作者 丁文姚 张自力 +1 位作者 余国先 韩毅 《大数据》 2019年第3期76-95,共20页
为揭示我国地方大数据政策的发展趋势与内容关联性,基于政策扩散与政策转移理论,采用内容分析法、社会网络分析方法,探索我国各省市68条地方大数据政策的时空扩散模式与内容转移特征。研究发现:我国地方大数据政策发布与参照的时间扩散... 为揭示我国地方大数据政策的发展趋势与内容关联性,基于政策扩散与政策转移理论,采用内容分析法、社会网络分析方法,探索我国各省市68条地方大数据政策的时空扩散模式与内容转移特征。研究发现:我国地方大数据政策发布与参照的时间扩散模式均符合政策扩散一般规律,时间扩散曲线呈S型;政策参照扩散模式为目前中国常见的"中央—地方扩散"与自上而下层级参照扩散模式;此外,地方大数据政策对重要国家政策内容的继承性较高,不同区域政策内容的创新各具特色。 展开更多
关键词 地方政策 大数据政策 政策参照 政策扩散 政策转移
下载PDF
区域卫生数据用于临床疗效分析的可用性研究 被引量:2
4
作者 叶琪 赵亮 +3 位作者 阮彤 冯东雷 高炬 刘珉 《大数据》 2018年第3期13-23,共11页
区域卫生数据来源于不同的医院,经历多轮采集、转换、整合过程,数据可能存在各种质量问题。提出了一套"数据可用性"的评估流程,从临床科研需求出发,设计评估需求模板,采集评估需求,进而获得评估度量。通过面向心力衰竭疗效分... 区域卫生数据来源于不同的医院,经历多轮采集、转换、整合过程,数据可能存在各种质量问题。提出了一套"数据可用性"的评估流程,从临床科研需求出发,设计评估需求模板,采集评估需求,进而获得评估度量。通过面向心力衰竭疗效分析的需求实例,获得了与数据的完整性和一致性相关的10个度量指标,并对某省级区域平台的数据进行了可用性评估。结果发现,与临床科研相关的数据的完整性和一致性都仍有待提高。 展开更多
关键词 区域卫生数据 数据质量 数据可用性 疗效分析
下载PDF
社交网络分析在公共安全领域的应用 被引量:3
5
作者 邵蓥侠 冯是聪 《大数据》 2017年第2期38-44,共7页
社交网络分析技术是一种通用有效的研究社会人员之间复杂关系模式的方法。以公安领域为背景,首先介绍了社交网络分析理论,然后详细阐述该技术在公安领域的3个应用案例,包括犯罪团伙挖掘、核心成员识别和串并案挖掘,以期为读者了解社交... 社交网络分析技术是一种通用有效的研究社会人员之间复杂关系模式的方法。以公安领域为背景,首先介绍了社交网络分析理论,然后详细阐述该技术在公安领域的3个应用案例,包括犯罪团伙挖掘、核心成员识别和串并案挖掘,以期为读者了解社交网络分析技术在公共安全领域的应用提供帮助。 展开更多
关键词 社交网络分析 公共安全 犯罪团伙
下载PDF
决策驱动型省级政务大数据治理技术架构及实现
6
作者 孟凡 杨群力 高阳 《大数据》 2024年第2期140-151,共12页
新时期政务数据在形态、产生机制等方面发生了巨大转变,呈现模态多样、体量巨大、结构复杂、时序演变等特征,给传统治理带来了全新的挑战。针对此问题,以省级政务大数据治理为切入点,分析了传统省级政务大数据治理的技术架构和瓶颈。围... 新时期政务数据在形态、产生机制等方面发生了巨大转变,呈现模态多样、体量巨大、结构复杂、时序演变等特征,给传统治理带来了全新的挑战。针对此问题,以省级政务大数据治理为切入点,分析了传统省级政务大数据治理的技术架构和瓶颈。围绕政府决策场景提出了一种决策驱动型省级政务大数据治理技术架构——凤翔模型,分析其内涵概念、设计原则和总体架构,并对其可行性进行论证。针对凤翔模型技术架构中的4项关键业务问题和关键技术问题,进一步提出针对性的技术实现思路,为各省市后续治理项目建设以及相关技术路线研究选型提供参考。 展开更多
关键词 政务大数据 数据治理 决策 复杂结构
下载PDF
刍议大数据治理的三大基础思维
7
作者 李汶龙 袁媛 安筱鹏 《大数据》 2022年第4期34-45,共12页
尝试抽象出既有大数据治理规则背后的逻辑和思维基础。具体而言,梳理了3种性质不同的基础思维,即简单类比、法律移植和规范想象。3种思维在某一特定历史阶段或多或少都存在,并非对立或者排斥关系,而是处于连续的谱系中。为了增进理解,... 尝试抽象出既有大数据治理规则背后的逻辑和思维基础。具体而言,梳理了3种性质不同的基础思维,即简单类比、法律移植和规范想象。3种思维在某一特定历史阶段或多或少都存在,并非对立或者排斥关系,而是处于连续的谱系中。为了增进理解,将“路径依赖”作为参考概念。前两种基础思维属于路径依赖式思维,最后一种强调对既有路径的脱离和超越。基于对大数据治理基础思维的梳理和分析,进一步提出关于治理的顶层设计建议。首先,对传统物权(所有权)的依赖已经走到逻辑终点,如果脱离这一认知轨道,如何通过深入触及数据实践的方式设计治理规则是目前最主要的挑战。其次,法律移植是近十几年来大数据治理规则发展的主要引擎,但移植不同于翻译,移植本身也不是最终目的。审慎对待选择性借鉴的问题,以及规则和理论一体两面的问题,是目前移植实践的瓶颈和突破口。最后,与前两种路径依赖式思维对立,尝试提出规范想象的理念,指出适时脱离既有的历史轨迹和思维惯性的必要性。规范想象力的构建是一个复杂且持续的事业,需要同时跨越学科的藩篱,超越纯概念层面的认知,并形成有效的规则-理论互动。 展开更多
关键词 大数据治理 路径依赖 简单类比 法律移植 规范想象
下载PDF
强化学习在资源优化领域的应用 被引量:3
8
作者 王金予 魏欣然 +1 位作者 石文磊 张佳 《大数据》 2021年第5期131-149,共19页
资源优化问题广泛存在于社会、经济的运转中,积累了海量的数据,给强化学习技术在这一领域的应用奠定了基础。由于资源优化问题覆盖广泛,从覆盖广泛的资源优化问题中划分出3类重要问题,即资源平衡问题、资源分配问题和装箱问题。并围绕这... 资源优化问题广泛存在于社会、经济的运转中,积累了海量的数据,给强化学习技术在这一领域的应用奠定了基础。由于资源优化问题覆盖广泛,从覆盖广泛的资源优化问题中划分出3类重要问题,即资源平衡问题、资源分配问题和装箱问题。并围绕这3类问题总结强化学习技术的最新研究工作,围绕各研究工作的问题建模、智能体设计等方面展开详细阐述。 展开更多
关键词 强化学习 资源优化 多智能体系统
下载PDF
基于区块链技术的数据资产管理机制 被引量:8
9
作者 赵明 董大治 《大数据》 2021年第4期49-60,共12页
使用区块链技术可以保证数据资产管理的高安全性、高隐私性以及可追溯性等。通过对当前基于区块链的数据资产管理机制进行深入研究,总结得出当前管理机制只针对区块链体系框架中的某一层进行应用的结论。为了解决这一问题,提出了基于区... 使用区块链技术可以保证数据资产管理的高安全性、高隐私性以及可追溯性等。通过对当前基于区块链的数据资产管理机制进行深入研究,总结得出当前管理机制只针对区块链体系框架中的某一层进行应用的结论。为了解决这一问题,提出了基于区块链技术的数据资产管理新模式,对区块链体系中的各个层次进行结合应用。该模式在网络层增加了节点权限控制机制,在共识层实现了共识机制可自定义属性,在数据层通过优化结构和建立索引来提高数据查询效率,在智能合约层实现了数据智能化管理和共享,在交易层实现了可自定义加密算法的信息加密。实验结果表明,相比于传统模式,基于区块链技术的数据资产管理新模式在链上数据查询效率上提升了2.33倍。 展开更多
关键词 数据资产 数据资源 数据资产管理 区块链技术
下载PDF
数据跨境监管初探 被引量:4
10
作者 朱扬勇 熊贇 《大数据》 2021年第1期135-144,共10页
随着对数据价值的认识日益增强,数据跨境越来越受到关注。一方面,数据跨境是经济全球化和数字经济发展的必由之路;另一方面,数据跨境有可能危害国家数据安全。因此,需要对必要的、合理的数据跨境和恶意的、有害的数据跨境等进行研究、界... 随着对数据价值的认识日益增强,数据跨境越来越受到关注。一方面,数据跨境是经济全球化和数字经济发展的必由之路;另一方面,数据跨境有可能危害国家数据安全。因此,需要对必要的、合理的数据跨境和恶意的、有害的数据跨境等进行研究、界定,并制定相应规制。首先分析并给出了当前数据跨境的两种类型和4种渠道,然后提出了基于数据分类的数据跨境监管措施,为数据跨境监管和数据跨境立法提供了支持。 展开更多
关键词 数据跨境 数据跨境监管 数据跨境类型 数据跨境渠道
下载PDF
数据流技术在GPU和大数据处理中的应用 被引量:2
11
作者 苏华友 梅松竹 +1 位作者 李荣春 窦勇 《大数据》 2020年第3期117-128,共12页
数据流模型是一种高效的计算模型,由于其在并行性方面具有天然的优势,数据流技术在软硬件领域得到了广泛的应用。在硬件体系结构方面,数据流模型引领计算机体系结构在传统冯·诺伊曼架构下向支持更高并发的方向发展。基于超长向量... 数据流模型是一种高效的计算模型,由于其在并行性方面具有天然的优势,数据流技术在软硬件领域得到了广泛的应用。在硬件体系结构方面,数据流模型引领计算机体系结构在传统冯·诺伊曼架构下向支持更高并发的方向发展。基于超长向量处理单元的流处理和SIMT的现代GPU就广泛使用了数据流技术的思想。在编程模型方面,数据流思想在大数据编程模型领域得到了广泛应用,例如MapReduce和Spark等。从数据流模型的角度多层次分析了英伟达GPU的体系结构以及CUDA编程模型,阐述了数据流模型在GPU软硬件系统中的应用。分析了数据流思想和GPU大规模并行处理体系结构在大数据处理中的应用和发展趋势。 展开更多
关键词 数据流 GPU 大数据处理
下载PDF
基于容忍因子的近似最近邻混合查询算法
12
作者 贺广福 薛源海 +3 位作者 陈翠婷 俞晓明 刘欣然 程学旗 《大数据》 2024年第1期17-34,共18页
近似最近邻搜索(ANNS)是计算机领域中一种重要的高效相似度搜索技术,可用于在大规模数据集中进行快速信息检索。随着人们对高精度信息检索的需求不断增长,同时使用结构化信息和非结构化信息进行混合查询的方式也得到了广泛应用。然而,... 近似最近邻搜索(ANNS)是计算机领域中一种重要的高效相似度搜索技术,可用于在大规模数据集中进行快速信息检索。随着人们对高精度信息检索的需求不断增长,同时使用结构化信息和非结构化信息进行混合查询的方式也得到了广泛应用。然而,基于近邻图的过滤贪心算法在混合查询时可能会因结构化约束条件的影响导致连通性降低,进而损害搜索精度。为此,提出了一种基于容忍因子的过滤贪心算法,通过容忍因子控制不满足结构化约束条件的顶点参与路由,在不改变索引结构的前提下维持原有近邻图的连通性,克服了结构化约束条件对检索精度的负面影响。实验结果证明,新算法可以在不同结构化约束强度下实现ANNS的高精度搜索,同时保持检索效率。该研究解决了基于近邻图的ANNS在混合查询场景中的问题,为大规模数据集的快速混合查询信息检索提供了一种有效的解决方案。 展开更多
关键词 混合查询 向量检索 最近邻搜索 过滤搜索
下载PDF
跨信任域的联邦k-支配Skyline查询算法
13
作者 史烨轩 童咏昕 +2 位作者 周昊 许可 吕卫锋 《大数据》 2023年第4期32-43,共12页
k-支配Skyline查询是一种主流的Skyline查询变种,其在多目标决策与推荐领域有着广泛的应用。随着这些应用规模不断扩大,在由多个参与方组成的数据联邦中进行跨域k-支配Skyline查询的需求日益旺盛。然而,由于数据联邦中的参与方之间彼此... k-支配Skyline查询是一种主流的Skyline查询变种,其在多目标决策与推荐领域有着广泛的应用。随着这些应用规模不断扩大,在由多个参与方组成的数据联邦中进行跨域k-支配Skyline查询的需求日益旺盛。然而,由于数据联邦中的参与方之间彼此不互信,进行跨信任域的查询计算需引入大量安全操作,效率较低。为此提出了一种基于跨域隐私向量聚合的算法,从而实现高效的联邦k-支配Skyline查询,并运用一种密文压缩技术进一步优化查询效率,最后通过充分的实验验证了所提方案的优越性。 展开更多
关键词 k-支配Skyline查询 数据联邦 安全多方计算 同态加密
下载PDF
信息-数据二维视角下的数据权属体系构建 被引量:1
14
作者 顾勤 周涛 +3 位作者 钟书丽 秦之湄 张瑶瑶 陈祎 《大数据》 2022年第5期153-169,共17页
数据确权是数据要素市场化体系建设中亟待解决的基础性问题。从信息与数据二维视角出发,对信息与数据的概念和特点进行剖析和甄别,并在此基础上提出通过信息主体与数据管理主体分类来构建数据权属体系的方法。所提方法设想如下:①信息... 数据确权是数据要素市场化体系建设中亟待解决的基础性问题。从信息与数据二维视角出发,对信息与数据的概念和特点进行剖析和甄别,并在此基础上提出通过信息主体与数据管理主体分类来构建数据权属体系的方法。所提方法设想如下:①信息是实质内容,数据是信息的载体,个人、组织与其他物质都是信息内容产生的主体,个人和组织是信息的所有者;②个人或组织对其以某种形式记录信息形成的数据,拥有数据管理的权利与义务;③在现行法律框架与客观实践下,数据所有权应归国家所有,数据管理主体拥有数据有限的占有、使用、收益和处分的权利,同时需履行相应义务保障信息主体权益。 展开更多
关键词 数据权属 所有权 人格权 财产权
下载PDF
基于SVD++隐语义模型的信任网络推荐算法 被引量:3
15
作者 陈佩武 束方兴 《大数据》 2021年第4期105-116,共12页
推荐算法通常基于用户的行为数据进行建模,然而显式行为数据的稀疏性可能会引起推荐算法的冷启动问题。为了降低数据稀疏和冷启动问题对推荐算法效果的影响,在已有显式信任关系的基础上,基于用户相似度引入隐式信任关系,通过SVD++隐语... 推荐算法通常基于用户的行为数据进行建模,然而显式行为数据的稀疏性可能会引起推荐算法的冷启动问题。为了降低数据稀疏和冷启动问题对推荐算法效果的影响,在已有显式信任关系的基础上,基于用户相似度引入隐式信任关系,通过SVD++隐语义模型设计了新的推荐算法。为了提升算法效果,进一步融合邻域模型,推导出算法评分预测式及损失函数。在Epinions开源数据集中将RMSE和MAE作为测试指标,在全体用户集和冷启动用户集上进行对比实验。实验结果显示,设计的推荐算法可以在一定程度上改善原推荐算法的冷启动问题,并取得更好的评分预测效果。 展开更多
关键词 推荐算法 隐语义模型 信任网络 评分预测
下载PDF
工业时序大数据质量管理 被引量:6
16
作者 丁小欧 王宏志 于晟健 《大数据》 2019年第6期19-29,共11页
工业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中一种重要的数据形式,存在大量的数据质量问题,需要设计数据清洗方法对其进行检测和有效处理。介绍了工业时序大数... 工业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中一种重要的数据形式,存在大量的数据质量问题,需要设计数据清洗方法对其进行检测和有效处理。介绍了工业时序大数据的特点及工业数据质量管理的难点,并对工业时序大数据质量管理的研究现状加以分析、总结,最后,提出了时序大数据质量管理方法和系统性能的提升方向。 展开更多
关键词 数据质量管理 时序数据 工业大数据分析 数据清洗
下载PDF
基于知识图谱的小微企业贷款申请反欺诈方案 被引量:15
17
作者 金磐石 万光明 沈丽忠 《大数据》 2019年第4期100-112,共13页
近年来,在各大商业银行竞相开展小微企业信贷业务的同时,贷款欺诈风险也随之产生。针对小微企业信贷业务的特点,提出了一种基于全方位企业画像与企业关联图谱的贷前反欺诈模型。通过整合多源信息,形成完整的企业属性特征,并结合从图谱... 近年来,在各大商业银行竞相开展小微企业信贷业务的同时,贷款欺诈风险也随之产生。针对小微企业信贷业务的特点,提出了一种基于全方位企业画像与企业关联图谱的贷前反欺诈模型。通过整合多源信息,形成完整的企业属性特征,并结合从图谱中提取的关系网络结构特征,把特征共同输入模型,以定量评估小微企业客户的欺诈风险。实验表明,使用隐含在关系图谱中的信息比单纯使用企业自身特征建模在测试集上的AUC提高了5%,有助于银行机构准确地对企业申贷欺诈行为进行评估。 展开更多
关键词 反欺诈 企业画像 关联图谱
下载PDF
大数据的价值发现方法 被引量:3
18
作者 杜小勇 陈跃国 《大数据》 2017年第2期19-25,共7页
大数据的价值有不同的体现形式和发现价值的途径。总结了从大数据中发现价值的3种基本途径:数据服务、数据分析与数据探索,并对它们的特点进行了分析和对比。数据服务通过提供高性能和高并发的数据访问从微观层面体现数据价值;数据分析... 大数据的价值有不同的体现形式和发现价值的途径。总结了从大数据中发现价值的3种基本途径:数据服务、数据分析与数据探索,并对它们的特点进行了分析和对比。数据服务通过提供高性能和高并发的数据访问从微观层面体现数据价值;数据分析侧重利用统计模型的方法在宏观层面上对大数据进行处理,通过产生数据洞察的形式体现数据价值;数据探索侧重通过交互模型在微观和宏观的不断变换,引导用户浏览和发现数据的价值。 展开更多
关键词 大数据 价值发现 数据服务 数据分析 数据探索
下载PDF
基于微博数据对突发性环境污染事件公众感知变迁研究
19
作者 张志恒 陈兴鹏 惠丹 《大数据》 2016年第3期60-72,共13页
发掘突发环境污染事件下公众感知变迁特征对于应急决策具有重要意义。以"2014年兰州市自来水污染"为例,尝试采用新浪微博的数据,使用内容分析法对公众感知变迁的计量特征、6个感知方向变迁特征进行分析。结果表明,反映公众感... 发掘突发环境污染事件下公众感知变迁特征对于应急决策具有重要意义。以"2014年兰州市自来水污染"为例,尝试采用新浪微博的数据,使用内容分析法对公众感知变迁的计量特征、6个感知方向变迁特征进行分析。结果表明,反映公众感知的小文本集遵循齐夫定律;公众感知依次经历发散、平稳、收敛、"公众反思"4个阶段;感知方向的变迁特征分为阶段弱敏感性与强敏感性两类。基于公众感知阶段划分及公众感知方向变迁特征提出应对突发性环境污染事件的建议。 展开更多
关键词 突发环境污染事件 公众感知 内容分析法 微博
下载PDF
构建支持大模型训练的计算机系统需要考虑的4个问题
20
作者 郑纬民 《大数据》 2024年第1期1-8,共8页
支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭... 支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭建大模型的基础设施,提出4点平衡设计,以确保系统的性能、可靠性和可扩展性。 展开更多
关键词 大模型训练 计算机系统 超算系统 大模型基础设施
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部