期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
10
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数据空间基础设施的技术挑战及数联网解决方案
被引量:
11
1
作者
罗超然
马郓
+1 位作者
景翔
黄罡
《大数据》
2023年第2期110-121,共12页
数据空间是网络空间从“以计算为中心”向“以数据为中心”转型的一种新形态,蕴含着变革性重大科技问题和换道超车创新机遇。类似互联网是网络空间的主要基础设施,数据空间也需要“以数据为中心”的新型基础设施,其核心功能是实现数据...
数据空间是网络空间从“以计算为中心”向“以数据为中心”转型的一种新形态,蕴含着变革性重大科技问题和换道超车创新机遇。类似互联网是网络空间的主要基础设施,数据空间也需要“以数据为中心”的新型基础设施,其核心功能是实现数据的一阶实体化。从数据空间的视角出发,分析总结互联网、万维网和数字对象架构等主流技术体系对数据一阶实体化的支持和不足,给出数据空间基础设施的基本内涵与技术挑战。提出基于数据语用原理的数据一阶实体化方法,通过融合数字对象架构、分布式账本和智能合约等技术形成数联网解决方案,支撑互联网规模的数据空间基础设施构造和运行。
展开更多
关键词
数据空间基础设施
数联网
数字对象架构
数据语用
下载PDF
职称材料
数据空间的发展历史与全球一体化趋势
2
作者
罗超然
刘天成
黄罡
《信息通信技术》
2024年第3期57-62,共6页
数据智能技术的发展推动着网络空间从计算为中心转变为以数据为中心的新形态,即“数据空间”。随着数据作为生产要素的价值不断凸显,“数据空间”广泛出现在各个行业、领域,但数据空间的定义尚未形成共识。文章从数据空间一词的首次出...
数据智能技术的发展推动着网络空间从计算为中心转变为以数据为中心的新形态,即“数据空间”。随着数据作为生产要素的价值不断凸显,“数据空间”广泛出现在各个行业、领域,但数据空间的定义尚未形成共识。文章从数据空间一词的首次出现开始,梳理近二十年来数据空间相关概念发展,提出狭义和广义数据空间的分类思路。随后从数据跨域价值释放的角度出发,分析全球一体化数据空间的必要性,分析该方向上的两条主要技术路径:链接数据和数字对象架构,并对数据空间的发展趋势进行展望。
展开更多
关键词
数据空间
全球一体化
链接数据
数字对象架构
下载PDF
职称材料
面向“融合科学”新范式的科学数据跨中心可信共享技术框架
3
作者
杨婧如
蔡华谦
+2 位作者
杨勇
李影
刘佳
《数据与计算发展前沿(中英文)》
CSCD
2024年第4期22-33,共12页
【目的】大数据催生了一种基于多学科数据融合解决重大科技问题的科研新范式,即“融合科学”新范式。科学数据跨学科、跨领域、跨机构的协同分析与应用成为了科学数据价值充分释放的重要方式,科学数据的跨中心可信共享成为科学数据中心...
【目的】大数据催生了一种基于多学科数据融合解决重大科技问题的科研新范式,即“融合科学”新范式。科学数据跨学科、跨领域、跨机构的协同分析与应用成为了科学数据价值充分释放的重要方式,科学数据的跨中心可信共享成为科学数据中心建设的关键目标。【方法】针对科学数据中心数据多源异构、数据量大、资源分散、专业性强、具有明确的知识产权等特点与挑战,本文提出科学数据跨中心可信共享技术框架,该框架包括科学数据建模与互操作方法、双标识融合解析、可信存证、数据确权与流转追溯等关键技术。【结果】在跨越五个科学数据中心的数据共享场景下,验证了该框架的有效性。【结论】为实现面向“融合科学”新范式的科学数据跨中心可信共享提供了一种可行技术路径。
展开更多
关键词
科学数据
融合科学
可信共享
互操作
标识解析
下载PDF
职称材料
可信数据空间:数据产业高质量发展的新动力
被引量:
1
4
作者
梅宏
黄罡
《智慧中国》
2024年第12期20-21,共2页
数字经济作为继农业经济和工业经济之后的新经济形态,源于互联网、大数据和人工智能等新一代信息技术的高速发展和深度应用,当前正处于成形期,其主要特征之一是数据成为新的生产要素并衍生出数据产业新业态。在此背景下,国家数据局发布...
数字经济作为继农业经济和工业经济之后的新经济形态,源于互联网、大数据和人工智能等新一代信息技术的高速发展和深度应用,当前正处于成形期,其主要特征之一是数据成为新的生产要素并衍生出数据产业新业态。在此背景下,国家数据局发布《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),这是国家层面首次针对可信数据空间这一新型数据基础设施进行前瞻性的系统布局。《行动计划》紧紧抓住数据要素市场化配置改革这一主线,以打造数据空间中国方案——可信数据空间为关键着力点,全力加快培育全国一体化数据市场,进而为推动数据产业迈向高质量发展注入强大动力,可谓意义深远。
展开更多
关键词
新经济形态
《行动计划》
数据空间
要素市场化
人工智能
大数据
新业态
新一代信息技术
原文传递
基于知识图谱的GitHub层次化学习和检索服务
被引量:
1
5
作者
江惠珍
孙艳春
黄罡
《计算机工程》
CAS
CSCD
北大核心
2024年第5期16-25,共10页
GitHub是全球最大的在线代码托管平台,为软件开发学习者提供了丰富的学习资源,然而面对丰富而繁杂的GitHub内容,软件开发初学者在使用GitHub的搜索功能搜索所需的学习资源时,由于需求不明确或缺乏相关知识和经验,常会遇到难以构建合适...
GitHub是全球最大的在线代码托管平台,为软件开发学习者提供了丰富的学习资源,然而面对丰富而繁杂的GitHub内容,软件开发初学者在使用GitHub的搜索功能搜索所需的学习资源时,由于需求不明确或缺乏相关知识和经验,常会遇到难以构建合适的搜索文本进行有效搜索的问题。针对该问题,利用GitHub主题潜在的层次结构,结合Wikipedia软件开发领域知识,设计GitHub软件开发领域知识图谱,在此基础上提出一种基于知识图谱的GitHub层次化学习和检索服务。通过对比实验和调查问卷的方式验证了提出的层次化学习和检索服务的可行性和有效性。
展开更多
关键词
GitHub平台
维基百科
知识图谱
层次化学习
检索服务
下载PDF
职称材料
超图应用方法综述:问题、进展与挑战
6
作者
曾蠡
杨婧如
+2 位作者
黄罡
景翔
罗超然
《计算机应用》
CSCD
北大核心
2024年第11期3315-3326,共12页
超图是图的泛化,相较于普通图,它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构,超图在应用领域正在发挥越来越大的作用,研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解,有效地提升了解决问题...
超图是图的泛化,相较于普通图,它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构,超图在应用领域正在发挥越来越大的作用,研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解,有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术,缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此,在总结介绍超图的一些基础概念后,分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案;通过对现有工作的归纳总结,阐述了超图运用于现实问题中仍然存在的一些问题与障碍;最后,对超图应用的未来研究方向进行了展望。
展开更多
关键词
超图应用
图像处理
网络分析
推荐系统
分布式网络
下载PDF
职称材料
一种面向非全网共识账本的高效查询方法
7
作者
马新建
景翔
+4 位作者
胡颖聪
朱晓旻
蔡华谦
林兵
孙艳春
《小型微型计算机系统》
CSCD
北大核心
2024年第10期2492-2499,共8页
存证是分布式账本的重要应用领域.为了满足大数据场景下海量数据的存证需求,出现了新型的非全网共识账本.这种账本采用非全网共识算法,大大提高了系统的存证性能.但是,这种账本的数据会随机分布在网络中,因此对数据查询带来了挑战.为适...
存证是分布式账本的重要应用领域.为了满足大数据场景下海量数据的存证需求,出现了新型的非全网共识账本.这种账本采用非全网共识算法,大大提高了系统的存证性能.但是,这种账本的数据会随机分布在网络中,因此对数据查询带来了挑战.为适应非全网共识账本数据分散存储的特点,提出了一种高效的数据查询方法.该方法在查询过程中加入了学习机制,通过账户地址的相似度来指导请求转发,使得查询过程具有更高的性能和更低的延迟.基于该方法,设计和实现了用于非全网共识账本的查询系统,并在仿真环境和真实环境中进行了测试.结果表明,该查询方法在查询性能方面提升了12%,在响应时间方面降低了12%,验证了该查询方法的有效性.
展开更多
关键词
分布式账本
非全网共识
查询方法
存证
大数据
下载PDF
职称材料
结构化视角下的药品审评架构:KASA的创新实践
8
作者
张原
李海玲
+1 位作者
张华川
马郓
《中国医药导刊》
2024年第11期1098-1103,共6页
药品审评流程的效率和质量对新药上市速度和公众健康安全至关重要。随着信息技术的发展,药品审评中的数据结构化需求日益增长,成为提升审评效能的关键。知识辅助评价和结构化申请(KASA)系统作为药品审评流程中的创新实践,其结构化视角...
药品审评流程的效率和质量对新药上市速度和公众健康安全至关重要。随着信息技术的发展,药品审评中的数据结构化需求日益增长,成为提升审评效能的关键。知识辅助评价和结构化申请(KASA)系统作为药品审评流程中的创新实践,其结构化视角和应用对审评现代化转型具有重要意义。本研究深入分析了KASA的基本组成、审评体系架构,以及数据结构化在药品审评中的必要性和面临的挑战,探讨KASA结构化审评框架的创新之处。KASA通过整合结构化数据、先进的算法和知识管理工具,显著提高了审评工作的准确性、一致性和透明度。其成功应用表明了基于结构化的审评系统在提高审评效率、降低成本、促进决策科学化方面的巨大潜力。KASA的创新实践为全球药品审评流程的现代化提供了宝贵的经验和启示。未来,随着新一代信息技术的不断发展和药品审评领域标准的不断完善,药品审评工作将迎来新的发展机遇和挑战。
展开更多
关键词
KASA结构
药品审评
数据结构化
高效审评
下载PDF
职称材料
数据基础设施关键技术发展现状与挑战
被引量:
3
9
作者
黄罡
罗超然
+1 位作者
马郓
杨婧如
《科技纵览》
2023年第12期68-71,共4页
2006年,三位图灵奖得主不约而同提出了面向第四范式的数据基础设施的相关工作.图灵奖得主、数据库先驱吉姆·格雷总结提出了实验、理论、计算模拟和数据密集等四种科学研究范式,指出数据密集型第四范式科研需要支持所有科学文献和...
2006年,三位图灵奖得主不约而同提出了面向第四范式的数据基础设施的相关工作.图灵奖得主、数据库先驱吉姆·格雷总结提出了实验、理论、计算模拟和数据密集等四种科学研究范式,指出数据密集型第四范式科研需要支持所有科学文献和数据均可在线访问和互操作的使能工具和设施.
展开更多
关键词
图灵奖
数据密集型
使能工具
数据库
科学研究范式
科学文献
第四范式
在线访问
原文传递
科学研究第四范式到来,数据基础设施如何应对?
10
作者
黄罡
杨婧如
+3 位作者
马郓
蔡华谦
杨勇
景翔
《科技纵览》
2023年第7期60-63,共4页
随着以大数据和人工智能技术为代表的新一轮科学技术革命加速演进,研究者们对于科研数据的获取需求也不断提升。互联网上的公开数据成为了以大语言模型为代表的人工智能技术发展的主要原料,先进的大语言模型均需要大规模的文本数据进行...
随着以大数据和人工智能技术为代表的新一轮科学技术革命加速演进,研究者们对于科研数据的获取需求也不断提升。互联网上的公开数据成为了以大语言模型为代表的人工智能技术发展的主要原料,先进的大语言模型均需要大规模的文本数据进行预训练,例如AlexaTM使用了1.3万亿个Token进行训练、Chinchilla-7OB使用了1.4万亿个Token进行训练。
展开更多
关键词
人工智能技术
文本数据
大数据
语言模型
科学技术革命
预训练
科研数据
ALEXA
原文传递
题名
数据空间基础设施的技术挑战及数联网解决方案
被引量:
11
1
作者
罗超然
马郓
景翔
黄罡
机构
数据空间技术与系统全国重点实验室
北京大
数据
先进
技术
研究院
北京大学人工智能研究院
北京大学软件与微电子学院
北京大学计算机学院
出处
《大数据》
2023年第2期110-121,共12页
基金
北京高等学校卓越青年科学家计划项目(No.BJJWZYJH01201910001004)。
文摘
数据空间是网络空间从“以计算为中心”向“以数据为中心”转型的一种新形态,蕴含着变革性重大科技问题和换道超车创新机遇。类似互联网是网络空间的主要基础设施,数据空间也需要“以数据为中心”的新型基础设施,其核心功能是实现数据的一阶实体化。从数据空间的视角出发,分析总结互联网、万维网和数字对象架构等主流技术体系对数据一阶实体化的支持和不足,给出数据空间基础设施的基本内涵与技术挑战。提出基于数据语用原理的数据一阶实体化方法,通过融合数字对象架构、分布式账本和智能合约等技术形成数联网解决方案,支撑互联网规模的数据空间基础设施构造和运行。
关键词
数据空间基础设施
数联网
数字对象架构
数据语用
Keywords
infrastructure of dataspace
internet of data
DOA
data pragmatic
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
数据空间的发展历史与全球一体化趋势
2
作者
罗超然
刘天成
黄罡
机构
数据空间技术与系统全国重点实验室
北京大学计算机学院
北京大学人工智能研究院
出处
《信息通信技术》
2024年第3期57-62,共6页
文摘
数据智能技术的发展推动着网络空间从计算为中心转变为以数据为中心的新形态,即“数据空间”。随着数据作为生产要素的价值不断凸显,“数据空间”广泛出现在各个行业、领域,但数据空间的定义尚未形成共识。文章从数据空间一词的首次出现开始,梳理近二十年来数据空间相关概念发展,提出狭义和广义数据空间的分类思路。随后从数据跨域价值释放的角度出发,分析全球一体化数据空间的必要性,分析该方向上的两条主要技术路径:链接数据和数字对象架构,并对数据空间的发展趋势进行展望。
关键词
数据空间
全球一体化
链接数据
数字对象架构
Keywords
Data Space
Global Data Space
Linked Data
Digital Object Architecture
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向“融合科学”新范式的科学数据跨中心可信共享技术框架
3
作者
杨婧如
蔡华谦
杨勇
李影
刘佳
机构
数据空间技术与系统全国重点实验室
北京大学
北京大学
中国科学院计算机网络信息中心
出处
《数据与计算发展前沿(中英文)》
CSCD
2024年第4期22-33,共12页
基金
国家重点研发计划“面向国家科学数据中心的基础软件栈及系统”(2021YFF0704200)。
文摘
【目的】大数据催生了一种基于多学科数据融合解决重大科技问题的科研新范式,即“融合科学”新范式。科学数据跨学科、跨领域、跨机构的协同分析与应用成为了科学数据价值充分释放的重要方式,科学数据的跨中心可信共享成为科学数据中心建设的关键目标。【方法】针对科学数据中心数据多源异构、数据量大、资源分散、专业性强、具有明确的知识产权等特点与挑战,本文提出科学数据跨中心可信共享技术框架,该框架包括科学数据建模与互操作方法、双标识融合解析、可信存证、数据确权与流转追溯等关键技术。【结果】在跨越五个科学数据中心的数据共享场景下,验证了该框架的有效性。【结论】为实现面向“融合科学”新范式的科学数据跨中心可信共享提供了一种可行技术路径。
关键词
科学数据
融合科学
可信共享
互操作
标识解析
Keywords
scientific data
convergence science
trusted sharing
interoperability
identifier resolution
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP308 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
可信数据空间:数据产业高质量发展的新动力
被引量:
1
4
作者
梅宏
黄罡
机构
中国科学院
北京大学
数据空间技术与系统全国重点实验室
出处
《智慧中国》
2024年第12期20-21,共2页
文摘
数字经济作为继农业经济和工业经济之后的新经济形态,源于互联网、大数据和人工智能等新一代信息技术的高速发展和深度应用,当前正处于成形期,其主要特征之一是数据成为新的生产要素并衍生出数据产业新业态。在此背景下,国家数据局发布《可信数据空间发展行动计划(2024—2028年)》(以下简称《行动计划》),这是国家层面首次针对可信数据空间这一新型数据基础设施进行前瞻性的系统布局。《行动计划》紧紧抓住数据要素市场化配置改革这一主线,以打造数据空间中国方案——可信数据空间为关键着力点,全力加快培育全国一体化数据市场,进而为推动数据产业迈向高质量发展注入强大动力,可谓意义深远。
关键词
新经济形态
《行动计划》
数据空间
要素市场化
人工智能
大数据
新业态
新一代信息技术
分类号
F42 [经济管理—产业经济]
原文传递
题名
基于知识图谱的GitHub层次化学习和检索服务
被引量:
1
5
作者
江惠珍
孙艳春
黄罡
机构
北京大学计算机学院高可信软件
技术
教育部
重点
实验室
数据空间技术与系统全国重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第5期16-25,共10页
基金
北京高等学校卓越青年科学家计划项目(BJJWZYJH01201910001004)。
文摘
GitHub是全球最大的在线代码托管平台,为软件开发学习者提供了丰富的学习资源,然而面对丰富而繁杂的GitHub内容,软件开发初学者在使用GitHub的搜索功能搜索所需的学习资源时,由于需求不明确或缺乏相关知识和经验,常会遇到难以构建合适的搜索文本进行有效搜索的问题。针对该问题,利用GitHub主题潜在的层次结构,结合Wikipedia软件开发领域知识,设计GitHub软件开发领域知识图谱,在此基础上提出一种基于知识图谱的GitHub层次化学习和检索服务。通过对比实验和调查问卷的方式验证了提出的层次化学习和检索服务的可行性和有效性。
关键词
GitHub平台
维基百科
知识图谱
层次化学习
检索服务
Keywords
GitHub platform
Wikipedia
knowledge graph
hierarchical learning
retrieval service
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
超图应用方法综述:问题、进展与挑战
6
作者
曾蠡
杨婧如
黄罡
景翔
罗超然
机构
数据空间技术与系统全国重点实验室
北京大学软件与微电子学院
北京大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2024年第11期3315-3326,共12页
基金
国家重点基础研究发展计划项目(2021YFF0901100)。
文摘
超图是图的泛化,相较于普通图,它在复杂关系的高阶特征表达上具有显著优势。作为一种相对较新的数据结构,超图在应用领域正在发挥越来越大的作用,研究者采用超图模型及算法对现实世界中的具体问题进行建模、求解,有效地提升了解决问题的效率及质量。现有对超图的综述更多侧重于解决超图本身问题的理论及技术,缺乏对超图在具体应用场景下的建模及求解方法的归纳总结。为此,在总结介绍超图的一些基础概念后,分析了超图在各个主流应用场景下的应用方法、技术、共性问题及解决方案;通过对现有工作的归纳总结,阐述了超图运用于现实问题中仍然存在的一些问题与障碍;最后,对超图应用的未来研究方向进行了展望。
关键词
超图应用
图像处理
网络分析
推荐系统
分布式网络
Keywords
hypergraph application
image processing
network analysis
recommender system
distributed network
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种面向非全网共识账本的高效查询方法
7
作者
马新建
景翔
胡颖聪
朱晓旻
蔡华谦
林兵
孙艳春
机构
北京大
数据
先进
技术
研究院
北京大学软件与微电子学院
北京智融云河科技有限公司
北京大学计算机学院
福建师范大学物理与能源学院
数据空间技术与系统全国重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第10期2492-2499,共8页
基金
国家重点研发计划项目(2020YFB1006001)资助.
文摘
存证是分布式账本的重要应用领域.为了满足大数据场景下海量数据的存证需求,出现了新型的非全网共识账本.这种账本采用非全网共识算法,大大提高了系统的存证性能.但是,这种账本的数据会随机分布在网络中,因此对数据查询带来了挑战.为适应非全网共识账本数据分散存储的特点,提出了一种高效的数据查询方法.该方法在查询过程中加入了学习机制,通过账户地址的相似度来指导请求转发,使得查询过程具有更高的性能和更低的延迟.基于该方法,设计和实现了用于非全网共识账本的查询系统,并在仿真环境和真实环境中进行了测试.结果表明,该查询方法在查询性能方面提升了12%,在响应时间方面降低了12%,验证了该查询方法的有效性.
关键词
分布式账本
非全网共识
查询方法
存证
大数据
Keywords
distributed ledger
non-network-wide consensus
query method
evidence preservation
big data
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
结构化视角下的药品审评架构:KASA的创新实践
8
作者
张原
李海玲
张华川
马郓
机构
国家药品监督管理局药品审评中心
药品监管科学
全国
重点
实验室
数据空间技术与系统全国重点实验室
出处
《中国医药导刊》
2024年第11期1098-1103,共6页
基金
药品监管科学全国重点实验室项目(2023SKLDRS0151)。
文摘
药品审评流程的效率和质量对新药上市速度和公众健康安全至关重要。随着信息技术的发展,药品审评中的数据结构化需求日益增长,成为提升审评效能的关键。知识辅助评价和结构化申请(KASA)系统作为药品审评流程中的创新实践,其结构化视角和应用对审评现代化转型具有重要意义。本研究深入分析了KASA的基本组成、审评体系架构,以及数据结构化在药品审评中的必要性和面临的挑战,探讨KASA结构化审评框架的创新之处。KASA通过整合结构化数据、先进的算法和知识管理工具,显著提高了审评工作的准确性、一致性和透明度。其成功应用表明了基于结构化的审评系统在提高审评效率、降低成本、促进决策科学化方面的巨大潜力。KASA的创新实践为全球药品审评流程的现代化提供了宝贵的经验和启示。未来,随着新一代信息技术的不断发展和药品审评领域标准的不断完善,药品审评工作将迎来新的发展机遇和挑战。
关键词
KASA结构
药品审评
数据结构化
高效审评
Keywords
KASA architecture
Drug review
Data structuration
Efficient review
分类号
R954 [医药卫生—药学]
下载PDF
职称材料
题名
数据基础设施关键技术发展现状与挑战
被引量:
3
9
作者
黄罡
罗超然
马郓
杨婧如
机构
数据空间技术与系统全国重点实验室
出处
《科技纵览》
2023年第12期68-71,共4页
文摘
2006年,三位图灵奖得主不约而同提出了面向第四范式的数据基础设施的相关工作.图灵奖得主、数据库先驱吉姆·格雷总结提出了实验、理论、计算模拟和数据密集等四种科学研究范式,指出数据密集型第四范式科研需要支持所有科学文献和数据均可在线访问和互操作的使能工具和设施.
关键词
图灵奖
数据密集型
使能工具
数据库
科学研究范式
科学文献
第四范式
在线访问
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
科学研究第四范式到来,数据基础设施如何应对?
10
作者
黄罡
杨婧如
马郓
蔡华谦
杨勇
景翔
机构
数据空间技术与系统全国重点实验室
北京大学计算机学院
北京大学软件与微电子学院
出处
《科技纵览》
2023年第7期60-63,共4页
基金
国家重点研发计划“新型研发机构创新服务平台技术研发与应用”项目(项目编号:2021YFF0901100)
北京高等学校卓越青年科学家项目(项目编号:BJJWZYJHO1201910001004)
中国石油一北京大学基础研究合作项目、新基石科学基金会所设立的科学探索奖的支持。
文摘
随着以大数据和人工智能技术为代表的新一轮科学技术革命加速演进,研究者们对于科研数据的获取需求也不断提升。互联网上的公开数据成为了以大语言模型为代表的人工智能技术发展的主要原料,先进的大语言模型均需要大规模的文本数据进行预训练,例如AlexaTM使用了1.3万亿个Token进行训练、Chinchilla-7OB使用了1.4万亿个Token进行训练。
关键词
人工智能技术
文本数据
大数据
语言模型
科学技术革命
预训练
科研数据
ALEXA
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
数据空间基础设施的技术挑战及数联网解决方案
罗超然
马郓
景翔
黄罡
《大数据》
2023
11
下载PDF
职称材料
2
数据空间的发展历史与全球一体化趋势
罗超然
刘天成
黄罡
《信息通信技术》
2024
0
下载PDF
职称材料
3
面向“融合科学”新范式的科学数据跨中心可信共享技术框架
杨婧如
蔡华谦
杨勇
李影
刘佳
《数据与计算发展前沿(中英文)》
CSCD
2024
0
下载PDF
职称材料
4
可信数据空间:数据产业高质量发展的新动力
梅宏
黄罡
《智慧中国》
2024
1
原文传递
5
基于知识图谱的GitHub层次化学习和检索服务
江惠珍
孙艳春
黄罡
《计算机工程》
CAS
CSCD
北大核心
2024
1
下载PDF
职称材料
6
超图应用方法综述:问题、进展与挑战
曾蠡
杨婧如
黄罡
景翔
罗超然
《计算机应用》
CSCD
北大核心
2024
0
下载PDF
职称材料
7
一种面向非全网共识账本的高效查询方法
马新建
景翔
胡颖聪
朱晓旻
蔡华谦
林兵
孙艳春
《小型微型计算机系统》
CSCD
北大核心
2024
0
下载PDF
职称材料
8
结构化视角下的药品审评架构:KASA的创新实践
张原
李海玲
张华川
马郓
《中国医药导刊》
2024
0
下载PDF
职称材料
9
数据基础设施关键技术发展现状与挑战
黄罡
罗超然
马郓
杨婧如
《科技纵览》
2023
3
原文传递
10
科学研究第四范式到来,数据基础设施如何应对?
黄罡
杨婧如
马郓
蔡华谦
杨勇
景翔
《科技纵览》
2023
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部