为研究地质学领域的大数据和人工智能研究现状、热点和前沿,在中国知网(CNKI)核心期刊和Web of Science(WoS)核心数据库收集了2000—2022年相关中文文献3600篇、英文文献1803篇,利用社区结构分析软件CiteSpace,从合作作者、研究国家、...为研究地质学领域的大数据和人工智能研究现状、热点和前沿,在中国知网(CNKI)核心期刊和Web of Science(WoS)核心数据库收集了2000—2022年相关中文文献3600篇、英文文献1803篇,利用社区结构分析软件CiteSpace,从合作作者、研究国家、研究机构、关键词聚类、关键词时空分布图谱等进行可视化分析,并统计了2021—2022年间,地质学领域国际顶级期刊(综合影响因子10以上)的文献进行前沿分析。分析结果表明,近10年内该研究领域全球累计发文量激增,以中国为代表的亚洲国家和以美国为代表的欧美国家研究为主,双方累计发文量相差不大,论文中介中心性欧美国家普遍较高。我国研究机构之间的交流合作居多,与国外的研究机构交流合作较少,国外研究机构则与之相反。该领域以应用机器学习类方法、知识图谱构建等,在地质灾害防治、地震解释、石油与天然气勘查、固体矿产资源预测等方向进行的科学研究为研究热点,以深度学习、集成学习、智能平台搭建等为手段的地球演化过程中的重大地质事件研究、全球性气候变化、极地及海洋地质研究、数字地质建模及定量分析、地震预报、地灾易发性精准评估等为研究前沿。展开更多
地质数据是经济社会发展的上游要素,具有非常重要的价值。当前,地质大数据研究存在数据底座与应用系统未解耦、数据即服务(Data as a Service,DaaS)未充分厘清的问题,这导致地质数据的可复用性差。本文在系统应用数据湖技术的基础上,聚...地质数据是经济社会发展的上游要素,具有非常重要的价值。当前,地质大数据研究存在数据底座与应用系统未解耦、数据即服务(Data as a Service,DaaS)未充分厘清的问题,这导致地质数据的可复用性差。本文在系统应用数据湖技术的基础上,聚焦多源、异构、海量、时空相关地质数据的汇聚、治理与服务,研究提出基于数据湖技术的地质大数据底座架构,设计由数据采集与清洗层、数据存储层、数据计算与分析层、数据服务层、数据治理层构成的技术架构,并对部分关键技术选型进行验证,为地质大数据中心建设工程提供实践参考。展开更多
文摘为研究地质学领域的大数据和人工智能研究现状、热点和前沿,在中国知网(CNKI)核心期刊和Web of Science(WoS)核心数据库收集了2000—2022年相关中文文献3600篇、英文文献1803篇,利用社区结构分析软件CiteSpace,从合作作者、研究国家、研究机构、关键词聚类、关键词时空分布图谱等进行可视化分析,并统计了2021—2022年间,地质学领域国际顶级期刊(综合影响因子10以上)的文献进行前沿分析。分析结果表明,近10年内该研究领域全球累计发文量激增,以中国为代表的亚洲国家和以美国为代表的欧美国家研究为主,双方累计发文量相差不大,论文中介中心性欧美国家普遍较高。我国研究机构之间的交流合作居多,与国外的研究机构交流合作较少,国外研究机构则与之相反。该领域以应用机器学习类方法、知识图谱构建等,在地质灾害防治、地震解释、石油与天然气勘查、固体矿产资源预测等方向进行的科学研究为研究热点,以深度学习、集成学习、智能平台搭建等为手段的地球演化过程中的重大地质事件研究、全球性气候变化、极地及海洋地质研究、数字地质建模及定量分析、地震预报、地灾易发性精准评估等为研究前沿。
文摘地质数据是经济社会发展的上游要素,具有非常重要的价值。当前,地质大数据研究存在数据底座与应用系统未解耦、数据即服务(Data as a Service,DaaS)未充分厘清的问题,这导致地质数据的可复用性差。本文在系统应用数据湖技术的基础上,聚焦多源、异构、海量、时空相关地质数据的汇聚、治理与服务,研究提出基于数据湖技术的地质大数据底座架构,设计由数据采集与清洗层、数据存储层、数据计算与分析层、数据服务层、数据治理层构成的技术架构,并对部分关键技术选型进行验证,为地质大数据中心建设工程提供实践参考。