-
题名面向人工智能的数据治理框架
- 1
-
-
作者
李继峰
张成龙
刘鑫
陈劲宇
张津铭
毕超
-
机构
国务院发展研究中心资源与环境政策研究所
国网能源研究院
中国农业发展银行
国网福建省电力有限公司经济技术研究院
中国信息通信研究院人工智能研究所
-
出处
《大数据》
2025年第1期2-20,共19页
-
基金
国家电网有限公司总部管理科技项目(No.1400-202357320A-1-1-ZN)。
-
文摘
数据对人工智能的开发应用具有至关重要的作用,这已成为工业界和学术界的共识。基于人工智能与数据的互动关系,以及以数据为中心的开发实践,提出面向人工智能的数据治理框架,包含源数据治理、预训练数据治理、评测数据治理、微调数据治理、推理数据治理和运维数据治理6个方面,每个方面都有其重点任务和技术。同时,深入分析ChatGPT、Ziya2和能源领域部分人工智能模型的数据治理案例和成功经验,以验证该框架的有效性。结果表明,该框架在提高人工智能模型性能、优化数据管理流程等方面具有积极作用,对面向人工智能的数据治理的理论和技术创新具有参考价值。
-
关键词
人工智能
源数据治理
预训练数据治理
评测数据治理
微调数据治理
推理数据治理
运维数据治理
-
Keywords
artificial intelligence
source data governance
pre-trained data governance
evaluation data governance
fine-tuning data governance
inference data governance
operation and maintenance data governance
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-