国家数据局:分三类建设高质量数据集赋能AI发展

作者:

CBISMB

责任编辑:

邹大斌

来源:

ISMB

时间:

2025-04-30 10:00

关键字:

数据 国家数据局 AI

数据是训练AI能力的“原料”之一。在第八届数字中国建设峰会29日举行的“高质量数据集和数据标注”主题交流活动上,由国家数据局指导的全国数据标准化技术委员会提出,将强化标准引领,分三类建设高质量数据集。

一类为“通识数据集”,包含面向社会公众、无需专业背景即可理解的通用知识,主要用于支撑通用模型落地应用。

一类为“行业通识数据集”,包含面向行业从业人员、需要一定专业背景才能理解的行业领域通用知识,主要用于支撑行业模型落地应用。

一类为“行业专识数据集”,包含面向特定业务场景相关人员、需要较深的专业背景才能理解的行业领域专业知识,主要用于支撑业务场景模型落地应用。

简单举例,互联网百科、问答等为“通识数据集”;行业研究机构报告等为“行业通识数据集”;医院科室特定疾病病例等为“行业专识数据集”。

国家数据局相关负责人表示,从发展趋势来看,人工智能模型对数据集的需求正从“通用知识”向“专业知识”延伸拓展,经过专家精细化标注的数据集已成为AI价值实现过程中不可或缺的基石,下一步将积极引导做好高质量数据集和数据标注建设工作,为人工智能技术创新和产业应用提供坚实的数据基础。

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-2
京公网安备:11010502051901号
ICP证:京B2-20230255