2024-09-25 10:03
人民网成都9月25日电 (袁菡苓)为贯彻落实四川省委、省政府关于推进人工智能1号创新工程的决策部署,满足模型训练和优化数据需求,加快培育本土龙头企业和大模型集群,近期,四川省发展改革委(省数据局)、四川省大数据中心组织开展了高质量数据集征集工作。经现场调研和综合评估,遴选出四川省首批8个人工智能高质量数据集,并在2024年“数据要素×”大赛四川分赛总决赛活动上发布。
据了解,高质量数据集是经过清洗、标注等数据处理后,在格式、质量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源、严格按照国家有关标准和要求打造,包括文本75.69TB、图像20.35PB、音频22.83TB、视频1.2PB、3D模型62TB,可用于医药研制、商贸流通、公共安全、能源调度等各类应用场景,对推动四川省人工智能产业进一步建圈强链,加快进入全国人工智能第一方阵具有重要推动作用。
下一步,四川省发展改革委(省数据局)将持续支持和鼓励行业企业、数商和社会资本,整合公共数据、企业数据等各类数据资源,建设更多具有四川特色、符合国家标准要求的行业高质量数据集,并分批次予以发布。
人民网成都9月25日电 (袁菡苓)为贯彻落实四川省委、省政府关于推进人工智能1号创新工程的决策部署,满足模型训练和优化数据需求,加快培育本土龙头企业和大模型集群,近期,四川省发展改革委(省数据局)、四川省大数据中心组织开展了高质量数据集征集工作。经现场调研和综合评估,遴选出四川省首批8个人工智能高质量数据集,并在2024年“数据要素×”大赛四川分赛总决赛活动上发布。
据了解,高质量数据集是经过清洗、标注等数据处理后,在格式、质量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源、严格按照国家有关标准和要求打造,包括文本75.69TB、图像20.35PB、音频22.83TB、视频1.2PB、3D模型62TB,可用于医药研制、商贸流通、公共安全、能源调度等各类应用场景,对推动四川省人工智能产业进一步建圈强链,加快进入全国人工智能第一方阵具有重要推动作用。
下一步,四川省发展改革委(省数据局)将持续支持和鼓励行业企业、数商和社会资本,整合公共数据、企业数据等各类数据资源,建设更多具有四川特色、符合国家标准要求的行业高质量数据集,并分批次予以发布。