| 数据工厂的构成、建设模式和运营机制研究 | |
| 所屬分類:技术论文 | |
| 上傳者:wwei | |
| 文檔大小:5183 K | |
| 標(biāo)簽: 数据工厂 高质量数据集 数据基础设施 | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:高质量数据集是人工智能大模型训练的核心“燃料”。当前,高质量数据集构建主要由人工智能企业自行完成,呈现零散化、作坊式、非标化的特点,难以满足人工智能大模型快速发展的需求。借鉴水厂、电厂等资源型基础设施的发展规律,结合国内外高质量数据集设施化生产的典型实践,提出“数据工厂”概念,将其定义为面向人工智能大模型应用、设施化规模化构建高质量数据集的生产设施。系统阐述了数据工厂由“储备车间”“生产车间”“中试车间”构成的三级架构体系,分析了数据标注企业升级、数据存储基地转型、人工智能企业延伸和技术企业创新设立四种建设模式,提出了保障模式、定制模式、电商模式和结对子模式四种运营机制,为推动高质量数据集设施化、规模化供给提供理论支撑和实践参考。 | |
| 現(xiàn)在下載 | |
| VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2