数据工厂的构成、建设模式和运营机制研究
所屬分類:技术论文
上傳者:wwei
文檔大小:5183 K
標(biāo)簽: 数据工厂 高质量数据集 数据基础设施
所需積分:0分積分不夠怎么辦?
文檔介紹:高质量数据集是人工智能大模型训练的核心“燃料”。当前,高质量数据集构建主要由人工智能企业自行完成,呈现零散化、作坊式、非标化的特点,难以满足人工智能大模型快速发展的需求。借鉴水厂、电厂等资源型基础设施的发展规律,结合国内外高质量数据集设施化生产的典型实践,提出“数据工厂”概念,将其定义为面向人工智能大模型应用、设施化规模化构建高质量数据集的生产设施。系统阐述了数据工厂由“储备车间”“生产车间”“中试车间”构成的三级架构体系,分析了数据标注企业升级、数据存储基地转型、人工智能企业延伸和技术企业创新设立四种建设模式,提出了保障模式、定制模式、电商模式和结对子模式四种运营机制,为推动高质量数据集设施化、规模化供给提供理论支撑和实践参考。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。