我国高质量数据集建设现状
-
摘要: 在新一轮数字化革命的推动下,数据成为继土地、劳动力、资本、技术之后的第五大生产要素,并在不同社会领域配合其可复制性、可增强性、可训练性、可互操作性等独有特征,实现跨行业价值释放。然而,未经筛选整合的海量数据依然存在数据噪声、非对称性、低完整性等内生问题,难以通过可信利用转化形成可持续的数据价值。面对迥然相异的产业技术需求,数据可以通过特定的格式和结构加以集合进而发挥实质价值,这一概念亦被称作“数据集”。 在新质生产力驱动的全新技术业态下,以人工智能为代表的尖端科技正在对特定垂直场域中的“场景数据集”展现更强的上下文依赖性,医疗、交通、教育、金融等场景化的专业性数据集需求高速提升,特定应用场景的精细化对数据价值体系提出更高要求。此背景下,场景数据集的概念激活与高质量发展正密切关联我国数字产业经济的创新性配置、领域性转型与技术性突破。 为实现场景数据价值效用的乘数倍增与充分释放,亟须打通我国关联领域目前在数据供给、数据流通、数据评估、数据标准、数据开放、数据共享等层面的堵点,以“场景化加工能力”与“多样化共享体系”两大要点共同构建具有国际化样板意义的高质量场景数据集。
计量
- 文章访问数: 6
- PDF下载量: 2