加快建设人工智能高质量数据集

  当前,人工智能处在加快速度进行发展的关键时期,正在重塑经济社会持续健康发展模式。2024年中央经济工作会议指出,开展“人工智能+”行动,培育未来产业。数据作为AI发展的三大核心要素之一,是人工智能模型训练的基础要素,也是人工智能模型应用的核心资源,加快建设人工智能高质量数据集,对于推动“人工智能+”场景落地具备极其重大意义。

  高质量数据供给是推动新一代人工智能加快发展的关键要素。当前,面向新一代人工智能的数据供给仍有不足,数据处理专用技术有待进一步突破,数据产业和数据生态有待丰富,高质量数据集的整体规划和支持政策还有待完善。

  首先,通用领域、垂直领域以及具身智能领域的高质量数据供给仍有不足。一方面,中文公开数据在质量和数量方面落后于英文数据。另一方面,我国公共数据开放利用程度有待提升,各地开放标准不统一,专门面向AI发展的高质量行业数据集仍较匮乏。具身智能领域真实交互数据采集不足,根本原因在于智能机器人与环境的交互数据获取困难且成本高昂,同时,企业采集数据缺乏统一的参照标准。

  其次,高质量数据的合成、处理和利用技术亟待提升。利用深度学习和强化学习生成高精确度、多样化合成数据的技术在成熟度和应用场景范围上急需突破。跟着社会自动化和智能化程度的逐步的提升,对数据处理的要求也不断的提高,因此急需针对结构化、半结构化和非结构化数据的处理技术进行迭代优化,进一步提升数据处理效率。

  再次,数据主体和商业模式发展尚不成熟。我国缺乏类似美国Databricks和Snowflake“数据+人工智能”模式的高质量数据汇聚和治理主体,具备大规模数据汇聚管理分析能力的公司数量不足。医疗、法律、保险、金融、工业、科研等多个领域的公共数据授权运营主体目前仍在培育中,数据集构建和运营利用的商业模式发展还不够成熟。

  最后,高质量数据集的专项规划和支持政策有待完善。我国已出台一系列数据发展相关指引政策,但是面向新一代人工智能模型训练和场景应用的高质量数据集专项规划和支持政策尚未出台,其建设、运营、流通、利用等方面举措有待进一步细化。在数据采集方面,各领域数据缺乏适用的标准规范;在数据使用方面,缺少面向大模型和具身智能模型训练的数据共享和流通促进机制,某些特定的程度上限制了模型能力的快速提升。

  针对当前存在的资源、技术、模式、制度等方面问题,结合新一代AI发展的需要,建议发挥政府和市场的协同作用,多措并举推进高质量数据集建设。

  一是加快公共数据开放和企业数据流通,建设面向新一代人工智能的高质量数据集。建议形成部门、行业、地区共同参与的协同机制,围绕高质量数据集建设,扩大数据供给范围和规模,完善公共及行业数据标准,加速可信数据空间建设。面向医疗、教育、科研、法律、工业、农业、物流、金融、能源、交通等重点领域建设大数据中心及大模型行业应用创新(工程)中心,打破信息孤岛,构建完备数据生态,构建高质量数据集,提升垂直领域人工智能模型能力。着眼无人驾驶、具身智能等未来产业需求,开放相关公共数据,制定行业数据标准,探索企业间数据流通机制,鼓励企业和研究机构创建高质量行业数据集。

  二是围绕建设行业高质量数据集关键技术问题加大攻关力度。面向数据合成和处理,加快开发数据合成、数据治理的关键共性技术;面向数据流通汇聚,大力推广隐私计算、区块链等技术;面向“数据+人工智能”应用模式,着力开发数据管理技术,探索新型模型结构和训练架构。鼓励面向人工智能的数据产品、数据服务企业牵头承担国家重点项目,开展应用基础研究和关键核心技术攻关。推动产学研合作和创新联合体建设,打造数据技术、产品和服务深层次地融合的新型合作模式。面向重点场景,打造数据技术“测试场”,提供真实数据环境、模拟应用场景,建设中试基地,吸引企业、高校和科研机构参与数据技术的创新和验证,加速新技术推广和应用。

  三是带领企业和商业模式创新,构建AI数据产业生态。大力培育人工智能数据资源、技术、服务、应用、安全、基础设施等多领域企业,重点建设面向AI行业的数据产业创新平台。鼓励企业基于“数据+人工智能”探索多领域商业模式,支持企业与各方合作,打造基于高质量数据集的产业创新链和ECO。鼓励企业探索大模型和具身智能应用场景,驱动数据产业高质量发展。支持模型应用、模型开发、数据服务、数据产品等相关企业组建创新联合体,开发高质量数据集,发展“数据即服务”“知识即服务”“模型即服务”等新业态。

  四是加大人工智能高质量数据集建设政策支持力度。面向新一代人工智能技术开发和应用发展需求,完善数据资源构建体系,培育数据产业,支持数据技术发展,系统推进高质量数据集建设,强化行业应用。统筹中央和地方财政资金、产业引导基金和各类政策性投资,加大对高质量数据集建设的投入。鼓励金融机构创新产品和服务,增加对数据相关企业的融资支持。引导社会资本有序参与人工智能高质量数据集的开发利用。

  发展数字化的经济是我国把握新一轮科技革命和产业变革新机遇的战略选择。面对创新涌现、迭代迅速的发展形态趋势,我国积极顺应数字化的经济发展规律,审时度势调整发展政策。

  建立粮食产销区省际横向利益补偿机制,重点是推进科技和改革双轮驱动。其中,改革的核心在于粮食政策创设与制度创新,调动和保护好农民种粮积极性,让农民种粮有奔头,让政府抓粮有动力。

  在当前中国的发展进程中,新型城镇化和乡村全面振兴是两个至关重要的战略方向。这两大战略的实施,不仅关系到中国现代化进程的推进,也是实现全体人民共同富裕的关键步骤。

  城市是科研机构、人才、设施等创新要素最为集中的地方;城市自身的高水平发展离不开创新。城市的创新及发展,既需要制定明确的目标,还需要遵循一定的规律和原则。

  全过程人民民主以聚焦民生的方式促进机会公平、打破利益藩篱,让维护社会正义的机制更完善,持续性地疏浚社会成员上升发展流动渠道,确保每个个体都拥有人生出彩、梦想成线

  契合数字化、智能化的传播格局,适应Z世代拥抱变革、表达活跃、实践奋进的代际特征,以更鲜活的话语、多元的样态实现有效触达,彰显理论的生命力与引领力,是做好新时代理论传播的应有之义。

  人工智能产业作为国民经济最重要的先导产业、基础产业和战略性产业,正在通过生产要素、生产资料更新、重组,生产关系、生产制度重塑,成为最具潜力、带动力和深刻影响力的新质生产力引航。

  共建“一带一路”的主要目标之一是通过政策沟通、设施联通、贸易畅通、资金融通、民心相通,实现共建国家的一起发展与繁荣。经过11年的共同努力,一大批标志性项目相继建成并投入运营,为共建国家带来了许多实实在在的利益。

  经济学在应对气候平均状态随时间的变化中的角色,应该是在科学决定气候目标的基础上,主要研究怎么样以成本最小化的方式实现该目标,而不是将经济考虑凌驾于科学之上,由经济学决定温升应该控制到什么程度。

  数字丝路是我国新时期发展的战略性选择,是构建互联网空间命运共同体的新阶段。数字丝路贸易的伟大实践正在使古老的丝路焕发出新的光辉。

  党的十八大以来,我国国际关系学科建设显著加强,发展目标、主要任务、建设路径都更加明确,要求更加清晰,学科建设明显提速,突出体现在学术创新、实践支撑、人才教育培训等方面。

  新型城镇化进程的学科建设涵盖了高等教育体系中为适应新型城镇化发展需求而设立的大量有关专业和研究方向,在实践中也是由一个庞大的职业群体共同推进着与中国现代化进程相伴的城镇化进程。

  新时代中国式现代化的伟大实践,为理论创造提供了强大动力和广阔空间,为建构中国自主的知识体系奠定了坚实基础。

  随着技术的慢慢的提升和应用的深入,数智化将为经济社会发展全面绿色转型带来更多的机遇和动力,助力中国实现美丽中国建设和“双碳”目标,为全球绿色低碳可持续发展贡献更大力量。

  网络梗”越来越成为互联网空间讲好正能量故事的优良载体。加强“梗能力”建设,是推动党的创新理论高质量传播的重要途径。

  与“修昔底德陷阱”的预设恰恰相反,构建人类命运共同体遵循共商共建共享原则,推动平等有序的世界多极化和普惠包容的经济全球化向前发展。

  “碳中和”背景下,有必要将具有高碳汇水平且集中分布的区域纳入生态保护红线范围当中,实施具有规范性和制度化的用途管制策略。

  数字治理,本质上是数字技术向多元治理主体赋能增效的过程,其目的是在数据收集、分析、利用的基础上,从多个层面对治理系统的感知、决策和执行能力进行提升。

  在面对错综复杂的国际环境和百年未有之大变局时,我们更需要的是中国特色大国外交的理念,而非吸引眼球的所谓“理论”。

  面对复杂多变的国际形势,必须用好总体国家安全观这一强大思想武器,自觉运用其方法论原则武装头脑、指导实践,从整体上把握国家安全,不断开创新时代国家安全工作新局面。