从传统市场到大模型驱动 AI时代的数据交易革命
创始人
2025-07-16 17:01:45
0

随着大模型技术的迅猛发展,对大量高质量数据集的需求呈现出爆发式增长的态势。根据北京国际大数据交易所董事长李振军在2025全球数字经济大会上的介绍,2024年人工智能数据仅占交易所交易量的10%,而到2025年目前累计起来已接近80%。这一爆炸性数据的背后是AI产业从通用模型向行业垂直应用的快速演进,以及随之而来对专业化、高质量数据的迫切需求。

大模型兴起之前,数据交易市场已走过十余年的发展历程,但始终处于相对初级和分散的状态。传统数据交易主要服务于商业分析、精准营销、科研等有限场景,交易规模和影响力远未达到今日水平。这一阶段的数据交易呈现出明显的“三低”特征:市场集中度低、数据标准化程度低、交易透明度低。总体而言,大模型时代前的数据交易市场处于“叫好不叫座”的状态,数据要素的价值并没有得到真正的释放。

人工智能大模型的崛起彻底改写了数据交易市场的游戏规则。2023~2025年间,随着ChatGPT、DeepSeek等生成式AI的爆红,高质量训练数据从“有用资源”一跃成为“战略资产”,市场需求呈现指数级增长,人工智能数据成为数据流通最活跃的领域。这场变革不仅扩大了数据交易的规模,更是从根本上重塑了数据的价值标准和获取方式。

首先,高质量数据集成为大模型时代的“新石油”。与传统AI应用不同,大模型训练需要覆盖行业核心专业知识和生产经营活动的多模态、专业化的数据资源。这种需求催生了“高质量数据集”的明确定义——用于训练、验证和优化大模型而收集、整理、标注形成的数据资源集合,其价值取决于专业性、多样性和清洁度。

其次,行业知识底座构建成为竞争焦点。随着AI产业从通用模型向垂直应用下沉,对细分行业理解深度直接决定模型性能。这种转变使得金融、医疗、法律等专业领域的数据集价格水涨船高。同时,数据模态需求多元化也日趋明显。以自动驾驶为例,训练数据不仅需要高清图像和视频,还需同步激光雷达点云、毫米波雷达信号、车辆控制参数等多维信息,以及极端场景下的数据。这种复杂需求使单一模态数据的价值大幅降低,跨模态关联数据集成为稀缺资源。

最后,数据获取渠道正在发生结构性变化。互联网公开数据的比例正在下降,私域数据的生产日益受到重视,头部企业纷纷建立从采集、清洗到加工、治理的完整数据产线,并着手建设企业级RAG知识库。未来企业的专业数据将成为数据获取的主要渠道,数据也将正式成为企业可入表、可交易的资产。

大模型从根本上提升了数据的战略地位,将其从辅助性资源转变为AI产业的核心生产资料。这种转变不仅重塑了数据交易市场的规模与结构,也对数据基础设施建设提出了全新要求,从而推动数据交易体系进行全面的革命。未来的数据交易将呈现以下特点:

一是,去中心化与中心化混合架构或将成为主流。纯中心化的数据交易所面临效率瓶颈,而完全去中心化的模式又难以确保质量和合规,未来可能形成“监管沙盒+市场化平台+去中心化网络”的多元结构。

二是,多元化的定价与激励机制将出现,以激活数据供给。传统“一次性买断”模式难以适应AI训练数据的特性,采用类似代币式的新型激励机制,数据贡献者不仅能获得即时收益,还可分享模型后续产生的长期价值,将进一步为数据交易注入新活力。此外,深圳设立的“语料券”制度通过政府补贴的方式,促进语料的开放共享和交易。多元化的激励工具有助于释放各类主体的数据供给意愿。

三是,垂直行业共同体(如行业数据联盟)将不断出现,逐步突破数据壁垒。AI时代下,通用数据市场难以满足专业领域的特殊需求。金融、医疗、制造等行业正在形成各种形式的数据联盟,共同建设行业知识库。这种行业自发组织的共享机制能够降低单个企业的数据获取成本,同时避免敏感信息过度扩散。

未来的五到十年,数据交易生态将在AI驱动下经历深刻重构。一方面,技术进步和制度创新将解决当前面临的许多瓶颈,释放数据要素的巨大潜力;另一方面,伦理、法律和地缘政治因素可能带来新的不确定性。成功的企业和政策制定者需要保持战略定力,在把握大方向的同时灵活应对变化。对中国而言,庞大的市场规模、丰富的应用场景和积极的政策引导构成了独特优势,有望在全球数据要素市场发展中扮演重要的引领角色。

(作者系清华大学硕士、美国杜克大学访问学者、浙江省可持续发展研究会ESG专委会专家组专家)

相关内容

热门资讯

存储芯片价格史诗级上升 202... 【CNMO科技】正如石油是现代工业体系的血液,存储芯片已成为数字时代科技生态不可或缺的基石。然而,2...
规范AI拟人化互动服务,“虚拟... 2025年12月27日,国家互联网信息办公室发布《人工智能拟人化互动服务管理暂行办法(征求意见稿)》...
马斯克脑机接口重大突破!万人排... 最近,马斯克的Neuralink再次投下重磅炸弹。在一场20分钟的技术演示中,一系列颠覆性的数据被首...
原创 独... Steam DB 数据显示,2025年全年Steam新游上线数量逼近两万,这个承载了大部分中小团队单...
原创 三... 在当今这个信息如洪流般奔涌、科技迭代日新月异的时代,学术圈的喧嚣与浮躁似乎成了一种常态。然而,最近西...
中强精英取得显示屏后壳点胶机构... 国家知识产权局信息显示,广东中强精英电子科技有限公司取得一项名为“一种显示屏后壳的点胶机构”的专利,...
数据中心爆改飞机引擎:接入电网... 财联社12月28日讯(编辑 马兰)数据中心对电网的依赖大大限制了该行业的发展,但如今这一情况正在发生...
科技昨夜今晨1228:比亚迪方... 来源:市场资讯 (来源:IT之家) “科技昨夜今晨”时间,大家好,现在是 2025 年 12 月 2...
性能真的不重要了吗?Jeff ... 新智元报道 编辑:倾倾 【新智元导读】很多人背着「过早优化是万恶之源」的名言,写出的却是处处漏风的...
“基于电脑的艺术”如何走过30... 展览开幕式现场。 VR眼镜一戴,另一个时空、另一个世界就向你敞开了大门;造型奇特的“头盔”加持,你的...
桂林鸿程取得外置卧式多头分级机... 国家知识产权局信息显示,桂林鸿程矿山设备制造有限责任公司取得一项名为“一种外置卧式多头分级机”的专利...
真的建议你睡前关掉WiFi,不... 它几乎存在于每个家庭 还常年不断电 没有它你可能还会焦虑 它,就是WiFi路由器 据中国新闻网报道 ...
小米17:旗舰机市场销量领跑,... 在2025年的旗舰机市场,小米17系列以破竹之势席卷而来,不仅销量数据屡创新高,更以“技术普惠”的理...
昆明文理学院举办“AI赋能语言... 近日,“AI赋能语言教学与国际传播”研讨会暨云南教育国际交流协会民办高校专家委员会第三次会议在昆明文...
建霖健康取得易于更换滤芯的装置... 国家知识产权局信息显示,厦门建霖健康家居股份有限公司取得一项名为“一种易于更换滤芯的装置”的专利,授...
有色金属行业积极推动人工智能大... 从过去采矿凭经验到如今实现智慧勘探,从昔日冶炼靠手艺到如今实现AI精准调控,从以往粗放加工到如今大数...
原创 越... 越南开国功臣武元甲晚年说:若非黎笋固执,中越根本不用打那一仗。这话一出来,不知道戳中了多少经历过那段...
申彦通讯取得丝印定位工装专利,... 国家知识产权局信息显示,上海申彦通讯设备制造有限公司取得一项名为“一种丝印定位工装”的专利,授权公告...
浦东具身智能企业跻身全球第一梯... 来源:市场资讯 (来源:上观新闻) 12月26日,浦东具身智能企业——艾利特机器人发布全新复合机器人...
俄罗斯团体评年度热词 “拉布布... 新华社莫斯科12月28日电(记者栾海)临近岁末,俄罗斯多家团体评选出本国2025年度热词,“胜利”、...