从传统市场到大模型驱动 AI时代的数据交易革命
创始人
2025-07-16 17:01:45
0

随着大模型技术的迅猛发展,对大量高质量数据集的需求呈现出爆发式增长的态势。根据北京国际大数据交易所董事长李振军在2025全球数字经济大会上的介绍,2024年人工智能数据仅占交易所交易量的10%,而到2025年目前累计起来已接近80%。这一爆炸性数据的背后是AI产业从通用模型向行业垂直应用的快速演进,以及随之而来对专业化、高质量数据的迫切需求。

大模型兴起之前,数据交易市场已走过十余年的发展历程,但始终处于相对初级和分散的状态。传统数据交易主要服务于商业分析、精准营销、科研等有限场景,交易规模和影响力远未达到今日水平。这一阶段的数据交易呈现出明显的“三低”特征:市场集中度低、数据标准化程度低、交易透明度低。总体而言,大模型时代前的数据交易市场处于“叫好不叫座”的状态,数据要素的价值并没有得到真正的释放。

人工智能大模型的崛起彻底改写了数据交易市场的游戏规则。2023~2025年间,随着ChatGPT、DeepSeek等生成式AI的爆红,高质量训练数据从“有用资源”一跃成为“战略资产”,市场需求呈现指数级增长,人工智能数据成为数据流通最活跃的领域。这场变革不仅扩大了数据交易的规模,更是从根本上重塑了数据的价值标准和获取方式。

首先,高质量数据集成为大模型时代的“新石油”。与传统AI应用不同,大模型训练需要覆盖行业核心专业知识和生产经营活动的多模态、专业化的数据资源。这种需求催生了“高质量数据集”的明确定义——用于训练、验证和优化大模型而收集、整理、标注形成的数据资源集合,其价值取决于专业性、多样性和清洁度。

其次,行业知识底座构建成为竞争焦点。随着AI产业从通用模型向垂直应用下沉,对细分行业理解深度直接决定模型性能。这种转变使得金融、医疗、法律等专业领域的数据集价格水涨船高。同时,数据模态需求多元化也日趋明显。以自动驾驶为例,训练数据不仅需要高清图像和视频,还需同步激光雷达点云、毫米波雷达信号、车辆控制参数等多维信息,以及极端场景下的数据。这种复杂需求使单一模态数据的价值大幅降低,跨模态关联数据集成为稀缺资源。

最后,数据获取渠道正在发生结构性变化。互联网公开数据的比例正在下降,私域数据的生产日益受到重视,头部企业纷纷建立从采集、清洗到加工、治理的完整数据产线,并着手建设企业级RAG知识库。未来企业的专业数据将成为数据获取的主要渠道,数据也将正式成为企业可入表、可交易的资产。

大模型从根本上提升了数据的战略地位,将其从辅助性资源转变为AI产业的核心生产资料。这种转变不仅重塑了数据交易市场的规模与结构,也对数据基础设施建设提出了全新要求,从而推动数据交易体系进行全面的革命。未来的数据交易将呈现以下特点:

一是,去中心化与中心化混合架构或将成为主流。纯中心化的数据交易所面临效率瓶颈,而完全去中心化的模式又难以确保质量和合规,未来可能形成“监管沙盒+市场化平台+去中心化网络”的多元结构。

二是,多元化的定价与激励机制将出现,以激活数据供给。传统“一次性买断”模式难以适应AI训练数据的特性,采用类似代币式的新型激励机制,数据贡献者不仅能获得即时收益,还可分享模型后续产生的长期价值,将进一步为数据交易注入新活力。此外,深圳设立的“语料券”制度通过政府补贴的方式,促进语料的开放共享和交易。多元化的激励工具有助于释放各类主体的数据供给意愿。

三是,垂直行业共同体(如行业数据联盟)将不断出现,逐步突破数据壁垒。AI时代下,通用数据市场难以满足专业领域的特殊需求。金融、医疗、制造等行业正在形成各种形式的数据联盟,共同建设行业知识库。这种行业自发组织的共享机制能够降低单个企业的数据获取成本,同时避免敏感信息过度扩散。

未来的五到十年,数据交易生态将在AI驱动下经历深刻重构。一方面,技术进步和制度创新将解决当前面临的许多瓶颈,释放数据要素的巨大潜力;另一方面,伦理、法律和地缘政治因素可能带来新的不确定性。成功的企业和政策制定者需要保持战略定力,在把握大方向的同时灵活应对变化。对中国而言,庞大的市场规模、丰富的应用场景和积极的政策引导构成了独特优势,有望在全球数据要素市场发展中扮演重要的引领角色。

(作者系清华大学硕士、美国杜克大学访问学者、浙江省可持续发展研究会ESG专委会专家组专家)

相关内容

热门资讯

华电科工申请冷却塔专利,能够提... 国家知识产权局信息显示,华电科工股份有限公司申请一项名为“冷却塔”的专利,公开号CN12120695...
超值优惠累领奖励双福利,CF手... 手游巴士(www.shouyoubus.com)2025年12月29日: 哈喽各位CFer,注意啦!...
原创 S... 大家好我是指尖,新赛季定档1月8日,不知道大家上分的时间还是否来得及,终于到了数着手指等待新版本的时...
GEO优化哪家强?技术硬核公司... 在AI搜索时代,你的内容是否真的能被看见、被推荐?GEO优化已成为决定品牌在AI生成答案中成败的关键...
科学家造出全球最小自主机器人!... 快科技12月29日消息,近日,宾夕法尼亚大学和密歇根大学的研究团队通过合作,成功开发出一种比盐粒还小...
百瑞昇取得高效光伏玻璃砂干燥机... 国家知识产权局信息显示,福建漳州百瑞昇工贸有限公司取得一项名为“高效光伏玻璃砂干燥机”的专利,授权公...
杭州以勒咖啡机:省级研发中心的... 在杭州临平区国家高新经济技术开发区内,坐落着一家专注于智能商用设备研发与制造的企业——杭州以勒上云机...
GEO是什么?三步教你搞定AI... 在AI搜索逐渐普及的今天,你是否担心自己的品牌和内容被淹没在海量信息里,再也无法被精准找到?这背后,...
原创 魔... 盘点魔兽世界六十年代10大最有影响力的武器,全拿过的兄弟堪称真神人物,速看! 一:雷霆之怒逐风者的祝...
新闻早点|江西省博物馆声明:展... 高速磁悬浮新突破!仅用5.3秒,时速800公里 近日,记者从湖北东湖实验室获悉,科研人员通过悬浮支撑...
存储芯片价格史诗级上升 202... 【CNMO科技】正如石油是现代工业体系的血液,存储芯片已成为数字时代科技生态不可或缺的基石。然而,2...
规范AI拟人化互动服务,“虚拟... 2025年12月27日,国家互联网信息办公室发布《人工智能拟人化互动服务管理暂行办法(征求意见稿)》...
马斯克脑机接口重大突破!万人排... 最近,马斯克的Neuralink再次投下重磅炸弹。在一场20分钟的技术演示中,一系列颠覆性的数据被首...
原创 独... Steam DB 数据显示,2025年全年Steam新游上线数量逼近两万,这个承载了大部分中小团队单...
原创 三... 在当今这个信息如洪流般奔涌、科技迭代日新月异的时代,学术圈的喧嚣与浮躁似乎成了一种常态。然而,最近西...
中强精英取得显示屏后壳点胶机构... 国家知识产权局信息显示,广东中强精英电子科技有限公司取得一项名为“一种显示屏后壳的点胶机构”的专利,...
数据中心爆改飞机引擎:接入电网... 财联社12月28日讯(编辑 马兰)数据中心对电网的依赖大大限制了该行业的发展,但如今这一情况正在发生...
科技昨夜今晨1228:比亚迪方... 来源:市场资讯 (来源:IT之家) “科技昨夜今晨”时间,大家好,现在是 2025 年 12 月 2...
性能真的不重要了吗?Jeff ... 新智元报道 编辑:倾倾 【新智元导读】很多人背着「过早优化是万恶之源」的名言,写出的却是处处漏风的...
“基于电脑的艺术”如何走过30... 展览开幕式现场。 VR眼镜一戴,另一个时空、另一个世界就向你敞开了大门;造型奇特的“头盔”加持,你的...