最高法法官:在大模型训练数据输入端构建合理使用制度
创始人
2025-07-02 04:00:29
0

大模型公司把作品作为训练数据是否要经过权利人许可?最高人民法院法官亓蕾近期就此撰文认为,大模型训练的技术实现具有更为优位的价值位阶,她建议采取“宽进严出”的制度设计思路:在训练数据“输入端”,构建数据合理使用制度;在AI应用“输出端”采取较为严格的制度设计,兼顾AI技术发展和权利人利益保护。

上述观点发表于最高人民法院机关刊《人民司法》杂志2025年第11期。亓蕾认为,AI训练数据虽然属于“输入端”的问题,但该问题的解决不能割裂AI的“输出端”。“宽进严出”的制度设计思路,首先是建立在对AI大模型的认知基础上,即应当区分认识“大模型的能力”和“大模型的应用”,前者对应“输入端”,后者对应“输出端”。

亓蕾表示,AI训练数据在某种意义上属于技术研发,单纯的模型训练不会直接影响权利人,真正的风险来自于模型训练后投入应用。目前,AI大模型应用造成风险的概率和严重程度尚不清楚,还未产生规模风险,对“输入端”进行源头风险预防的正当性并不充分。其次,若在“输入端”严格规制,AI开发者训练数据要么面临极高的授权成本,要么面临极高的法律风险,均将阻碍人工智能的技术创新。此外,多数国家和地区对对AI训练数据均采取宽容态度。

此前不少声音赞同将AI训练数据纳入合理使用的依据在于,如果采用传统的版权许可模式,会因版权成本高昂、磋商交易繁杂而抑制大模型公司的创新,甚至会变相激励大模型公司游走版权保护灰色边缘,等版权人诉讼再被动应付;而版权法定许可模式的缺陷依然明显,对大模型公司而言,承担的成本仍然高昂,而且还要求版权管理组织在当中付出较高的法定许可费管理成本。

亓蕾亦认同,著作权法上的授权许可、法定许可和合理使用制度均为解决训练数据合法性的方案,但前两种方案均面临交易成本过高的问题。

亓蕾建议,通过立法,将AI训练数据作为著作权合理使用的特定情形。理由在于,AI模型训练数据之于AI产业属于底层技术支撑,具有较强的公共利益性与价值优位性。其次,AI将作品作为训练预料并非为了复制存储作品,而是机器学习作品中蕴含的人类自然语言规律,以在输出端生成新的知识信息,数字化的作品在AI模型训练中已经被碾细碎化,作为参数内嵌于AI模型。

“传统意义上的使用,犹如厨师对原材料的烹饪过程,而大模型对训练数据的使用则近似于‘分子料理’般的打散重塑。”亓蕾如是类比说。

允许合理使用,并非不予关照版权权利人的利益。亓蕾表示,应同步赋予著作权人在前端数据合法取得以及后端侵权风险规制上的救济手段,也就是说,法律通过赋予著作权人对作品设置有效技术措施的权利,以及要求AI服务提供者对生成内容的合法性负有注意义务等规定,对合理使用进行动态平衡。

近期,美国法院相继作出两份关于大模型训练数据合理使用问题的裁决,引起中国国内业界和学界的关注。

当地时间6月23日,加州北区地方法院在作家诉Anthropic案中裁决,大模型公司未经过许可使用图书来训练AI模型,属于版权法上的合理使用;但在数据采集阶段,必须确保来源合法,才能避免担责。(详见:)

随后6月25日,加州北区地方法院另一法官又在作家诉Meta案中认定,Meta对作家作品的使用虽被判定为合理使用,但这主要是因为,原告作者未能提供证据支持作品市场价值被稀释的正确论点,并不代表Meta使用受版权保护的作品训练其大模型是合法的。该案法院提到,未经许可使用受版权保护的作品来训练大模型,在许多情况下都是违法的。

“这两起案件对我国有很大的借鉴意义。”在6月28日的中国科学技术法学会首届“中国科技法治纵横谈”论坛上,网易(杭州)网络有限公司法务总监汪海涛建议,应当在具体个案中去考察大模型公司使用作者作品,是否会对作品的市场价值产生不利影响,而不是抽象地判断是否构成合理使用。

采写:南都记者 杨柳

相关内容

热门资讯

HarmonyOS功能推荐新鲜... 今天看到华为发布了HarmonyOS功能推荐,一整个哇塞,全部都是超戳我的超好用功能。特别是“快乐心...
Meta收购中国初创公司Man... 据路透社报道,Meta(原Facebook母公司)周一宣布,已达成协议收购中国人工智能初创公司Man...
数字孪生水利系列①丨数字孪生技... 为积极响应国家数字孪生水利建设的战略部署,广州市水务局按“分类推进、全域协同”原则,系统推进了广州市...
2025,人形机器人狂奔|刻度... 【大河财立方 见习记者 郑棋文】2025年,对于具身智能机器人来说,注定是浓墨重彩的一年。从春晚聚光...
拒绝字节3000万美元,Man... 曾全网都在求“邀请码”的Manus,被Meta收购了!全球AI智能体赛道格局的重磅收购,在2025年...
《永劫无间》小米渠道版本手机游... IT之家 12 月 30 日消息,“永劫无间手游”官方微博发文,称由于与小米渠道合作运营策略的调整,...
国家平台智能中台正式上线,将加... 国家平台智能中台正式上线,将推动智能教学从示范试点走向普遍应用,加速教育智能化转型的进程。 12月3...
金鹰基金:科技自强和出海深化趋... 来源:新浪基金 2025年以来中美科技股均取得亮眼成绩,算力板块涨幅领跑市场,模型和应用侧亦出现局部...
华为发布2025新年致辞:鸿蒙... 2025-12-30 10:41:33 作者:狼叫兽 2025年12月30日,华为发布新年致辞,...
中特科技取得绕线机减振装置专利... 国家知识产权局信息显示,中特科技(青岛)股份有限公司取得一项名为“绕线机减振装置”的专利,授权公告号...
mPEG-Gly5-Amine... 常用名称:mPEG-Gly5-Amine 包装规格: 瓶装,可按 mg 或 g 级提供 mPEG-G...
Meta加速AI布局:收购中国... 来源:环球网 【环球网科技综合报道】12月30日消息,据路透社报道,Meta(原Facebook母...
科普这一年 2025年,时值“十四五”规划收官与永州科普事业高质量发展的攻坚之年。永州市科协紧紧围绕“三高四新”...
柳州调查队工会召开退休职工座谈... 为切实增强退休职工职业荣誉感和在职干部职工凝聚力、感召力、向心力,12月26日,国家统计局柳州调查队...
人形机器人催化电池“新风口”,... 12月30日午后,机器人、电池联袂走强。步科股份、新时达、三花智控封涨停板,科达利、容百科技、欣旺达...
我国成功发射天绘七号卫星 12月30日12时12分,我国在酒泉卫星发射中心使用长征四号乙运载火箭,成功将天绘七号卫星发射升空,...
松田锻压取得电动螺旋压力机用上... 国家知识产权局信息显示,青岛松田锻压机械有限公司取得一项名为“一种电动螺旋压力机用上顶料装置”的专利...
智元机器人赶高铁被闸机拦截 来源:新鲜速递 机器人赶高铁被闸机拦截、高空滑翔时“吓到”语音卡顿的滑稽画面,正让“机器人囧途vlo...
息通五洲:重新定义下一代通信标... 息通五洲运用新一代UDP技术,能够实时感知网络状况、预测潜在拥塞点,并动态调整传输速率与路径选择,使...
实战强能!贵港消防2025应急... 近日,贵港市消防救援支队应急通信实战化暨通信员、无人机操控员培训班圆满落下帷幕。在为期两周的集中淬炼...