阿里巴巴公布一种大型语言模型训练相关专利
创始人
2026-02-14 03:20:51
0

企查查APP显示,近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置和设备”专利。

专利摘要显示,本发明实施例中,通过获取多个初始采样数据,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核结果;根据每个初始采用数据生成思维链数据,并确定思维链数据集合;根据思维链数据集合对基础大型语言模型进行全量微调,确定中间大型语言模型;根据中间大型语言模型以及多个所述初始采样数据,迭代生成多个中间思维链数据;进而根据预先设置的奖励函数,确定各所述中间思维链数据的奖励数值;最后采用组相对策略优化算法GRPO对所述中间大型语言模型进行强化学习,确定目标大型语言模型。通过上述方法,可以提高大型语言模型的可解释性和审核精度。

上一篇:南方电网三家新机构,同日揭牌成立!

下一篇:没有了

相关内容

热门资讯

阿里巴巴公布一种大型语言模型训... 企查查APP显示,近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置...
南方电网三家新机构,同日揭牌成... 来源:市场资讯 (来源:电力四射) 南网科研院消息,2月4日,黄埔实验室、南方电网工程技术研究院、南...
智能硬件公司觉得自己无所不能|... 记者 陈月芹 编者按:2025年,科技互联网的齿轮转动得比以往任何时候都要快。在技术洗牌的前夜,没有...
王者荣耀伽罗沧流箭什么时候上线... 大家好,王者荣耀官方近期放出了很多好看的英雄新皮肤,其中伽罗沧流箭这款皮肤也吸引了很多玩家们,不少人...
市总工会扎实做好岁末年初安全生... 科技赋能,宁夏紫光天化蛋氨酸有限责任公司“三级降膜蒸发+脱碳浓缩”技术,使碳酸钾杂质去除率达95%以...
JDG3-2AG,无畏力压大帅... 王又见王,辅助位最黑的蛋对上最帅的畏,两边的境遇已经不可同日而语,最终还是无畏更胜一筹,带领JDG3...
迪盛微申请曝光系统及激光器控制... 国家知识产权局信息显示,迪盛微(江苏)装备科技有限公司申请一项名为“曝光系统、激光直写曝光机、激光器...
原创 春... 大家好呀,我是瑜瑜。王者荣耀在本次春节活动期间,包括情人节活动,也确实上线了很多高质量的皮肤,基本上...
LCK杯季后赛首轮,BFX击败... 2026LCK杯季后赛在休息了大约一周之后,季后赛也在12号正式开赛了,因为LCK杯季后赛采用的也是...
国产百万销量单机《饿殍》衍生之... 快科技2月13日消息,今天零创游戏工作室单机新作《哀鸿:城破十日记》正式开启预售活动。 令人意想不到...
在中世纪造飞船炸外星人,这款物... 说实话,我没想到Spiderling Studios敢这么玩。 《围攻》这游戏我断断续续玩了五年,库...
Creatio推出银行专用智能... 软件供应商Creatio周四宣布,推出专为银行业设计的六个预构建智能体产品。这些智能体专注于收入增长...
【红包封面】燕云无限大太吾绘卷... 文/青晖 昨天部分红包都比较紧俏,可能很多小伙伴都没有抢到,不用难过, 今天不用抢了! 跟昨天相反,...
马年限定测评汇总,哪些夯到爆不... 马年限定的6款皮肤都已经测试完了,对应的单篇都已经发布,这一篇我们来做一个汇总。 非常推荐的两款-朵...
我县2项目获省“尖复合材料兵领... 近日,省科技厅下达了2026 年度“尖兵领雁+X”科技计划项目,我县浙江鹏孚隆科技股份有限公司承担的...
当AI长出“手脚”:“物理AI... 新华社北京2月13日电 2月13日,《新华每日电讯》发表题为《当AI长出“手脚”:“物理AI”重构产...
贵阳联通点亮观山湖区新春消费新... 新春将至,年味渐浓。贵阳联通观山湖区分公司以数智技术为笔、以服务民生为墨,参与观山湖区“呼噜潮玩年货...
国际领先!玉林这家侨企的技术和... 2026年2月,中国林产工业协会在南京组织专家委员会,对由广西林科院牵头,联合西南林业大学、广西高林...
在陪伴中遇见更好的自己 来源:滚动播报 (来源:中国航空报) 李欣欣 在信息化的时代浪潮里,我们的生活被切割成了无数个碎片化...
小红书:对未主动标识的AI生成... 来源:澎湃新闻 小红书将限制分发未主动标识的AI生成合成内容。 2月12日,小红书薯管家发布关于加强...