DeepSeek论文登上Nature封面,梁文锋署名
创始人
2025-09-19 05:00:37
0

近日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》第645期的封面。论文研究表明,大语言模型(LLM)的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。

在中国科技产业涌现创新性成果的过程中,资金快速涌入科技板块。Choice数据显示,科创人工智能ETF华夏盘中一度飙涨近4%,东财人工智能指数午盘也收涨2.43%。多位业内人士称,大模型训练与推理应用正在全球范围内规模化落地,未来AI产业链的高景气度将持续推动相关企业收入、利润与盈利能力的协同提升,相关机会有望持续演绎。

DeepSeek-R1训练方法发布

具体来看,与今年1月发布的DeepSeek-R1的初版论文相比,此次论文披露了更多模型训练的细节,并对发布初期外界有关“蒸馏”方法的质疑作出了正面回应。

该论文研究表明,大语言模型(LLM)的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM领域研究生水平问题等任务上,比传统训练的LLM表现更好。

如果说,此前的研究主要依赖大量的监督数据来提升模型性能。那么DeepSeek开发团队则选择新路线:不用监督微调(SFT)作为冷启动,通过大规模强化学习(RL)也能显著提升模型的推理能力。

DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,即这一模型通过解决问题获得奖励,从而强化学习效果。团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

此外,值得一提的是,开发团队观察到,DeepSeek-R1-Zero学会了通过重新评估初始方法来更合理地分配思考时间。

DeepSeek小步迭代

今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

8月,在外界纷纷期待DeepSeek-R2发布之时,DeepSeek小步快跑,宣布发布DeepSeek-V3.1。

据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,即一个模型同时支持思考模式与非思考模式;二是更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

资金加速流入科技板块

中国科技产业频现创新成果背景下,各路资金涌入科技板块。

Choice数据显示,科创人工智能ETF华夏盘中一度飙涨近4%,东财人工智能指数午盘也收涨2.43%。

9月18日,第二批14只科创债ETF集中发布基金合同生效公告,发行规模合计为407.86亿元。其中,13只科创债ETF发行规模均超过29亿元。

另外,私募排排网统计数据显示,截至9月9日,按定增上市日统计,今年以来共有41家私募参与了分布于15个申万一级行业的41家上市公司的定增,合计获配金额达39.6亿元。其中,截至9月9日,今年以来私募参与电子板块定增项目的获配金额达10.98亿元,占比达27.7%。

望正资产近日发表观点称,2023年以来,人工智能产业蓬勃发展,已有不少相关企业展现出强劲增长。盈利是驱动股价上行的核心驱动力,后续将研究和布局商业模式成熟、收入利润进入快速增长通道的标的,包括AI算力、AI应用等领域优质企业。

淡水泉也在接受上证报记者采访时表示,公司投资关注两个方向:一是新兴成长领域具备业绩持续性的优质公司,包括AI科技、创新药等细分行业的龙头股;二是周期领域中竞争力突出、受益于“反内卷”政策或美元走弱趋势的头部企业。

作者:马嘉悦 谭镕

相关内容

热门资讯

神奇“白帽子”,精准“打靶”失... 在位于松江区佘山智造园的全澜科技实验室内,创始人姜建指着一顶布满电极的白色帽子介绍:“传统失眠调控刺...
数智化为电炉炼钢点燃新引擎专题... -广告- 在钢铁行业转型升级的浪潮中,数字化与智能化技术的融入为传统电炉炼钢注入新的活力。通过先进的...
AI+算力协同创新 助力医疗大... 当前,AI医疗正深度融入临床与健康管理场景,医疗行业迎来了数智化发展新机遇。为进一步推动技术协同创新...
吉因加科技冲刺港股IPO 【深圳商报讯】(记者 钟国斌)港交所12月21日披露,吉因加科技(绍兴)股份有限公司(下称吉因加科技...
2026 AI 商业中场:从原... 来源:市场资讯 (来源:晚点LatePost) 文丨江思远 2000 年,美国互联网泡沫破灭时,G...
首都航空:用“数字翅膀”赋能旅... 自2021年12月8日加入辽宁方大集团以来,新海航首都航空四年来始终以党建为引领,以服务创新为动力,...
飞荣达:公司在液冷散热领域已展... 证券日报网讯 12月22日,飞荣达在互动平台回答投资者提问时表示,公司目前在服务器、终端设备领域研发...
快手被黑灰产攻击,黑灰产已全面... 12月22日晚,快手平台多个直播间出现色情、暴力等违规内容,快手一度关停直播。对此,快手方面回应称,...
慧研智投平台引领智能投顾时代为... 慧研智投平台通过应用最前沿的科技,致力于提供精准且个性化的投资方案,推动智能投顾业务的发展。该平台利...
户外无电无网视频汇聚平台Eas... 在视频监控领域,“没电没网”的场景一直是行业痛点。如果园、鱼塘、养殖场视频监控的实现面临着独特的挑战...
百利天恒朱义:原始创新打造超级... 来源:21世纪经济报道 21世纪经济报道记者 季媛媛 韩利明 肿瘤领域始终是医药创新的热土,PD-1...
一粒稻米,如何变身“黄金救命药... 新华社北京12月23日电 12月23日,《新华每日电讯》发表题为《一粒稻米,如何变身“黄金救命药”?...
英特尔Hammer Lake处... IT之家 12 月 23 日消息,YouTube 频道 RedGamingTech(RGT)昨日(1...
团队准备休假:Windows ... 快科技12月23日消息,随着圣诞与元旦双节临近,微软Windows Insider团队也正式开启了传...
联通在线取得基于语音识别的IP... 国家知识产权局信息显示,联通在线信息科技有限公司、联通视频科技有限公司取得一项名为“基于语音识别的I...
租机器人对顾客开启夸夸模式?海... 新年里,租一台机器人在餐厅写“福”字,再让机器人开启对顾客的“夸夸模式”,送上新年祝福,这样的就餐体...
闵行这家养老机构通过市级验收! 近日,位于上海市闵行区季乐路76号的华漕镇敬老院顺利通过上海市智慧化养老院建设验收。该院以“六大智慧...
新“前端之父”来了!智谱深夜放... 从技术上线时间点来看,这也是智谱在IPO前夜放出的关键一招。那么究竟效果如何?我们也第一时间在Z.a...
大涨!特斯拉,新纪录! 来源:市场资讯 (来源:证券时报) 特斯拉股价创历史新高。 当地时间12月22日,美股三大指数集体高...
原创 绝... 中国的绝密重器曝光,美国没想到中国撕开封锁,比预想中提前了好多年。 日前,外媒称中国科学家在深圳一座...