字节首次开源推理模型,连夺7项第一
创始人
2025-08-21 15:43:08
0

智东西

作者 | 陈骏达

编辑 | 心缘

智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。

Seed-OSS系列模型是推理模型,专门针对推理任务进行了优化,还允许用户灵活地控制思维预算。

字节Seed团队共开源了Seed-OSS的三个版本,分别为:

(1)基础模型Seed-OSS-36B-Base

(2)无合成数据基础模型Seed-OSS-36B-Base-woSyn

(3)指令微调模型Seed-OSS-36B-Instruct

指令微调后的Seed-OSS-36B-Instruct在通用知识、Agent、编程、长上下文等领域的基准测试中,取得同量级开源模型中的7项SOTA(性能最佳)表现,整体能力超过了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在大部分领域旗鼓相当。

▲基准测试结果,加粗项为开源SOTA(图源:Hugging Face)

Seed-OSS系列模型采用了宽松的Apache2.0开源协议,并会在后续发布模型的详细技术报告。

开源地址:

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

值得一提的是,字节Seed团队本次的发布方式较为“研究友好”。鉴于在预训练中包含合成指令数据可能会影响后训练研究,无合成数据基础模型的发布,为研究社区提供了更多样化的选择。这一系列模型还支持4位和8位格式的量化,以减少内存需求。

Seed-OSS系列模型使用了12万亿个token的预训练数据,采用当前主流的因果语言模型架构,也就是“预测下一个token”类型的模型。同时,Seed-OSS系列均为稠密模型,没有采用MoE等架构。

这一系列模型结合了几项关键技术,包括RoPE(旋转位置编码)、GQA注意力机制(Grouped Query Attention)、RMSNorm归一化(Root Mean Square Normalization)、SwiGLU激活函数等。这是现代大模型常见的高效组件组合,可提升训练稳定性和推理性能。

Seed-OSS的上下文窗口达512k,相当于能一次性处理数十万字的内容。这一上下文窗口并非后续扩展而来,而是通过原生训练打造的。

思考预算功能可帮助开发者控制模型推理成本,优化使用体验等。字节Seed团队分享了Seed-OSS在不同思考预算下性能的变化情况。

对于更简单的任务(如IFEval),模型的思维链较短,随着思维预算的增加,分数波动并不明显。对于更具挑战性的任务(如AIME和LiveCodeBench),模型的思维链更长,随着思维预算的增加,分数也会提高。

字节Seed团队称,如果没有设置思维预算(默认模式),Seed-OSS将不会拥有任何思考长度限制。

如果指定了思维预算,建议优先考虑512的整数倍值,因为模型已经在这些区间上进行了大量的训练。

当思维预算为0时,模型会直接输出内容,建议将任何低于512的预算设置为0。

Seed-OSS系列模型,获得了不少开发者的认可。Hugging Face的华人工程师Tiezhen Wang评价道,这一系列模型“很适合做消融研究”。这种研究能以较低的成本,探索不同组件对大模型性能的影响。

有网友称,这种尺寸的基础模型在开源界也是比较罕见的,Qwen3就没有公布14B以上的基础模型。另一位网友补充道,长上下文能力对真实应用而言有很大的价值。

结语:从可选项到标配,国产开源模型再添新选项

近期,字节Seed团队已经密集开源了多款模型,除此次的Seed-OSS系列之外,他们还开源了多语言翻译模型Seed-X、智能体模型Tar系列、图像编辑模型Vincie等。

如今,开源已经逐渐从可选项变为近似“标配”的存在,连OpenAI等原本坚持闭源策略的厂商,也在逐步开源模型。字节本次将更为核心的语言模型贡献给社区,给开源社区的后续研究提供了更多基础模型的选择。

相关内容

热门资讯

我国大型人工硐室储气试验获重大... 12月25日,中国能建对外宣布,已在长沙完成大型人工硐室储气原位试验,创造了该领域运行时长与可靠性的...
全球首套超高温热泵储能技术发布 来源:中国能源网 作为能源转型的关键基石,长时储能在构建新型电力系统中发挥着重要作用。《中国能源报》...
2025年3款苹果语音转文字工... 先看价格。Transcribe按分钟收费,0.3元/分钟。录1小时会议,要18元。用得多就贵。Lec...
一文读懂什么是云POS系统|上... 导言:从“本地软件”到“云端服务”的时代跨越 当传统的本地POS还在为维护和升级烦恼时,一种更灵活...
推出App Store,宇树会... 来源:市场资讯 (来源:钛媒体APP) 临近年关,宇树科技的曝光又多了起来:先是月初传出了和竞争对手...
梦想与征程电脑版下载 梦想与征... 《梦想与征程》是一款精灵题材的竖版放置类游戏。匠心打造豪华战斗画质,在战斗中展示超华丽炫酷精灵必杀技...
国和兴科技取得电解水制氢储氢一... 国家知识产权局信息显示,北京国和兴科技有限公司取得一项名为“一种电解水制氢储氢一体化装置”的专利,授...
壹点企讯|华为官宣六大健康管理... 12月25日,第二届华为终端健康管理行业峰会在深圳召开。华为擎云发布了六大健康管理解决方案及全新商用...
联想将推出超级AI智能体,对标... 来源:新浪科技 新浪科技讯 12月26日上午消息,新浪科技获悉,联想集团计划在CES期间发布首款面向...
变相收购?黄仁勋200亿美元拿... 图片由AI生成 出品 | 搜狐科技 作者 | 梁昌均 编辑 | 杨锦 AI芯片巨头英伟达持续买买买,...
nova 15系列加量不加价!... 当代年轻人,喜欢什么样的手机?当然不能只是单纯的好看或好用了!既要是“自拍神器”,又要“颜值出圈”,...
红外耳温计“误报”真相:久用误... 2026年1月1日起,我国将全面禁止生产含汞体温计和含汞血压计产品。水银体温计即将正式退出历史舞台。...
金水情暖台胞 服务共筑同心 中国台湾网12月26日讯 为深入践行“两岸一家亲”理念,2025年以来,郑州市金水区台办紧扣台胞台属...
手机放电饭锅里,抢票成功率就会... 最近,网上火了一种抢票方法,很多博主分享自己的经验时称:把手机放进电饭锅内胆,狂点屏幕,抢票成功率就...
中广核广东太平岭核电厂1号机组... 12月24日,工程师操作设备在堆芯装载首组燃料组件。 12月24日下午,中广核广东太平岭核电厂1号机...
中能华兴申请风光储联合发电预测... 国家知识产权局信息显示,中能华兴(厦门)科学技术研究院有限公司申请一项名为“一种多源数据融合的风光储...
原创 猎... 大家好,我是捡雪球的何二维一。 今天全新的星雪庆典系列活动也是正式上线,这一波活动是继上次中秋节的兔...
Omdia预测2026年SSD... IT之家 12 月 26 日消息,市场调研机构 Omdia 今天发文,预测 2026 年 SSD 和...
OpenAI新目标:让AI记住... AIPress.com.cn报道 OpenAI首席执行官 Sam Altman 近期在科技播客中抛出...
罗克维尔斯申请模型推理方法专利... 国家知识产权局信息显示,北京罗克维尔斯科技有限公司申请一项名为“模型推理方法、装置、电子设备、计算机...