字节首次开源推理模型,连夺7项第一
创始人
2025-08-21 15:43:08
0

智东西

作者 | 陈骏达

编辑 | 心缘

智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GPT-5上下文窗口的2倍,相当于1600页文本。

Seed-OSS系列模型是推理模型,专门针对推理任务进行了优化,还允许用户灵活地控制思维预算。

字节Seed团队共开源了Seed-OSS的三个版本,分别为:

(1)基础模型Seed-OSS-36B-Base

(2)无合成数据基础模型Seed-OSS-36B-Base-woSyn

(3)指令微调模型Seed-OSS-36B-Instruct

指令微调后的Seed-OSS-36B-Instruct在通用知识、Agent、编程、长上下文等领域的基准测试中,取得同量级开源模型中的7项SOTA(性能最佳)表现,整体能力超过了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在大部分领域旗鼓相当。

▲基准测试结果,加粗项为开源SOTA(图源:Hugging Face)

Seed-OSS系列模型采用了宽松的Apache2.0开源协议,并会在后续发布模型的详细技术报告。

开源地址:

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base

https://huggingface.co/ByteDance-Seed/Seed-OSS-36B-Instruct

值得一提的是,字节Seed团队本次的发布方式较为“研究友好”。鉴于在预训练中包含合成指令数据可能会影响后训练研究,无合成数据基础模型的发布,为研究社区提供了更多样化的选择。这一系列模型还支持4位和8位格式的量化,以减少内存需求。

Seed-OSS系列模型使用了12万亿个token的预训练数据,采用当前主流的因果语言模型架构,也就是“预测下一个token”类型的模型。同时,Seed-OSS系列均为稠密模型,没有采用MoE等架构。

这一系列模型结合了几项关键技术,包括RoPE(旋转位置编码)、GQA注意力机制(Grouped Query Attention)、RMSNorm归一化(Root Mean Square Normalization)、SwiGLU激活函数等。这是现代大模型常见的高效组件组合,可提升训练稳定性和推理性能。

Seed-OSS的上下文窗口达512k,相当于能一次性处理数十万字的内容。这一上下文窗口并非后续扩展而来,而是通过原生训练打造的。

思考预算功能可帮助开发者控制模型推理成本,优化使用体验等。字节Seed团队分享了Seed-OSS在不同思考预算下性能的变化情况。

对于更简单的任务(如IFEval),模型的思维链较短,随着思维预算的增加,分数波动并不明显。对于更具挑战性的任务(如AIME和LiveCodeBench),模型的思维链更长,随着思维预算的增加,分数也会提高。

字节Seed团队称,如果没有设置思维预算(默认模式),Seed-OSS将不会拥有任何思考长度限制。

如果指定了思维预算,建议优先考虑512的整数倍值,因为模型已经在这些区间上进行了大量的训练。

当思维预算为0时,模型会直接输出内容,建议将任何低于512的预算设置为0。

Seed-OSS系列模型,获得了不少开发者的认可。Hugging Face的华人工程师Tiezhen Wang评价道,这一系列模型“很适合做消融研究”。这种研究能以较低的成本,探索不同组件对大模型性能的影响。

有网友称,这种尺寸的基础模型在开源界也是比较罕见的,Qwen3就没有公布14B以上的基础模型。另一位网友补充道,长上下文能力对真实应用而言有很大的价值。

结语:从可选项到标配,国产开源模型再添新选项

近期,字节Seed团队已经密集开源了多款模型,除此次的Seed-OSS系列之外,他们还开源了多语言翻译模型Seed-X、智能体模型Tar系列、图像编辑模型Vincie等。

如今,开源已经逐渐从可选项变为近似“标配”的存在,连OpenAI等原本坚持闭源策略的厂商,也在逐步开源模型。字节本次将更为核心的语言模型贡献给社区,给开源社区的后续研究提供了更多基础模型的选择。

相关内容

热门资讯

工信部发文,事关人工智能赋能中... 工业和信息化部网站消息,近日,工业和信息化部发布《关于征集2025年度中小企业人工智能典型应用场景的...
50强诞生!下一站:南宁 近日,广西AI赋能千行百业超级联赛跨境人才赛道——2025年第八届中国·南宁海(境)外人才创新创业大...
淘宝第一个程序员离职后去向曝光... IT之家 8 月 19 日消息,财联社 8 月 13 日消息称,阿里巴巴集团前合伙人蔡景现已离职,其...
996?不存在的!我在逆水寒当... 当代社畜的日常是什么?是挤着地铁赶早高峰,是盯着电脑屏幕到深夜,是周而复始的996,是工资条上永远追...
谷歌自研芯片,里程碑 公众号记得⭐️,第一时间看推送不会错过。 来源 :内容 编译自 androidauthority ...
中国移动安徽公司以信息技术赋能... 当5G信号与螺旋桨同频共振,当“空天地”一体化网络覆盖城市上空,低空经济不再只是蓝图里的名词,而成为...
谁说摄影必须烧钱?逆水寒零成本... 提起摄影,相信不少人对摄影的第一印象就是“烧钱”,“越玩越穷”。确实,对于一些对摄影感兴趣的人来说,...
中国移动浙江公司启动“梯停点亮... “以前在电梯里打电话不方便,扫码支付停车费、电车电费时,有时候手机要转圈圈。”家住杭州城西的周先生说...
《inZOI》制作人访谈:勤勉... “与玩家一起完成游戏” 8月20日,生活模拟赛道的新军《inZOI》迎来了自己的首个DLC“海岛假期...
光伏智慧监测系统功能的实现路径 光伏智慧监测是一种通过多维感知、高效传输、智能分析、闭环管理等功能,实现光伏电站的高效、安全、智能化...
浪漫七夕 情缘江湖 《剑网2》... 西山居剑侠情缘系列游戏--《剑网2》系列游戏8月21日将带来七夕鹊桥会、星砂藏、拾旧、打卡同心江湖等...
科隆展对话CF虹项目组:做原型... 今年的科隆游戏展,《穿越火线:虹》(以下简称CF虹)可以说是我个人最关注的产品。 8月9日在CF嘉年...
强化科研根基,聚力创新发展|首... 科技创新成为企业发展核心驱动力的当下,首钢朗泽始终将科研置于战略高地,凭借顶尖的研发团队、深厚的技术...
背刺一半?《纪元117:罗马和... 今日(8月21日)在未来游戏展上,育碧公布了《纪元117:罗马和平》全新预告,本作将于11月13日发...
小米16系列即将发布,Pro款... 今日,据博主@数码闲聊站爆料,小米16系列已完成入网备案,共计三款机型将在9月正式亮相。本次产品线依...
原创 水... 水深9533米,接近地球海洋的最深处,承受近千个大气压,常年冰冷、黑暗,毫无阳光可言——这样的环境,...
《inZOI》免费DLC“海岛... 近日,由Krafton开发的生活模拟游戏《inZOI》上线了其首个DLC“海岛假期”,该DLC将对所...
《死亡空间》导演强烈支持AI制... 曾经参与执导开发了《死亡空间》、《木卫四协议》等游戏的Glenn Schofield日前在外媒采访中...
京东通信将免费为所有在网用户陆... IT之家 8 月 21 日消息,京东通信官方 8 月 20 日发布公告,为了更好地服务用户,京东通信...
东莞松山湖AI“空中警察”上岗 图为巡逻警察在松山湖风景区巡查。 向熙航 何绮莹 郭文君 摄影报道 “这里是松山湖公安空中巡逻警察...