讯飞星火X2来了:基于全国产算力 、直面行业刚需硬核升级
创始人
2026-02-11 16:41:22
0

今天,科大讯飞正式发布基于全国产算力训练的星火X2大模型。从X1.5到X2,升级有两大亮点:

1、通用能力全面升级,星火X2整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优;130+多语言综合能力继续提升,拉美、东盟等地区重点语种效果保持业界领先水平。

2、依托星火X2的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,产品应用方案取得显著进步。

这次面向关键行业落地的实用化升级,标志着我国基于全国产算力训练的大模型底座在算法和工程创新方面迈入新阶段。星火X2在实现通用能力全面升级的同时,更加专注于教育、医疗、汽车、智能体等高专业性、高体验性场景,致力于为这些领域提供领先、可靠的技术方案与支撑。

赋能医疗,专业能力持续提升并保持业界领先,个人健康助手各项能力在业界率先通过权威评测验证,“讯飞晓医”APP全面升级;赋能教育,步骤级批改、错因定位等技术进一步扩大全球领先优势,业界首发错因贯穿的个性化学习能力,让启发式讲解更契合学生思路,推动AI学习机等产品实现更精准的自主学习闭环,进一步提升孩子学习兴趣与学习效率;面向汽车智能座舱的星火中小尺寸模型同步升级,智能交互实车评测行业全面领先,模糊意图效果从完全不可用达到基本好用,让汽车像老朋友聊天一样精准听懂你的“潜台词”;星辰Agent平台全新升级,进一步强化了“会思考能执行”的精品智能体构建能力。智能体数量已经超过130万,作为企业级智能体平台,在复杂行业场景任务上进一步解决用户关键刚需。

即日起,星火X2的最新能力可直接在讯飞星火网页版和APP体验,全新API也已上线讯飞开放平台,持续解放生产力;星火APP5.2.0新版本同步上线,进一步强化了更懂你的AI助手,欢迎大家来体验。

星火X2来了,多项核心能力表现持续突出

此次星火X2通用能力全面升级,整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲美国际最优;同时,星火X2的130+多语言综合能力继续提升,拉美、东盟等地区重点语种效果保持业界领先水平,为跨语言教育、医疗与产业应用提供可靠支撑。

星火X2通过量化单台昇腾服务器即可运行。星火X2采用293B MoE稀疏架构,结合权重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通信等多种工程化创新,实现了国产大EP并行部署,推理性能相比X1.5提升50%。

星火大模型多尺寸中小模型同步升级,在办公本、翻译机、汽车座舱交互等场景的核心效果显著提升。

通用大模型核心能力效果对比

外部公开高难任务效果对比

*测试集合来源:基础能力测试集(滚动刷新),来自海量真实大模型请求任务脱敏数据,包括讯飞星火APP、API真实开发者场景、以及教育、医疗等行业核心任务。公开测试集以数学、答题、推理、代码、智能体等外部典型Benchmarks为主。

还是用一道题来试试效果:

这是2025年11月哈佛-麻省理工数学锦标赛(HMMT)里的一道英文题目,难倒国内主流模型,但星火X2在分析思考后,不仅给出了正确答案,还给出了详尽的解题过程。

再来看看星火X2能不能解答西班牙语数学题:

依旧是快速给出详细解题过程以及正确答案。

星火X2能力的显著升级离不开技术的持续创新突破,典型工作包括:

训推采样校准强化学习算法

针对MoE大模型RL训练中的训推分布不一致问题,提出训练与推理概率重采样自适应校准算法,大幅提升强化学习训练准确率和稳定性。

递归式高难数据合成方法

针对高难任务数据稀缺问题,设计多轮迭代式推导的数据合成方案,实现推理错误逐步纠正与收敛,持续构建稀缺型高质量数据,提升模型深度推理准确率。

多阶段RL高吞吐采样方法

设计P/D(Prefill/Decoder)两阶段分离的多阶段推理采样方案,解决国产化平台强化学习高吞吐采样情况下的效率干扰问题,训练效率提升10%。

服务高性能部署优化算法

通过模型轻量化压缩,完成国产机器的单机大EP并行部署,推理性能相比星火X1.5提升50%,实现大模型在国产平台的轻量化落地与高效推理双重突破。

推动行业大模型升级更懂你的Al再进步

实用性是检验大模型能力的硬标准。依托星火X2的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,在教育、医疗、司法、汽车交互、企业智能体应用等关键场景表现一新,在功能和效果层面实现全面升级,“更懂你的AI”再进一步。

赋能医疗 各项能力持续保持显著领先

星火X2底座赋能医疗,助力星火医疗大模型核心能力全面提升并持续保持业界领先。基于居民健康档案的智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等关键任务上,模型能力均显著超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。

*测试集合来源:按照《医疗健康行业大模型应用技术要求》,基于脱敏真实用户数据及居民健康档案,构建全新测试集合MedLLM-EHR-EVAL-V2。

星火医疗大模型围绕个人健康助手的各项能力已率先通过上海市医疗大模型应用检测验证中心评测验证。(备注:上海市医疗大模型应用检测验证中心为国内首个面向医疗大模型应用评测和验证的平台,由上海AI实验室牵头打造,华山医院、中山医院、瑞金医院等12所医疗机构成为中心首批验证单位。)

在此基础上,“讯飞晓医”APP各项能力全面升级,多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等健康咨询任务在业界持续保持显著领先。

*测试集合来源:测试集合基于线上个人健康咨询的真实场景脱敏数据随机抽样。

另外,讯飞晓医的语音交互对话能力也是本次升级的一个重要特色,欢迎大家体验。

面向用户的健康刚需,讯飞晓医因为更专业所以更让人放心~

赋能教育 率先实现错因贯穿个性化学习能力

新版本的星火X2底座全面赋能教育,步骤级批改、错因定位等技术进一步扩大全球领先优势。结合领先的多学科答题及推理能力,业界率先发布错因贯穿的个性化学习能力。数学步骤级批改效果进一步提升,同时支持更精准的错因定位,在答疑上实现契合学生本人思路的启发式讲解,相关技术持续保持业界领先,并推动应用成效显著提升。

*测试集合来源:测试集合基于备授课、考试、作业、学习等真实场景脱敏数据随机抽样。

面向学生自主学习场景,科大讯飞AI学习机在1对1精准学、答疑辅导和互动课等效果持续提升。依托更精准的步骤级批改能力,诊断精准率、规划合理率和辅学启发性效果领先行业,实现个性化、启发式、规划性教学,进一步提升孩子学习兴趣与学习效率。

赋能汽车 智能座舱交互系统全面升级

基于星火X2升级,在汽车领域,2B、7B、30B-A3等多尺寸中小模型同步升级,助力汽车智能座舱交互系统全面提升,在人人/人机对话判断、模糊意图理解、高情商回复等方面交互体验显著提升。特别是模糊意图交互效果实现跨越式突破,从完全不可用提升至基本好用水平,实车评测业内全面领先,结合星火多模态大模型感知理解能力,真正实现座舱内自由、自然的人机交互体验。

星辰Agent平台和精品智能体 效果全新升级

星火X2的智能体能力,在长时复杂任务规划、多工具组合调用以及长上下文等方面均实现了显著提升。

星辰Agent平台全新升级,进一步强化了“会思考能执行”的精品智能体构建能力。当前智能体数量已经超过130万,作为企业级智能体平台,已整合语音交互、语音识别、图像理解等百余种精品开放平台能力,丰富企业级场景应用工具生态,支撑快速构建企业场景中的更复杂、更实用的精品智能体。

面向企业采购场景的招采智能体,在招标文件合规检测、供应商资质核验、投标异常行为检测等核心场景,效率提升超3倍。同时,支持企业像搭积木一样极速定制专属招采专家,专用智能体开发从原来的几天压缩至分钟级,助力企业精准风控、高效降本。

面向行业深度分析的星火行业大师产品,针对能源、农粮等行业的专业商情分析领域进行深度融合,结合产业图谱推理和分析,显著降低幻觉。商情信息洞察及辅助决策时间从“周”降低到“天”,为客户快速决策提供及时的技术支撑。

携手开发者,持续共建国产化大模型繁荣生态

讯飞星火已上线最新的星火X2,持续打造更懂你的AI助手。一键开启语音对话,快速响应你的需求。特别是面向年轻人求职和学习提升需求,本次重点升级了科研助手和求职助手,全流程辅助用户找工作和写论文。

讯飞开放平台已正式上线星火X2 API。讯飞开放平台新注册开发者可以领取最多100万Tokens免费额度,让模型能力以更低成本进入真实开发与规模化验证。从模型进化到API规模化开放,再到真实场景的持续落地,星火X2面向全球超1000万开发者共享更强理解力与执行力的深度推理能力。

星火X2升级,不仅是一次算法和工程的创新,更是基于全国产算力训练的大模型在解决行业刚需问题上的跃升。

我们诚邀每一位用户、开发者、行业伙伴共同体验,在真实的业务场景中检验实用价值,持续将全栈自主可控的国产大模型推向安全可信、高效稳定的规模化应用。

相关内容

热门资讯

锚定仓储原生场景!极智嘉走出人... 2月10日,全球智能机器人引领者极智嘉(2590.HK)重磅发布全球首款人形通用仓储机器人 Gino...
告别无效游戏时间,在《天下贰·... 年味儿正浓,红包收得开心,花出去也如流水。走亲访友、聚会聚餐、给晚辈压岁钱……摸摸口袋,是不是感觉余...
齐河深耕“专精特新”!山东泰瑞... 齐鲁晚报·齐鲁壹点 李梦晴 通讯员 刘磊 陈璐 王岳琪 近日,走进山东泰瑞丰新材料有限公司生产车间,...
原创 安... 大家好我是指尖,没想到11日的爆料竟然这么精彩,皮肤是一个接一个,让人眼花缭乱,目眩神驰,在吕布典藏...
一人公司“乘风破浪”! 上海助... 最近,一种名为“OPC”的创业模式火了。“OPC”其实是“One Person Company”的简...
锚点|你能看到红外光吗? 来源:市场资讯 (来源:看看新闻Knews) 你能不能看到红外光?当然不能,因为红外的意思本来就是在...
知乎答主亮相2026顶尖科学家... 近日,2026年世界顶尖科学家峰会(World Laureates Summit, 以下简称WLS)...
《罗密欧是个绝命侠》主创采访:... 草蜢工作室全新原创 IP《罗密欧是个绝命侠》即将于2026年2月11日正式发售,本作由以《英雄不再》...
好突然,官方又一口气发了6款皮... 大家好呀,我是瑜瑜。王者荣耀最近又发布了 6 款新皮肤的特效,其中是 4 款新皮肤和两款星传说,并且...
三门核电新机组冷试成功 来源:科技日报 2月10日凌晨,中核集团旗下中国核电投资控股的三门核电3号机组一回路水压试验(冷试)...
2026年了,你认为AI会取代... 刷到这篇的朋友,先停下手里的事认真回答:2026年了,AI真的要取代我们了吗? 打开手机,微软Of...
赛晶亚太申请引脚超声焊接质量测... 国家知识产权局信息显示,赛晶亚太半导体科技(浙江)有限公司申请一项名为“一种引脚超声焊接质量测试方法...
灵台抢速第一宠!逍遥情缘手游马... 前两天,在逍遥情缘手游中,备受瞩目的马年神兽正式登场。玩家们早已按耐不住的好奇心,在一刻终于得到满足...
《围攻》新扩展包《破碎天际》中... 作为在《围攻》里烧了上千小时的玩家,看到《破碎天际》预告片的第一反应是——这游戏终于要把"胡逼建造"...
微博发布2025年热搜趋势报告... 近日,微博正式发布《2025年微博热搜趋势报告》,报告基于微博热搜话题和用户行为数据,全景式还原了过...
多举措筑牢“数字底座” 五部门... 记者10日获悉,工业和信息化部、中央网信办、中央空管办、国家发展改革委、中国民航局等五部门近日联合印...
炉石新版本变天,一张卡毁对手半... 近日,随着炉石新补丁上线,标准环境中萌生了各种奇奇怪怪的卡组,造成此现状的主要原因是一张旧卡突然崛起...
10分钟买空23页交易行,起底... 游戏中的金融市场,是一个看不见硝烟的战场,表面上看似风平浪静,内里却暗流涌动,一旦错失了“情报”,可...
《罗密欧是个绝命侠》评测:一场... 如果说有哪些游戏一眼就能看出其制作人,那么须田刚一的作品一定是一面叛逆的旗帜。《罗密欧是个绝命侠》再...
在轨204天:神舟二十号乘组的... 在轨204天:神舟二十号乘组的太空时光 ■解放军报记者 贺逸舒 特约记者 占康 1月21日,中共中央...