元脑服务器的创新应用:浪潮信息引领AI计算新时代
创始人
2025-03-10 10:41:15
0

来源:三号女青年

浪潮信息的元脑 R1 服务器现已全面支持开源框架 SGLang,能够在单机环境下实现 DeepSeek 671B 模型的高并发性能,用户并发访问量超过1000。通过对 SGLang 最新版本的深度适配,元脑 R1 推理服务器在运行高性能模型时,展现出卓越的处理能力,满足了现代AI应用对算力的严苛要求。

DeepSeek R1参数量达到6710亿,采用了MLA注意力机制和共享专家、路由专家共同组成的混合专家(MoE)架构,其创新的模型架构也带来了在推理服务上的性能挑战。浪潮信息团队从AI服务器和推理框架入手开展了协同优化工作。

编辑

元脑R1推理服务器NF5688G7原生搭载FP8计算引擎,针对DeepSeek R1 671B模型部署速度快且无精度损失,1128GB HBM3e高速显存满足671B模型 FP8精度下不低于800GB显存容量的需求,单机支持全量模型推理情况下,仍保留充足的KV缓存空间。显存带宽高达4.8TB/s,完美契合DeepSeek R1模型"短输入长输出、显存带宽敏感"的技术特征,在推理解码阶段可实现极致加速。在通信方面,GPU P2P带宽达900GB/s,保障单机部署张量并行最佳通讯性能。

SGLang是新兴的开源推理框架项目,其得到活跃的社区支持,并在工业界获得了广泛应用。SGlang的核心特性包括:快速的后端运行时、灵活的前端语言、广泛的模型支持等。尤其值得关注的是,SGLang针对MLA注意力机制开展了针对性的工程优化,并在框架上对MoE架构的推理做了优化设计。SGLang也是最早适配DeepSeek v3和R1的优选推理框架之一。

目前,元脑R1推理服务器 NF5688G7已完成SGLang最新版本 0.4.3的适配优化工作。通过硬件调优、算子优化、混合并行、多token预测等多方面的工程实践,在元脑R1推理服务器 NF5688G7上运行DeepSeek 671B R1模型,成功实现了单用户解码最高33 tokens/s及最大用户并发超1000的优异性能表现。

编辑

单路并发性能测试日志,根据TPOT换算用户解码性能为33.3 tokens/s

DeepSeek R1 671B是一个稀疏度较高的MoE架构模型,具有模型参数量大、计算量小的特点。和Dense模型相比,在满足KV cache的显存占用的前提下,可以支持更高的并发访问需求。实测数据表明,基于单台NF5688G7,在使用DeepSeek R1进行带思维链深度思考的短输入长输出的问答场景下,使用100/1000作为输入输出长度,实测在单个用户并发时的解码性能为33.3tokens/s;在16个用户并发时,每个用户有约20 tokens/s的解码性能;在64个用户并发时,每个用户有约10.4 tokens/s的解码性能。而在使用1024个用户并发访问的极限测试时,单台NF5688G7实现了3975.76 tokens/s的吞吐性能,可以满足超高并发场景下多用户使用需求。

编辑

1024路并发性能测试日志,测试使用了1000/1000的输入输出长度,实现了3975.76 tokens/s的总设备吞吐

浪潮信息团队正与业内团队密切合作,在计算架构、算子调优、并行策略、框架适配、调度管理等多个方面持续发力,旨在为用户带来高性能、高效稳定、性价比高的DeepSeek大模型部署服务方案,助力大模型快速落地应用。

浪潮信息团队与行业内的合作伙伴紧密协作,持续在计算架构、算子优化、并行策略及框架适配等多个领域进行创新,旨在为用户提供高效、稳定且具性价比的 DeepSeek 大模型部署服务。作为全球领先的 IT 基础设施产品和服务提供商,浪潮信息致力于通过元脑服务器推动人工智能的快速发展与应用落地,构建开放、绿色的智能计算生态。

相关内容

热门资讯

西部算力“新引擎”!中国移动(... 近日,位于成都市双流区的中国移动(四川成都)数据中心二期工程顺利通过竣工验收。据承建方中国五冶集团相...
真我GT7 Pro亮相2025... 来源:新浪科技 8月1日至4日,第二十二届ChinaJoy在上海新国际博览中心举行。真我携旗下多款...
中国电竞产业报告发布:上海办赛... 日前,ChinaJoy期间一年一度的全球电竞大会于上海市静安区召开,会上发布了《2025年1-6月份...
苏奥传感获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示苏奥传感(300507)新获得一项发明专利授权,专利名为“一种...
摩尔线程吴庆:MUSA三大创新... 强大的芯片有效算力是作为“AI工厂”的核心竞争力。而作为GPU的 “灵魂”,其软件能力深刻决定了硬件...
【玩家招募】解码啤酒节与博物馆... 当崂山啤酒的泡沫 漫过世纪广场的霓虹, 可听见山海间飘来千年的低语? 孩子们在啤酒大棚间追逐嬉闹, ...
新野:中原玩具制造之都“拔节生... 7月31日,走进新野县先进制造业开发区河南磊展科技有限公司的生产车间,注塑机轰鸣,智能仓储机器人穿梭...
商丘电信永城分公司爱心翼站开展... 为切实增强青少年的网络安全意识,提升其在网络环境中的自我保护能力,商丘电信组织永城分公司腾宇路自营厅...
富奥股份获得发明专利授权:“冷... 证券之星消息,根据天眼查APP数据显示富奥股份(000030)新获得一项发明专利授权,专利名为“冷镦...
明略科技引领AIGD浪潮,助力... 来源:有连云 AI 能帮助人类制定更优决策吗? 2016年,AlphaGo击败围棋世界冠军李世石,震...
《王者荣耀》架空短剧定档8月4... 《王者荣耀》架空短剧《王者荣耀之权谋径山》正式官宣定档8月4日。 这部基于王者大陆世界观创作的剧集...
欧圣电气获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示欧圣电气(301187)新获得一项实用新型专利授权,专利名为“...
Steam 喜加一:原价 22... IT之家 8 月 2 日消息,开发商 Gun Jumpers 宣布旗下射击游戏《DRACOMATON...
像素风格动作游戏续作《Agge... 发行商今日公布了《Aggelos 2》的预告片。 游戏预告片: 《Aggelos 2》是热门2D...
充电宝3C认证大消息!新增生产... 充电宝召回风波发生后,移动电源行业正加速向规范化、标准化方向发展。如今,充电宝相关企业3C认证新规发...
侧手翻、咏春拳到非遗傩舞,机器... 街舞、蒙古族舞蹈、非遗傩舞、千手观音,侧手翻、肩肘倒立、叶问蹲、转帕……这是一场机器人舞者的较量,别...
ChinaJoy首日直击:50... 2025 ChinaJoy首日,华为游戏中心携手《王者荣耀》《光与夜之恋》《少女前线2:追放》《诛仙...
原创 L... MSI以及电竞世界杯英雄联盟项目,已经结束,LCK赛区的GEN拿到了两连冠。但是对于电竞战队来说,荣...
什么时候才能给孩子一个手机 前几天和一位朋友聊天,近期她带着孩子回老家过暑假。 原本她以为,回到农村可以让孩子们享受一段“农家乐...
腾讯王者荣耀陷国内首起涉游戏算... 对此,腾讯方面曾派遣游戏团队赴青岛与孙女士沟通,回应称匹配机制属于商业机密,无法对外公开。事实上,早...