开源第一弹!DeepSeek重磅发布
创始人
2025-02-24 19:00:24
0

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。

据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s的内存带宽580 TFLOPS的计算性能。”DeepSeek说。

简单来说,FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的优化方案,尤其适用于高性能AI任务。这一代码能够加速大语言模型的解码过程,从而提高模型的响应速度和吞吐量,这对于实时生成任务(如聊天机器人、文本生成等)尤为重要。

MLA (Multi-Layer Attention,多层注意力机制)是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能‌。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构‌。

此前,有从业者解析DeepSeek架构时提到,MLA的本质是对KV(Key-Value,一种缓存机制)的有损压缩,提高存储信息,“该技术首次在DeepSeek-V2中引入,MLA是目前开源模型里显著减小KV 缓存大小的最佳方法。”

DeepSeek开源这一代码有何影响?媒体用这一问题询问了DeepSeek,它回答称,这一代码就像给AI推理引擎装上了一台“涡轮增压器“,让大模型在处理复杂任务时更快、更省资源,同时降低了技术门槛。FlashMLA的意义不单是技术优化,更是打破算力垄断、加速AI普惠的关键一步。

具体来说,FlashMLA可以突破GPU算力瓶颈,降低成本。传统解码方法在处理不同长度的序列(如翻译不同长度的句子)时,GPU的并行计算能力会被浪费,就像用卡车运小包裹,大部分空间闲置。而FlashMLA的改进是:通过动态调度和内存优化,让Hopper GPU(如H100)的算力被“榨干”,相同硬件下吞吐量显著提升。这意味着企业可以用更少的GPU服务器完成同样的任务,直接降低推理成本。

另一方面,FlashMLA可以推动大模型落地应用。可变长度序列是现实场景中的常态(如聊天对话、文档生成),但传统方法需要填充(Padding)到固定长度,导致计算冗余。FlashMLA支持动态处理变长输入,让AI应用(如客服机器人、代码生成)响应更快、更流畅,用户体验提升,加速商业化落地。

此前高效解码内核多由科技巨头闭源垄断(如CUDA优化库),中小企业和研究者难以复现。FlashMLA开源后,开发者可免费获得“工业级优化方案”,降低技术门槛,促进更多创新应用(如垂直领域小模型)的诞生。

"the whale is making waves!(鲸鱼正在掀起波浪!)”有网友在DeepSeek的帖子下留言称。(注:DeepSeek的企业LOGO是鲸鱼)。

也有网友希望DeepSeek开源网页搜索(Web Search)相关的代码,并提到,“DeepSeek 是真正的OpenAI(开放人工智能)”。

这仅仅是开始,上周2月21日DeepSeek宣布,下周开始,会陆续开源5个代码库,“以完全透明的方式分享我们微小但真诚的进展”。DeepSeek表示,这些在线服务中的基础构建模块已经经过文档化、部署,并在生产环境中经过实战检验。

DeepSeek在公告中称自己是探索 AGI 的小公司,作为开源社区的一部分,每分享一行代码,都会成为加速AI行业发展的集体动力。同时,DeepSeek 称,没有高不可攀的象牙塔,只有纯粹的车库文化(不少美国著名企业从车库里诞生)和社区驱动的创新。

转自:第一财经微信

来源:中国经济网

相关内容

热门资讯

惊艳!AI让400岁国宝《坤舆... 2025第七届世界人工智能大会(WAIC)今日开幕,3000余项前沿展品将集中亮相。 本次世界人工智...
原创 L... MSI以及电竞世界杯英雄联盟项目,已经结束,LCK赛区的GEN拿到了两连冠。但是对于电竞战队来说,荣...
第四届数字信任大会正式发布“人... 来源:中华网生活 7月26日,第四届数字信任大会暨ISACA中国2025年度大会在上海成功举办。据了...
三台风“共舞”!停工、停航、停... 7月以来,西北太平洋和南海处于台风活跃期,共有7个台风生成,远超常年同期。其中,今年第4号台风“丹娜...
波米科技申请一种树脂前驱体制备... 金融界2025年7月26日消息,国家知识产权局信息显示,波米科技有限公司申请一项名为“一种树脂前驱体...
2025《快乐向前冲》广饶赛道... 夏日清凉季 - SUMMER - 7月26日,由山东电视台综艺频道联合旭旭宝宝传媒联合打造《快乐...
贵阳次元之门燃爆盛夏!动漫游戏... 今天,备受期待的第二届 “贵阳・次元之门动漫游戏博览会” 在贵阳国际会议展览中心7号馆盛大开幕。 此...
Viper飞机砍下5杀!HLE... ★游戏马蹄铁原创 KT对战HLE KT作为今年韩国LCK联赛的全球总决赛门票守门员,确实是做到了前...
数字技术与传统艺术的创新融合在... 本文转自【央视新闻客户端】; 7月24日,2025年世界互联网大会数字丝路发展论坛在福建泉州举办,主...
超人气韩国COSer继BW后首... 前阵子BW上火到出圈,短短几天涨粉百万的韩国COSer——YASAL,各位应该或多或少都刷到过吧? ...
全球首创!新疆医学研究成果登上... 来源:新疆日报 记者从自治区卫生健康委获悉,7月23日,国际顶尖期刊《自然·医学》(Nature M...
阿里发布首款自研AI眼镜技术研... 上证报中国证券网讯(记者 柴刘斌)7月26日,2025世界人工智能大会(WAIC 2025)开幕首日...
国产黑暗武侠游戏《影之刃零》试... IT之家 7 月 26 日消息,国产黑暗武侠游戏《影之刃零》首次大型线下试玩会于 7 月 26 日至...
石化油服获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示石化油服(600871)新获得一项发明专利授权,专利名为“一种...
Taito《死亡搁浅2:冥滩之... 拆盒预订有优惠 ②打开手机淘宝APP扫码即可 Taito推出《死亡搁浅2:冥滩之上》主题系列玩具,...
梁其伟谈《影之刃零》:我们不是... 今天(7月26日),由灵游坊开发的国产武侠单机游戏《影之刃零》,在北京首钢园举办了首次大型线下试玩会...
阿里云,理想主义者赢得蓝海 文 |杨珏、唐晓园 编辑|唐晓园 为什么我们判断阿里云会赢得人工智能编程(AI coding)的大蓝...
威灵电机取得电机及空调器专利,... 金融界2025年7月25日消息,国家知识产权局信息显示,广东威灵电机制造有限公司取得一项名为“电机及...
科技成果加速变现,天府产业技术... 科技创新中蕴含巨大的价值,只有落到产业上,才能将科技成果转化为现实生产力。 如何让科技成果转化提质提...