新年第一周,AI大模型掀起架构创新潮。先是元旦,DeepSeek抛出mHC这一重大改进,普林斯顿与加州大学洛杉矶分校联合团队同日提出DDL。紧随其后,1月4日,《金融时报》发布“人工智能教父”、Meta前首席科学家Yann LeCun专访透露,其提出的全新模型架构,将于12个月内推出雏形版本。
当OpenAI下一代模型Orion性能提升受限,谷歌和Anthropic的研发节奏也在调整,高质量数据短缺加剧带来的收益递减,使得基于Scaling Law逻辑的模型能力提升日益减慢,新架构的突破,无疑将成为扭转AI产业这一局面的强大驱动力。
在AI进入落地应用阶段的当下,这也意味着更优的用户体验将从终端创新、场景适配主导,向终端创新、场景适配与模型能力提升共同主导升级,架构突破与Scaling扩张的协同,将支撑行业进入新一轮应用加速期。
而与此同时,不同的架构创新路线,以及大模型厂商在架构落地进度、落地方案上的差异,也将加剧各家大模型在不同领域能力的分化。大模型差异化特征持续增强的趋势,正考验着应用厂商的场景拓展战略与模型选用智慧。以联想集团、Manus等为代表的整合式策略优势正在凸显。
适配全新模型架构的算力基础设施升级,也为算力基础设施供应商们,带来了新的市场格局重构机遇。而联想集团等国际领先厂商,近期已对此有所布局,展现出其敏锐的市场洞察与反应能力。
应用端企业的模型整合策略
当前,AI应用端已开始涌现出规模化企业。比如,联想集团旗下的天禧AI月活跃用户已突破2.8亿,年分发量突破40亿次。在开发者层面,天禧AI注册人数超过23万,并已孕育出超过5000款领域智能体和AI应用。
AI编程软件Cursor的ARR也已达到10亿美元,AI agent Manus则在8个月时间ARR达到1亿美元,AI搜索工具Perplexity也在向Agent拓宽产品边界,其ARR也已达到2亿美元。
这些规模化企业的涌现,对小型、初创企业提出了更紧迫的挑战。如何选择新的架构路线,如何匹配自身细分场景并兼顾未来拓展需要,不仅影响着其未来能否赶上先进者,在大模型能力分化与AI新场景打造均充满不确定性的未来站稳脚跟,也决定着其长期差异化优势的构建。
对联想集团、Cursor、Manus、Perplexity这些领先者而言,其地位也并非雷打不动。传统场景仍处于渗透初期,新场景仍待打造,巨大的增量空间下,竞争格局仍存在诸多变数,选择更适合自身发展需要的模型同样重要。
联想集团选择了多模型整合的策略。联想天禧AI接入了DeepSeek、豆包、文心一言、通义千问、Kimi、MiniMax等众多行业顶级大模型,用户可根据自身需要,灵活调用任意一款大模型,结合其全时空主动记忆、全域个人知识库管理能力、多智能体协同技术、超级互联技术,实现更好的“AI Twin”(个人AI双胞胎)体验。面向企业端的联想百应智能体,也集成了以DeepSeek、通义千问为代表的多个大模型。
从前述三大架构创新来看,mHC框架优势在于提升稳定性、可扩展性的同时,降低模型训练的算力和能源需求,对于更注重运行稳定性与投入产出比的工业场景价值更大。DDL架构则赋予了神经网络动态管理其内部“记忆状态”的能力,为建模更动态、更复杂的关系提供了底层可能,在政务、科研、商业等需要处理更多复杂信息和任务的场景中有着更大需求。Yann LeCun提出的JEPA架构,则打破了对语言文本的依赖,通过学习视频和空间数据来理解物理世界,同时具备规划、推理和长效记忆的能力,更能满足智能眼镜、机器人等需要空间理解能力的场景。
普遍的观点认为,三者并非非此即彼的关系,AI的下一程,应该是三者融合的发展路径——用JEPA构建世界模型,用mHC和DDL优化连接。但模型之间的差异化,就存在于各大厂商在这三者上的发力程度与优化效果上。因此,联想集团的这一策略,优势不仅在于能够在未来三大突破落地之时,集成不同模型的优势,同时规避市场竞争中趋于弱势的模型架构带来的长期风险,更在于其自身的业务布局基本覆盖了工业、政务、科研、商业、智能眼镜、机器人等全部场景,为所有大模型的能力发挥均提供了用武之地。
对于这一策略,近期有两大事件值得关注。一是12月30日,Meta以数十亿美元的对价,收购了采用同一策略的AI Agent产品Manus;二是1月3日,英伟达CEO黄仁勋在与联想集团CEO杨元庆的一场对谈中提出,未来AI系统的应用不再依赖于单一的云端模型,而是公有云上前沿大模型与企业、个人私有的定制化模型深度融合,并表示这种“融合”需要强大的载体,也是联想与英伟达在“企业级AI”领域可联手拓展的市场。
Meta是国际主流大模型厂商,英伟达则是全球AI底层芯片霸主,两大事件标志着,以联想集团、Manus为代表的多模型整合策略,得到了从底层芯片商到模型架构商的共同支持,结合联想集团的多场景布局对不同模型能力的需求,最终实现了整个产业链条的闭环。
未来的AI应用企业,能否更好抢抓本轮大模型架构革新机遇,也在很大程度取决于其能否像联想集团一样完成这一产业链闭环,尤其是其模型整合平台是否具备完善的落地技术支撑,以及场景多样性与数量规模是否能够充分发挥不同模型的优势。
算力端企业的通用化硬件布局
新架构的实现,依然需要新的算力基础设施支持。以DeepSeek提出的mHC框架为例,一份专家调研纪要显示,其技术路线较依赖FP32高精度计算格式,对内存带宽和高速互联带宽也提出了更高要求,尤需高端芯片的支持。并且,目前该架构主要针对英伟达超节点链路设计,更适配英伟达生态。DDL与JEPA两大架构创新,显然也对算力硬件有新的要求。
值得注意的是,作为少数应用、算力双线布局的企业之一,几乎与几大创新架构问世同期,联想集团似乎已有应对,并在策略上显示出较高明确度。
1月4日,联想集团发布首款基于第五代AMD EPYC处理器的2U单路(2U1S)标准机架服务器联想问天WR5215 G5,除AI工作负载性能实现25%的显著提升,并通过单路设计、联想问天海神液冷技术实现关键部件全覆盖,实现整机功耗降低25%,散热能力提升100%之外,公司还特别提到其100%兼容国产主流软硬件生态,并可帮助用户节省高达50%的CPU软件授权成本。联想集团表示,联想问天WR5215 G5服务器已完成与统信UOS、麒麟等操作系统,以及多家主流国产数据库与虚拟化平台的深度适配与互认证。
在前述杨元庆与黄仁勋的对谈中,双方也透露,正联合打造“一款革命性的服务器”——基于RTX Pro的联想企业级AI系统,英伟达将为这一项目提供这家公司技术最为先进的芯片。众所周知,英伟达AI芯片的核心优势,在于其性能领先之外,还具备更强通用性。
从100%兼容国产主流软硬件生态的联想问天WR5215 G5,到采用英伟达通用型芯片的新款服务器,可以看出,联想集团应对多路径架构创新的核心策略,就是通过实现对不同架构的全面适配,在满足客户差异化需求的同时,降低单个客户的匹配成本。
联想集团是全球主要算力基础设施硬件提供商之一,其服务器产品国内、全球市场份额均位居前三,其中在AI服务器细分领域更是位居全球第二。联想集团的应对策略,或成为国内外主流厂商的一致选择。
尽管这一策略可能造成对谷歌TPU、亚马逊Trainium3等定制化芯片相应市场需求的忽略,但整体已能覆盖绝大部分市场。即便是谷歌、亚马逊,也仍未真正摆脱对英伟达芯片的依赖。根据台湾《经济日报》报道,市场分析师预测的英伟达明年GB300系列服务器机柜5.5万台出货量中,谷歌、亚马逊仍有多达3000至4000台的采购量。并且,联想集团等主流厂商与谷歌、亚马逊长期深度绑定,仍有匹配其定制化芯片的需求空间。
此外,从硬件性能适配,到大模型厂商需求落地,仍存在供应商筛选过程,对硬件厂商的市场拓展能力也是一次考验。其中极关键的一点,即对大模型厂商算力部署决策的预判与快速应对。联想集团在推出问天WR5215 G5服务器,以及联手英伟达推出新款服务器两大布局上的表现,值得所有行业参与者关注。
不少机构预计,DeepSeek将在春节前后进行重大发布,很可能是备受期待却推迟已久的R2,并以此复刻去年的“冲击效应”,也可能是更新更快的通用模型V4,进一步激发实用性和经济价值。mHC是否会进入新模型,也引发市场大量猜测。无论结果如何,这些预测与猜测,都展现了业界对mHC、DDL与JEPA等架构创新对行业变革的巨大期待。DeepSeek等大模型厂商如何回应这一期待,联想集团、Cursor、Manus、Perplexity等算力、应用厂商又如何继续以新的布局应对这一期待的实现,均将成为其发展空间与市场地位的重要锚点。