大模型开启架构革命之年，AI全产业链酝酿新变局_游戏资讯

大模型开启架构革命之年，AI全产业链酝酿新变局

创始人

2026-01-06 17:41:37

0次

新年第一周，AI大模型掀起架构创新潮。先是元旦，DeepSeek抛出mHC这一重大改进，普林斯顿与加州大学洛杉矶分校联合团队同日提出DDL。紧随其后，1月4日，《金融时报》发布“人工智能教父”、Meta前首席科学家Yann LeCun专访透露，其提出的全新模型架构，将于12个月内推出雏形版本。

当OpenAI下一代模型Orion性能提升受限，谷歌和Anthropic的研发节奏也在调整，高质量数据短缺加剧带来的收益递减，使得基于Scaling Law逻辑的模型能力提升日益减慢，新架构的突破，无疑将成为扭转AI产业这一局面的强大驱动力。

在AI进入落地应用阶段的当下，这也意味着更优的用户体验将从终端创新、场景适配主导，向终端创新、场景适配与模型能力提升共同主导升级，架构突破与Scaling扩张的协同，将支撑行业进入新一轮应用加速期。

而与此同时，不同的架构创新路线，以及大模型厂商在架构落地进度、落地方案上的差异，也将加剧各家大模型在不同领域能力的分化。大模型差异化特征持续增强的趋势，正考验着应用厂商的场景拓展战略与模型选用智慧。以联想集团、Manus等为代表的整合式策略优势正在凸显。

适配全新模型架构的算力基础设施升级，也为算力基础设施供应商们，带来了新的市场格局重构机遇。而联想集团等国际领先厂商，近期已对此有所布局，展现出其敏锐的市场洞察与反应能力。

应用端企业的模型整合策略

当前，AI应用端已开始涌现出规模化企业。比如，联想集团旗下的天禧AI月活跃用户已突破2.8亿，年分发量突破40亿次。在开发者层面，天禧AI注册人数超过23万，并已孕育出超过5000款领域智能体和AI应用。

AI编程软件Cursor的ARR也已达到10亿美元，AI agent Manus则在8个月时间ARR达到1亿美元，AI搜索工具Perplexity也在向Agent拓宽产品边界，其ARR也已达到2亿美元。

这些规模化企业的涌现，对小型、初创企业提出了更紧迫的挑战。如何选择新的架构路线，如何匹配自身细分场景并兼顾未来拓展需要，不仅影响着其未来能否赶上先进者，在大模型能力分化与AI新场景打造均充满不确定性的未来站稳脚跟，也决定着其长期差异化优势的构建。

对联想集团、Cursor、Manus、Perplexity这些领先者而言，其地位也并非雷打不动。传统场景仍处于渗透初期，新场景仍待打造，巨大的增量空间下，竞争格局仍存在诸多变数，选择更适合自身发展需要的模型同样重要。

联想集团选择了多模型整合的策略。联想天禧AI接入了DeepSeek、豆包、文心一言、通义千问、Kimi、MiniMax等众多行业顶级大模型，用户可根据自身需要，灵活调用任意一款大模型，结合其全时空主动记忆、全域个人知识库管理能力、多智能体协同技术、超级互联技术，实现更好的“AI Twin”（个人AI双胞胎）体验。面向企业端的联想百应智能体，也集成了以DeepSeek、通义千问为代表的多个大模型。

从前述三大架构创新来看，mHC框架优势在于提升稳定性、可扩展性的同时，降低模型训练的算力和能源需求，对于更注重运行稳定性与投入产出比的工业场景价值更大。DDL架构则赋予了神经网络动态管理其内部“记忆状态”的能力，为建模更动态、更复杂的关系提供了底层可能，在政务、科研、商业等需要处理更多复杂信息和任务的场景中有着更大需求。Yann LeCun提出的JEPA架构，则打破了对语言文本的依赖，通过学习视频和空间数据来理解物理世界，同时具备规划、推理和长效记忆的能力，更能满足智能眼镜、机器人等需要空间理解能力的场景。

普遍的观点认为，三者并非非此即彼的关系，AI的下一程，应该是三者融合的发展路径——用JEPA构建世界模型，用mHC和DDL优化连接。但模型之间的差异化，就存在于各大厂商在这三者上的发力程度与优化效果上。因此，联想集团的这一策略，优势不仅在于能够在未来三大突破落地之时，集成不同模型的优势，同时规避市场竞争中趋于弱势的模型架构带来的长期风险，更在于其自身的业务布局基本覆盖了工业、政务、科研、商业、智能眼镜、机器人等全部场景，为所有大模型的能力发挥均提供了用武之地。

对于这一策略，近期有两大事件值得关注。一是12月30日，Meta以数十亿美元的对价，收购了采用同一策略的AI Agent产品Manus；二是1月3日，英伟达CEO黄仁勋在与联想集团CEO杨元庆的一场对谈中提出，未来AI系统的应用不再依赖于单一的云端模型，而是公有云上前沿大模型与企业、个人私有的定制化模型深度融合，并表示这种“融合”需要强大的载体，也是联想与英伟达在“企业级AI”领域可联手拓展的市场。

Meta是国际主流大模型厂商，英伟达则是全球AI底层芯片霸主，两大事件标志着，以联想集团、Manus为代表的多模型整合策略，得到了从底层芯片商到模型架构商的共同支持，结合联想集团的多场景布局对不同模型能力的需求，最终实现了整个产业链条的闭环。

未来的AI应用企业，能否更好抢抓本轮大模型架构革新机遇，也在很大程度取决于其能否像联想集团一样完成这一产业链闭环，尤其是其模型整合平台是否具备完善的落地技术支撑，以及场景多样性与数量规模是否能够充分发挥不同模型的优势。

算力端企业的通用化硬件布局

新架构的实现，依然需要新的算力基础设施支持。以DeepSeek提出的mHC框架为例，一份专家调研纪要显示，其技术路线较依赖FP32高精度计算格式，对内存带宽和高速互联带宽也提出了更高要求，尤需高端芯片的支持。并且，目前该架构主要针对英伟达超节点链路设计，更适配英伟达生态。DDL与JEPA两大架构创新，显然也对算力硬件有新的要求。

值得注意的是，作为少数应用、算力双线布局的企业之一，几乎与几大创新架构问世同期，联想集团似乎已有应对，并在策略上显示出较高明确度。

1月4日，联想集团发布首款基于第五代AMD EPYC处理器的2U单路（2U1S）标准机架服务器联想问天WR5215 G5，除AI工作负载性能实现25%的显著提升，并通过单路设计、联想问天海神液冷技术实现关键部件全覆盖，实现整机功耗降低25%，散热能力提升100%之外，公司还特别提到其100%兼容国产主流软硬件生态，并可帮助用户节省高达50%的CPU软件授权成本。联想集团表示，联想问天WR5215 G5服务器已完成与统信UOS、麒麟等操作系统，以及多家主流国产数据库与虚拟化平台的深度适配与互认证。

在前述杨元庆与黄仁勋的对谈中，双方也透露，正联合打造“一款革命性的服务器”——基于RTX Pro的联想企业级AI系统，英伟达将为这一项目提供这家公司技术最为先进的芯片。众所周知，英伟达AI芯片的核心优势，在于其性能领先之外，还具备更强通用性。

从100%兼容国产主流软硬件生态的联想问天WR5215 G5，到采用英伟达通用型芯片的新款服务器，可以看出，联想集团应对多路径架构创新的核心策略，就是通过实现对不同架构的全面适配，在满足客户差异化需求的同时，降低单个客户的匹配成本。

联想集团是全球主要算力基础设施硬件提供商之一，其服务器产品国内、全球市场份额均位居前三，其中在AI服务器细分领域更是位居全球第二。联想集团的应对策略，或成为国内外主流厂商的一致选择。

尽管这一策略可能造成对谷歌TPU、亚马逊Trainium3等定制化芯片相应市场需求的忽略，但整体已能覆盖绝大部分市场。即便是谷歌、亚马逊，也仍未真正摆脱对英伟达芯片的依赖。根据台湾《经济日报》报道，市场分析师预测的英伟达明年GB300系列服务器机柜5.5万台出货量中，谷歌、亚马逊仍有多达3000至4000台的采购量。并且，联想集团等主流厂商与谷歌、亚马逊长期深度绑定，仍有匹配其定制化芯片的需求空间。

此外，从硬件性能适配，到大模型厂商需求落地，仍存在供应商筛选过程，对硬件厂商的市场拓展能力也是一次考验。其中极关键的一点，即对大模型厂商算力部署决策的预判与快速应对。联想集团在推出问天WR5215 G5服务器，以及联手英伟达推出新款服务器两大布局上的表现，值得所有行业参与者关注。

不少机构预计，DeepSeek将在春节前后进行重大发布，很可能是备受期待却推迟已久的R2，并以此复刻去年的“冲击效应”，也可能是更新更快的通用模型V4，进一步激发实用性和经济价值。mHC是否会进入新模型，也引发市场大量猜测。无论结果如何，这些预测与猜测，都展现了业界对mHC、DDL与JEPA等架构创新对行业变革的巨大期待。DeepSeek等大模型厂商如何回应这一期待，联想集团、Cursor、Manus、Perplexity等算力、应用厂商又如何继续以新的布局应对这一期待的实现，均将成为其发展空间与市场地位的重要锚点。

上一篇：AI技术融入衣食住行这些消费新场景竞相涌现

下一篇：零重力起居没有睡袋的小鼠航天员这样睡觉→

大模型开启架构革命之年，AI全产业链酝酿新变局

相关内容

热门资讯