大模型开启架构革命之年,AI全产业链酝酿新变局
创始人
2026-01-06 17:41:37
0

新年第一周,AI大模型掀起架构创新潮。先是元旦,DeepSeek抛出mHC这一重大改进,普林斯顿与加州大学洛杉矶分校联合团队同日提出DDL。紧随其后,1月4日,《金融时报》发布“人工智能教父”、Meta前首席科学家Yann LeCun专访透露,其提出的全新模型架构,将于12个月内推出雏形版本。

当OpenAI下一代模型Orion性能提升受限,谷歌和Anthropic的研发节奏也在调整,高质量数据短缺加剧带来的收益递减,使得基于Scaling Law逻辑的模型能力提升日益减慢,新架构的突破,无疑将成为扭转AI产业这一局面的强大驱动力。

在AI进入落地应用阶段的当下,这也意味着更优的用户体验将从终端创新、场景适配主导,向终端创新、场景适配与模型能力提升共同主导升级,架构突破与Scaling扩张的协同,将支撑行业进入新一轮应用加速期。

而与此同时,不同的架构创新路线,以及大模型厂商在架构落地进度、落地方案上的差异,也将加剧各家大模型在不同领域能力的分化。大模型差异化特征持续增强的趋势,正考验着应用厂商的场景拓展战略与模型选用智慧。以联想集团、Manus等为代表的整合式策略优势正在凸显。

适配全新模型架构的算力基础设施升级,也为算力基础设施供应商们,带来了新的市场格局重构机遇。而联想集团等国际领先厂商,近期已对此有所布局,展现出其敏锐的市场洞察与反应能力。

应用端企业的模型整合策略

当前,AI应用端已开始涌现出规模化企业。比如,联想集团旗下的天禧AI月活跃用户已突破2.8亿,年分发量突破40亿次。在开发者层面,天禧AI注册人数超过23万,并已孕育出超过5000款领域智能体和AI应用。

AI编程软件Cursor的ARR也已达到10亿美元,AI agent Manus则在8个月时间ARR达到1亿美元,AI搜索工具Perplexity也在向Agent拓宽产品边界,其ARR也已达到2亿美元。

这些规模化企业的涌现,对小型、初创企业提出了更紧迫的挑战。如何选择新的架构路线,如何匹配自身细分场景并兼顾未来拓展需要,不仅影响着其未来能否赶上先进者,在大模型能力分化与AI新场景打造均充满不确定性的未来站稳脚跟,也决定着其长期差异化优势的构建。

对联想集团、Cursor、Manus、Perplexity这些领先者而言,其地位也并非雷打不动。传统场景仍处于渗透初期,新场景仍待打造,巨大的增量空间下,竞争格局仍存在诸多变数,选择更适合自身发展需要的模型同样重要。

联想集团选择了多模型整合的策略。联想天禧AI接入了DeepSeek、豆包、文心一言、通义千问、Kimi、MiniMax等众多行业顶级大模型,用户可根据自身需要,灵活调用任意一款大模型,结合其全时空主动记忆、全域个人知识库管理能力、多智能体协同技术、超级互联技术,实现更好的“AI Twin”(个人AI双胞胎)体验。面向企业端的联想百应智能体,也集成了以DeepSeek、通义千问为代表的多个大模型。

从前述三大架构创新来看,mHC框架优势在于提升稳定性、可扩展性的同时,降低模型训练的算力和能源需求,对于更注重运行稳定性与投入产出比的工业场景价值更大。DDL架构则赋予了神经网络动态管理其内部“记忆状态”的能力,为建模更动态、更复杂的关系提供了底层可能,在政务、科研、商业等需要处理更多复杂信息和任务的场景中有着更大需求。Yann LeCun提出的JEPA架构,则打破了对语言文本的依赖,通过学习视频和空间数据来理解物理世界,同时具备规划、推理和长效记忆的能力,更能满足智能眼镜、机器人等需要空间理解能力的场景。

普遍的观点认为,三者并非非此即彼的关系,AI的下一程,应该是三者融合的发展路径——用JEPA构建世界模型,用mHC和DDL优化连接。但模型之间的差异化,就存在于各大厂商在这三者上的发力程度与优化效果上。因此,联想集团的这一策略,优势不仅在于能够在未来三大突破落地之时,集成不同模型的优势,同时规避市场竞争中趋于弱势的模型架构带来的长期风险,更在于其自身的业务布局基本覆盖了工业、政务、科研、商业、智能眼镜、机器人等全部场景,为所有大模型的能力发挥均提供了用武之地。

对于这一策略,近期有两大事件值得关注。一是12月30日,Meta以数十亿美元的对价,收购了采用同一策略的AI Agent产品Manus;二是1月3日,英伟达CEO黄仁勋在与联想集团CEO杨元庆的一场对谈中提出,未来AI系统的应用不再依赖于单一的云端模型,而是公有云上前沿大模型与企业、个人私有的定制化模型深度融合,并表示这种“融合”需要强大的载体,也是联想与英伟达在“企业级AI”领域可联手拓展的市场。

Meta是国际主流大模型厂商,英伟达则是全球AI底层芯片霸主,两大事件标志着,以联想集团、Manus为代表的多模型整合策略,得到了从底层芯片商到模型架构商的共同支持,结合联想集团的多场景布局对不同模型能力的需求,最终实现了整个产业链条的闭环。

未来的AI应用企业,能否更好抢抓本轮大模型架构革新机遇,也在很大程度取决于其能否像联想集团一样完成这一产业链闭环,尤其是其模型整合平台是否具备完善的落地技术支撑,以及场景多样性与数量规模是否能够充分发挥不同模型的优势。

算力端企业的通用化硬件布局

新架构的实现,依然需要新的算力基础设施支持。以DeepSeek提出的mHC框架为例,一份专家调研纪要显示,其技术路线较依赖FP32高精度计算格式,对内存带宽和高速互联带宽也提出了更高要求,尤需高端芯片的支持。并且,目前该架构主要针对英伟达超节点链路设计,更适配英伟达生态。DDL与JEPA两大架构创新,显然也对算力硬件有新的要求。

值得注意的是,作为少数应用、算力双线布局的企业之一,几乎与几大创新架构问世同期,联想集团似乎已有应对,并在策略上显示出较高明确度。

1月4日,联想集团发布首款基于第五代AMD EPYC处理器的2U单路(2U1S)标准机架服务器联想问天WR5215 G5,除AI工作负载性能实现25%的显著提升,并通过单路设计、联想问天海神液冷技术实现关键部件全覆盖,实现整机功耗降低25%,散热能力提升100%之外,公司还特别提到其100%兼容国产主流软硬件生态,并可帮助用户节省高达50%的CPU软件授权成本。联想集团表示,联想问天WR5215 G5服务器已完成与统信UOS、麒麟等操作系统,以及多家主流国产数据库与虚拟化平台的深度适配与互认证。

在前述杨元庆与黄仁勋的对谈中,双方也透露,正联合打造“一款革命性的服务器”——基于RTX Pro的联想企业级AI系统,英伟达将为这一项目提供这家公司技术最为先进的芯片。众所周知,英伟达AI芯片的核心优势,在于其性能领先之外,还具备更强通用性。

从100%兼容国产主流软硬件生态的联想问天WR5215 G5,到采用英伟达通用型芯片的新款服务器,可以看出,联想集团应对多路径架构创新的核心策略,就是通过实现对不同架构的全面适配,在满足客户差异化需求的同时,降低单个客户的匹配成本。

联想集团是全球主要算力基础设施硬件提供商之一,其服务器产品国内、全球市场份额均位居前三,其中在AI服务器细分领域更是位居全球第二。联想集团的应对策略,或成为国内外主流厂商的一致选择。

尽管这一策略可能造成对谷歌TPU、亚马逊Trainium3等定制化芯片相应市场需求的忽略,但整体已能覆盖绝大部分市场。即便是谷歌、亚马逊,也仍未真正摆脱对英伟达芯片的依赖。根据台湾《经济日报》报道,市场分析师预测的英伟达明年GB300系列服务器机柜5.5万台出货量中,谷歌、亚马逊仍有多达3000至4000台的采购量。并且,联想集团等主流厂商与谷歌、亚马逊长期深度绑定,仍有匹配其定制化芯片的需求空间。

此外,从硬件性能适配,到大模型厂商需求落地,仍存在供应商筛选过程,对硬件厂商的市场拓展能力也是一次考验。其中极关键的一点,即对大模型厂商算力部署决策的预判与快速应对。联想集团在推出问天WR5215 G5服务器,以及联手英伟达推出新款服务器两大布局上的表现,值得所有行业参与者关注。

不少机构预计,DeepSeek将在春节前后进行重大发布,很可能是备受期待却推迟已久的R2,并以此复刻去年的“冲击效应”,也可能是更新更快的通用模型V4,进一步激发实用性和经济价值。mHC是否会进入新模型,也引发市场大量猜测。无论结果如何,这些预测与猜测,都展现了业界对mHC、DDL与JEPA等架构创新对行业变革的巨大期待。DeepSeek等大模型厂商如何回应这一期待,联想集团、Cursor、Manus、Perplexity等算力、应用厂商又如何继续以新的布局应对这一期待的实现,均将成为其发展空间与市场地位的重要锚点。

相关内容

热门资讯

国家邮政局:“十四五”时期我国... 【解说】1月7日国家邮政局消息,“十四五”时期,我国快递业务量达到千亿级,增长到近2000亿件,对全...
广电流量卡到底怎么样?亲测三个... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
科大讯飞在威海成立信息科技公司 每经AI快讯,天眼查工商信息显示,近日,威海荣讯信息科技有限公司成立,法定代表人为柳升华,注册资本2...
马斯克旗下xAI宣布完成200... 当地时间周二,马斯克旗下的xAI宣布完成200亿美元的新一轮融资,远超原定150亿美元的融资目标。 ...
德迈仕:强化内部治理加大研发创... 证券之星消息,德迈仕(301007)01月07日在投资者关系平台上答复投资者关心的问题。 投资者:请...
北京腾飞创建取得便于操作的建筑... 国家知识产权局信息显示,北京腾飞创建建筑工程有限公司取得一项名为“一种便于操作的建筑施工平台”的专利...
NASA 好奇号从夏普山发回全... 1 月 7 日消息,美国国家航空航天局(NASA)的“好奇号”火星车从这颗红色星球的夏普山高坡上,发...
我省加氢催化技术引领高端化工新... 日前在厦门举行的第三届全国连续化加氢催化论坛(CHC2025)上,一则重磅消息引发行业广泛关注——由...
美芝申请电子膨胀阀和制冷设备专... 国家知识产权局信息显示,广东美芝制冷设备有限公司申请一项名为“电子膨胀阀和制冷设备”的专利,公开号C...
合肥庐阳区:都市科创融合 产业... 央广网合肥1月6日消息(记者徐秋韵)清晨6点,董铺湖面的薄雾还未散尽,机器已经先于整座城市苏醒。 庐...
氮化镓加速渗透,近期PD快充市... 前言 随着PD快充协议持续演进,以及各大手机、3C数码配件品牌高功率快充生态逐步成熟,氮化镓功率器...
冠晶科技取得晶振超短直角剪脚机... 国家知识产权局信息显示,湖南冠晶科技有限公司取得一项名为“一种晶振超短直角剪脚机”的专利,授权公告号...
首贷落地!北京农商银行236万... 在北京经济技术开发区,一场金融与科技的“牵手”故事正在上演。 北京华诺泰生物医药科技有限公司是经开区...
“观天”预演!巡天空间望远镜科... 新华社北京1月7日电(记者胡喆)记者从中国科学院国家天文台获悉,我国科研团队在中国空间站巡天空间望远...
平台不得大数据“杀熟”,让数字... 文/九派新闻特约评论员 舒圣祥 市场监管总局和国家网信办日前联合发布《网络交易平台规则监督管理办法》...
总规模超80GWh!储能企业接... 近期,国内储能企业接连宣布签署合作协议。据记者统计总规模超80GWh。 亿纬锂能1月5日宣布,202...
中央网信办:持续重拳整治低俗“... 记者从1月7日的发布会上了解到,中央网信办有关负责人表示,《直播电商监督管理办法》和《网络交易平台规...
苏州加快建设“人工智能+”城市... 近日,苏州市政府印发《苏州市进一步加快建设“人工智能+”城市的若干措施(2026年版)》(以下简称《...
探秘宇宙“时间胶囊”,点燃天文... 近日,贵阳市第一中学科创中心组织选择天文方向职业体验的学子们,赴贵州陨石文化科普馆开启了一场“星际探...
冀货“一招鲜” | 平乡童车,... 冀时新闻报道邢台平乡,被誉为“中国童车之都”,全国近一半的童车、自行车在这里生产。面对激烈的市场竞争...