一个台积电,115万片晶圆与2026年的“芯片战争”
创始人
2026-01-09 11:42:05
0

编者按:以定力致远,以重构图新。大象新闻、大象财富联合腾讯新闻腾讯科技推出2025年终策划《定力与重构》,回望2025、展望2026,让洞察照见本质,向变革寻求确定。

“未来六个季度数据中心收入5000亿美元。”黄仁勋在GTC25上说。

刚开锣的2026CES,老黄又宣称90%的ASIC项目会失败,这实际上是对此前谷歌TPU为代表的ASIC芯片的口头“讨伐”,一场针对ASIC的全面围猎已经悄悄开始。

很多人会关心,GPU、ASIC竞争的终局如何?答案是取决于半导体战争的终极弹药库——台积电CoWoS先进封装产能。

这意味着,只要对台积电CoWoS产能预订、分配情况,进行颗粒度拆解,就能精确测算出2026年AI算力芯片的出货格局。

01战争的起源

我们先对GPU和ASIC的战争背景做一些铺垫(有行业基础可跳过本部分)。

人工智能对算力的需求扩张是共识,但必须明确:更先进的计算架构、工艺制程和先进封装,是三个关键路径。

关于架构,谈到最多的是GPGPU(通用图形处理器),英伟达在这条路上,借助CUDA生态的20年铺垫,成为通用并行计算的绝对王者。

硬件层面,英伟达的核心武器有两个:HBM内存极高的带宽、GPGPU大规模流处理器阵列。从H200、GB200到今年即将推出的“Vera Rubin”,都是这条路径的产物,性能提升直接与显存带宽、NVLink互连规模挂钩。

GPGPU之外,以谷歌TPU为代表的ASIC芯片,探索出了另一条更精准、定制化的架构——云端推理侧的负载日益固化,为特定算法(如Transformer)定制的ASIC芯片,能够展现出碾压级的能效比,即每瓦性能和总拥有成本(TCO)优势。

谷歌的TPU、亚马逊的Trainium都是这条路径的先锋。博通Marvell、Al chip等设计公司,正是通过为这些云巨头定制ASIC芯片,撕开了AI芯片万亿市场的一道口子。

相比架构竞争,工艺制程这条路径显得更好理解,从7nm、5nm、3nm到2025年底量产的2nm,每一次制程跃进都意味着晶体管密度和能效的提升。

不过,工艺制程是一条高门槛的路径:进化速度越来越慢,成本越来越贵,2nm晶圆代工价格高达3万美元,入场费已非所有玩家都能承受。此外,工艺制程的微缩还将面临“功耗墙”和“存储墙”。

架构、制程之外,第三个关键路径是先进封装,以CoWoS(Chip on Wafer on Substrate)为代表的先进封装是台积电为高性能计算打造的“皇冠上的明珠”。

(CoWoS封装概念图,来源:台积电)

CoWoS的精髓在于异构集成,将多个小芯片,例如计算芯粒(GPU/ASIC核心)、高带宽内存(HBM)、I/O芯粒等,通过中介层进行超高密度、超高带宽互连,集成在一个封装内。

(表1:CoWoS中介层面积变化趋势)

这种方式可以突破单芯片光罩(掩模板)尺寸限制,中介层面积当前可达2800mm²,直接好处就是晶体管更多,HBM显存更高。

另外,由于CoWoS采用了硅中介层,上面的微凸块(μBump)间距极小,芯粒间通信带宽激增,延迟和功耗大幅降低。

正因如此,无论是追求极致性能的英伟达GPU,还是追求最佳总拥有成本的云巨头ASIC,但凡涉足顶级AI算力,都离不开CoWoS。

所以,在2026年这个时间点上,当制程进入2nm深水区,成本高企,架构路线出现根本性分叉时,CoWoS先进封装的产能分配,就成了决定算力版图的最关键变量,没有之一。

02 产能图谱:台积电CoWoS的供给格局

(表2:台积电CoWoS产能爬坡情况)

从我们掌握的情况来看,过去三年,台积电CoWoS产能一路从单月12K晶圆,逐步爬升至2025年底的80K/月,2026年年底的预估目标是120K/月左右。

取一个全年有效平均值:96K/月,即2026年台积电CoWoS总有效产能约为:96K/月 × 12个月 = 1150000片晶圆,这是AI芯片战的总弹药基数。

※产能分配原则

这1150000万片晶圆如何分配,背后是一场基于于技术、商业、地缘的复杂棋局。

按照优先级,英伟达作为CoWoS最早期、最大胆的共同定义者和投资者,其架构(如NVLink)与台积电CoWoS工艺深度耦合,毫无意外可以拿到最多。

按客户层级,由于苹果、英伟达、AMD是台积电前三大VVIP级客户,其巨额预付款和长期协议锁定了基础产能。不过,苹果要到2028年才有自研AI芯片。另外,博通、Marvell因承接谷歌、AWSMeta等云巨头天量ASIC订单,已跻身顶级VIP客户行列。

另外,对台积电来说,除了ASIC以外,AMD、英特尔乃至中国客户,都是制衡英伟达、分散客户风险的重要力量,也会分得一部分产能。

※产能分配明细

总体来看,产品需求最旺、单价最高、技术最领先的英伟达有望拿到其中近60%的产能;AMD的预定量在90K左右,占比接近8%,相比2025年有64%的增量,增幅几乎与英伟达一致。

当然单一客户CoWoS订单激增,也包含了中介层放大的因素,但对于业绩的贡献必然是正面的。不过也要强调,更复杂、集成度更高的封装(如集成更多HBM、更大中介层)初期良率较低,实际有效产出需打折。

(表3:CoWoS产能整体预订和分配情况)

整个ASIC阵营,大致可以划分为博通、世芯(AI Chip)、Marvell和联发科几家,其中博通是领头羊。

博通2026年预定量大幅增至200K,同比增122%,主要受谷歌TPU外供拉动,但要博通主要负责TPU v6p以及v7p,偏向推理的v7e由联发科负责,会在2026年下半年推出。未来TPU v8还是会遵循v7的模式,由博通与联发科两家下单CoWoS。

博通的200K预定量,按客户预订情况大致拆分如下:

第一大客户谷歌TPU预计分得200K当中60~65%

第二大客户Meta的MTIA大约占博通预订量的20%左右

第三大客户OpenAI将于年底推出内部代号Titan芯片,台积电N3制程,预计占今年博通预订量的5-10%,2027年将达到20%+

2028年,苹果的AI ASIC芯片Baltra也将面世,目前由博通负责高速互联,SerDes IP以及后段布线,预计2026年上半年进入流片阶段。

相比之下,由于AWS下一代Trainium 3转单世芯(Al chip),Marvell显得比较失意,主要客户还是AWS的Trainium 2,好在新客户微软采用N3E制程的Maia 200加入,才避免了下滑,CoWoS预定量与2025年持平。

世芯由于拿到了AWS Trainium 3订单,CoWoS预订量上升到60k,同比增加200%,大部分预定产能为N3制程的Trainium 3 Anita,加上Inferentia 2、微软Maia 100以及少量的Intel Gaudi 3。

Annapurna作为AWS的子公司,一直承担AI ASIC开发任务,同时也向台积电直接预定CoWoS产能,Trainium 3的Mariana版本有别于Al chip的Anita版本,同时在台积电投片。

联发科是台积电2026年CoWoS的新进客户,目前已调拨大量人力支持ASIC业务——未来将成为联发科的重点板块——2026年下半年主要承担侧重推理的TPU v7e的出货,并在2027年作为出货主力年,同时2027年将叠加TPU v8e的订单,有机会出现600%的CoWoS同比增幅。

根据我们了解到的情况,联发科目前已将AI ASIC视为未来核心业务,作为行业巨头,其布局AI芯片将很大影响目前ASIC设计的行业格局。

剩下的台积电CoWoS客户的量级都小于1万片,其中微软自研ASICAthena的早期设计与流片还是微软自己的团队在小批量推进中。

有了产能的分配数据,基于硅中介层面积,大致就能算出来,2026年,各家能够出多少颗GPU/ASIC芯片。

我们假设英伟达的660000片晶圆当中,10%分配给Hopper架构,即6.6万片,按单片切29颗来计算,预计今年整体H200的产出量可以达到190万颗。

回看整体台积电整体产能分配,拿下总共75万片CoWoS产能的GPGPU阵营(NV+AMD),在面对还只有37万片产能的ASIC阵营时,还是拥有绝对的火力优势,甚至英伟达一家的火力就超过全球其他企业的总和。

03 算力、营收:GPGPU具备碾压优势

CoWoS是一个关键变量,但仅比较CoWoS还是会误判战局——不同的封装方案,比如single-die以及dual-die方案,将导致中介层面积出现很大的不同。

以Hopper为例,由于采用single-die,一片CoWoS晶圆可以切29颗,到了Blackwell由于采用dual-die方案,每片晶圆只能切14颗。

所以,台积电CoWoS的产能增幅,不能单纯定义为AI芯片出货量的增加,也要考虑CoWoS硅中介层面积不断放大的增量。

(从CoWoS到SoW,光罩面积及中介层变化,来源:台积电)

前面表1有提到,硅中介层面积越来越大的变化趋势,是AI芯片明确的技术路线,目前中介层面积是光罩面积的3.3x,2026年的Rubin将提升到是4~5.5x,而2027年4-die合封的Rubin Ultra将达到9~9.5x。

因此,以CoWoS的产能(消耗面积)增、减幅度来计算企业营收增、减幅度更为准确。

所以,这场AI芯片战争的主导因素,除了要看谁消耗了更多的CoWoS产能,也要看谁贡献了更多的算力,以及谁创造了更多的营收和利润。

算力维度的比较非常直观,一颗英伟达B300的FP8算力达10PFLOPS,而一颗定制推理ASIC的算力可能仅为其几分之一,即便是最强的TPU v7p也只有英伟达B300的一半,这没有将今年要推出的Rubin考虑在内。

就在刚刚的CES上,老黄说Rubin的性能比Blackwell在推理提升5倍,训练提升了3.5倍,言外之意是GPU与ASIC的性能差距并没有缩小。

从算力维度可以得出结论——即使CoWoS切出来的芯片颗数接近,GPGPU阵营的总算力很可能仍大幅领先,这是GPU通用架构的“蛮力”优势——来自CoWoS消耗面积(晶体管)的多寡。

价值维度的比较则更为残酷,英伟达单颗GPU售价高达3万美元以上,未来会提升到4-5万美元。云巨头自研ASIC芯片的“成本”即便与GPU接近,“内部结算价”肯定卖不到GPGPU的市场价格。

以Anthropic向博通采购210亿美元的100万颗TPU为例,扣除服务器等诸多配置,单颗对外售价在1.5万美元以下,不到英伟达Blackwell系列的一半。

结合算力和价值两个点,可以更明确的得出结论——AI芯片是多维度的比拼,不单单比摩尔定律、比芯片工艺制程,还要比谁的面积更大,能放进更多晶体管,最终表现在性能上的差别,也决定了价格。

英伟达用60%的CoWoS产能,创造整个AI加速芯片市场70%以上的收入和90%以上的利润,这才是文章开头黄仁勋“6个季度,5000亿美元”的底气。

04 ASIC的本质:优化财务报表

英伟达的优势,CUDA就不必说了,经常被忽略掉的是搭配的NVLink、NVSwitch所构成的系统级优势,用户买的不是芯片,而是一整套最强的“交钥匙”解决方案。

作为对比,ASIC芯片优势在于,云厂这类超大规模用户,当其软件栈完全自控且工作负载高度特化且稳定(如搜索推荐、广告排名、语音识别推理),自研能带来极致的总拥有成本(TCO)优化。

可以这样说:AISC要讲的故事——专用化换取“去英伟达化”,最终优化财务报表。所以,能不能用ASIC的关键只有一点,规模(量)够不够大,没有其他。

首先,自研ASIC的资金、人力投入巨大;其次,便宜的TPU可不是买来就直接能用的,像Anthropic向博通采购210亿美元直接采购谷歌TPU的方案,背后也需要配置一只极为强大的底层系统工程师团队,并不断进行深度迁移及适配。

所以,仅仅开支这一项,也决定了ASIC只有超大型云厂、超大规模企业才会使用,但即便是购买现成ASIC芯片,也就能拓展到Anthropic这体量的大模型企业,很难再往下了。

再者,目前头部AI集群的功耗已从几十千瓦迈向兆瓦级,未来芯片功耗将飙升至数千瓦,普通客户无法承受这种规模。而且,在风冷已到极限,液冷(包括冷板、浸没式)成为标配的背景下,数据中心的物理设计和最大集群规模,都是必须综合考量的因素。

另外,GPGPU与AISC两者的较量也不限于单芯片,基于CPO共封装来解决“功耗墙”和“互连墙”,这种系统级的方案,以及华为的384颗NPU互连的CloudMatrix 384这种系统架构创新,也都至关重要。

所以,CoWoS只是起点,更上层的互连网络(NVLink, CXL, UCIe)、光引擎(CPO)都是竞争的关键变量。

而这些变量所需要的巨额资本支出,都不是小厂可以承受的。

05 终局推演:军火商大赢家

现阶段英伟达为代表的GPGPU市场,虽然部分被侵蚀,但随着物理AI这些领域的推进,在可见的3-5年,英伟达仍将统治AI训练市场和高性能通用计算市场(训练、新兴应用、中小企业、科研)。

但是,推理占据未来AI算力实际消耗的大头,且工作负载更固定,正是ASIC的用武之地,ASIC的势头只会越来越好。

所以大家会看到,为了加固“护城河”,英伟达斥资200亿美元收购Groq,意图将LPU融入自己的技术矩阵中。

与此同时,英伟达也在通过推出更细分领域的产品,如推理专用芯片、更灵活的订阅模式(DGX Cloud)、以及更强大的系统级解决方案(如NVL144/288/576),来应对ASIC的“包围”。

目前的英伟达依旧处于有利位置,依旧掌握着“AI芯片战争”的主动权,他们要解决的核心问题——市占率与毛利的平衡。只要英伟达不坚守极高的毛利率,愿意牺牲毛利换取市场,他还是无坚不摧的王者。

ASIC生态下,谷歌TPU外供,标志着ASIC从“概念”和“试点”正式迈入“规模化部署”,其增长直接与这些云巨头的资本开支绑定。

只要巨头们持续投资AI基础设施,且自研芯片的TCO优势持续存在,ASIC芯片对CoWoS需求就会持续增长。博通,联发科,Marvell作为顶级设计服务商将持续受益。

很多人会关注,GPGPU和ASIC对CoWoS产能需求变化?

从产品进化的角度来看,2026年的Rubin架构产品,率先采用5.5x光罩面积的中介层,2027年很快会推进到9.5x,ASIC产品的绝对性能没有GPGPU那般极致要求,2026年预估也就在3.3x,甚至在2027年也大概率还如此。所以结论基本也是明确的:未来GPGPU对CoWoS产能的预定量会大幅度增长。

而回到最终芯片的数量上,由于ASIC芯片的中介层普遍在2500mm²,单片CoWoS晶圆切出来的芯片数量,是GPGPU的两倍,而GPGPU目前CoWoS预定量是AISC的两倍,所以今年两种类型AI芯片的全球出货量,也就大体相当。

至于企业营收,那就与CoWoS出货量成正比了,因为性能与面积(晶体管总数)成正比,同制程双颗的dual-die性能必然高于single-die的芯片。

所以,未来我们更可能看到的是一个“GPU+ASIC”的混合算力世界:云巨头用英伟达GPU进行前沿模型研发和训练,同时用自研ASIC进行成本敏感的大规模推理部署。

换句话说,这场战争并非一场你死我活的歼灭战,而是一场持久且复杂的“划界战争”。

但不管两种生态格局如何,作为这场芯片战共同且唯一的“军火商”,台积电坐拥CoWoS产能的定价权,将是无论哪一方获胜都不可或缺的终极大赢家。

文丨吴梓豪

编辑丨苏扬 成书丽

关于作者:

相关内容

热门资讯

市场监督管理总局将调查评估外卖... 2026年1月9日,国家市场监督管理总局发布公告,国务院反垄断反不正当竞争委员会办公室将对外卖平台服...
【科技资讯】6、4、5、6、1... 1月8日,中国载人航天工程办公室面向全社会发布2025年度《中国空间站科学研究与应用进展报告》。 中...
DIGIERA宣布模块化全闪N... IT之家 1 月 9 日消息,康佳系半导体企业康盈旗下消费级存储企业 DIGIERA 在 CES 2...
中国厂商包揽前六!2025年全... 2025年全球人形机器人总出货量预计达13318台,市场进入快速增长阶段。 近日,全球权威市场研究机...
浪潮申请一种多核系统的内存优化... 国家知识产权局信息显示,山东浪潮科学研究院有限公司申请一项名为“一种多核系统的内存优化方法、装置、设...
小米申请数据获取方法专利,能够... 国家知识产权局信息显示,北京小米移动软件有限公司申请一项名为“数据获取方法、装置及存储介质”的专利,...
原创 钻... 大家好呀,我是瑜瑜。在王者荣耀中,有些英雄对于中低分段的玩家来说,是绝对不能碰的。除非你真的很热爱这...
古墓一下,马上摸金!《和平精英... 新年伊始,精英集结!1月7日,《和平精英》“古墓迷途”玩法概念片正式发布,该片围绕四位核心探险家及其...
什么?摸鱼玩手机也能实现零花钱... 全体搬砖党快看过来!《天下贰·经典版》今日开服直接炸锅,服务器都爆满了,登录队伍排的望不到头,弹窗预...
仅49克!乐奇AI眼镜黑科技刷... 大象新闻记者 李莉 金晓利 1月6日-9日,在拉斯维加斯LVCC Central Hall 1721...
博通集成亮相CES 2026:... 2026年1月,全球消费电子盛会CES 2026在美国拉斯维加斯盛大举行。博通集成(RiseLink...
松下、未野、小米迷你mini剃... 迷你剃须刀因追求小巧,常陷入“性能陷阱”:动力孱弱刮不净、刀网粗糙易扯须、反复刮剃致泛红。这些难点让...
嘉实基金:锚定产业本质,解锁科... 2026 年 “春季躁动” 行情中,科创主线一马当先,让科技投资再次成为市场焦点。但科技行业技术迭代...
“人工智能+制造”重磅部署,五... 来源:21世纪经济报道 1月7日,工业和信息化部、中央网信办、国家发展改革委、教育部、商务部、国务院...
深读 | 烟火深处,书香漫卷—... 《福建日报》2026年1月9日08版 核心提示 当手机成为阅读新宠,碎片化“屏读”填满了闲暇时光,对...
中山三院发布人工智能医生,辅助... 1月9日,中山大学附属第三医院(简称“中山三院”)举办“数智融合·医研共进”主题发布会,重磅推出智能...
原创 拳... 在不到两年前,拳头游戏官方正式宣布推出“英雄联盟名人堂”,设立这一奖项的目的则是为了表彰那些为英雄联...
国家互联网信息办公室关于发布2... 促进生成式人工智能服务创新发展和规范应用,网信部门会同有关部门按照《生成式人工智能服务管理暂行办法》...
深圳市俱进纸品包装申请耐黄变测... 国家知识产权局信息显示,深圳市俱进纸品包装有限公司申请一项名为“一种耐黄变测试装置”的专利,公开号C...