newtype

newtype

HBM摆脱传统周期的逻辑

过去的半导体周期,本质上是消费电子换机节奏驱动的。但AI推理不一样。大模型在推理阶段对内存的依赖,是系统性的硬约束,不是弹性配件。

huangyihe's avatar
huangyihe
Jun 28, 2026
∙ Paid

当前市场对HBM和DRAM最大的争议,就是这两个品种到底能不能摆脱传统半导体周期性。

过去的半导体周期,本质上是消费电子换机节奏驱动的。手机、PC的出货量决定了DRAM的需求。需求有规律地起伏,原厂也习惯于扩产、压价、去库存这套节奏,大概每两三年走完一轮。

但AI推理不一样。大模型在推理阶段对内存的依赖,是系统性的硬约束,不是弹性配件。

每一代新GPU,能跑多大的模型、每秒能输出多少个Token,上限不是由计算核心决定的,而是由HBM的容量和带宽决定的。

GPU芯片可以用3nm、2nm工艺做得越来越快,但如果HBM跟不上,整套系统的推理效率就会被死死卡在内存墙上。

这个逻辑意味着,每一代GPU更新,对HBM的需求几乎注定是指数级增长,而不是线性增长。

为什么是指数级增长?这个问题的背后有两个机制。

This post is for paid subscribers

Already a paid subscriber? Sign in
© 2026 Weatherman · Privacy ∙ Terms ∙ Collection notice
Start your SubstackGet the app
Substack is the home for great culture