找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1|回复: 0

用户分享【AI推理导致存储需求爆炸?】

[复制链接]

17

主题

0

回帖

51

积分

注册会员

积分
51
发表于 昨天 16:47 | 显示全部楼层 |阅读模式
用户分享【AI推理导致存储需求爆炸?】


AI推理 → Token暴增→ KV Cache变大 →存储需求爆炸

──────────────────────

1.先搞懂:Token 是什么?

简单说:
Token = AI 处理文字/对话的最小单位  

• 一句话 =若干个 Token  
•一张图 = 很多很多 Token  
•一次长对话 =越来越多 Token  

为什么Token 会指数级增长?  
3个核心原因:  

① 对话越来越长  
以前一问一答很短;现在要多轮对话、长文档、长上下文,Token 直接翻倍。  

② 多模态爆发(图+视频+语音)  
图片、视频的 Token 数量是文字的几百上千倍。  

③ AI 系统越来越复杂  
多智能体协作、工具调用、记忆存储、知识库检索→  
一次请求背后是几十次内部推理,Token总量爆炸。  

→结果就是:Token不是线性增加,是指数级往上冲。

──────────────────────

2.再搞懂:KV Cache 是什么?

AI 生成文字是逐字生成的。  
每生成一个字,都要回忆前面所有内容。  

如果每次都重新算一遍前面所有内容:
• 速度巨慢  
•算力巨贵
• 根本没法用  

所以 AI搞了个缓存机制:
把前面算过的中间结果存起来,下次直接用  
这堆缓存就叫:  
KVCache(Key-Value Cache)  

KV Cache有多大?  
和 Token数量成正比:  
• Token越多→ KV Cache越大  
•上下文越长 → KV Cache越大  
•模型越大 →单 Token 占的空间越大  

长对话场景下,KV Cache能占满整张显卡的显存。

──────────────────────

3.什么叫“KV Cache 下沉”?

以前:  
KV Cache只放在 GPU 显存里,快但贵、容量小。  

现在 Token 暴增,GPU显存根本装不下,  
于是必须把 KV Cache往下层搬:

• 一部分放HBM(高带宽显存)  
• 一部分放 SRAM  
• 一部分放 DRAM(内存)  
• 一部分放SSD / 持久内存  
• 甚至放到分布式存储集群  

这就叫:KVCache 下沉

──────────────────────

4. 为什么这两件事会驱动存储需求暴涨?

把逻辑串起来:  

① AI推理越来越多  
② Token 指数级增长 →需要缓存的内容越来越多  
③GPU 显存装不下 → KVCache 必须下沉到内存、SSD、分布式存储  
④ 下沉 =存储容量、带宽、IO全面爆发需求

最终结果:  
• 显存(HBM)需求暴增  
•内存(DRAM)需求暴增  
•高性能 SSD /企业级存储需求暴增  
•高速互联(CXL、NVLink)需求暴增  
• AI存储服务器、集群需求暴增  

一句话总结:  
Token 越多→ KV Cache 越大 → 越要下沉 →存储越不够用→ 存储行业直接起飞

──────────────────────

5. 对应到股市里的投资逻辑(最实用)

受益方向非常清晰:  

① HBM 显存  
(DRAM厂、先进封装、HBM 模组)  

②高带宽内存/ DRAM  
(长文、多模态必带)

③高性能 SSD / 企业级存储  
(KVCache 下沉主力承接)  

④ CXL 互联、内存池化  
(让内存和存储像水一样共用)  

⑤ AI存储服务器、分布式存储  
(云厂商、算力厂疯狂采购)  

──────────────────────

ultra 简洁版(方便你记)

• Token指数增长 =AI 处理的内容越来越多、越来越长  
• KV Cache =AI 的“短期记忆”,内容越多记忆越大  
• Cache下沉 =显存装不下,往内存、SSD、存储里塞  
•结果:存储容量、带宽、性能需求爆发式增长

(转自市值风云App社区,仅做内容分享,不构成操作建议)

#ai#
#存储#
#ai算力#
#存储芯片涨价#
#牛市炒股就用市值风云app#
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-23 07:30 , Processed in 0.202153 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表