标签聚合

kv cache

当前页面聚合了与“kv cache”相关的文章，适合快速查找同主题内容。

文章数量：1 浏览方式：按专题连续阅读返回首页

2026年4月6日 AI

vLLM推理OOM排查记：不是显存不够，是你没搞清楚max_length和batch_size的坑

70B模型配了4张80G卡，长文本一推就爆。查了一圈发现不是显存容量...

阅读全文