Google 发新的开源多模态模型了，16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来？🤔

登黑不得善终

2026-06-13 12:32:30

Google 发新的开源多模态模型了，16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来？🤔

Gemma 4 12B，Google 把本地多模态模型推到 16GB 设备档位

Google 发布 Gemma 4 12B，定位在边缘小模型 E4B 和 26B MoE 之间：参数规模更轻，但保留接近 26B 模型的推理能力，目标是让多模态 agent 能直接在笔记本上跑。

核心变化是架构：从独立视觉/音频 encoder，改成 unified encoder-free 路线。视觉输入通过轻量 embedding 模块进入 LLM backbone，音频直接投影到文本 token 同一空间。少一层 encoder，换来更低延迟和更小内存占用。

对开发者来说，关键不只是“又多一个开源模型”，而是本地 agent 终于可以同时看、听、推理，并且不必默认把数据送上云。

🔗 链接：https://blog.google/innovation-a ... oducing-gemma-4-12b（发布）
📄 Developer Guide：http://t.cn/AXXTTooV（Guide）
🤗 Hugging Face 权重集合：http://t.cn/AXIY3RmR（权重）
💻 Gemma Skills：http://t.cn/AXXTToof（skills）
#HOW I AI# #ai生活指南# #效率工具#

相关阅读