Google 发新的开源多模态模型了,16G 显存就能跑。但是我更关心的是 Gemini 3.5 Pro 什么时候出来?🤔
Gemma 4 12B,Google 把本地多模态模型推到 16GB 设备档位
Google 发布 Gemma 4 12B,定位在边缘小模型 E4B 和 26B MoE 之间:参数规模更轻,但保留接近 26B 模型的推理能力,目标是让多模态 agent 能直接在笔记本上跑。
核心变化是架构:从独立视觉/音频 encoder,改成 unified encoder-free 路线。视觉输入通过轻量 embedding 模块进入 LLM backbone,音频直接投影到文本 token 同一空间。少一层 encoder,换来更低延迟和更小内存占用。
对开发者来说,关键不只是“又多一个开源模型”,而是本地 agent 终于可以同时看、听、推理,并且不必默认把数据送上云。
🔗 链接:https://blog.google/innovation-a ... oducing-gemma-4-12b(发布)
📄 Developer Guide:http://t.cn/AXXTTooV(Guide)
🤗 Hugging Face 权重集合:http://t.cn/AXIY3RmR(权重)
💻 Gemma Skills:http://t.cn/AXXTToof(skills)
#HOW I AI# #ai生活指南# #效率工具#