【DeepSeek V4 更多细节曝光,最快下周发布】
“APPSP”微信公众号消息,DeepSeekV4的细节,正在陆续浮出水面。
科技账号Legit率先披露,V4的轻量版本代号为「sealion-lite(海狮轻量版)」,目前已在至少一家推理服务商处展开内测,相关方均签署了严格的保密协议。
据悉,该版本支持100万token上下文窗口,原生具备多模态能力,性能明显优于现有网页及应用端模型。另有用户同期展示了V4生成的SVG样本,直言效果相当亮眼。
在参数疑似泄露的同期,今天凌晨,路透社援引知情人士消息称,DeepSeek计划最快于下周发布DeepSeekV4。
结合此前南华早报透露的消息,DeepSeek下一代旗舰模型预计将是一款万亿参数级别的基础模型。且正是由于模型规模大幅增长,训练速度明显放缓,导致发布时间被推迟。
但路透社报道中还提到,在发布V4之前,DeepSeek并未按行业惯例向英伟达、AMD等美国芯片厂商提供模型预览,转而提前数周向包括华为在内的中国芯片供应商开放访问权限,以便完成适配和优化工作。
截至发稿前,英伟达与AMD均拒绝置评,DeepSeek和华为亦未作出回应。
网友本周也发现,DeepSeek的GitHub仓库迎来密集更新,大量积压的PR被集中合并处理。
此次更新主要集中在与DeepSeekAPI集成相关的代码库,内容涵盖AI客户端应用、开发运维工具及企业级解决方案等第三方集成项目,更像是工程师节后返工的例行整理。
从HuggingFace上超过7500万次的累计下载量来看,DeepSeek依然是全球开源AI领域最受瞩目的存在之一。
这只「海狮」究竟何时正式亮相,所有人都在翘首以待。