大模型的连续跟踪

大模型的连续跟踪

一、Anthropic:
——Claude调整订阅政策,第三方工具调用权限被移除,用户需单独购买额度包或切换至APIKey模式(2026.04.04起)
——意外泄露原始代码,曝光了包括24小时自主代理(KAIROS)和AI电子宠物(BUDDY)在内的多项未发布功能;从泄露代码看,融合了当下业界热切讨论的PromptEngineering、ContextEngineering和HarnessEngineering(2026.03.31)
二、OpenAI:
——Codex更新定价策略,新增按用量计费,并将降低年度团队坐席价格(2026.04.03)
——完成最新一轮1220亿融资,投后估值8520亿,首次从个人投资者处筹集资金(2026.03.31);
三、Gemini:
——发布新一代开源模型Gemma4:共发布四种尺寸,有效2B(E2B)、有效4B(E4B)、26B专家混合(MoE)和31B密集模型。其中31B模型目前在行业标准的ArenaAI文本排行榜上排名世界第3,26B模型则排名第6,超越了20倍于其大小的模型(2026.04.02)
——发布Veo3.1Lite预览版:gemini目前最具成本效益的视频生成模型(生成1秒720p视频价格为0.05,仅为Veo3.1Fast版本的1/3,Veo3.1标标准版本的1/8)(2026.3.31)
——Gemini推出新的Flex和Priority推理层级,支持差异化生产部署:GeminiFlexAPI价格为标准API的50%;GeminiPriorityAPI价格高于标准API75-100%(2026.4.1)
四、通义:
——发布Qwen3.6Plus基座模型:原生支持多模态理解与推理,编程能力接近Claude系列(2026.04.02),发布当天OpenRuter日调用量突破1.4万亿Token,打破该平台的单日单模型调用量的全球纪录;
——发布Wan2.7-Image:图像生成与编辑统一模型,同时具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力(2026.04.01)
——发布Qwen3.5-Omni:千问新一代全模态大模型,在多项多模态任务中超越Gemini-3.1Pro,成为目前全球最强的全模态大模型之一(2026.03.30)
五、智谱:
——发布首个多模态Coding基座模型GLM-5V-Turbo:能够原生处理图片、视频、文本等多模态输入,同时擅长长程规划、复杂编程和动作执行;深度适配Agent工作流(2026.04.02)
——发布25年业绩:实现收入7.24亿元(同比+131.9%),其中云端部署收入1.90亿元(同比+292.6%),本地化部署收入5.34亿元(同比+102.3%)(2026.03.31)
六、MiniMax&Kimi:本周暂无重要变化
分类