【能独立啃硬骨头】
Opus 4.7 最大亮点是自主编程能力显著升级。以前那些需要你盯着、一步一步指导的复杂编程任务,现在可以放心交给它独立跑完整流程。早期用户测试显示,它不仅能搞定更难、更长链的任务,还会主动验证输出再汇报。在 Finance Agent 等第三方测评里,已经拿到 state-of-the-art 的成绩。
【看得更清楚了】
视觉处理能力也有明显突破,支持长边最高 2576 像素(约 375 万像素),超过此前 Claude 模型的三倍。做智能代理、从复杂图表提取数据、或需要精确读取屏幕内容的任务都会直接受益——过去必须压缩的截图,现在原图直接丢进去就行。
【Claude Mythos 的影子】
这次升级有个微妙背景:Anthropic 手里其实有个更强大的 Claude Mythos Preview,但因为网络安全风险的顾虑,目前只限量开放。Opus 4.7 就是经过安全降级后的版本,训练时专门降低了网络攻击能力,并配套自动识别高风险用途的防护机制。
安全研究人员想做渗透测试或漏洞研究,必须申请 Anthropic 新推出的 Cyber Verification Program,合规使用。
【Claude Code 同步升级】
Claude Code 新增了 /ultrareview 命令,能专门进行深度代码审查,自动找出 bug 和设计问题。Pro 和 Max 用户可以免费试用三次。此外,auto 模式(允许 Claude 自主决策、连续执行)也首次向 Max 用户全面开放。
同时新增了介于 high 和 max 之间的 xhigh 推理力度档位,Claude Code 所有套餐默认推理力度已全部提升至 xhigh。
【新 tokenizer,账单可能微涨】
升级 Opus 4.7 后有两点值得注意。
一是 tokenizer 换了,同样文本可能消耗过去 1.0 到 1.35 倍的 token。
二是在高推理档下,尤其是多轮交互场景,它的思考更深入,输出 token 更长。这两点可能导致实际账单微涨,Anthropic 建议拿自己的真实流量先跑一遍,算清楚再决定是否迁移。
Anthropic 声称 Opus 4.7 整体性价比仍然更优,但“具体任务具体分析”,谨慎起见,最好亲测。
至于 Mythos Preview 何时能普遍开放,Anthropic 此次没有给出时间表。
官方公告:http://t.cn/AXMei2ZL