
文章图片

文章图片

文章图片

文章图片

文章图片
机器之心报道
机器之心编辑部
你会掏钱吗?
你说巧不巧 , 就在 Sam Altman 官宣两个开源推理模型之前的半个小时 , 却被 Anthropic 抢先一步 , 发布了新模型 Claude Opus 4.1 。
以前只有 OpenAI 抢占别人家的风头 , 这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性!
对比他们发推时间 , 算下来就是前后脚的功夫 , 不知是 Anthropic 提前得知了消息 , 还是刚巧赶上了 , 又或者是 Anthropic 以为 OpenAI 要发 GPT-5 , 提前放出模型 , 时间挨的那么近 , 应该不是巧合 。 大家觉得呢?
总之 , 国外这几家公司上新模型 , 基本都在按照这个循环进行 。
Claude Opus 4.1 登场
最新 Claude Opus 4.1 模型 , 基于 Claude Opus 4 构建 , 后者在今年 5 月末发布 。 可以看出 Anthropic 模型迭代速度还是非常快的 。 Claude Opus 4.1 主要在智能体任务、真实世界编程和推理能力上有了大幅提升 , 具有 200K 上下文窗口 。
对于商业用户和个人用户而言 , Claude Opus 4.1 已面向 Claude Pro、Max、Team 和 Enterprise(企业)用户开放使用 。
对于开发者而言 , Claude Opus 4.1 可通过以下平台使用:
Anthropic API Amazon Bedrock Google Cloud 的 Vertex AI此外 , Claude Opus 4.1 也已集成至 Claude Code 中 。
在 API 价格方面 , Claude Opus 4.1 的定价为:
每百万输入 token 15 美元 每百万输出 token 75 美元如果启用提示缓存(prompt caching) , 最多可节省 90% 的成本;使用批处理可节省多达 50% 的成本 。
定价:https://www.anthropic.com/pricing#api
在性能方面 , Opus 4.1 在 SWE-bench Verified 基准上达到 74.5% , 此外 , 该模型还在深度研究和数据分析等方面有所提升 , 尤其是在细节追踪和智能体搜索方面 。
根据 GitHub 评估 , Claude Opus 4.1 在大多数能力上相较于 Opus 4 都有所提升 , 尤其在多文件代码重构方面表现出显著进步 。
企业用户方面 , Rakuten Group 发现 , Opus 4.1 在处理大型代码库时 , 能够精准定位需要修改的部分 , 且不会做出不必要的更改或引入新的 bug 。 这种精确性让他们的团队更愿意在日常调试任务中使用它 。
还有企业用户称 , 在他们的初级开发者评估基准测试中 , Opus 4.1 相比 Opus 4 提升幅度很大 , 其性能飞跃大致相当于 Sonnet 3.7 升级至 Sonnet 4 的提升幅度 。
Anthropic 建议所有用户将 Opus 4 升级至 Opus 4.1 。 在 API 中 , 开发者只需使用 claude-opus-4-1-20250805 即可接入新版模型 。
使用场景
Claude Opus 4.1 提供了混合推理模式 , 既可以实现即时响应 , 也可以展示推理过程 。 API 用户还可对思维预算进行精细控制 , 以实现成本与性能的最优平衡 。
其典型应用场景包括但不限于:
高级编程能力:Claude Opus 4.1 在 SWE-bench 基准上处于领先地位 , 能够完成耗时数日的工程任务 , 并在成千上万步操作中提供连贯且具备上下文感知的解决方案 。 得益于更优的代码品味与 32K 的输出 token 支持 , 它可以灵活适应特定的编程风格 , 在大规模代码生成与重构项目中展现出卓越的质量表现 。
智能体搜索与研究:Claude Opus 4.1 能够高效地检索外部和内部数据源 , 在复杂的信息环境中综合出全面的洞见 。 凭借其在智能体搜索任务中的强大表现 , 它可以进行长达数小时的自主研究 —— 同时分析包括专利数据库、学术论文和市场报告在内的多种资料 , 为决策提供战略性洞察 。
最后 , 随着新模型的发布 , Anthropic 还发布了系统卡 , 感兴趣的读者 , 可以前去阅读 。
地址:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf
大家也是期待新模型可以解决屎山问题 。
不过 , 面对高昂的订阅费 , 大家也是吐槽:太贵 , 买不起 。
「太吃token了 。 」
【就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1】对了 , 在谷歌攒的 AI 国际象棋比赛第一天 , Claude Opus 4 败给了 Gemini 2.5 Pro , 不知 Claude Opus 4.1 要是参战的话 , 结局会不会改写 。
推荐阅读
- OpenAI或在周五凌晨发布GPT-5 有望较现有模型好得多
- 刘慈欣:当前离科幻最近的技术就是人工智能
- OpenAI被“断供”,AI圈也搞起了以邻为壑
- 刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗
- Anthropic切断OpenAI访问Claude模型的权限
- Claude断供OpenAI,AI编程竞争再升级
- OpenAI 奥尔特曼“剧透”GPT-5
- 19岁小哥伯克利辍学创业,获2800万美元融资,OpenAI投了
- GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防
- 别再入局大模型,除非你是马斯克?OpenAI董事长90分钟深度访谈
