Anthropic 推出人工智能性能提升的 Claude Opus 4.8

Anthropic 的 Claude Opus 4.8 作为其 AI 平台的升级版本首次亮相，具有增强的编码、代理任务和经济高效的性能。

Anthropic Launches Claude Opus 4.8 with Improved AI Performance

Anthropic 于 2026 年 5 月 28 日正式推出了 Claude Opus 4.8，这是其 Opus 级 AI 系列的最新版本。定位为对其前身 Opus 4.7 的精细升级，该版本专注于提高编码、财务分析和长期运行知识工作等代理任务的判断力、可靠性和性能。定价保持不变，标准使用成本为每百万个输入代币 5 美元，每百万个输出代币 25 美元，而更快的推理模式现在便宜三倍。

Opus 4.8 中的突出增强包括更敏锐的自我批评能力，特别是在编码任务中。早期测试人员报告说，该模型忽视自行生成代码中的缺陷的可能性降低了四倍。此外，该模型引入了“动态工作流程”，使其能够自主处理大型多步骤项目。此功能对于执行复杂工程任务（例如大规模代码库迁移）的企业用户特别相关。

Opus 4.8 建立在 Anthropic Opus 系列快速迭代周期的基础上。从 2025 年底强调记忆和聊天连续性的 Opus 4.5 开始，该系列不断发展到 Opus 4.6 的漏洞检测功能和 Opus 4.7 扩展的上下文处理和自适应推理功能。最新模型深化了这些功能，重点关注持续性能和用户一致的行为。

现实世界的基准测试凸显了 Opus 4.8 的多样化优势。它在 Anthropic 的法律代理基准测试中取得了最高分，表明实质性法律工作流程的可靠性和引文精确度显着提高。对于数据密集型任务，例如财务文档分析，该模型比 Opus 4.7 具有更好的标记效率和检索准确性。此外，它在 Online-Mind2Web 基准测试中得分为 84%，在一致的浏览器代理任务中超越了其前身和 GPT-5.5 等竞争对手。

另一个关键升级是模型的“努力控制”功能，它允许用户在处理任务时调整人工智能的强度。较高的努力水平会导致更深入、更周到的响应，而较低的设置则优先考虑速度和令牌效率。快速模式以 2.5 倍的速度运行，现在每百万输入令牌的成本仅为 10 美元，这使得需要快速结果的用户更容易使用。

Anthropic 还强调了此版本中的一致性和安全性改进。该公司的协调团队指出，Opus 4.8 显示出更强的亲社会特征，包括更好地支持用户自主权以及减少欺骗或滥用等不当行为的可能性。这些更新与 Anthropic 更广泛地推动负责任的人工智能部署相一致，正如其 Mythos 级项目所示，该项目专注于具有增强网络安全保障的高级智能模型。

立即可用，Opus 4.8 已集成到企业级项目的 Claude Code 中，并为开发人员提供 API 访问。该公司暗示即将推出更先进的型号，神话级系统预计将在几周内首次亮相。目前，Claude Opus 4.8 代表着寻求可靠、经济高效的人工智能解决方案的组织向前迈出了重要一步。

书签