Anthropic的Claude Sonnet 4.5可自主编程超过30小时 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

anthropic-4.5-sep-25-770x433

在AI竞争中，Anthropic推出了Claude Sonnet 4.5，这是一款公司声称在编程方面表现出色的模型。Claude Sonnet 4.5据称在编写生产就绪代码、使用计算机、执行网络安全任务以及金融服务的研究、建模和预测方面表现优于其前代产品。

“Claude Sonnet 4.5重新设定了我们的期望——它可以进行超过30小时的自主编程，使我们的工程师能够在显著减少时间的情况下处理数月的复杂架构工作，同时在庞大的代码库中保持一致性，”iGent AI的首席执行官兼联合创始人Sean Ward在Anthropic的公告中说道。

Claude Sonnet 4.5在编程方面表现出色

让AI独立工作如此长时间表明Anthropic可能兑现AI同事的承诺。Claude Sonnet 4.5在各种基准测试中表现优于Claude Opus 4.1——Anthropic两个月前发布的最强大模型。公司表示除了持续编程，Claude Sonnet 4.5还被认为在法律、医学和更广泛的STEM领域的任务中表现出色。

Claude Sonnet 4.5经过调校以避免谄媚、阴谋、权力追求和鼓励妄想思维。Anthropic称其为“最符合标准”的模型。

其定价为每百万输入标记3美元和每百万输出标记15美元，与Claude Sonnet 4相同，对于需要重度编程的现有用户来说是个不错的选择，尽管在更广泛的生成式AI领域中相对昂贵。

Anthropic宣布了Claude的其他新功能和工具

Anthropic还在其产品中发布了升级：

Claude Code中的保存点。
Claude Code中的新终端界面和原生VS Code扩展。
Claude API中的新上下文编辑功能和记忆工具，延长了代理独立工作的时间。
Claude应用中的代码执行和文件创建。
Claude for Chrome扩展，提供给加入候补名单的Max级别订阅者。
Claude Agent SDK。

前沿AI显示出逐步改进和更多专业化

Gartner预测2025年生成式AI支出将同比增长149.8%，达到约142亿美元的终端用户支出。

随着模型的改进，它们之间的差异变得不那么显著。根据Gartner的研究报告（仅限订阅者链接）。

“随着Claude Sonnet 4.5的推出，Anthropic正在寻求巩固其在编程领域的领导地位，”Gartner分析师Arun Chandrasekaran在给TechRepublic的电子邮件中说道。“然而，除了编程领域，他们还训练模型在他们看到机会的另外两个领域——金融和网络安全中表现出色。然而，这些领域的改进是渐进的。

“然而，凭借在建立MCP作为生成式AI和Agentic AI通信的行业协议方面的成功，Anthropic在记忆、代理协调和自主性方面增加了显著的能力。”

Anthropic的新模型通过其专业化，特别是在编程和金融领域的专注来区分自己，这两个行业可能由于生成式AI而经历显著的工作转型。

“Claude Sonnet 4.5表明Anthropic打算在日益竞争的生成式AI（GenAI）模型市场中转向领域专业化，”研究报告中说道。

特别是，Claude Sonnet 4.5的网络安全技能验证了市场对能够执行威胁分析和安全测试的LLM的强烈需求，Gartner表示。