Anthropic 周三发布了其最新的小语言模型 Claude Haiku 4.5。
Claude Haiku 4.5 提供与独立生成式 AI 供应商的 Sonnet 4 模型相似的编码性能水平,但价格更低,速度是原来的两倍多。
Anthropic 表示,新的小型模型在使用计算机等任务方面比 Claude Sonnet 4 更好,因此它与 Claude for Chrome 等应用程序配合使用时表现良好。
Anthropic 表示,由于其高智能和速度,Haiku 4.5 对于为聊天助手和客户服务代理提供支持等任务非常有用。Haiku 4.5 的发布是在 Anthropic 于 9 月 29 日推出 Claude Sonnet 4.5 之后发布的。
Anthropic 表示,用户可以部署 Haiku 4.5 子代理来完成多个任务,或者使用 Haiku 4.5 和 Sonnet 4.5 同时协同工作,而不是仅仅依赖 Sonnet 4.5 的一个实例来完成任务。
成本效益
很明显,Anthropic 设计 Haiku 是为了补充 Sonnet,Informa TechTarget 旗下 Omdia 的分析师 Lian Jye Su 说。
“这给了你更好的成本效益比,”Su说。他补充说,如果用户想通过大型十四行诗模型运行他们的人工智能项目,这将导致大量的代币消耗和更高的成本。相比之下,将任务委托给较小的模型(例如 Haiku)更受欢迎。
“对于运行大型人工智能工作负载的企业来说,这是一个更好的价值主张,”Su 说。
但是,使用较小的模型需要权衡,例如较小的上下文窗口以及较低的可靠性和准确性。
即便如此,有时最好对较小的模型进行微调并应用护栏以使其更可靠,Su 继续说道。
“总会有权衡,但可以通过其他机制来减轻权衡,”他说。“这是一个值得采取的权衡,因为从代币消费的角度来看,你节省的金额可能相当高。人工智能一点也不便宜。
因此,他补充说,使用人工智能技术的企业应该从一开始就了解人工智能工作流程是复杂的,并准备混合使用大型和小型模型以提高成本效益。
Futurum Group 分析师 David Nicholson 表示,在十四行诗 4.5 和俳句 4.5 之间提供“分工”的能力也提出了一些问题。
“我渴望看到这一点付诸实践,”他说。“很有趣,但这让我想知道他们是如何划分任务并保持最初目标的完整性的。”
“每个 Haiku 实例都在生成独特的数据,”Nicholson 继续说道。“所有子任务 Haiku 实例都知道其他实例在做什么吗?将任务划分为子任务的效率有什么限制?
安全与竞争
Anthropic 在 AI 安全 4.5 级标准下发布了 Haiku 2,Su 表示,这表明 Anthropic 专注于 B2B 公司,并与金融、医疗保健和公共部门等行业合作。他指出,这种安全标准是企业关注的相对较高的标准。
然而,虽然 Haiku 4.5 的成本低于典型的大型语言模型,但 Anthropic 在模型编码领域继续面临来自其他生成式 AI 供应商的激烈竞争,例如 OpenAI 及其 Codex CLI 代理。
“现在所有的模型都是迭代的,”Su说。“不幸的是,即使在所有顶级供应商之间,也没有真正突出的特征。”
Claude Haiku 4.5 可在 Claude Code 和 Anthropic 的应用程序上使用,包括作为 Claude 聊天机器人。