Microsoft的Bing团队发布了“Harrier”,一个开源嵌入模型。Harrier支持100多种语言,提供32,000个令牌的上下文窗口,并基于超过20亿个示例及GPT-5的合成数据进行训练。团队表示,Harrier在多语言MTEB v2基准测试中位居榜首,并优于OpenAI和亚马逊的专有模型。

除了完整的270亿参数模型外,团队还发布了两个较小的变体——0.6B和2.7亿,设计用于性能较低的硬件。这三款型号均可在 MIT 授权下于 Hugging Face 上购买。未来,团队计划将该技术集成到必应中,并引入新的人工智能代理接地服务中。
嵌入模型负责搜索、检索和组织人工智能系统所需的信息,以获得准确的答案。据Microsoft称,随着AI代理独立承担更复杂、多步骤的任务,这些任务变得越来越关键。
