Mistral AI已发布Mistral Medium 3,这是一款中型语言模型,专为那些寻求高性价比、强大性能和灵活部署选项的企业设计。该模型现已通过Mistral的平台和Amazon SageMaker提供,并计划进一步在IBM WatsonX、Azure AI Foundry、Google Cloud Vertex AI和NVIDIA NIM上发布。
据Mistral称,Medium 3的性能可与更大型的模型如Claude Sonnet 3.7媲美。在内部基准测试中,其得分达到这些大型模型的90%以上,同时保持较低的成本,预计每百万输入标记的费用为0.40美元,输出为2美元。公司报告称,该模型超越了开放模型如LLaMA 4 Maverick,并在编码和STEM相关任务中表现优于商业产品。
该模型支持在多种环境中部署,包括使用少至四个GPU的混合和完全本地配置。它还提供定制选项,包括后期训练、微调以及与私有企业数据和工具的集成。
在实际应用中,Mistral Medium 3在编码、客户支持自动化和技术数据分析方面表现出色。公司指出,金融、能源和医疗保健领域的早期采用,强调了该模型与特定领域应用的兼容性。
然而,并非所有社区反馈都是正面的。一位Reddit用户评论:
它的表现不如DeepSeek模型,但其API更昂贵。而且由于他们没有发布权重,不清楚为什么有人会为此付费。
这种观点反映了一些关于专有模型与开放权重替代品价值的持续争论,特别是在优先考虑透明度和精细控制的开发者和研究社区中。
另一方面,该模型也得到了企业专业人士的支持。Okta的新兴市场销售总监Arnaud Bories表示:
热烈祝贺Mistral AI团队的这一激动人心的发布。对企业级定制和安全性的关注尤为突出。在Okta,我们始终在探索如何将身份作为安全和无缝AI采用的催化剂——期待看到我们如何共同支持和增强这些创新。
随着企业AI市场的不断扩展,Mistral Medium 3进入了一个竞争激烈的领域,提供了一种优先考虑部署灵活性、成本控制和集成准备的模型。