
Microsoft 的首款内部 AI 图像生成器 MAI-Image-1 现已在两款产品中推出:Bing Image Creator 和 Copilot Audio Expressions。该公司于 10 月宣布了该模型。Microsoft AI 首席执行官 Mustafa Suleyman 在 X 上的一篇帖子中写道,文本到图像模型将“即将”进入欧盟。
苏莱曼补充说,该模型“非常擅长”生成食物和自然场景的图像,以及艺术照明和逼真的细节。
Microsoft 此前曾在其博客上发布过更多详细信息:“MAI-Image-1 擅长生成逼真的图像,例如照明(例如反射光、反射)、风景等等。与许多更大、更慢的型号相比尤其如此。它的速度和质量的结合意味着用户可以更快地将他们的想法呈现在屏幕上,快速迭代它们,然后将他们的工作转移到其他工具上以继续完善。
Microsoft 的 MAI-Image-1 还将在 Copilot 的文本转语音平台 Copilot Audio Expressions 的“故事模式”中创建 AI 生成的艺术作品,以伴随 AI 生成的音频故事。
8 月,Microsoft 宣布了他们的第一个内部 AI 模型——语音模型 MAI-Voice-1 和基于文本的模型 MAI-1-preview。当时,该公司表示计划在某些未具体说明的情况下在其 Copilot AI 助手中使用 MAI-1-preview,这表明 Microsoft 可能正在摆脱对 OpenAI 模型的依赖。截至今天,Microsoft 表示其 Copilot 聊天机器人正在过渡到 OpenAI 的最新模型 GPT-5,同时还向用户提供 Anthropic 的 Claude AI 模型作为选项。
MAI-Image-1 被列为 Bing 图像创建网站和应用程序上可用的三种 AI 模型之一。另外两个模型 DALL-E 3 和 GPT-4o 来自 OpenAI。
