微软公司今天宣布推出其第三个自主研发的人工智能模型,旨在减少对行业巨头OpenAI的依赖。
新模型名为MAI-Image-1,顾名思义,这是公司首个文本到图像生成器。它由微软AI团队内部设计和开发,是公司首个专注于图像生成的模型。
“MAI-Image-1标志着我们旅程的下一步,并为我们产品中更具沉浸感、创造性和动态的体验铺平了道路,”微软AI在博客文章中宣布了这一新模型。
据称,MAI-Image-1在创建高度逼真的图像方面表现出色,因为它是与“创意专业人士”合作开发的。微软AI团队解释说,其目标之一是避免AI图像生成器常见的“重复或通用风格化输出”。从微软提供的示例图像来看,这一努力似乎得到了回报,因为它能够生成比其他模型更自然的光照和逼真的景观。
团队还强调,MAI-Image-1能够比其他通常更大的模型更快地处理提示并生成图像,这听起来是另一个重大优势。话虽如此,这一切都无法确认,因为目前似乎只对部分测试者开放。然而,该模型已经在LMArena的前十名文本到图像排名中占据了一席之地,在那里人们比较各种AI系统的图像输出并投票选出他们最喜欢的。
更重要的是,这一发布强调了微软决心建立自己作为顶级AI模型制造商的资质,加速与之前依赖的OpenAI的分离。微软是OpenAI最早的财务支持者之一,并且仍然是其最大的投资者之一,但两家公司的目标在过去几年中有所分歧。因此,微软不再拥有OpenAI的GPT模型的独家早期访问权,也不再单独使用它们来支持其一些AI功能。例如,微软365的一些AI功能现在由Anthropic PBC的模型提供支持。与此同时,微软在创建自己的AI模型方面进行了重大投资。今年8月,公司宣布了其首个两个内部模型,
MAI-Voice-1和MAI-1-preview。当时,微软AI部门负责人Mustafa Suleyman表示,公司已经制定了一个“庞大的五年路线图”,因此未来可能会有更多模型发布。
最终,MAI-Image-1似乎注定要为微软Copilot和Bing图像创作者的图像创作功能提供动力,公司表示它将“很快”上线。