微软推出三款新基础模型

2026年04月03日由佚名发表 2695 0

微软AI，这家科技巨头的研究实验室，宣布推出三款基础AI模型。这些模型于周四发布，能够生成文本、语音和图像。

此次发布表明，微软继续致力于构建自己的多模态AI模型，并与竞争对手的AI实验室展开竞争，尽管它仍与OpenAI保持合作关系。

根据公司新闻稿，MAI-Transcribe-1可以将25种不同语言的语音转录为文本，其速度是微软Azure Fast产品的2.5倍。MAI-Voice-1是一个音频生成模型，允许用户在一秒钟内生成60秒的音频，并创建自定义语音。MAI-Image-2是一个视频生成模型。

MAI-Image-2最初于3月19日在MAI Playground上发布，这是一个新的大型语言模型测试平台。现在，所有三款模型都在微软Foundry上发布，转录和语音模型也在MAI Playground中可用。

这些模型由微软的MAI超级智能团队开发，这是一个由微软AI首席执行官Mustafa Suleyman领导的AI研究团队，于2025年11月成立并宣布。

“在微软AI，我们正在构建人文主义AI。我们在创建AI模型时有一个独特的视角——以人为中心，优化人们实际交流的方式，训练以实用为目的，”Suleyman在博客文章中写道。“你很快会在Foundry和微软的产品和体验中看到更多我们的模型。”

在日益拥挤的大型语言模型市场中，MAI希望这些模型的卖点是它们比谷歌和OpenAI的更便宜，公司在博客文章中写道。

MAI-Transcribe-1的起价为每小时0.36美元。MAI-Voice-1的起价为每100万字符22美元，MAI-Image-2的起价为文本输入每100万代币5美元，图像输出每100万代币33美元。

尽管发布了自己的模型，Suleyman在一次与VentureBeat的采访中重申了微软对与OpenAI合作关系的承诺——尽管最近对该合作关系的重新谈判使微软能够真正追求这种超级智能研究，Suleyman告诉The Verge。

微软已投资超过130亿美元用于AI研究实验室并通过多年合作关系在其各种产品中托管其模型。微软在芯片方面采取相同的立场；它既生产自己的芯片，也从外部供应商购买。

相关文章：

Microsoft的MAI-Transcribe-1运行速度是前代的2.5倍，每音频小时售价为0.36美元

文章来源：https://techcrunch.com/2026/04/02/microsoft-takes-on-ai-rivals-with-three-new-foundational-models/

标签：

微软

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇星海图获近20 亿元B+轮融资，多家机构入局

下一篇 OpenAI收购科技播客公司TBPN

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市