微软推出三款新基础模型

2026年04月03日 由 佚名 发表 219 0


微软AI,这家科技巨头的研究实验室,宣布推出三款基础AI模型。这些模型于周四发布,能够生成文本、语音和图像。


此次发布表明,微软继续致力于构建自己的多模态AI模型,并与竞争对手的AI实验室展开竞争,尽管它仍与OpenAI保持合作关系。


根据公司新闻稿,MAI-Transcribe-1可以将25种不同语言的语音转录为文本,其速度是微软Azure Fast产品的2.5倍。MAI-Voice-1是一个音频生成模型,允许用户在一秒钟内生成60秒的音频,并创建自定义语音。MAI-Image-2是一个视频生成模型。


MAI-Image-2最初于3月19日在MAI Playground上发布,这是一个新的大型语言模型测试平台。现在,所有三款模型都在微软Foundry上发布,转录和语音模型也在MAI Playground中可用。


这些模型由微软的MAI超级智能团队开发,这是一个由微软AI首席执行官Mustafa Suleyman领导的AI研究团队,于2025年11月成立并宣布。


“在微软AI,我们正在构建人文主义AI。我们在创建AI模型时有一个独特的视角——以人为中心,优化人们实际交流的方式,训练以实用为目的,”Suleyman在博客文章中写道。“你很快会在Foundry和微软的产品和体验中看到更多我们的模型。”


在日益拥挤的大型语言模型市场中,MAI希望这些模型的卖点是它们比谷歌和OpenAI的更便宜,公司在博客文章中写道。


MAI-Transcribe-1的起价为每小时0.36美元。MAI-Voice-1的起价为每100万字符22美元,MAI-Image-2的起价为文本输入每100万代币5美元,图像输出每100万代币33美元。


尽管发布了自己的模型,Suleyman在一次与VentureBeat的采访中重申了微软对与OpenAI合作关系的承诺——尽管最近对该合作关系的重新谈判使微软能够真正追求这种超级智能研究,Suleyman告诉The Verge。


微软已投资超过130亿美元用于AI研究实验室并通过多年合作关系在其各种产品中托管其模型。微软在芯片方面采取相同的立场;它既生产自己的芯片,也从外部供应商购买。




相关文章

Microsoft的MAI-Transcribe-1运行速度是前代的2.5倍,每音频小时售价为0.36美元



文章来源:https://techcrunch.com/2026/04/02/microsoft-takes-on-ai-rivals-with-three-new-foundational-models/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消