微软推出Mu:用于Windows设置的轻量级设备内语言模型

2025年06月27日 由 佚名 发表 44 0

微软已经推出Mu,这是一种新型的小规模语言模型,专为在神经处理单元(NPU)上本地运行而设计,首先在Copilot+ PC的Windows设置应用程序中部署。该模型允许用户通过自然语言来控制系统设置,旨在减少对云端处理的依赖。

Mu是一个拥有330百万参数的编码器-解码器转换器,经过优化以适用于边缘设备。根据微软的说法,这种架构通过重用编码的输入表示来减少延迟,与仅解码器模型不同,后者在生成过程中必须重新处理完整的输入输出序列。公司表示,这样的结果是更快的推理速度和更低的内存开销,能够满足个人设备上实时交互的性能需求。


屏幕截图2025-06-27095257

微软报告称,在高通的Hexagon NPU上,Mu实现了47%的首个标记延迟减少,并且与相似规模的仅解码器模型相比,解码速度快近五倍。关键特性包括旋转位置嵌入(RoPE)、分组查询注意力(GQA)、双层归一化(LayerNorm)和模型量化技术,如后训练量化(PTQ)到8位和16位格式。这些优化是与包括AMD、英特尔和高通在内的芯片制造商合作开发的。

为了将Mu适配于Windows设置代理,微软在超过360万个示例上对模型进行了微调,这些示例涵盖了数百个可调节设置。训练过程包括合成数据生成、噪声注入、提示调优和低秩适应(LoRA)。结果是一个可以将用户输入(如“关闭蓝牙”或“增加亮度”)映射到可操作的系统级更改的系统,微软表示典型响应时间保持在500毫秒以下。

该代理目前可供使用Copilot+设备的Dev Channel中的Windows Insiders使用。为了处理不明确的输入——如简短或模糊的问题——微软添加了一个后备系统,当没有足够的上下文时显示常规搜索结果。

行业观察者注意到了Mu的潜力。AI研究员和开发者Michał Choiński评论:


如果Mu能在这种速度和规模下持续交付,它可能会悄然重新定义桌面AI体验。


Techling LLC的创始人Muhammad Akif补充道:


如果Mu保持这种性能水平,它可能会将AI叙事从‘云优先’转向‘设备智能’。


AI解决方案专家George Draco强调了其更广泛的影响:


对设备内AI的重大飞跃。离线速度与上下文记忆改变了我们对生产力工具的看法。好奇Mu将如何重塑日常工作流程。


微软表示,计划扩大对更多设置类别的支持,并在Mu成为更广泛设备内AI能力的基础时提高短查询的性能。


文章来源:https://www.infoq.com/news/2025/06/microsoft-mu/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消