Stability AI发布120亿参数Stable LM 2模型

2024年04月09日 由 daydream 发表 96 0

Stability AI公司继续以惊人的速度推出新模型,近日宣布了Stable LM 2 120亿参数模型更新的好消息。


尽管Stability AI公司因其出色的文本到图像生成式AI模型Stable Diffusion而广为人知,但其视野却远超图像生成领域,拥有一系列更为广泛的模型。


微信截图_20240409111026


Stable LM在2023年4月首次亮相,作为一个大型的文本内容语言模型(LLM),并在今年1月更新为更先进的Stable LM 2 1.6B模型。


这次新推出的Stable LM 2 12B模型,通过增加参数和提升性能,极大地增强了Stable LM 2的能力。公司自豪地宣称,在某些基准测试中,其表现甚至超过了像Llama 2 70B这样的更大模型。


Stable LM 2 12B包括基础版本和指令调优变体,旨在提升七种语言(英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语)的会话能力。这款新模型已经通过Stability AI会员资格向商业用户开放,这也是公司主要的收入来源。


“指令模型是专门设计和训练的,以便以会话方式与用户互动。”Stability AI公司语言团队负责人Carlos Riquelme表示,“此外,我们还投入了大量努力来确保其更加安全。”


这次更新发生在联合创始人兼首席执行官Emad Mostaque因管理不善的指控而辞职不到一个月后,但显示出公司仍在不断前进,并在新任临时联合首席执行官Shan Shan Wong和Christian Laforte的领导下继续发布新的模型更新。


Stability AI致力于在Stable LM 2中寻求性能与可及性的平衡


Stability AI声称,Stable LM 2 12B在功能、精度和可及性之间达到了理想的平衡。


这款拥有120亿参数的模型,能够处理各种任务,而这些任务通常只限于参数和计算要求更高的模型。基准测试结果显示,Stable LM 2 12B展现出了与明显更大的模型相当的强大性能。


微信截图_20240409111153


特别值得一提的是,Stability AI在构建较小的1.6B模型时所采用的一般方法,也同样适用于新的12B模型。


“我们预见了一个未来,模型将不再单独使用,而是作为更广泛系统的一部分运行,其中一个或几个语言模型会相互交互,并利用外部软件工具。”Riquelme表示,“因此,在这个方向上,12B模型也经过了训练,能够发挥这种主导作用,通过连接和调用各种功能和API,以满足不同用户和组织的需求。”


1.6B模型也在不断优化


Stability AI不仅增加了Stable LM 2的参数,还对之前发布的1.6B版本进行了改进。


Riquelme指出,像1.6B Stable LM这样的小型模型可以用于执行更具体、更狭窄的任务,而更大的12B模型将拥有更多的能力。尽管如此,他强调,更新后的Stable LM 2 1.6B模型改进了其对话风格,更加安全,并且能够更好地与其他软件工具连接。


“它的大小与以前相同,因此同样快速且轻量级。”Riquelme表示,“另一方面,12B在性能上更出色,更可靠,但计算量也更大。”


他解释说,根据用例和可用资源(如响应时间、内存和预算)的不同,不同的模型将提供不同的权衡方案。


“我们认为,没有一种模型大小适用于所有情况,因此我们提供了两种截然不同的模型大小。”他说。

文章来源:https://venturebeat.com/ai/stability-ai-brings-12b-parameters-to-stable-lm-2-model-update/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消