HyperWrite推Reflection 70B:AI语言模型新突破

2024年09月10日 由 daydream 发表 600 0

近日,HyperWrite 公司联合创始人兼 CEO Matt Shumer 在社交网络上宣布推出了 Reflection 70B,这一基于 Meta 开源 Llama 3.1-70B Instruct 的大型语言模型(LLM)。Shumer 表示,Reflection 70B 采用了新的错误自我纠正技术,在第三方基准测试中表现突出。


微信截图_20240910114524


Shumer 称 Reflection 70B 为“全球顶尖的开源 AI 模型”。然而,随后有第三方评估未能重现其所声称的性能指标,导致 Shumer 被指控在社交网络上存在欺诈行为。


该模型的特点在于其反射调优(Reflection-Tuning)技术,这项技术使得模型能在生成文本前自行检测和纠正错误。这一技术的应用使得 Reflection 70B 在某些基准测试中表现出色,尤其是在 MMLU 和 HumanEval 测试中。


为了验证 Reflection 70B 的性能,公众可以在“游乐场”网站上试用演示版本。然而,由于流量激增,HyperWrite 正在努力获取更多的 GPU 资源来支持这一模型的运行。


Shumer 提到,Reflection 70B 的成功部分归功于 Glaive AI,一家专注于创建特定用例数据集的初创公司。Glaive 的快速 AI 模型训练技术帮助 HyperWrite 加速了 Reflection 70B 的开发过程。


HyperWrite 最初由 Shumer 和 Jason Kuperberg 创立,位于纽约州长岛梅尔维尔镇。该公司曾因开发出 Chrome 扩展程序 HyperWrite 而受到关注,该程序可帮助用户撰写邮件和其他文档。至 2023 年 11 月,HyperWrite 已拥有两百万用户,并因其影响力入选《福布斯》年度“30位30岁以下”榜单。


2023 年 3 月,HyperWrite 完成了由 Madrona Venture Group 领投的新一轮融资,获得 280 万美元投资。此轮融资后,公司增加了新的 AI 功能,如虚拟助手服务等。


Shumer 计划在未来推出更大的模型 Reflection 405B,预期该模型将超越目前市场上的顶尖闭源模型。同时,HyperWrite 将发布一份详尽的报告,介绍 Reflection 模型的训练过程和基准测试结果。

文章来源:https://venturebeat.com/ai/meet-the-new-most-powerful-open-source-ai-model-in-the-world-hyperwrites-reflection-70b/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消