HyperWrite推Reflection 70B：AI语言模型新突破

2024年09月10日由 daydream 发表 1177 0

近日，HyperWrite 公司联合创始人兼 CEO Matt Shumer 在社交网络上宣布推出了 Reflection 70B，这一基于 Meta 开源 Llama 3.1-70B Instruct 的大型语言模型（LLM）。Shumer 表示，Reflection 70B 采用了新的错误自我纠正技术，在第三方基准测试中表现突出。

微信截图_20240910114524

Shumer 称 Reflection 70B 为“全球顶尖的开源 AI 模型”。然而，随后有第三方评估未能重现其所声称的性能指标，导致 Shumer 被指控在社交网络上存在欺诈行为。

该模型的特点在于其反射调优（Reflection-Tuning）技术，这项技术使得模型能在生成文本前自行检测和纠正错误。这一技术的应用使得 Reflection 70B 在某些基准测试中表现出色，尤其是在 MMLU 和 HumanEval 测试中。

为了验证 Reflection 70B 的性能，公众可以在“游乐场”网站上试用演示版本。然而，由于流量激增，HyperWrite 正在努力获取更多的 GPU 资源来支持这一模型的运行。

Shumer 提到，Reflection 70B 的成功部分归功于 Glaive AI，一家专注于创建特定用例数据集的初创公司。Glaive 的快速 AI 模型训练技术帮助 HyperWrite 加速了 Reflection 70B 的开发过程。

HyperWrite 最初由 Shumer 和 Jason Kuperberg 创立，位于纽约州长岛梅尔维尔镇。该公司曾因开发出 Chrome 扩展程序 HyperWrite 而受到关注，该程序可帮助用户撰写邮件和其他文档。至 2023 年 11 月，HyperWrite 已拥有两百万用户，并因其影响力入选《福布斯》年度“30位30岁以下”榜单。

2023 年 3 月，HyperWrite 完成了由 Madrona Venture Group 领投的新一轮融资，获得 280 万美元投资。此轮融资后，公司增加了新的 AI 功能，如虚拟助手服务等。

Shumer 计划在未来推出更大的模型 Reflection 405B，预期该模型将超越目前市场上的顶尖闭源模型。同时，HyperWrite 将发布一份详尽的报告，介绍 Reflection 模型的训练过程和基准测试结果。

文章来源：https://venturebeat.com/ai/meet-the-new-most-powerful-open-source-ai-model-in-the-world-hyperwrites-reflection-70b/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Salesforce发布开源“大型动作模型”xLAM系列

下一篇 AI2发布开源模型OLMoE，降低推理成本

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术