英文

注意:新版本已发布。请查看更新的权重 here 。如果您仍然希望使用此旧版本,请参阅不同版本之间的兼容性和差异 here

Vicuna 模型卡片

模型详情

Vicuna 是通过对从 ShareGPT 收集的用户共享对话进行 LLaMA 微调而训练出来的聊天助手。

  • 开发者: LMSYS
  • 模型类型:基于变压器架构的自回归语言模型。
  • 许可证:非商业许可
  • 微调自模型: LLaMA

模型来源

用途

Vicuna 的主要用途是用于大型语言模型和聊天机器人的研究。模型的主要用户是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。

如何开始使用模型

命令行界面: https://github.com/lm-sys/FastChat#vicuna-weights 。API(OpenAI API、Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api

训练详细信息

Vicuna v1.1 是通过使用受监督指令微调从 LLaMA 得到的数据进行微调的。训练数据大约有 70,000 个从 ShareGPT.com 收集的对话。有关更多详细信息,请参阅附录中的 "Vicuna 模型的训练详细信息" 部分 paper

评估

Vicuna 在标准基准、人类偏好和 LL-as-a-judge 方面进行评估。有关更多详细信息,请参阅 paper leaderboard

Vicuna 不同版本之间的差异

请参阅 vicuna_weights_version.md

致谢

特别感谢 @TheBloke 提前托管这个合并的权重版本。