英文

?? 重要 ??

此模型已过时!请使用相同的模型 https://huggingface.co/facebook/blenderbot_small-90M 代替

模型描述

摘要

构建开放领域的聊天机器人对于机器学习研究来说是一个具有挑战性的领域。虽然先前的工作已经显示出,在参数数量和训练数据规模方面扩大神经模型会获得改进的结果,但我们展示了其他因素对于高性能聊天机器人也是重要的。良好的交流需要许多技能,这些技能由一位专家级的对话者以无缝的方式融合在一起:提供有趣的话题、倾听对方的发言、提出问题并回答问题,在适当的情况下展示知识、共情和个性。我们表明,当给予适当的训练数据和生成策略选择时,大规模模型可以学会这些技能。我们构建了90M、2.7B和9.4B参数神经模型的变体,并公开提供我们的模型和代码。人工评估显示我们的最佳模型在多轮对话中优于现有方法,以参与度和人性度测量标准衡量。然后,我们通过分析模型的故障案例讨论了这项工作的局限性。