NVIDIA推出ChatQA,GPT-4级别的对话式问答(QA)模型

2024年01月22日 由 camellia 发表 429 0

NVIDIA的研究人员最近推出了ChatQA,这是一系列对话式问答回答模型,旨在实现与GPT-4等级精确度相当的性能。


1


NVIDIA的ChatQA推出了从7B到70B不等规模的模型系列。在10个对话式问答数据库上的广泛评估显示,表现最佳的ChatQA-70B不仅超过了GPT-3.5-turbo,还达到了与GPT-4相当的水平。值得注意的是,这些成就是在没有依靠ChatGPT模型的任何合成数据的情况下取得的。


ChatQA的研发团队提出了一种两阶段指导性调优方法,显著提高了大型语言模型(LLMs)在零样本对话QA中的结果。为了解决对话式QA中的检索问题,研究人员对一个多轮QA数据库进行了密集检索器的微调,其结果与最先进的查询重写模型相当,同时降低了部署成本。


NVIDIA展示了使用其精心策划的对话式QA数据微调单轮查询检索器的有效性。这种方法与最先进的基于LLM的查询重写模型的表现相当,而且无需额外的计算时间和可能伴随重写的API成本。


NVIDIA的ChatQA在处理答案难以寻找的场景中表现出了显著的进步。引入少量“无法回答”的样本已经证实能显著提高模型的能力。通过对无法回答案例的评估,显而易见的是,领先的模型ChatQA-70B与强大的GPT-4相比仅存在细微的性能差距。


NVIDIA并不孤单。几个基础模型已经达到了GPT-4的能力。谷歌可能随时推出Gemini Ultra。同时,Mistral的首席执行官Arthur Mensch在法国国家广播电台宣布,该公司将在2024年公布一个开源的GPT-4级别模型。

文章来源:https://analyticsindiamag.com/nvidia-introduces-chatqa-gpt-4-level-conversational-qa-models/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消