Retell AI推出逼真会话语音AI代理API

2024年02月23日 由 daydream 发表 463 0

一家名为 Retell AI 的新创公司从最新一批 Y Combinator 中脱颖而出,雄心勃勃地要改变基于语音的人工智能。Retell AI提供了一个会话语音应用程序接口(API),允许开发人员使用大型语言模型轻松创建声音自然的语音代理。


如今,虽然有 ElevenLabs 这样最先进的合成语音提供商,但构建真正模仿人类对话的语音AI仍然非常具有挑战性。传统的方法通常是将语音到文本、LLM 和文本到语音技术拼凑在一起,导致体验中出现不自然的停顿、尴尬的打断和机器人语调。


这种脱节的方法可能导致令人沮丧的用户体验,其特点是延迟时间长和误解。我们在人类对话中认为理所当然的事情,如快速反应时间、处理中断和自然的轮流发言,在人工智能系统中并不存在。


正如 Retell AI 联合创始人兼首席营销官 Evie Wang 所解释的那样:"开发人员在人工智能对话体验上花费了数百个小时,但最终却得到了糟糕的体验,如 4-5 秒的长延迟、不恰当的截止时间、互相讲话。"


微信截图_20240223103110


Retell AI 的解决方案是一个 API,可代表开发人员处理这些复杂的对话协调问题。他们的专业模型建立在核心语音和语言组件之上,以模拟人类讨论的动态。其与众不同之处在于它强调创造 "神奇的 "人工智能对话体验。这家初创公司对其系统进行了微调,实现了令人印象深刻的平均 800 毫秒的响应时间,与人类互动的节奏非常接近。


他们的平台拥有语音稳定性控制、反向通道、实时 ASR 转录以及添加自定义语音等功能。即将推出的增强功能包括环境噪音添加、文本回复对话化和情感分析,从而进一步缩小人机交流的差距。


开发人员可以使用自己的 LLM 和前端,而 Retell AI 会在幕后处理所有会话重任。集成工作包括将 LLM 插入 Retell 的管道,并通过 WebSocket 连接到网站、移动应用或电话提供商。


12a8df9f-56f3-4387-a7aa-82727edcc5e4


Retell AI 还提供了一个无代码沙盒,让任何人都能通过仪表板创建语音代理原型。用户无需编写任何代码,就能设计对话流、连接电话号码并试用语音样本。


使用案例包括人工智能呼叫中心、语音辅导应用程序、虚拟伴侣等。由于其应用程序接口自动处理了繁琐的对话工程工作,开发人员可以完全专注于构建其语音应用程序的独特功能。


除了技术创新,Retell AI 的使命还源于将语音人工智能作为与数字服务交互的主要界面的愿景。随着对话式人工智能逐渐成为主流,这家初创公司提出的 "插入你的 LLM,语音代理就诞生了 "这一简单得令人难以置信的价值主张可能会被证明是绝妙的。

文章来源:https://www.maginative.com/article/retell-ai-launches-with-api-for-realistic-conversational-voice-ai-agents/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消