ClaraLabs的机器学习

2016年07月05日由荟荟发表 301124 0

克拉拉实验室正在建立一个结合了最好的人力和机器人才的同事。像机器一样，克拉拉总是记得偏好。像一位优秀的助手一样，Clara非常重视每条消息的细微差别，并有助于建立作为团队成员的丰富关系。为了实现这种自动化但社会娴熟的体验，人员和机器工作并一起学习，以在我们认为是合作智能的积极反馈循环中完成任务。

我们的平台使Clara远程助理（CRA）成为超人类：他们可以处理来自数百名客户的复杂请求，而每个客户或对话几乎没有任何先验背景。相反，传统的远程助理可以处理最多三到五个客户端。通过机器学习（ML）进一步放大比例，用于部分（有时完全）自动化工作。

实时人在环系统缩短了新ML驱动功能的上市时间。

构建实时人在环系统可缩短新ML驱动功能的上市时间，并对预测如何集成到平台中产生重大影响。我们很乐意分享我们对这些问题的看法。

克拉拉的机器学习

首先，一点背景。监督ML算法需要带注释的训练数据。在最基本的设置中，每个数据点采用形式（例如，注释）; 例如，我们可能有一对（“我正在复制我的助手来设置一些东西。”，REQUEST_SCHEDULE）。构建一个好的数据集有两个关键方面：

1.示例应与我们在应用程序中预期的类似。如上例所示，安排请求很难找到维基百科短语或新闻文章的语料库。
2.必须为目标应用程序精确注释每个示例。
训练样例越具代表性，注释越好，预测结果就越好。获得这样的注释数据可能是困难且耗时的，因为通常需要数万个独特的例子。在实践中，原始数据示例被执行到执行繁琐注释任务的承包商; 疲劳经常导致许多注释错误和噪声数据。

我们的平台在以下方面脱颖而出。

我们为人和机器共同设计

调度任务被分解为可由人和机器理解的子任务，紧密耦合软件设计和人工过程。仔细考虑必须注释的内容通常会增加易处理性预测模型。

我们的数据质量很高，因为注释者“得到它”

CRA通常隐含地扮演注释者的双重角色。因此，我们的助手在执行Clara任务时表现越好，我们的训练数据质量就越高。此外，数据质量是跨学科（如UX）和公司团队的首要考虑因素。

小数据集很快成为大数据集

人工监督意味着预测一开始不需要高度准确，能够快速启动新的学习驱动的产品功能。我们快速测试新想法，而无需花费大量资源来构建数据集和调优算法。换句话说，我们的机器学习工作非常灵活。

敏捷ML：一个简单的例子

并非我们所有的ML功能都开始纯粹用于自动化。这方面的一个例子就是我们对助手的同情提示。

黑色水平线上方的文本是发送给Clara的示例消息。带下划线的黄色短语按我们的算法分类为“疾病”和第一人称。基于这些参数生成黑色水平线以下的建议响应。

如图所示，我们检测到移情反应何时适合，生成建议并将其呈现给助理。CRA可以选择轻松地在传出消息上添加响应。选择后，这将作为我们数据集的注释，并带来更好的客户体验。我们可以在准确到足以推动自动响应之前发布这样的功能，从而显着降低开发新ML驱动功能的时间成本，并为实验和迭代打开大门。

标签：

公司板 ClaraLabs

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Talla——避免静态知识库的黑洞

下一篇新的整合：ClaraLabs与Lever合作

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术