亚马逊创建并开源数据集，用于理解不同语言的名称

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2018年08月10日由浅浅发表 754455 0

亚马逊已经创建并开源了一个数据集，用于训练AI模型以识别不同语言和脚本类型的名称，因此Alexa可以例如在英语发音者发音时理解日本艺术家或人的名字，反之亦然。

这被称为音译多语言命名实体音译系统，用于识别不同语言名称的工具基于在亚马逊从维基数据制作数据集之后创建的AI模型，用于填充维基百科的内容。总之，该数据集包含近400000个阿拉伯语，英语，希伯来语，日语片假名和俄语等语言的名称。

研究结果已发表在Arxiv上，将于本月晚些时候在新墨西哥州圣达菲举行的国际计算语言学会议上分享。

亚马逊AI在识别名称方面的表现因语言对而异。例如，根据亚马逊博客文章，英语到俄语比希伯来语更容易理解，因为虽然它们不同，但英语和俄语的字母表比英语更像希伯来语。

在亚马逊宣布计划将Echo智能扬声器带到墨西哥的同时，亚马逊的语言理解也在受到欢迎，这是第一个讲西班牙语的拉丁美洲Echo扬声器。Alexa Skills Kit和Alexa Voice Service今天也宣布将Alexa带入墨西哥的第三方设备。

随着智能扬声器销售和AI助手采用的竞争在国际市场上升温，它突出了每个AI助手的缺点。虽然Alexa目前使用六种语言，但Siri超过20种，而谷歌今年早些时候表示计划在今年年底之前提供超过30种语言。

为了提高Alexa对新语言的理解，去年亚马逊工程师创建并游戏化了Cleo，这是一种Alexa技能，用于收集来自世界各国的语音样本。

论文：arxiv.org/pdf/1808.02563.pdf

标签：

语音识别自然语言处理NLP 亚马逊Amazon

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇三星Galaxy Home智能音箱首次亮相，嵌入AI助手Bixby

下一篇成为Beatbox大佬：AI助力将声音转化为节奏

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术