亚马逊推出新的机器学习芯片Inferentia；提供数据标记服务；全新GPU instance

2018年11月29日由浅浅发表 718848 0

本周在拉斯维加斯举行的年度AWS会议re：Invent上，亚马逊发布了几个与AI相关的新闻公告。亚马逊宣布了一些新产品和新功能：推出一款由AWS设计的芯片Inferentia，专门用于部署带有GPU的大型AI模型；AWS SageMaker Ground Truth，主要为自定义AI模型、人类训练AI模型提供数据标记；全新GPU instance。

Inferentia

亚马逊宣布推出一款由AWS设计的芯片Inferentia，专门用于部署带有GPU的大型AI模型，该芯片预计于明年推出。

Inferentia将适用于TensorFlow和PyTorch等主要框架，并与EC2instance类型和亚马逊的机器学习服务SageMaker兼容。

AWS首席执行官Andy Jassy在re：Invent会议上表示，“你将能够在每个芯片上获得数百个TOPS，而且如果你愿意的话，你可以将它们组合在一起以获得数千个TOPS。”

Inferentia还适用于Elastic Inference，后者是一种加速使用GPU芯片部署AI的方法。Elastic Inference可以处理1到32 teraflops的数据范围。Inferentia检测EC2instance何时使用主要框架，然后查看神经网络的哪些部分将从加速中获益最多，之后，它将这些部分移动到Elastic Inference，以提高效率。

Jassy表示，今天推出AI模型所需的两个主要流程是训练和推理，而推理的成本占了近90％。“我们认为运营成本可以通过Elastic Inference节省75％，如果你将Inferentia放在上层，成本将再优化10倍，所以这将是一个巨大的改变，这两款产品的推出为我们的客户带来了重大的启发。”

全新GPU instance

亚马逊还推出全新的GPU instance产品。新的P3dn GPU instance是分布式机器学习和高性能计算应用的理想选择。这些instance由NVIDIA Tesla Tensor Core V100 GPU组成，每个GPU具有32GB内存。

团队表示，“这使开发人员能够在多个instance中线性扩展模型训练性能，加速预处理并消除数据传输瓶颈，并迅速提高其机器学习模型的质量。”

新的GPU instance具有100 Gbps网络吞吐量，可实现HPC和机器学习训练的分布式工作负载的横向扩展。

Jeff Barr表示，GPU内存是p3.16xlarge instance的两倍，vcpu数量是p3.16xlarge instance的1.5倍，这些instance将让你探索更大、更复杂的深度学习算法、渲染3D图像、实时转换视频代码、模拟金融风险等等。与现有的P3 instance相比，新的P3dn instance的网络吞吐量提高了4倍。

新的GPU instance将于下周上市。

AWS SageMaker Ground Truth

AWS SageMaker Ground Truth，主要为自定义AI模型或人类训练AI模型提供数据标记，SageMaker是亚马逊用于构建，训练和部署机器学习模型的服务。

SageMaker于一年前首次在re：Invent上推出，并与其他服务开展竞争，如微软的Azure机器学习和谷歌的AutoML。

在此之前，亚马逊上周为SageMaker添加了GitHub集成和内置算法。而今年早些时候，引入了在自己的机器上本地训练模型的能力。

此外，亚马逊今天还宣布：推出AWS市场，供开发人员销售他们的AI模型；DeepRacer League和AWS DeepRacer汽车，该汽车在模拟环境中使用强化学习训练的AI模型上运行。

在今天预览中还提供了许多无需预先知道如何构建或训练AI模型的服务，包括Textract用于从文档中提取文本，Personalize用于客户建议，以及Amazon Forecast，一种生成私有预测模型的服务。

标签：

行业亚马逊Amazon 峰会论坛 GPU

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 NBC Universal利用机器学习，使广告推送更加精准及时

下一篇高通风投宣布成立AI基金，将为AI公司投资1亿美元

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术