英特尔开发强化学习系统，可实现控制3D类人等复杂AI任务

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2019年06月12日由 bie管我叫啥发表 763831 0

英特尔AI实验室和俄勒冈州立大学协作机器人和智能系统研究所展开一项研究，结合了多种方法来制作性能更好的强化学习系统，可应用于机器人，自主车辆功能控制和其他复杂AI任务。

该系统名为协同进化强化学习（CERL），可以在Humanoid、OpenAI的Hopper和Walker2D等基准测试中实现更好的性能，比基于梯度的算法或用于强化学习的进化算法更优秀。

使用CERL方法，研究人员能够使一个3D类人智能体在OpenAI的类人基准上直立行走。

这些结果部分是通过训练系统实现的，这些训练系统探索更多的强化学习训练环境，以寻求奖励并完成特定任务。

环境探索对于确保记录各种经验并考虑行动方案非常重要。研究人员在一篇解释CERL如何运作的论文中表示，与环境探索相关的问题已经出现，特别是随着使用深度强化学习来完成具有挑战性的现实任务的流行，这些问题变得更加突出。

论文写道，“神经进化将整个过程联系起来，产生一个超出任何个体学习者能力的自然学习者。”

CERL结合了基于策略梯度的强化学习和进化算法，然后在每批或一代训练系统中选择表现最佳的神经网络。这样，研究人员可以使用最强大的神经网络来创建新一代系统，并且可以将计算资源分配给实现最佳性能的算法。

CERL还结合了重放缓冲区，用于存储学习者在环境中的体验，以便创建单个重放缓冲区并在系统之间共享体验，从而实现比以前方法更高的样本效率。

论文：

arxiv.org/abs/1905.00976

标签：

行业英特尔

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇初创公司Robust为机器人打造首个工业级的认知平台

下一篇 H2O.ai：在独立研究的最新评估中，公司被评为AI自动解决方案的领导者

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来