人工智能可以像人类一样玩游戏

2020年01月31日由 TGS 发表 600538 0

人工智能可以像人类一样玩基于文本的游戏吗？这是Uber人工智能研究部门的应用科学家最近研究一个问题。他们基于探索和模仿学习的系统，利用策略来解决游戏，方法是遵循高回报的轨迹。

基于文本的电脑游戏通过自然语言向玩家描述他们的世界，并期望玩家使用文本与游戏互动。这些游戏很有趣，因为它们可以被看作是人工智能理解、解决问题和生成语言的试验台。此外，在研究人员提供一个学习的环境中，这些技能可以与环境交互，而不是只能使用固定全集，不像现有方法那样只能解决简单的游戏。

在开发文本游戏AI时面临的一个挑战是如何与大型动作空间进行竞争。举例来说，如果词汇量为2万个，最多能造出7个单词的句子，那么行动的总数就会达到惊人的1.28e^30。

新模型将观察结果映射到动作，同时跟踪游戏空间中未开发的区域。在第一阶段，探索环境和记录访问地方的档案单元。这些细胞包含一系列观察数据，数据通过一些数学函数映射到相同的表示法，每一个都与元数据相关，包括指向细胞的轨迹、轨迹的长度和轨迹的累积回报。在每个游戏会话中，模型会根据元数据选择一个单元，并从与该单元相关的轨迹末端开始随机探索。

第二阶段的目标是将“脆弱的”操作序列转换成可以跨不同游戏应用的策略，甚至可以泛化为不可见的游戏。在一系列的实验中，团队总共设计了三种不同的场景：单人模式，即一个模型接受一款游戏的训练和测试；联合，多个模型接受一款游戏的训练和测试；简单起见，在所有游戏中，最大步数都设置为50。

最终结果是喜人的，该团队报告说，新模型找到了一种最优策略，与以前最先进的系统相比，它的动作减少了大约一半，并且拥有一个轨迹。研究人员指出，虽然还不是一种完美的方法，对游戏的描述有很大的重叠，导致策略收到类似的观察结果，但与之前的方法比，已经有了突破，即，可以在大型动作游戏中找到好的发展轨迹。

标签：

机器学习 Uber优步

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Adobe的AI试衣已上线，再也不用担心变成卖家秀了

下一篇 Google将跨平台AI管道框架MediaPipe引入网络

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体