AI智能体学会动物进化法则

发布时间：2021-04-12 15:16:27 所属栏目：评论来源：互联网

导读：是人工智能领域的一大研究课题，并且也有非具身与具身智能之分。当前，AI 领域更多关注非具身认知，而创建具身智能体非常具有挑战性。近日，斯坦福李飞飞等学者提出了一种新的计算框架深度进化强化学习（DERL）, 基于该框架创建的具身智能体可以在多个复杂环

是人工智能领域的一大研究课题，并且也有非具身与具身智能之分。当前，AI 领域更多关注非具身认知，而创建具身智能体非常具有挑战性。近日，斯坦福李飞飞等学者提出了一种新的计算框架——深度进化强化学习（DERL）, 基于该框架创建的具身智能体可以在多个复杂环境中执行多项任务。此外，该研究还通过形态学习首次证明了演化生物学中的鲍德温效应。

在过去 6 亿年中，进化带来了不同类型的「无尽之形最美」（endless forms most beautiful），从古老的两侧对称虫到多种多样的动物形态。这些动物还展示出了显著的具身智能（embodied intelligence），利用进化的形态学习复杂任务。具身认知领域认为，智能体可以快速学得这种智能行为，它们的形态也能很好地适应环境。然而，AI 领域更多地关注「非具身认知」，如语言、视觉或游戏等。

当人工具身智能体的形态能够很好地适应环境，则它们可以在多种复杂环境中学习控制任务，然而创建这类智能体很有挑战性，原因如下：

这需要在大量可能形态中进行搜索；

通过终身学习评估智能体适应度需要大量计算时间。

因此，之前的研究要么在极度有限的形态搜索空间中进化智能体，要么在给出的固定人工设计形态下找出最优参数。评估适应度（fitness）的难度使得先前研究避免直接基于原始感官观察学习自适应控制器；使用少量参数 (≤ 100) 学习人工设计控制器；学习预测一种形态的适应度；模仿拉马克进化（Lamarckian）而不是达尔文进化，直接跨代传输学得的信息。此外，之前研究主要局限于平地移动的简单任务，智能体具备的自由度 (DoF) 较少，或者形体构型由立方体组成，将学习控制器这一问题进一步简化。

如何克服这些局限呢？

近日，来自斯坦福大学的研究者 Agrim Gupta、Silvio Savarese、Surya Ganguli 和李飞飞提出了一种新型计算框架——深度进化强化学习 (Deep Evolutionary Reinforcement Learning, DERL)，该框架能够在环境、形态和控制这三种复杂度维度下同时规模化创建具身智能体。

（编辑：江门站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

发扬探月精神，勇攀科	读书类短视频能不能引
社区团购仍然一团浆糊	可靠简单却激动人心，