加入收藏 | 设为首页 | 会员中心 | 我要投稿 江门站长网 (https://www.0750zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

AI智能体学会动物进化法则

发布时间:2021-04-12 15:16:27 所属栏目:评论 来源:互联网
导读:是人工智能领域的一大研究课题,并且也有非具身与具身智能之分。当前,AI 领域更多关注非具身认知,而创建具身智能体非常具有挑战性。近日,斯坦福李飞飞等学者提出了一种新的计算框架深度进化强化学习(DERL), 基于该框架创建的具身智能体可以在多个复杂环

是人工智能领域的一大研究课题,并且也有非具身与具身智能之分。当前,AI 领域更多关注非具身认知,而创建具身智能体非常具有挑战性。近日,斯坦福李飞飞等学者提出了一种新的计算框架——深度进化强化学习(DERL), 基于该框架创建的具身智能体可以在多个复杂环境中执行多项任务。此外,该研究还通过形态学习首次证明了演化生物学中的鲍德温效应。

在过去 6 亿年中,进化带来了不同类型的「无尽之形最美」(endless forms most beautiful),从古老的两侧对称虫到多种多样的动物形态。这些动物还展示出了显著的具身智能(embodied intelligence),利用进化的形态学习复杂任务。具身认知领域认为,智能体可以快速学得这种智能行为,它们的形态也能很好地适应环境。然而,AI 领域更多地关注「非具身认知」,如语言、视觉或游戏等。

当人工具身智能体的形态能够很好地适应环境,则它们可以在多种复杂环境中学习控制任务,然而创建这类智能体很有挑战性,原因如下:

这需要在大量可能形态中进行搜索;

通过终身学习评估智能体适应度需要大量计算时间。

因此,之前的研究要么在极度有限的形态搜索空间中进化智能体,要么在给出的固定人工设计形态下找出最优参数。评估适应度(fitness)的难度使得先前研究避免直接基于原始感官观察学习自适应控制器;使用少量参数 (≤ 100) 学习人工设计控制器;学习预测一种形态的适应度;模仿拉马克进化(Lamarckian)而不是达尔文进化,直接跨代传输学得的信息。此外,之前研究主要局限于平地移动的简单任务,智能体具备的自由度 (DoF) 较少,或者形体构型由立方体组成,将学习控制器这一问题进一步简化。

如何克服这些局限呢?

近日,来自斯坦福大学的研究者 Agrim Gupta、Silvio Savarese、Surya Ganguli 和李飞飞提出了一种新型计算框架——深度进化强化学习 (Deep Evolutionary Reinforcement Learning, DERL),该框架能够在环境、形态和控制这三种复杂度维度下同时规模化创建具身智能体。

(编辑:江门站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读