具身智能

Embodied Intelligence EI
具身智能是指具备物理形态并能够与环境进行交互的人工智能系统。它强调智能的形成不仅依赖于计算能力,还依赖于身体(Embodiment)与环境的相互作用。具身智能需要智能体通过传感器和执行器与环境实时交互,从而实现动态学习和适应环境。

所有具身智能框架都围绕着一个核心闭环:“感知-思考-行动” (Perception-Cognition-Action Loop)。但与传统AI不同,具身智能强调这个环路是通过身体与物理世界直接交互来闭合的。

它强调智能体通过物理身体与环境进行交互,从而实现感知、决策和行动的能力,这种智能强调:

特性

核心技术框架

感知-动作闭环(Perception-Action Loop)

感知-动作循环:这是具身智能的核心机制之一。智能体通过感知环境中的信息(如视觉、触觉等),然后根据这些信息做出决策并执行动作,再通过环境的反馈调整自身行为,从而形成一个闭环系统。
流程:传感器数据 → 环境理解 → 决策 → 执行器控制 → 环境反馈。
关键技术:
多模态感知:融合视觉、触觉、力觉、听觉等(如触觉传感器GelSight)。
实时运动控制:基于动力学模型的轨迹优化(如MPC控制)。

学习范式

学习与适应性:具身智能体通常采用强化学习、进化算法或深度学习等技术,通过反复试错来找到最佳行为策略。这种学习机制使得智能体能够在未知环境中不断调整和优化自身行为。

Affordance

世界模型

具身智能理论认为,智能体的世界模型并非天生拥有,而是通过与环境的互动逐步建构起来的。这种模型帮助智能体理解环境,并做出适应性决策。

具身智能的框架
Visual-Locomotion-Affordance