深圳Yolo 视觉
深圳
立即加入
词汇表

具身人工智能

探索具身人工智能,了解智能系统如何与物理世界交互。发现如何Ultralytics 增强机器人感知能力。

具身人工智能标志着从被动算法向智能系统的重大转变,这类系统能够在物理或模拟的3D环境中感知、推理并互动。不同于仅基于静态数据集运行的传统机器学习模型,这些系统拥有实体躯体——无论是物理机器人底盘还是虚拟化身——使其能够执行操作并从持续的环境反馈中学习。 通过融合传感器输入与智能决策,具身智能体消除了数字计算与现实世界执行的鸿沟。

具身系统如何感知世界

这些动态系统的核心是先进的计算机视觉技术,它使智能体能够在空间层面理解周围环境。为实现安全高效的导航,具身智能体高度依赖实时物体检测姿势估计 。开发者在构建这些智能体的神经通路时,常PyTorch 深度学习框架TensorFlow 工具来处理复杂空间数据。

为实现真正的自主性,这些系统正日益结合视觉语言模型强大的实时推理引擎。这使得人工智能不仅能识别杯子,更能理解"拿起桌边那个红杯"等复杂指令。斯坦福大学人本人工智能研究所等机构的研究 持续拓展着智能体整合多感官数据的边界。

区分相关的人工智能术语

要理解这一领域,需要将其与密切相关的概念区分开来:

  • 机器人学:机器人技术主要关注机械硬件、执行器和电机控制。具身人工智能则提供了使硬件实现自主性的认知软件层,波士顿动力公司的Atlas机器人便是此类技术的典型代表。
  • 物理人工智能: 尽管两者常被混用,物理人工智能严格要求具备实体化的真实世界硬件。具身人工智能的范畴更广,涵盖在模拟3D物理环境中训练的虚拟代理,NVIDIA机器人平台
  • 人工智能代理传统人工智能代理在数字空间中运作(例如浏览网页或编写代码)。具身代理则专精于处理空间维度、物理约束及连续的感官流。

实际应用

认知推理与物理动作的融合已在多个行业催生出变革性应用,相关成果在ACM人工智能研究数字图书馆中被大量收录。

  • 自动驾驶汽车:无人驾驶汽车依靠具身智能在城市街道中导航。它们处理持续的激光雷达和摄像头数据来解读交通标志和行人动态,正如Waymo的自动驾驶技术那样,在动态的城市环境中安全地与之互动。
  • 智能制造Ultralytics 的机械臂执行复杂装配线任务。它们能动态识别、拾取并分拣缺陷零件,展现了近期DeepMind机器人研究探索的核心原理。
  • 农业无人机:无人驾驶飞行器 通过空间感知技术监测作物健康状况,仅在需要区域智能喷洒资源,从而减少浪费并提高产量。

为具身智能体构建感知能力

开发者在构建这些物理系统时,常借助Ultralytics 动态训练数据进行标注,并将轻量级边缘AI模型无缝部署至低功耗硬件设备。

以下是一个Python ,演示机器人代理如何利用视觉模型持续detect 其环境中的detect 物体。

from ultralytics import YOLO

# Load the lightweight YOLO26 model designed for real-time edge hardware
model = YOLO("yolo26n.pt")

# Perform continuous object detection on a robotic camera feed
results = model.predict(source="camera_feed.mp4", stream=True)

# Process the spatial bounding boxes to guide robotic interaction
for r in results:
    print(f"Detected {len(r.boxes)} objects ready for physical interaction.")

随着硬件设计与认知建模领域的成熟——在诸如Anthropic安全研究和 OpenAI最新推理模型等对齐努力的指引下——具身系统将持续从研究实验室走向日常生活环境,正如《IEEE Spectrum》机器人报道中屡屡强调的那样。

使用Ultralytics YOLO增强动力

为您的项目获取高级 AI 视觉。立即找到适合您目标的许可证。

探索许可选项