遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Video Understanding

探索视频理解如何分析时间动态以解释动作。学习使用 Ultralytics YOLO26 实现实时追踪,以应用于先进 AI。

视频理解是计算机视觉 (CV)的一个高级分支,旨在让机器能够感知、分析并解析随时间变化的视觉数据。与处理独立静态快照的标准图像识别不同,视频理解涉及分析帧序列以掌握时间动态、背景信息和因果关系。通过处理时间这个“第四维度”,AI 系统不仅能识别物体,还能理解场景中发生的动作、事件及其叙事过程。这种能力对于创建能够在动态真实环境中安全有效交互的智能系统至关重要。

Link to this section视频分析的核心组件#

要成功解析视频内容,模型必须综合两种主要类型的信息:空间特征(画面中有什么)和时间特征(事物如何变化)。这需要复杂的架构,通常结合了多种神经网络策略。

Link to this section实际应用#

理解时间语境的能力为各行各业的先进自动化打开了大门。

  • 自动驾驶车辆:自动驾驶汽车利用视频理解来预测行人和车辆的轨迹。通过分析运动模式,系统可以预判潜在碰撞并执行复杂的机动动作。
  • 动作识别:在体育分析和医疗保健监控中,系统能够识别特定的人类活动——例如运动员进球或病人跌倒——以提供自动化的洞察或警报。
  • 智慧零售:商店利用这些系统进行异常检测,以识别盗窃行为或分析顾客人流模式,从而优化店面布局。
  • 内容审核:大型媒体平台使用视频理解来自动标记不当内容或按主题分类上传内容,极大地减少了人工审核的需求。

Link to this section区分相关概念#

虽然视频理解涵盖了广泛的功能,但它与 AI 领域中几个相关术语有所不同。

  • 视频理解与目标追踪:追踪侧重于在跨帧移动时保持实例(如特定汽车)的唯一身份。而视频理解则解析该车辆的行为,例如识别它正在“停车”或“超速”。
  • 视频理解与姿态估计:姿态估计检测单帧或序列中身体关节的几何结构。视频理解则利用这些数据推断动作的含义,例如“挥手致意”。
  • 视频理解与多模态 AI:视频理解侧重于视觉序列,而多模态 AI 将视频与音频、文本或传感器数据相结合,以进行更全面的分析。

Link to this section使用 YOLO26 实现视频分析#

视频理解的基础步骤是稳健地检测和追踪物体,以建立时间上的连续性。Ultralytics YOLO26 模型为实时追踪提供了顶尖的性能,这构成了更高级行为分析的前奏。

以下示例演示了如何使用 Python API 在视频源上执行目标追踪:

from ultralytics import YOLO

# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Track objects in a video file with persistence to maintain IDs
# 'show=True' visualizes the tracking in real-time
results = model.track(source="path/to/video.mp4", persist=True, show=True)

Link to this section挑战与未来趋势#

Despite significant progress, video understanding remains computationally expensive due to the sheer volume of data in high-definition video streams. Calculating FLOPS for 3D convolutions or temporal transformers can be prohibitive for edge AI devices. To address this, researchers are developing efficient architectures like the Temporal Shift Module (TSM) and leveraging optimization tools like NVIDIA TensorRT to enable real-time inference.

未来的发展正朝着精密的多模态学习方向迈进,模型将整合音频线索(例如警报声)和文本背景信息,以实现更深层次的理解。像 Ultralytics Platform 这样的平台也在不断演进,以简化复杂视频数据集的标注和管理,从而更轻松地为特定时间任务训练自定义模型。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅