使用Ultralytics YOLO 探索图像分割的强大功能。探索像素级精度、类型、应用和真实的人工智能使用案例。
图像分割是计算机视觉 (CV) 计算机视觉 (CV)中的一项核心技术。 将数字图像分割成多个像素子组,通常称为图像分割。其主要目的是 主要目的是将图像的表示简化为更有意义、更易于分析的图像。与之不同的是 物体检测将物体定位在一个 不同的是,图像分割提供的是 精确的、像素级的物体形状图。这一过程可为图像中的每个像素分配一个标签,从而使 人工智能(AI)模型 了解场景中实体的确切边界和轮廓。
在许多现代机器学习(ML)工作流程中,知道一个物体的大致位置是不够的、 知道物体的大致位置是不够的。需要与物理世界交互的应用 如机器人抓取包裹或汽车在蜿蜒曲折的道路上行驶,这些应用需要对几何形状有细致的了解。 几何形状。图像分割将原始视觉数据转换为一组分类区域,从而弥补了这一差距。这种 这种能力由先进的 深度学习(DL)架构,特别是 卷积神经网络(CNN),它可以提取空间特征来区分前景物体和背景。
了解具体的细分任务对于选择正确的模型架构至关重要。三个主要 是
精确划界的能力使细分在各行各业都不可或缺:
现代框架简化了分割任务的执行。旧式的两阶段检测器,如 掩膜 R-CNN 等旧式两阶段检测器虽然准确,但速度较慢,而单阶段模型则为这一领域带来了革命性的变化。 通过提供 实时推理。我们的 Ultralytics YOLO11 模型原生支持实例细分。展望未来、 正在开发YOLO26,以进一步优化这些 端到端处理功能。
开发人员可以使用标准库,如 OpenCV等标准库进行预处理 和可视化,同时使用 PyTorch框架进行繁重的 模型推理。
下面是一个简明示例,说明如何使用Python 中预先训练好YOLO11 模型执行实例分割:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks overlaid
results[0].show()
该代码片段可自动处理特征提取、边界框回归和掩码生成等复杂任务。 生成等复杂任务,使开发人员可以专注于将 将分割结果集成到 大型应用程序中。