深圳Yolo 视觉
深圳
立即加入
词汇表

集成

了解集成学习如何提高准确性并减少过拟合。学习如何结合多个模型,例如 Ultralytics YOLO26,以获得卓越的计算机视觉结果。

集成学习是 机器学习 (ML) 中一种强大的策略,它将多个独立模型(通常称为“弱学习器”)组合起来以产生单一的预测输出。其基本前提是,一组模型通常可以比任何单独的模型实现更高的 准确性 和更好的泛化能力。通过聚合来自不同算法的预测,集成方法有效地降低了 过拟合 训练数据 的风险,平滑了随机误差,并提高了整体系统稳定性。这种方法类似于咨询专家小组,而不是仅仅依赖于某个个体的意见来做出关键决策。

集合学习机制

集成方法的有效性在于它们能够处理 偏差-方差权衡。单个模型可能存在高方差(对噪声敏感)或高偏差(过度简化)的问题。集成通过特定技术缓解了这些问题:

计算机视觉中的集成

计算机视觉 (CV) 领域,集成方法常用于在竞赛和关键安全应用中最大化性能。对于 目标检测,这通常涉及在同一图像上运行多个模型,例如不同版本的 YOLO26。然后,使用 非极大值抑制 (NMS)加权框融合 (WBF) 等技术合并生成的 边界框,以得出最可能的目标位置。

实际应用

在预测可靠性至关重要的行业中,集成方法无处不在。

  1. 医学诊断和影像: 在医疗保健领域,避免假阴性至关重要。集成模型可能结合在 X 射线上训练的 卷积神经网络 (CNN)视觉 Transformer (ViT) 来 detect 异常。模型之间的共识提供了更高的置信度分数,协助放射科医生 detect 肿瘤 或诊断罕见疾病。
  2. 金融欺诈 detect: 金融机构使用集成方法分析交易模式。通过将逻辑回归模型与梯度提升机结合,系统可以 detect 单一模型可能遗漏的细微欺诈迹象,同时保持低误报率。

使用 python 实现模型集成

您可以通过加载多个训练好的模型并为相同的输入生成预测来模拟一个基本的推理集成。Ultralytics 平台允许您轻松训练这些变体。以下示例演示了如何加载两个不同的 Ultralytics YOLO 模型(YOLO26n 和 YOLO26s)以验证图像上的 detect 结果。

from ultralytics import YOLO

# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")

# Define the image source
source = "https://ultralytics.com/images/bus.jpg"

# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)

# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")

集成与数据增强

区分 集成 学习与 数据增强 至关重要。

  • 集成侧重于架构预测阶段,结合多个训练好的不同模型以提高结果。
  • 数据增强侧重于训练数据阶段,通过人工增加数据集的多样性(例如,通过旋转或翻转)来训练一个单一、更鲁棒的模型。

尽管数据增强有助于单个模型更好地学习,但集成学习有助于多个模型相互验证输出。这两种策略通常结合使用,以在 实例分割姿势估计 等任务中实现最先进的结果。

让我们一起共建AI的未来!

开启您的机器学习未来之旅