Ensemble
发现集成学习 (Ensemble Learning) 如何提高准确性并减少过拟合。学习结合多种模型(如 Ultralytics YOLO26)以获得卓越的计算机视觉成果。
集成学习是一种机器学习 (ML)中的强大策略,它将多个独立的模型(通常被称为“弱学习器”)组合起来以产生单一的预测输出。其基本前提是,一组模型往往比任何单个模型更能实现更高的准确率和更好的泛化能力。通过聚合来自不同算法的预测,集成方法能有效降低过拟合训练数据的风险,消除随机误差,并提高系统的整体稳定性。这种方法类似于咨询专家小组,而不是依靠单一专家的意见来做出关键决策。
Link to this section集成学习的机制#
集成方法的有效性在于其能够处理偏差-方差权衡。单个模型可能存在高方差(对噪声敏感)或高偏差(过于简单化)的问题。集成通过特定技术缓解了这些问题:
- Bagging (自助聚合): 该技术涉及在数据集的不同子集上训练同一算法的多个实例。最著名的例子是随机森林算法,它聚合了许多决策树的决策以降低方差。
- Boosting: 与 Bagging 不同,Boosting 是按顺序训练模型的。每个新模型都专注于纠正前一个模型所犯的错误。像 LightGBM 和 CatBoost 这样流行的框架利用这一点来创建高精度的预测系统。
- Stacking (堆叠泛化): 这涉及训练一个新的“元模型”来结合多个异构基础模型(例如神经网络和支持向量机)的预测。
Link to this section计算机视觉中的集成#
In the field of computer vision (CV), ensembles are frequently used to maximize performance in competitions and critical safety applications. For object detection, this often involves running multiple models—such as different versions of YOLO26—on the same image. The resulting bounding boxes are then merged using techniques like Non-Maximum Suppression (NMS) or Weighted Box Fusion (WBF) to derive the most probable object locations.
Link to this section实际应用#
集成方法在预测可靠性至关重要的行业中无处不在。
-
医学诊断与影像: 在医疗保健领域,避免假阴性至关重要。集成模型可能会结合在 X 射线图像上训练的卷积神经网络 (CNN) 和视觉 Transformer (ViT) 来检测异常。模型之间达成的一致性提供了更高的置信度,协助放射科医生检测肿瘤或诊断罕见病症。
-
金融欺诈检测: 金融机构使用集成来分析交易模式。通过将逻辑回归模型与梯度提升机相结合,系统可以检测到单个模型可能忽略的细微欺诈迹象,同时保持较低的误报率。
Link to this section使用 Python 实现模型集成#
你可以通过加载多个已训练好的模型并为同一输入生成预测来模拟基本的推理集成。Ultralytics 平台 让你能轻松训练这些变体。以下示例演示了如何加载两个不同的 Ultralytics YOLO 模型 (YOLO26n 和 YOLO26s) 来验证图像上的检测结果。
from ultralytics import YOLO
# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")
# Define the image source
source = "https://ultralytics.com/images/bus.jpg"
# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)
# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")Link to this section集成与数据增强的对比#
区分集成学习与数据增强非常重要。
- 集成侧重于架构和预测阶段,通过组合多个训练好的不同模型来提高结果。
- 数据增强侧重于训练数据阶段,通过(例如通过旋转或翻转)人工增加数据集的多样性,从而训练出单一且更稳健的模型。
虽然数据增强有助于单一模型更好地学习,但集成学习有助于多个模型相互验证输出。这两种策略通常会结合使用,以在实例分割和姿态估计等任务中取得最先进的结果。






