Ensemble

发现集成学习 (Ensemble Learning) 如何提高准确性并减少过拟合。学习结合多种模型（如 Ultralytics YOLO26）以获得卓越的计算机视觉成果。

集成学习是一种机器学习 (ML)中的强大策略，它将多个独立的模型（通常被称为“弱学习器”）组合起来以产生单一的预测输出。其基本前提是，一组模型往往比任何单个模型更能实现更高的准确率和更好的泛化能力。通过聚合来自不同算法的预测，集成方法能有效降低过拟合训练数据的风险，消除随机误差，并提高系统的整体稳定性。这种方法类似于咨询专家小组，而不是依靠单一专家的意见来做出关键决策。

Link to this section集成学习的机制#

集成方法的有效性在于其能够处理偏差-方差权衡。单个模型可能存在高方差（对噪声敏感）或高偏差（过于简单化）的问题。集成通过特定技术缓解了这些问题：

Bagging (自助聚合)： 该技术涉及在数据集的不同子集上训练同一算法的多个实例。最著名的例子是随机森林算法，它聚合了许多决策树的决策以降低方差。
Boosting： 与 Bagging 不同，Boosting 是按顺序训练模型的。每个新模型都专注于纠正前一个模型所犯的错误。像 LightGBM 和 CatBoost 这样流行的框架利用这一点来创建高精度的预测系统。
Stacking (堆叠泛化)： 这涉及训练一个新的“元模型”来结合多个异构基础模型（例如神经网络和支持向量机）的预测。

Link to this section计算机视觉中的集成#

In the field of computer vision (CV), ensembles are frequently used to maximize performance in competitions and critical safety applications. For object detection, this often involves running multiple models—such as different versions of YOLO26—on the same image. The resulting bounding boxes are then merged using techniques like Non-Maximum Suppression (NMS) or Weighted Box Fusion (WBF) to derive the most probable object locations.

Link to this section实际应用#

集成方法在预测可靠性至关重要的行业中无处不在。

医学诊断与影像： 在医疗保健领域，避免假阴性至关重要。集成模型可能会结合在 X 射线图像上训练的卷积神经网络 (CNN) 和视觉 Transformer (ViT) 来检测异常。模型之间达成的一致性提供了更高的置信度，协助放射科医生检测肿瘤或诊断罕见病症。
金融欺诈检测： 金融机构使用集成来分析交易模式。通过将逻辑回归模型与梯度提升机相结合，系统可以检测到单个模型可能忽略的细微欺诈迹象，同时保持较低的误报率。

Link to this section使用 Python 实现模型集成#

你可以通过加载多个已训练好的模型并为同一输入生成预测来模拟基本的推理集成。Ultralytics 平台让你能轻松训练这些变体。以下示例演示了如何加载两个不同的 Ultralytics YOLO 模型 (YOLO26n 和 YOLO26s) 来验证图像上的检测结果。

from ultralytics import YOLO

# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")

# Define the image source
source = "https://ultralytics.com/images/bus.jpg"

# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)

# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")