深圳Yolo 视觉
深圳
立即加入
词汇表

集成

使用集成方法提高预测准确性!了解如何结合多个模型来增强目标检测、自然语言处理等领域的性能。

集合方法是机器学习(ML)中的一种稳健策略。 机器学习(ML)中的稳健策略。 多个不同模型的预测结果进行组合,以优化整体性能。通过汇总不同 这种方法旨在减少单一模型在孤立运行时可能产生的误差,从而有效利用 众智"。主要目标是提高 预测的准确性和稳定性,使最终的 系统对未见数据的通用性更强。这种技术在减少常见问题方面尤为有效,例如 过拟合偏差-方差权衡等常见问题,确保 模型能捕捉到真正的基本模式,而不是训练数据中的噪音。 训练数据中的噪音。

集合学习的核心技术

有几种构建集合的基本策略,每种策略都以不同的方式操纵学习过程 以实现基础模型的多样性。

  • 套袋法(Bootstrap Aggregating) 这种方法是在数据集的不同随机子集上训练同一算法的多个实例。 最有名的例子是随机森林(Random Forest)。 随机森林 通常是通过平均法进行回归或投票法进行分类。
  • 增压与装袋不同、 提升法按顺序训练模型。每个新模型都专注于纠正前一个模型所犯的错误。 算法如AdaBoost梯度提升XGBoost等算法都使用这种方法将弱学习器转换为 强预测器。
  • 堆叠堆叠 泛化包括训练不同的基础模型(例如神经网络和 神经网络支持向量机),然后使用 元学习器 "来组合它们的预测结果。这种元模型可以学习权衡来自基础模型的输入的最佳方法,从而使预测结果最小化。 以最小化最终误差。

实际应用

在高风险环境中,集合方法至关重要。 精度和可靠性至关重要。

  1. 医疗诊断:在 在医学图像分析中,卷积神经网络CNN 卷积神经网络 (CNN) 通常用于detect 肿瘤等异常情况。通过组合在不同视角或分辨率下训练的模型 通过将在不同视角或分辨率下训练的模型组合在一起,系统可获得比任何单个网络更高的灵敏度和特异性,这对医疗领域的人工智能至关重要。 人工智能在医疗保健领域的应用至关重要。
  2. 自主导航:自动驾驶车辆的安全 自动驾驶汽车的安全依赖于强大的 物体检测。工程师通常将多种检测架构 多种检测架构,如 YOLO11RT-DETR-以确保在不同的照明和天气条件下正确识别行人和障碍物。 以确保在不同的照明和天气条件下正确识别行人和障碍物。

用Python实现集合

虽然像 PyTorchTensorFlow等框架允许进行复杂的自定义集合,但您也可以通过运行多个训练有素的模型并汇总其结果来执行基本的 通过运行多个训练有素的模型并汇总其结果来执行基本的集合。下面的示例演示了 加载两个不同的 Ultralytics YOLO模型生成预测 生成预测结果。

from ultralytics import YOLO

# Load two distinct YOLO11 models (e.g., Nano and Small versions)
model_n = YOLO("yolo11n.pt")
model_s = YOLO("yolo11s.pt")

# Run inference on a sample image
image_url = "https://ultralytics.com/images/bus.jpg"
results_n = model_n(image_url)
results_s = model_s(image_url)

# Compare the number of detected objects from each model
print(f"Nano Model Detections: {len(results_n[0].boxes)}")
print(f"Small Model Detections: {len(results_s[0].boxes)}")

合奏与相关术语

将 "Ensemble "与 ML 文献中的类似概念区分开来很有帮助:

  • 模型组合虽然 "集合 "指的是方法或技术,而 "模型集合 "通常描述的是 在生产中部署的特定工件--训练有素的模型文件集合。
  • 专家混合物(MoE) 传统的集合通常会在每次预测时查询所有组成模型。相比之下,MoE 架构 则使用门控机制,对给定输入只选择性地激活最相关的 "专家 "子模型,从而优化计算效率。 子模型,从而优化计算效率。

集合学习仍然是现代数据科学的基石,在 Kaggle 比赛的排行榜,并为最先进的应用提供动力。通过了解 如何有效地组合模型,开发人员就能推动计算机视觉和预测分析的发展。 计算机视觉和预测分析的界限。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入