自动化机器学习 (AutoML)
利用 AutoML 简化机器学习项目!自动执行数据准备、模型选择和调优,以节省时间并使所有人都能使用 AI。
自动机器学习 (AutoML) 是自动执行机器学习 (ML)模型开发中耗时且重复性任务的过程。它旨在使非专业人员也能使用高性能 ML 模型,并通过自动选择特征、算法和参数来提高数据科学家的生产力。通过处理从数据预处理到模型部署的任务,AutoML 简化了整个工作流程,从而能够更快地进行实验并创建更准确、更高效的模型。这种自动化是使高级人工智能更易于访问和扩展的关键一步。
AutoML 的工作原理
AutoML 系统可自动执行 机器学习流程 中最重复的部分。典型的 AutoML 流程涉及几个关键阶段:
- 数据准备和特征工程:自动清理原始数据并为模型生成有意义的特征。这可以包括处理缺失值、归一化以及从现有变量创建新的预测变量。
- 模型选择: 从各种可能性中为给定问题选择最合适的算法(例如,决策树、支持向量机或神经网络)。
- 超参数优化: 自动查找所选模型的最佳超参数。这通常使用复杂的搜索策略来完成,例如贝叶斯优化、网格搜索或进化算法。 Ultralytics 将此功能集成到其工具中,用于超参数调优等任务。
- 模型评估和迭代: 使用诸如准确率或F1 分数等指标评估模型的性能,并通过迭代该过程以获得更好的结果。
实际应用
AutoML 正在众多行业中得到应用,以加速开发并改善结果。
- 医疗保健中的人工智能: 在 医学图像分析 中,AutoML 可以快速测试不同的 图像分割 模型,以检测扫描图像中的肿瘤。 系统可以在 脑肿瘤数据集 等数据集上自动训练和评估各种架构,从而显著减少研究人员开发可部署诊断工具所需的时间。
- 金融服务: 银行使用 AutoML 构建欺诈检测模型。通过将历史交易数据输入到 AutoML 平台,它们可以自动生成和优化模型,以高精度识别欺诈模式,这项任务如果由数据科学家手动完成,则需要大量的人力。这在金融领域的计算机视觉中得到了进一步的探讨。
AutoML 与相关概念
区分 AutoML 与相关领域是有帮助的:
- AutoML 与 MLOps:虽然 AutoML 专门针对模型构建(选择、训练、调整)的自动化,但机器学习运维 (MLOps) 涵盖了整个 ML 生命周期。MLOps 包括部署、监控、管理和治理,确保模型在生产环境中可靠运行。AutoML 通常是更大的 MLOps 框架中的一个组件,可在模型部署和模型监控之前简化初始开发阶段。
- AutoML 与 NAS:神经架构搜索 (NAS) 是 AutoML 的一个子领域,专门侧重于自动设计神经网络的架构。虽然 NAS 可自动执行网络设计,但更广泛的 AutoML 工具还可以自动执行各种模型类型(而不仅仅是 NN)的特征工程和超参数调整。
AutoML 工具和平台
许多工具和平台都促进了 AutoML: