术语表

数据分析

了解数据分析如何通过优化数据质量、发掘洞察力和实现智能决策来推动人工智能和 ML 取得成功。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

数据分析涉及对数据或统计数据进行系统的计算检查。它包括对数据进行检查、清理、转换和建模,以发现有用信息、得出结论并支持知情决策。在人工智能(AI)机器学习(ML)领域,数据分析是准备数据集、通过探索性数据分析(EDA)等技术了解数据特征、提取有意义的特征以及评估模型性能的基础。这种严格的分析最终有助于建立更强大、更可靠的人工智能系统,包括以下复杂的模型 Ultralytics YOLO等复杂模型,用于物体检测等任务。

数据分析与人工智能和机器学习的相关性

数据分析是人工智能和 ML 项目取得成功的基础。在训练复杂的模型之前,需要对原始数据进行彻底分析。这涉及到一些关键步骤,如数据清理以解决错误和不一致问题,以及数据预处理以将数据格式适合算法。EDA 等技术通常通过使用Seaborn 等工具进行数据可视化来增强,有助于揭示数据中的潜在模式、结构、异常值和潜在偏差。对这些方面的深刻理解对于选择合适的模型、确保数据质量和实现有效的训练至关重要,通常由Ultralytics HUB 等平台进行管理。

此外,在模型训练之后,数据分析仍然至关重要。评估模型性能包括使用准确率平均 精度 (mAP)等指标,对照基本真实数据分析预测结果。您可以在我们的指南中了解有关YOLO 性能指标的更多信息。这一分析过程有助于找出模型的弱点,了解错误类型(通常使用混淆矩阵可视化),并通过超参数调整或探索不同的模型架构等方法指导改进工作。框架,如 PyTorchTensorFlow等框架,以及用于数据处理的Pandas等库,都是这一过程中的常用工具。

数据分析与相关概念

数据分析与其他几个术语虽然相关,但也有区别:

  • 数据挖掘主要侧重于在大型数据集中发现以前未知的新模式和关系。数据分析通常涉及分析已知数据方面或测试特定假设,但也可能包括探索性发现。进一步了解数据挖掘在计算机视觉中的作用
  • 机器学习(ML)使用算法从数据(通常通过数据分析进行准备和分析)中学习,无需明确编程即可做出预测或决策。分析为 ML 模型提供洞察力和准备好的数据。ML 是一种实现人工智能的方法,而数据分析则是一种应用数据的过程。
  • 大数据指极其庞大和复杂的数据集。数据分析是从数据中提取价值和见解的过程,无论其是否符合 "大数据 "的条件。大数据分析将分析技术专门应用于这些大型数据集。
  • 数据可视化是数据和信息的图形表示。它是更广泛的数据分析过程中用于探索数据和有效交流发现的关键工具。请参阅我们的TensorBoard 集成指南中的示例。
  • 商业智能(BI):通常更侧重于描述性分析(发生了什么),利用历史数据为业务决策提供信息,通常通过仪表盘和报告来实现。数据分析可包括描述性分析、诊断性分析、预测性分析和规范性分析。更多信息,请访问Gartner 的 IT 术语表

真实世界的人工智能/移动语言应用

数据分析有助于推动众多人工智能应用取得进展:

  1. 医学图像分析在人工智能模型检测医学扫描(如 X 射线或核磁共振成像)中的异常之前,需要广泛使用数据分析技术。原始图像要经过预处理(归一化、调整大小)和清理。探索性分析有助于了解数据集(如脑肿瘤数据集)中图像质量或患者人口统计学方面的差异。分析有助于识别相关特征,并根据专家注释评估诊断模型的性能(准确性、灵敏度、特异性),从而指导临床使用的改进。美国国立卫生研究院生物医学数据科学计划等资源凸显了其重要性。了解YOLO 模型如何用于医学成像中的肿瘤检测
  2. 人工智能驱动的零售库存管理零售商利用数据分析来优化库存水平,减少浪费。这包括分析历史销售数据、识别季节性趋势和了解客户购买模式(预测建模)。此外,计算机视觉(CV)系统由利用分析的视觉数据训练的模型驱动,可以实时监控货架库存。数据分析通过分析检测准确性以及将库存数据与销售结果联系起来,对这些系统的有效性进行评估,从而实现更智能的补货策略。探索Google Cloud AI for Retail行业解决方案。Ultralytics 提供对人工智能的见解,以实现 更智能的零售库存管理,并利用人工智能提高零售效率

数据分析为构建、完善和验证从医疗保健农业制造业等不同领域的有效人工智能和 ML 系统提供了所需的重要见解。利用Ultralytics HUB等平台可以简化从数据分析到模型部署的流程。

阅读全部