敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

数据分析

了解数据分析如何通过优化数据质量、发现见解和支持智能决策来推动 AI 和 ML 的成功。

数据分析是分析原始数据以得出有关该信息的结论的科学。它涉及检查、清理、转换和建模数据,以发现有用的信息、告知结论并支持决策。在 人工智能 (AI)机器学习 (ML) 领域,数据分析是构建、训练和评估高性能模型的基础步骤。通过发现 数据集 中的模式、相关性和异常情况,分析师可以提供指导模型开发并确保其有效性的关键见解。

该过程通常遵循一个生命周期,将原始数据转换为可操作的见解。这包括数据预处理以处理缺失值和不一致性、探索性数据分析以了解关键特征,以及应用统计技术来检验假设。从分析中获得的见解对于诸如特征工程、选择适当的模型架构以及执行超参数调整之类的任务至关重要。通常有四种类型的数据分析,每种分析都提供不同级别的见解,从回顾过去到展望未来。这些包括描述性分析、诊断性分析、预测性分析和规范性分析,如哈佛商学院在线等资源中所述。

真实世界的AI/ML应用

数据分析有助于推动众多 AI 应用的进步:

  1. 医学图像分析: 在人工智能模型可以检测医学扫描中的异常之前,需要广泛使用数据分析。原始图像经过预处理(标准化、调整大小)和清理。探索性分析有助于了解 脑肿瘤数据集 等数据集中图像质量或患者人口统计数据的变化。分析有助于识别相关特征,并根据专家注释评估诊断模型的性能(准确性、敏感性、特异性),从而指导临床使用的改进。NIH 生物医学数据科学计划等资源强调了其重要性。了解 YOLO 模型如何用于医学成像中的肿瘤检测
  2. 人工智能驱动的零售库存管理: 零售商使用数据分析来优化库存水平并减少浪费。这包括分析历史销售数据、识别季节性趋势以及了解客户的预测建模购买模式。此外,由使用分析后的视觉数据训练的模型驱动的计算机视觉(CV)系统可以实时监控货架库存。数据分析通过分析检测准确性并将库存数据与销售结果联系起来来评估这些系统的有效性,从而实现更智能的补货策略。探索Google Cloud AI for Retail以获取行业解决方案。Ultralytics提供了关于利用人工智能提高零售效率的见解。

与相关术语的区别

  • 数据可视化: 数据可视化是信息和数据的图形表示。它是数据分析的一个组成部分,用于通过图表、图形和地图传达发现或探索数据。虽然分析包括数据检查的整个过程,但可视化是用于使结果易于理解的特定工具。像 Tableau 这样的工具很受用于创建引人注目的可视化效果。
  • 数据挖掘: 这是数据分析领域中使用的一种特定技术。数据挖掘侧重于发现大型数据集中以前未知的模式和趋势,通常使用复杂的算法。正如Oracle 所解释的那样,分析使用这些发现的模式来做出明智的决策和检验假设。
  • 机器学习: 机器学习是人工智能的一个子集,专注于构建从数据中学习的系统。数据分析通常通过准备数据、识别特征以及使用平均精度均值 (mAP)等指标评估模型输出来融入 ML 生命周期。虽然分析为人类提供了解释的见解,但 ML 使用这些见解使模型能够做出自主预测。

数据分析提供了构建、改进和验证从医疗保健农业制造业等不同领域的有效 AI 和 ML 系统所需的关键见解。利用Ultralytics HUB等平台可以简化从数据分析到模型部署的过程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板