深圳Yolo 视觉
深圳
立即加入
词汇表

数据挖掘

了解数据挖掘如何将原始数据转化为可执行的洞见,从而为医疗保健、零售等领域的 AI、ML 和实际应用提供动力!

数据挖掘是探索和分析大型数据集以发现有意义模式的计算过程、 趋势和关系。通过将原始信息转化为可操作的 知识,这门学科是统计分析和人工智能(AI)之间的重要桥梁。 人工智能(AI)之间的重要桥梁。 企业利用数据挖掘来预测未来行为、识别异常情况并支持战略决策。 决策。现代数据挖掘通常与结构化数据库管理联系在一起,但它在很大程度上利用了 机器学习 (ML)算法来处理 非结构化输入,如文本、视频和传感器日志,将大数据转化为宝贵的组织资产。 大数据变成宝贵的组织资产。

流程的核心组成部分

数据挖掘的工作流程通常遵循标准的 跨行业数据挖掘标准流程 (CRISP-DM),该流程可指导从业人员从了解业务目标到部署模型。

  • 数据收集和注释 这一过程首先要从事务数据库、物联网传感器或图像存储库等不同来源收集原始信息、 或图像存储库。
  • 数据预处理原始数据 很少可以进行分析。这一阶段包括 数据清理,以去除噪音和处理缺失值 值,通常利用 Pandas等库来进行高效处理。
  • 模式发现:应用算法提取隐藏结构。这可能涉及 特征提取,以分离出最 相关变量进行分析。
  • 解释:对挖掘出的模式进行验证,以确保它们代表的是有用的知识,而不是随机的相关性 而不是随机的相关性。 数据可视化工具的帮助。

关键技术和方法

数据挖掘采用各种统计和 ML 技术来解决特定问题。

  • 分类这种技术 将数据项归入预定义的类别。例如,电子邮件提供商使用分类法将邮件 为 "垃圾邮件 "或 "收件箱"。
  • 聚类分析与 分类法不同,聚类是在没有预定义标签的情况下对相似数据点进行分组。它是 无监督学习的核心方法,常用于 市场细分。
  • 关联规则学习 这种方法可以识别数据集中变量之间的关系。它在零售市场篮子 分析中,发现购买面包的顾客也有可能购买黄油。
  • 异常检测这 这对于欺诈检测和网络安全至关重要。 网络安全至关重要。

实际应用

数据挖掘为智能系统提供动力,推动各主要行业提高效率。

  • 零售业的人工智能零售商挖掘大量的 交易历史记录,以优化供应链和个性化购物体验。通过分析购买 模式,公司建立 推荐系统 用户最有可能购买的产品,从而大幅增加收入。像 Google Cloud Retail等平台整合了这些功能,以预测 需求。
  • 医学图像分析 在医疗保健领域,数据挖掘被应用于病人记录和诊断成像。先进的模型如 YOLO11等先进模型可对视觉数据进行 "挖掘",以查找异常情况并对其进行分类。 对异常情况进行classify ,例如识别 磁共振成像扫描中的脑肿瘤。这有助于 美国国立卫生研究院(NIH)指出,这有助于放射科医生突出显示需要仔细检查的潜在问题。 美国国立卫生研究院(NIH)指出。

代码示例:挖掘可视化数据

在计算机视觉领域,"挖掘 "通常是指从非结构化图像数据中提取结构化信息(类标签和计数)。 从非结构化图像数据中提取结构化信息(类标签和计数)。下面的示例演示了如何使用 ultralytics 库来 detect 对象并提取其类别名称和置信度分数。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to mine object data from images
model = YOLO("yolo11n.pt")

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract and display mined insights: detected classes and confidence
for result in results:
    for box in result.boxes:
        cls_id = int(box.cls[0])
        print(f"Detected: {model.names[cls_id]} | Confidence: {box.conf.item():.2f}")

区分相关概念

必须将数据挖掘与数据科学领域的类似术语区分开来。

  • 数据分析数据挖掘 侧重于自动发现模式,而分析则是一个更广泛的术语,包括解释、交流和应用这些模式来支持业务决策、 交流以及应用这些模式来支持业务决策。
  • 深度学习(DL)深度学习是 是受神经网络启发的机器学习的一个专门子集。数据挖掘通常利用深度学习算法作为 工具来执行发现过程,尤其是在处理复杂任务(如 对象检测或自然语言处理等复杂任务时尤其如此。
  • 预测建模这是 通常是从数据挖掘中得出的特定结果。数据挖掘是通过探索数据来发现模式,而预测建模则是利用模式来预测未来事件。 建模则利用这种模式来预测未来事件。 SAS Analytics.

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入