Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Интеллектуальный анализ данных

Узнайте, как интеллектуальный анализ данных преобразует необработанные данные в полезную информацию, расширяя возможности ИИ, машинного обучения и реальных приложений в здравоохранении, розничной торговле и других областях!

Добыча данных - это вычислительный процесс изучения и анализа больших массивов данных с целью обнаружения значимых закономерностей, тенденций и взаимосвязей, которые не очевидны сразу. Преобразуя необработанную информацию в действенные знания, эта дисциплина служит важнейшим связующим звеном между статистическим анализом и искусственным интеллектом (ИИ). искусственным интеллектом (ИИ). Организации используют добычу данных для прогнозирования будущего поведения, выявления аномалий и поддержки принятия стратегических решений. принятия решений. Несмотря на то, что добыча данных часто ассоциируется с управлением структурированными базами данных, в современной добыче данных активно используются алгоритмы машинного обучения (ML) для обработки неструктурированных данных, таких как текст, видео и журналы датчиков. Большие данные превращаются в ценный организационный актив.

Основные компоненты процесса

Рабочий процесс добычи данных обычно соответствует стандарту Cross-Industry Standard Process for Data Mining (CRISP-DM), который направляет практиков от понимания бизнес-целей до развертывания моделей.

  • Сбор и аннотирование данных: Процесс начинается со сбора исходной информации из различных источников, таких как транзакционные базы данных, датчики IoT, или хранилища изображений.
  • Предварительная обработка данных: Необработанные данные редко бывают готовы к анализу. Этот этап включает очистку данных для удаления шумов и обработки отсутствующих значений, часто с использованием таких библиотек, как Pandas для эффективного манипулирования.
  • Обнаружение паттернов: Алгоритмы применяются для извлечения скрытых структур. Это может включать извлечение признаков для выделения наиболее наиболее значимых переменных для анализа.
  • Интерпретация: Добытые закономерности проверяются, чтобы убедиться, что они представляют собой полезные знания, а не случайные корреляции. а не случайные корреляции, часто с помощью инструменты визуализации данных.

Ключевые техники и методы

При добыче данных используются различные статистические и ML-методы для решения конкретных задач.

  • Классификация: Эта техника классифицирует элементы данных по заранее определенным классам. Например, поставщики электронной почты используют классификацию для фильтрации сообщений в "спам" или "входящие".
  • Кластерный анализ: В отличие от В отличие от классификации, кластеризация группирует похожие точки данных без заранее заданных меток. Это основной метод в неконтролируемого обучения, часто используемый для сегментации рынка.
  • Обучение ассоциативным правилам: Этот метод выявляет взаимосвязи между переменными в наборе данных. Известно, что он используется в анализе рыночной корзины в розничной торговле для определения того, что клиенты, покупающие хлеб, с большой вероятностью будут покупать и масло.
  • Обнаружение аномалий: Этот Направлен на выявление аномалий, которые значительно отклоняются от нормы, что имеет решающее значение для обнаружения мошенничества и сетевой безопасности.

Применение в реальном мире

Добыча данных позволяет создавать интеллектуальные системы, обеспечивающие эффективность в крупнейших отраслях промышленности.

  • ИИ в розничной торговле: Ритейлеры обрабатывают огромные истории транзакций, чтобы оптимизировать цепочки поставок и персонализировать покупки. Анализируя модели покупок анализируя модели покупок, компании создают рекомендательные системы, которые предлагают товары, которые пользователи, скорее всего, купят, что значительно увеличивает доход. Такие платформы, как Google Cloud Retail, объединяют эти возможности для прогнозирования спроса.
  • Анализ медицинских изображений: В здравоохранении поиск данных применяется к записям пациентов и диагностическим изображениям. Продвинутые модели, такие как YOLO11 могут "добывать" визуальные данные, чтобы находить и classify отклонений, например для выявления опухоли мозга на снимках МРТ. Это помогает радиологам, выделяя потенциальные проблемы, требующие более тщательного изучения, как отмечают Национальные институты здоровья (NIH).

Пример кода: Добыча визуальных данных

В компьютерном зрении "добыча" часто означает извлечение структурированной информации (меток классов и подсчетов) из неструктурированных данных изображения. Следующий пример демонстрирует, как использовать функцию ultralytics библиотека для detect объектов и извлечения их названий классов и баллов доверия.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to mine object data from images
model = YOLO("yolo11n.pt")

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract and display mined insights: detected classes and confidence
for result in results:
    for box in result.boxes:
        cls_id = int(box.cls[0])
        print(f"Detected: {model.names[cls_id]} | Confidence: {box.conf.item():.2f}")

Различение смежных понятий

Важно отличать добычу данных от аналогичных терминов в области науки о данных.

  • Аналитика данных: В то время как добыча данных сосредоточена на автоматическом обнаружении закономерностей, аналитика - более широкий термин, который включает в себя интерпретацию, интерпретацию, передачу и применение этих закономерностей для поддержки бизнес-решений.
  • Глубокое обучение (Deep Learning, DL): DL - это специализированное подмножество машинного обучения, вдохновленное нейронными сетями. При добыче данных алгоритмы DL часто используются в качестве инструменты для выполнения процесса обнаружения, особенно при решении сложных задач, таких как обнаружение объектов или обработка естественного языка.
  • Предиктивное моделирование: Это конкретный результат, часто получаемый в результате анализа данных. В то время как добыча данных исследует данные для поиска закономерностей, предиктивное моделирование использует эту закономерность для прогнозирования будущих событий, и это различие подчеркивает SAS Analytics.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас