Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024
Глоссарий

Глубокое обучение (DL)

Откройте для себя возможности глубокого обучения: изучите нейронные сети, методы обучения и реальные приложения в ИИ, здравоохранении и других областях.

Глубокое обучение (DL) — это специализированная подобласть машинного обучения (ML), которая использует многослойные нейронные сети для обучения на огромных объемах данных. Вдохновленные структурой человеческого мозга, модели DL, часто называемые глубокими нейронными сетями, предназначены для автоматического изучения иерархических представлений данных. Это означает, что начальные слои изучают простые признаки, а последующие слои объединяют их для изучения все более сложных закономерностей. Эта возможность сделала DL движущей силой основных достижений в области искусственного интеллекта (AI), особенно в таких сложных областях, как компьютерное зрение (CV) и обработка естественного языка (NLP).

Как работает глубокое обучение

В основе глубокого обучения лежат глубокие нейронные сети, которые представляют собой нейронные сети с несколькими скрытыми слоями между входным и выходным слоями. «Глубокий» в глубоком обучении относится к этой глубине. Каждый слой содержит обрабатывающие элементы (нейроны), которые применяют математическую операцию, управляемую функцией активации, к своим входным данным. Во время обучения в сеть подаются большие наборы данных, и алгоритм под названием обратное распространение используется для настройки внутренних параметров сети, или весов. Этот процесс настройки, обычно управляемый алгоритмом оптимизации, таким как градиентный спуск, минимизирует разницу между прогнозами модели и фактической истиной, как определено функцией потерь. Это позволяет сети автоматически обнаруживать сложные закономерности, не будучи явно запрограммированной на это. Ключевой исторической работой, которая помогла популяризировать современное DL, является статья AlexNet 2012 года, которая достигла самых современных результатов на наборе данных ImageNet.

Глубокое обучение против машинного обучения

Глубокое обучение является подмножеством машинного обучения, но основное различие заключается в их подходе к представлению данных. Традиционные методы машинного обучения часто в значительной степени полагаются на ручную разработку признаков, когда эксперты в предметной области тщательно разрабатывают признаки из необработанных данных, чтобы помочь модели делать точные прогнозы. В отличие от этого, модели глубокого обучения выполняют автоматическое извлечение признаков. Иерархическая структура глубоких сетей позволяет им изучать релевантные признаки непосредственно из данных. Это делает глубокое обучение особенно мощным для обработки неструктурированных данных, таких как изображения, текст и аудио, где ручная разработка признаков часто непрактична. Например, в распознавании изображений модель глубокого обучения может научиться идентифицировать края и текстуры на своих первых слоях, затем части объектов, такие как глаза и носы, на средних слоях, и, наконец, целые объекты, такие как лица, на более глубоких слоях.

Приложения и примеры

Способность глубокого обучения обрабатывать сложные данные привела к его внедрению в многочисленных отраслях и приложениях. Два ярких примера включают:

  1. Автономные транспортные средства: Автомобили с автоматическим управлением в значительной степени полагаются на глубокое обучение (DL) для восприятия в реальном времени. Модели Ultralytics YOLO, семейство современных моделей DL, используются для обнаружения объектов для идентификации пешеходов, других транспортных средств и дорожных знаков. Аналогично, DL используется для сегментации изображений, чтобы отличать пригодную для движения дорожную поверхность от ее окружения, что имеет решающее значение для безопасной навигации. Подробнее об этом можно прочитать в статье об использовании ИИ в самоуправляемых автомобилях.
  2. Анализ медицинских изображений: В здравоохранении модели DL помогают рентгенологам, анализируя медицинские сканы. Сверточные нейронные сети (CNN), популярная архитектура DL для зрения, может быть обучена обнаруживать аномалии, такие как опухоли на МРТ головного мозга или признаки заболевания на рентгеновских снимках, с высокой точностью. Это может привести к более ранней диагностике и улучшению результатов лечения пациентов, как это видно в таких приложениях, как обнаружение опухолей головного мозга.

Инструменты и фреймворки

Разработка моделей глубокого обучения (DL) облегчается различными программными библиотеками и платформами. Популярные фреймворки с открытым исходным кодом включают в себя:

Платформы, такие как Ultralytics HUB, предоставляют интегрированные среды для обучения пользовательских моделей, развертывания и управления моделями DL, особенно для задач компьютерного зрения с использованием таких моделей, как YOLO11. Эффективная разработка часто включает в себя такие методы, как тщательная настройка гиперпараметров, понимание метрик производительности и использование ускорения GPU для эффективного обучения моделей. Разработка и развертывание этих сложных систем часто управляется с помощью практик MLOps.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас
Ссылка скопирована в буфер обмена