Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Generative AI

Исследуй основы генеративного ИИ. Узнай, как он создает синтетические данные, интегрируется с Ultralytics YOLO26 и стимулирует инновации в компьютерном зрении.

Генеративный ИИ относится к подмножеству искусственного интеллекта (ИИ), ориентированному на создание нового контента, такого как текст, изображения, аудио, видео и программный код, в ответ на пользовательские запросы. В отличие от традиционных систем ИИ, предназначенных в первую очередь для анализа или классификации существующих данных, генеративные модели используют алгоритмы глубокого обучения (DL) для изучения базовых закономерностей, структур и распределений вероятностей в огромных наборах данных. После обучения эти системы могут генерировать новые результаты, которые имеют статистическое сходство с обучающими данными, но являются уникальными творениями. Эта возможность сделала генеративный ИИ краеугольным камнем современных фундаментальных моделей, стимулируя инновации в креативных индустриях, разработке программного обеспечения и научных исследованиях.

Link to this sectionКак работают генеративные модели#

В основе генеративного ИИ лежат сложные архитектуры нейронных сетей, которые учатся кодировать и декодировать информацию. Эти модели обычно обучаются с использованием обучения без учителя на обширных корпусах данных.

  • Трансформеры: Для текста и кода архитектура Transformer использует механизмы, такие как self-attention, для отслеживания связей между словами на больших расстояниях в последовательности. Это позволяет большим языковым моделям (LLM) генерировать связный и контекстуально релевантный текст.
  • Диффузионные модели: Для генерации изображений диффузионные модели работают путем добавления шума к изображению, пока оно не станет неузнаваемым, а затем учатся обращать этот процесс, чтобы восстановить четкое изображение из случайного шума.
  • GAN: Генеративно-состязательные сети (GAN) используют две нейронные сети — генератор и дискриминатор, которые соревнуются друг с другом, заставляя генератор создавать все более реалистичные результаты.

Link to this sectionГенеративный против дискриминативного ИИ#

Чтобы понять генеративный ИИ, крайне важно отличать его от дискриминативного ИИ. Хотя оба они являются столпами машинного обучения, их цели существенно различаются.

  • Генеративный ИИ фокусируется на создании. Он моделирует распределение отдельных классов для генерации новых образцов. Например, модель вроде Stable Diffusion создает новое изображение собаки на основе текстовых описаний.
  • Дискриминативный ИИ фокусируется на классификации и прогнозировании. Он изучает границы решений между классами для категоризации входных данных. Высокопроизводительные модели компьютерного зрения, такие как YOLO26, являются дискриминативными; они превосходны в обнаружении объектов, анализируя изображение для идентификации и локализации конкретных объектов (например, обнаружение собаки на фотографии), а не создавая само изображение.

Link to this sectionРеальные приложения#

Универсальность генеративного ИИ позволяет применять его в различных областях, часто в тандеме с дискриминативными моделями для создания мощных рабочих процессов.

  1. Генерация синтетических данных: Одним из наиболее практических применений для инженеров по компьютерному зрению является создание синтетических данных. Сбор реальных данных для редких граничных случаев — таких как специфические промышленные дефекты или опасные дорожные условия — может быть опасным или дорогостоящим. Генеративные модели могут создавать тысячи фотореалистичных изображений таких сценариев. Затем эти данные используются для обучения надежных детекторов, таких как YOLO26, повышая их точность в реальных условиях.

  2. Креативный дизайн и прототипирование: В творческом секторе инструменты, основанные на моделях text-to-image, позволяют дизайнерам быстро визуализировать концепции. Введя запрос, художник может сгенерировать несколько вариантов дизайна продукта, архитектурного макета или маркетингового актива, что значительно ускоряет фазу формирования идей.

  3. Генерация и отладка кода: Разработка программного обеспечения была преобразована моделями, обученными на репозиториях кода. Эти помощники помогают разработчикам, предлагая фрагменты кода, написание документации и даже выявление ошибок, оптимизируя жизненный цикл программного обеспечения.

Link to this sectionСинергия с компьютерным зрением#

Генеративный ИИ и дискриминативные модели компьютерного зрения часто функционируют как взаимодополняющие технологии. Общий конвейер включает использование генеративной модели для дополнения набора данных с последующим обучением дискриминативной модели на этом улучшенном наборе данных с использованием таких инструментов, как Ultralytics Platform.

Следующий пример на Python демонстрирует, как использовать пакет ultralytics для загрузки модели YOLO26. В гибридном рабочем процессе ты можешь использовать этот код для проверки объектов внутри синтетически сгенерированного изображения.

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Run inference on an image (e.g., a synthetic sample from a generative model)
# The model identifies objects within the generated content
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results to verify the synthetic data quality
results[0].show()

Link to this sectionПроблемы и соображения#

Несмотря на свою мощность, генеративный ИИ создает специфические проблемы, с которыми пользователям приходится сталкиваться. Модели могут иногда порождать галлюцинации, создавая правдоподобно звучащую, но фактически неверную информацию или визуальные артефакты. Кроме того, поскольку эти модели обучаются на данных масштаба интернета, они могут непреднамеренно распространять предвзятость в ИИ, присутствующую в исходном материале.

Этическая озабоченность по поводу авторских прав и интеллектуальной собственности также занимает важное место, как обсуждается в различных структурах этики ИИ. Исследователи и организации, такие как Stanford Institute for Human-Centered AI, активно работают над методами обеспечения ответственной разработки и развертывания этих мощных инструментов. Кроме того, вычислительные затраты на обучение этих массивных моделей привели к повышенному интересу к квантованию моделей для повышения энергоэффективности вывода на граничных устройствах.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.
Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.
Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.
Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.
Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.
Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.
Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения