Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Что такое синтетические данные в компьютерном зрении? Обзор

Абирами Вина

5 мин чтения

4 июля 2025 г.

Узнайте, как синтетические данные для обучения моделей ИИ используются в приложениях компьютерного зрения в различных отраслях, таких как здравоохранение и робототехника.

Данные всегда были движущей силой в таких областях, как аналитика и искусственный интеллект (ИИ). Фактически, то, как мы собираем, генерируем и используем данные, формирует будущее интеллектуальных систем. Например, беспилотные автомобили зависят от миллионов размеченных изображений и показаний датчиков, от дорожных знаков до движений пешеходов, чтобы научиться безопасно ориентироваться на дорогах.

Одним из наиболее важных типов данных, обеспечивающих этот прогресс, особенно в таких областях, как автономные транспортные средства и безопасность, являются визуальные данные, такие как изображения и видео. 

В частности, область ИИ, которая позволяет машинам интерпретировать эту визуальную информацию, называется компьютерным зрением. Она помогает системам понимать и анализировать визуальные входные данные так же, как это делают люди, поддерживая такие задачи, как распознавание лиц, обнаружение дорожных знаков и анализ медицинских изображений. 

Однако сбор крупномасштабных и высококачественных визуальных наборов данных из реального мира может быть трудоемким, дорогостоящим и часто вызывает опасения по поводу конфиденциальности. Именно поэтому исследователи активно изучают концепцию использования синтетических данных. 

Синтетические данные — это искусственно сгенерированные визуальные материалы, которые точно имитируют реальные изображения и видео. Они создаются с использованием таких методов, как 3D-моделирование, компьютерное моделирование и генеративные методы ИИ, такие как Generative Adversarial Networks (GANs) (Генеративно-состязательные сети), которые изучают закономерности на основе реальных данных для создания новых реалистичных примеров.

Ожидается, что синтетические данные будут играть решающую роль в развитии AI в ближайшее время — Gartner прогнозирует, что к 2030 году они станут более важными, чем реальные данные. В этой статье мы рассмотрим, что такое синтетические данные в контексте компьютерного зрения, как они генерируются и где они применяются в реальных сценариях. Давайте начнем!

Что такое синтетические данные в компьютерном зрении?

Предположим, вам нужно обучить модель Vision AI для обнаружения объектов в различных средах и условиях. Опора только на реальные данные может быть затруднительной, а иногда и ограничивающей. 

Между тем, синтетические данные можно использовать для создания подходящего набора данных, содержащего объекты в различных искусственно созданных условиях. Используя такие инструменты, как 3D-моделирование и симуляции, разработчики могут генерировать изображения с точным контролем над такими факторами, как освещение, углы и размещение объектов. Это, в свою очередь, обеспечивает большую гибкость для обучения модели, чем данные реального мира.

Синтетические данные особенно полезны, когда сбор реальных данных затруднен или невозможен. Например, для обучения модели распознаванию людей в широком диапазоне поз, таких как бег, приседание или лежание, потребуется захватить тысячи фотографий в различных условиях, под разными углами и при разном освещении. 

С другой стороны, с помощью синтетических данных разработчики могут легко генерировать эти вариации с точными метками, экономя время и усилия и улучшая производительность модели.

Рис. 1. Синтетический набор данных с различными позами людей и вариациями освещения (источник).

Синтетические и реальные данные в AI

Далее давайте подробнее рассмотрим различия между синтетическими и реальными данными. У обоих есть свои плюсы и минусы, когда речь идет об обучении моделей ИИ

Например, синтетические данные полезны, когда реальные данные трудно собрать, но они могут не отражать каждую мелочь, встречающуюся в реальной жизни. В то же время реальные данные более достоверны, но их может быть трудно получить, трудоемко маркировать и они могут не охватывать каждую ситуацию.

Объединяя синтетические и реальные данные, разработчики могут получить лучшее из обоих миров. Этот баланс помогает моделям ИИ учиться точнее, лучше обобщать в различных сценариях и уменьшать предвзятость.

Рис. 2. Синтетические и реальные данные в ИИ. Изображение автора.

Обзор генерации данных для моделей компьютерного зрения

От создания виртуальных миров с помощью 3D-инструментов до генерации изображений с использованием генеративного ИИ — вот некоторые распространенные методы, используемые для создания синтетических данных для обучения моделей компьютерного зрения:

  • 3D-моделирование: Разработчики используют программное обеспечение для 3D-моделирования для создания цифровых объектов и сцен. Это позволяет полностью контролировать такие параметры, как освещение, углы обзора камеры и размещение объектов, и полезно для создания реалистичных изображений людей, транспортных средств и окружающей среды.

  • Симуляции: Они воссоздают реальные ситуации, такие как дорожное движение или заводские условия, с использованием движков, основанных на физике. Симуляции полезны для безопасной генерации данных для обучения в таких областях, как робототехника и самоуправляемые автомобили.

  • Генеративные состязательные сети: GAN — это тип модели глубокого обучения, состоящей из двух сетей: одна создает изображения, а другая их оценивает. Вместе они генерируют очень реалистичные изображения, такие как человеческие лица или виды улиц, обучаясь на реальных примерах.

  • Процедурная генерация: Этот метод использует предопределенные правила или математические модели для автоматической генерации сложных визуальных структур, таких как ландшафт, здания или текстуры. Он часто используется в игровых и имитационных платформах и может создавать масштабные, разнообразные наборы данных с минимальным участием человека.

  • Рандомизация домена: Она может случайным образом изменять такие параметры, как освещение, цвета и формы объектов в синтетических сценах. Цель этого метода — помочь моделям сосредоточиться на том, что действительно важно, делая их более адаптируемыми к реальным условиям.
Рис. 3. Примеры данных: (a) на основе 3D-модели, (b) синтетические сцены с несколькими объектами и (c) изображения реального набора данных (источник).

Обучение моделей Vision AI с использованием синтетических данных

Теперь, когда мы обсудили некоторые из различных методов, используемых для создания синтетических данных, давайте рассмотрим, как они используются для обучения моделей ИИ. 

После генерации синтетические данные обычно можно интегрировать непосредственно в конвейер обучения так же, как и данные из реального мира. Как правило, они включают в себя необходимые аннотации, такие как метки объектов, ограничивающие рамки или маски сегментации, что означает, что их можно использовать для задач обучения с учителем, где модели учатся на размеченных парах вход-выход, без необходимости ручной разметки.

Во время обучения модель обрабатывает синтетические изображения, чтобы научиться обнаруживать признаки, распознавать закономерности и классифицировать объекты. Эти данные можно использовать для создания начальной версии модели с нуля или для обогащения существующего набора данных, что помогает улучшить производительность модели.

Во многих рабочих процессах синтетические данные также используются для предварительного обучения, обеспечивая моделям широкое понимание основ перед тонкой настройкой на реальных примерах. Аналогично, они используются для расширения наборов данных путем внесения контролируемых изменений, таких как различные условия освещения, углы или редкие классы объектов, для улучшения обобщения и уменьшения переобучения. 

Объединяя синтетические и реальные данные, команды могут обучать более надежные модели, которые хорошо работают в широком диапазоне условий, и при этом снизить зависимость от трудоемких и дорогостоящих усилий по сбору данных вручную.

Примеры использования синтетических данных в компьютерном зрении в реальных условиях

По мере того, как синтетические данные становятся более практичными и доступными, мы начинаем видеть, что они принимаются в различных реальных вариантах использования Vision AI. Давайте рассмотрим некоторые из наиболее значимых приложений в компьютерном зрении, где они используются.

Использование синтетических данных для обнаружения объектов в автономных транспортных средствах

Чтобы научить беспилотные автомобили безопасно водить, необходимо обучать модели на широком спектре сценариев, включая редкие или опасные ситуации. Однако сбор реальных данных для этих крайних случаев может быть сложным и иногда небезопасным. Синтетические данные могут помочь создать сцены, где модели смогут научиться обнаруживать объекты в сложных ситуациях. Они также могут имитировать различные конфигурации датчиков, что полезно, поскольку не все беспилотные автомобили используют одинаковое оборудование.

Платформа NVIDIA DRIVE Sim — отличный пример этого. Она создает высококачественные синтетические данные, используя фотореалистичные 3D-модели, виртуальные среды и имитацию работы датчиков. Она также может генерировать изображения с разных углов обзора, используя одно изображение. Использование таких синтетических данных помогает снизить потребность в дорогостоящем тестировании в реальных условиях, при этом обеспечивая модели необходимое разнообразие для эффективного обучения.

Рис. 4. Создание нескольких видов из одного изображения для вождения (источник).

Уменьшение предвзятости в медицинском AI-изображении с помощью синтетических данных

Модели компьютерного зрения, такие как Ultralytics YOLO11, которые поддерживают такие задачи, как обнаружение объектов и сегментация экземпляров, могут быть специально обучены для приложений медицинской визуализации. Однако данные обучения в реальном мире часто содержат предубеждения, поскольку они могут недостаточно представлять пациентов из всех демографических групп.

Например, рак кожи реже диагностируется у людей с более темным цветом кожи, что приводит к ограниченному объему данных для этих групп населения. Этот дисбаланс может способствовать ошибочным диагнозам и неравным результатам в здравоохранении, особенно в таких областях, как гистопатология, рентгенография грудной клетки и дерматология.

Синтетические изображения могут сыграть свою роль в продвижении к устранению этого пробела в данных. Генерируя дополнительные разнообразные примеры, такие как различные аномалии тканей, широкий спектр заболеваний легких и оттенки кожи с различными типами поражений, синтетические данные могут помочь улучшить производительность модели в недостаточно представленных группах. 

В настоящее время исследователи работают над разработкой и валидацией синтетических наборов данных для поддержки этих целей. Они также изучают, как синтетические данные можно использовать для тестирования медицинских инструментов и стратегий лечения, не полагаясь на реальные записи пациентов, что помогает ускорить исследования, защищая при этом конфиденциальность пациентов. Благодаря этой работе синтетические данные открывают путь к более инклюзивным, точным и этичным медицинским системам ИИ.

Продвижение сельскохозяйственного ИИ с помощью синтетических данных для точного земледелия

Создание систем Vision AI для сельскохозяйственных применений зависит от доступа к большим объемам размеченных данных. Однако сбор и маркировка изображений сельскохозяйственных культур, болезней и полевых условий — это медленный, дорогостоящий процесс, часто ограниченный такими факторами, как погода, вегетационный период или труднодоступность определенных районов. 

Эти проблемы затрудняют обучение моделей компьютерного зрения для выполнения таких задач, как обнаружение болезней растений, мониторинг посевов или прогнозирование урожайности. Здесь может помочь синтетические данные, имитируя различные сельскохозяйственные среды для создания полезных примеров для обучения.

Рис. 5. Использование синтетических изображений для улучшения выявления заболеваний (источник).

Основные выводы

Использование синтетических данных представляет собой важный шаг вперед в обучении моделей ИИ, особенно для систем компьютерного зрения в областях, где реальные данные ограничены или их трудно получить. Вместо того чтобы полагаться исключительно на реальные фотографии или видео, которые могут быть дорогими, трудоемкими или вызывать опасения по поводу конфиденциальности, синтетические данные позволяют нам генерировать реалистичные, размеченные изображения по требованию. 

Это упрощает обучение моделей Vision AI для таких задач, как автономное вождение, выявление заболеваний или мониторинг посевов. По мере развития ИИ синтетические данные будут играть еще большую роль в ускорении инноваций и улучшении доступности в различных отраслях.

Узнайте больше об ИИ в нашем репозитории GitHub и присоединяйтесь к нашему растущему сообществу. Откройте для себя влияние таких приложений, как ИИ в автономных транспортных средствах и компьютерное зрение в сельском хозяйстве. Ознакомьтесь с нашими вариантами лицензирования и воплотите в жизнь свои проекты Vision AI.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена