Что такое синтетические данные в компьютерном зрении? Обзор

Абирами Вина

5 минут чтения

4 июля 2025 года

Узнайте, как синтетические данные для обучения моделей искусственного интеллекта используются в приложениях компьютерного зрения в различных отраслях, таких как здравоохранение и робототехника.

Данные всегда были движущим фактором в таких областях, как аналитика и искусственный интеллект (ИИ). Фактически, то, как мы собираем, генерируем и используем данные, определяет будущее интеллектуальных систем. Например, чтобы научиться безопасно передвигаться по дорогам, самодвижущиеся автомобили используют миллионы помеченных изображений и показаний датчиков - от уличных знаков до движения пешеходов.

Одним из наиболее важных типов данных, обеспечивающих этот прогресс, особенно в таких областях, как автономные транспортные средства и безопасность, являются визуальные данные, такие как изображения и видео. 

В частности, область ИИ, позволяющая машинам интерпретировать эту визуальную информацию, называется компьютерным зрением. Оно помогает системам понимать и анализировать визуальные данные подобно человеку, поддерживая такие задачи, как распознавание лиц, определение дорожных знаков и анализ медицинских изображений. 

Однако сбор масштабных высококачественных наборов визуальных данных из реального мира может занимать много времени, быть дорогостоящим и часто вызывает вопросы конфиденциальности. Именно поэтому исследователи активно изучают концепцию использования синтетических данных. 

Синтетические данные - это искусственно созданные визуальные образы, которые в точности повторяют реальные изображения и видео. Для их создания используются такие методы, как 3D-моделирование, компьютерное моделирование и генеративные методы ИИ, например генеративные адверсарные сети (GAN), которые изучают закономерности на основе реальных данных, чтобы создавать новые реалистичные примеры.

Синтетические данные, как ожидается, вскоре будут играть важнейшую роль в разработке ИИ - по прогнозам Gartner, к 2030 году они станут более важными, чем данные реального мира. В этой статье мы рассмотрим, что такое синтетические данные в контексте компьютерного зрения, как они генерируются и где применяются в реальных сценариях. Давайте начнем!

Что такое синтетические данные в компьютерном зрении?

Предположим, вы хотите обучить модель искусственного интеллекта для обнаружения объектов в различных условиях. Опираться только на реальные данные может быть сложно, а иногда и ограниченно. 

В то же время для создания нужного набора данных можно использовать синтетические данные, содержащие объекты в различных искусственно созданных условиях. Используя такие инструменты, как 3D-моделирование и симуляция, разработчики могут генерировать изображения с точным контролем таких факторов, как освещение, углы и расположение объектов. Это, в свою очередь, обеспечивает большую гибкость при обучении моделей, чем реальные данные.

Синтетические данные особенно полезны, когда сбор реальных данных затруднен или невозможен. Например, для обучения модели распознавания людей в самых разных позах, таких как бег, приседание или лежание, потребуется сделать тысячи фотографий в разных условиях, под разными углами и при разном освещении. 

С другой стороны, используя синтетические данные, разработчики могут легко генерировать эти вариации с точными метками, экономя время и усилия и повышая производительность модели.

Рис. 1. Синтетический набор данных с различными позами людей и вариациями освещения(источник).

Синтетические и реальные данные в искусственном интеллекте

Далее давайте подробнее рассмотрим различия между синтетическими и реальными данными. И те, и другие имеют свои плюсы и минусы, когда речь идет об обучении моделей ИИ

Например, синтетические данные полезны, когда реальные данные трудно собрать, но они могут не отражать все мелкие детали, встречающиеся в реальной жизни. В то же время реальные данные более достоверны, но их трудно получить, на их маркировку уходит много времени, и они могут не охватывать все ситуации.

Сочетая синтетические и реальные данные, разработчики могут получить лучшее из двух миров. Такой баланс помогает моделям ИИ обучаться более точно, лучше обобщать различные сценарии и уменьшать предвзятость.

Рис. 2. Синтетические и реальные данные в искусственном интеллекте. Изображение автора.

Взгляд на генерацию данных для моделей компьютерного зрения

От создания виртуальных миров с помощью 3D-инструментов до генерации изображений с помощью генеративного ИИ - вот несколько распространенных методов, используемых для создания синтетических обучающих данных для моделей компьютерного зрения:

  • 3D-моделирование: Разработчики используют 3D-программы для создания цифровых объектов и сцен. Это позволяет полностью контролировать освещение, углы камеры и расположение объектов и помогает создавать реалистичные изображения людей, транспортных средств и окружающей среды.

  • Симуляторы: Они воссоздают реальные ситуации, такие как дорожное движение или заводские условия, с помощью физических движков. Симуляции полезны для безопасного генерирования обучающих данных в таких областях, как робототехника и самоуправляемые автомобили.

  • Генеративные состязательные сети: GAN - это тип модели глубокого обучения, состоящий из двух сетей: одной, которая создает изображения, и одной, которая их оценивает. Вместе они генерируют высокореалистичные изображения, такие как человеческие лица или виды улиц, обучаясь на реальных примерах.

  • Процедурная генерация: Эта техника использует предопределенные правила или математические модели для автоматической генерации сложных визуальных структур, таких как рельеф, здания или текстуры. Она часто используется в играх и симуляторах и позволяет создавать масштабные и разнообразные наборы данных при минимальном участии человека.

  • Рандомизация домена: Она позволяет случайным образом изменять освещение, цвета и формы объектов в синтетических сценах. Цель этой техники - помочь моделям сосредоточиться на том, что действительно важно, и сделать их более адаптируемыми к реальным условиям.
Рис. 3. Примеры данных: (a) 3D-модели, (b) синтетические многообъектные сцены и (c) изображения из реальных наборов данных(источник).

Обучение моделей искусственного интеллекта с помощью синтетических данных

Теперь, когда мы обсудили некоторые из различных методов создания синтетических данных, давайте рассмотрим, как они используются для обучения моделей искусственного интеллекта. 

После создания синтетические данные, как правило, могут быть интегрированы непосредственно в конвейер обучения так же, как и реальные данные. Они обычно содержат необходимые аннотации, такие как метки объектов, ограничительные рамки или маски сегментации. Это означает, что их можно использовать для задач контролируемого обучения, где модели обучаются на основе помеченных пар вход-выход, без необходимости ручного маркирования.

В процессе обучения модель обрабатывает синтетические изображения, чтобы научиться определять особенности, распознавать паттерны и классифицировать объекты. Эти данные можно использовать для создания первоначальной версии модели с нуля или для обогащения существующего набора данных, что поможет повысить производительность модели.

Во многих рабочих процессах синтетические данные также используются для предварительного обучения, давая моделям широкое базовое понимание, прежде чем они будут доработаны на реальных примерах. Аналогичным образом, синтетические данные используются для дополнения наборов данных путем введения контролируемых вариаций, таких как различные условия освещения, углы или редкие классы объектов, для улучшения обобщения и уменьшения избыточной подгонки. 

Комбинируя синтетические и реальные данные, команды могут обучать более надежные модели, которые хорошо работают в широком диапазоне условий, при этом сокращая затраты времени и средств на ручной сбор данных.

Применение синтетических данных в компьютерном зрении в реальном мире

По мере того как синтетические данные становятся все более практичными и доступными, мы начинаем видеть их применение в различных реальных случаях использования искусственного интеллекта в компьютерном зрении. Давайте рассмотрим некоторые из наиболее значимых приложений в компьютерном зрении, где он используется.

Использование синтетических данных для обнаружения объектов в автономных транспортных средствах

Обучение самоуправляемых автомобилей безопасному вождению требует тренировки моделей на широком спектре сценариев, включая редкие или опасные ситуации. Однако сбор реальных данных для таких ситуаций может быть сложным, а иногда и небезопасным. Синтетические данные помогают создать сцены, в которых модели могут научиться обнаруживать объекты в сложных ситуациях. Кроме того, они могут имитировать различные конфигурации датчиков, что очень важно, поскольку не все самодвижущиеся автомобили используют одинаковое оборудование.

Платформа DRIVE Sim от NVIDIA - отличный пример этого. Она создает высококачественные синтетические данные с помощью фотореалистичных 3D моделей, виртуального окружения и симуляций датчиков. Она также может генерировать изображения нескольких ракурсов вождения из одного изображения. Использование таких синтетических данных позволяет сократить потребность в дорогостоящих испытаниях в реальных условиях и при этом обеспечить модели разнообразие, необходимое для эффективного обучения.

Рис. 4. Создание нескольких видов вождения из одного изображения(источник).

Уменьшение предвзятости в искусственном интеллекте для медицинской визуализации с помощью синтетических данных

Модели компьютерного зрения, такие как Ultralytics YOLO11, поддерживающие такие задачи, как обнаружение объектов и сегментация экземпляров, могут быть специально обучены для применения в медицинской визуализации. Однако реальные данные для обучения часто содержат погрешности, поскольку могут неадекватно представлять пациентов из всех демографических групп.

Например, рак кожи реже диагностируется у людей с более темным цветом кожи, что приводит к ограничению данных по этим группам населения. Такой дисбаланс может привести к ошибочным диагнозам и неравным результатам в здравоохранении, особенно в таких областях, как гистопатология, рентгенография грудной клетки и дерматология.

Синтетические изображения могут сыграть свою роль, сделав шаг к устранению этого пробела в данных. Создавая дополнительные разнообразные примеры, такие как различные аномалии тканей, широкий спектр легочных заболеваний и оттенки кожи с различными типами поражения, синтетические данные могут помочь повысить эффективность моделей для недопредставленных групп. 

В настоящее время исследователи работают над созданием и проверкой синтетических наборов данных для достижения этих целей. Они также изучают возможности использования синтетических данных для тестирования медицинских инструментов и стратегий лечения, не опираясь на реальные истории болезни, что помогает ускорить исследования и одновременно защитить конфиденциальность пациентов. Благодаря этой работе синтетические данные прокладывают путь к созданию более инклюзивных, точных и этичных медицинских систем искусственного интеллекта.

Продвижение сельскохозяйственного ИИ с помощью синтетических данных для точного земледелия

Создание систем искусственного интеллекта для сельскохозяйственных приложений зависит от доступа к большим объемам помеченных данных. Однако сбор и маркировка изображений культур, болезней и состояния полей - дело медленное, дорогостоящее и часто ограниченное такими факторами, как погода, вегетационный период или сложность доступа к определенным участкам. 

Эти проблемы затрудняют обучение моделей компьютерного зрения для решения таких задач, как обнаружение болезней растений, мониторинг урожая или прогнозирование урожайности. Именно здесь на помощь могут прийти синтетические данные - имитация различных сельскохозяйственных условий для создания полезных обучающих примеров.

Рис. 5. Использование синтетических изображений для улучшения обнаружения заболеваний(источник).

Основные выводы

Использование синтетических данных представляет собой важный шаг вперед в обучении моделей ИИ, особенно для систем компьютерного зрения в тех областях, где реальные данные ограничены или труднодоступны. Вместо того чтобы полагаться исключительно на реальные фотографии или видео, которые могут быть дорогими, отнимать много времени или вызывать опасения по поводу конфиденциальности, синтетические данные позволяют нам генерировать реалистичные, помеченные изображения по требованию. 

Это облегчает обучение моделей искусственного интеллекта для таких задач, как автономное вождение, выявление заболеваний или мониторинг урожая. По мере развития ИИ синтетические данные будут играть все большую роль в ускорении инноваций и повышении доступности в различных отраслях.

Узнайте больше об искусственном интеллекте в нашем репозитории GitHub и присоединяйтесь к нашему растущему сообществу. Узнайте о влиянии таких приложений, как ИИ в автономных транспортных средствах и компьютерное зрение в сельском хозяйстве. Изучите наши возможности лицензирования и воплотите в жизнь свои проекты в области искусственного интеллекта.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена