Yolo 비전 선전
선전
지금 참여하기
용어집

합성 데이터

AI/ML을 위한 합성 데이터의 힘을 활용하세요! 데이터 부족, 개인 정보 문제 및 비용을 극복하면서 모델 학습 및 혁신을 강화하세요.

합성 데이터는 실제 데이터의 통계적 특성과 패턴을 모방한 인위적으로 생성된 정보를 말합니다. 인위적으로 생성된 정보를 말합니다. 다음과 같은 분야에서 머신러닝(ML)컴퓨터 비전(CV) 분야에서는 고성능 모델을 개발할 때 강력한 고성능 모델을 개발하기 위한 강력한 리소스로 사용됩니다. 고성능 모델을 개발할 수 있는 리소스입니다. 실제 이벤트에서 수집된 기존 데이터 세트와 달리 합성 데이터는 프로그래밍되거나 시뮬레이션되어 개발자가 필요에 따라 완벽하게 레이블이 지정된 교육 데이터의 방대한 저장소를 만들 수 있습니다. 업계 분석가들은 가트너의 업계 분석가들은 2030년까지 합성 데이터가 AI 모델에서 실제 데이터를 압도하여 지능형 시스템 구축 방식에 큰 변화를 가져올 것이라고 예측합니다. 구축 방식에 큰 변화를 가져올 것이라고 예측합니다.

합성 데이터 생성 방법

고품질 합성 데이터 세트를 생성하려면 고전적인 컴퓨터 그래픽부터 최신 제너레이티브 AI까지 부터 최신 제너레이티브 AI에 이르는 정교한 기술이 필요합니다. 이러한 방법은 다음을 보장합니다. 인공 데이터가 충분히 다양하여 모델이 이전에 보지 못한 새로운 시나리오에 잘 일반화할 수 있도록 합니다.

  • 3D 시뮬레이션 및 렌더링: 다음과 같은 게임 엔진 Unity와 Unreal Engine과 같은 게임 엔진을 사용하면 개발자는 사실적인 가상 환경을 구축할 수 있습니다. 여기서 물리 엔진은 빛, 중력, 오브젝트 상호 작용을 시뮬레이션하여 실제와 같은 이미지를 제작합니다. 이는 종종 다음과 함께 사용됩니다. 3D 오브젝트 감지 워크플로와 함께 사용됩니다.
  • 생성 모델: 다음과 같은 고급 알고리즘 생성적 적대 신경망(GAN)확산 모델과 같은 고급 알고리즘은 구조를 학습하여 무한한 새로운 변형을 생성합니다. 다음과 같은 도구 안정적 확산과 같은 도구는 이러한 모델이 어떻게 복잡한 시각적 데이터를 처음부터 스크래치.
  • 도메인 무작위화: 특정 시뮬레이션 룩에 특정 시뮬레이션된 모양에 과적합하는 것을 방지하기 위해 개발자는 도메인 무작위화를 사용합니다. 이 기법은 다음과 같은 매개변수를 다양하게 변경합니다. 조명, 텍스처, 카메라 각도 등의 파라미터를 크게 변경하여 AI가 배경 소음보다는 물체의 본질적인 특징을 학습하도록 합니다. 배경 노이즈.

실제 애플리케이션

합성 데이터는 데이터 수집이 병목 현상을 일으키는 산업에 혁신을 불러일으키고 있습니다.

  • 자율주행 차량: 자율주행차를 훈련하려면 교통 체증이나 악천후 등 드물고 위험한 상황을 포함하여 수백만 가지 주행 보행자가 차도에 뛰어들거나 악천후와 같은 드물고 위험한 상황을 포함한 수백만 가지의 주행 시나리오에 노출시켜야 합니다. 이러한 데이터를 물리적으로 수집하는 것은 안전하지 않습니다. 웨이모와 같은 기업은 시뮬레이션을 활용하여 자율주행 차량을 수십억 가상 마일을 주행하며 물체 감지 시스템을 개선합니다.
  • 헬스케어 및 의료 영상: 환자 기록은 다음과 같은 엄격한 규정으로 보호됩니다. HIPAA. 연구를 위해 실제 엑스레이나 MRI 스캔을 공유하는 것은 종종 법적으로 복잡합니다. 합성 데이터를 통해 연구자들은 실제와 같은 의료 이미지 분석 데이터 세트를 생성할 수 있습니다. 질병의 통계적 마커를 유지하면서 개인 식별 정보(PII)를 포함하지 않는 개인 식별 정보(PII)를 포함하지 않습니다. 이를 통해 데이터 프라이버시를 보호하면서 진단 도구를 발전시킬 수 있습니다.

합성 데이터 vs. 데이터 증강

합성 데이터와 데이터 증강을 구별하는 것이 중요합니다. 데이터 증강을 구별하는 것이 중요합니다. 데이터 세트.

  • 데이터 증강은 기존의 실제 이미지를 가져와서 뒤집기, 회전, 또는 색상 밸런스를 변경하여 다양성을 높입니다. 이에 대한 자세한 내용은 YOLO 데이터 증강 가이드에서 자세히 알아보세요.
  • 합성 데이터는 처음부터 새로 만들어집니다. 특정 소스 이미지의 수정에 의존하지 않고 완전히 새로운 인스턴스를 생성하여 카메라로 캡처한 적이 없는 시나리오를 만들 수 있습니다. 시나리오를 생성할 수 있습니다.

Ultralytics YOLO 통합

합성 데이터 세트는 일반적으로 이미지와 해당 주석 파일을 사용하여 실제 데이터 세트와 마찬가지로 포맷됩니다. 사용자는 다음과 같은 최신 모델을 원활하게 훈련할 수 있습니다. YOLO11 과 같은 최신 모델을 같은 최신 모델을 원활하게 학습시켜 틈새 작업의 성능을 높일 수 있습니다.

다음 예제는 코드를 사용하여 간단한 합성 이미지를 생성하고 이를 바탕으로 를 사용하여 ultralytics 패키지입니다.

import cv2
import numpy as np
from ultralytics import YOLO

# 1. Generate a synthetic image (black background, white rectangle)
# This mimics a simple object generation process
synthetic_img = np.zeros((640, 640, 3), dtype=np.uint8)
cv2.rectangle(synthetic_img, (100, 100), (400, 400), (255, 255, 255), -1)

# 2. Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# 3. Run inference on the synthetic data
# The model attempts to detect objects within the generated image
results = model.predict(synthetic_img)

# Display result count
print(f"Detected {len(results[0].boxes)} objects in synthetic image.")

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기