YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Data Preprocessing

데이터 전처리가 어떻게 원시 데이터를 AI를 위한 깨끗한 입력값으로 변환하는지 배우십시오. 스케일링과 정규화 같은 핵심 기법을 탐구하여 Ultralytics YOLO26 정확도를 높이십시오.

데이터 전처리는 원시 데이터를 알고리즘이 이해할 수 있는 깔끔한 형식으로 변환하는 머신러닝 파이프라인의 중요한 첫 단계입니다. 실제 환경에서 데이터는 종종 불완전하고 일관성이 없으며 특정 동작이나 경향이 결여되어 있어 컴퓨터가 보기에는 "지저분하거나(dirty)" "노이즈가 많은(noisy)" 상태인 경우가 많습니다. 전처리는 원시 정보와 신경망에 필요한 구조화된 입력 사이의 격차를 메워주며, 최종 모델의 정확도와 효율성에 큰 영향을 미칩니다. 엔지니어는 데이터셋을 표준화하고 정리함으로써 YOLO26과 같은 정교한 아키텍처가 노이즈가 아닌 의미 있는 패턴을 학습할 수 있도록 보장합니다.

Link to this section데이터 전처리가 중요한 이유는 무엇입니까?#

머신러닝 모델, 특히 컴퓨터 비전에 사용되는 모델은 입력 데이터의 품질과 규모에 민감합니다. 적절한 전처리가 없으면 모델이 학습 중에 수렴하는 데 어려움을 겪거나 신뢰할 수 없는 예측 결과를 생성할 수 있습니다. 예를 들어, 데이터셋 내 이미지의 해상도나 색상 스케일이 제각각인 경우, 모델은 실제 객체 탐지 작업에 집중하는 대신 이러한 불일치를 처리하는 방법을 배우는 데 추가적인 역량을 소모해야 합니다.

전처리 기법은 일반적으로 다음을 목표로 합니다:

  • 데이터 품질 개선: 오류, 이상치, 중복을 제거하여 데이터셋이 문제 영역을 정확하게 나타내도록 합니다.
  • 입력 표준화: 특징(예: 픽셀 값)을 균일한 범위(보통 0과 1 사이)로 재조정하여 경사 하강법과 같은 최적화 알고리즘이 더 원활하게 작동하도록 돕습니다.
  • 복잡성 감소: 차원 축소와 같은 기법을 통해 데이터 표현을 단순화하여 학습 과정을 가속화합니다.

Link to this section주요 전처리 기법#

학습을 위해 데이터를 준비하는 데 여러 표준 방법이 사용되며, 각 방법은 데이터 파이프라인에서 특정 목적을 수행합니다.

  • 데이터 정제: 이는 결측값 처리(대체), 일관성 없는 라벨링 수정, 손상된 파일 필터링을 포함합니다. 비전 AI 맥락에서는 흐릿한 이미지를 제거하거나 잘못된 바운딩 박스 좌표를 수정하는 것을 의미할 수 있습니다.
  • 정규화 및 스케일링: 픽셀 강도가 크게 다를 수 있으므로 이미지를 정규화하여 높은 값의 픽셀이 학습 과정을 지배하지 않도록 합니다. 일반적인 방법으로는 Min-Max 스케일링과 Z-점수 정규화가 있습니다.
  • 인코딩: 클래스 라벨(예: "고양이", "개")과 같은 범주형 데이터는 숫자 형식으로 변환되어야 합니다. 원-핫 인코딩이나 라벨 인코딩과 같은 기법이 표준적으로 사용됩니다.
  • 리사이징 및 포맷팅: 딥러닝 모델은 일반적으로 고정된 크기의 입력을 기대합니다. 전처리 파이프라인은 서로 다른 이미지를 자동으로 실시간 추론에 공통적으로 사용되는 640x640 픽셀과 같은 표준 규격으로 리사이징합니다.

Link to this section실제 애플리케이션 사례#

데이터 전처리는 산업 전반에 걸쳐 어디서나 사용되며 원시 입력이 실행 가능한 통찰력으로 변환되도록 합니다.

Link to this section의료 영상 진단#

의료 AI에서 전처리는 X-ray나 MRI 스캔을 분석하는 데 필수적입니다. 원시 의료 영상에는 종종 센서 노이즈나 기기마다 다른 조명 및 대비 차이가 포함되어 있습니다. 히스토그램 평활화와 같은 전처리 단계는 대비를 향상시켜 종양이나 골절을 더 잘 보이게 하며, 노이즈 감소 필터는 이미지 구조를 명확하게 합니다. 이러한 준비 과정을 통해 모델은 더 높은 정밀도로 종양 탐지를 수행할 수 있게 되어 위음성을 줄임으로써 잠재적으로 생명을 구할 수 있습니다.

Link to this section자율 주행#

자율주행 자동차는 LiDAR, 레이더, 카메라를 포함한 여러 센서의 입력에 의존합니다. 이 센서들은 서로 다른 속도와 스케일로 데이터를 생성합니다. 전처리는 이러한 스트림을 동기화하고 데이터 융합 전에 비나 눈부심과 같은 환경적 노이즈를 걸러냅니다. 자율주행 차량의 경우, 이는 인지 시스템이 도로에 대한 일관된 뷰를 수신하여 실시간 환경에서 안전한 내비게이션과 신뢰할 수 있는 보행자 탐지를 가능하게 합니다.

Link to this section관련 개념#

머신러닝 워크플로우에 등장하는 다른 용어들과 데이터 전처리를 구분하는 것이 중요합니다.

  • vs. 데이터 증강: 전처리는 모델이 데이터를 기술적으로 사용할 수 있도록 준비(예: 리사이징)하는 것이라면, 증강은 데이터셋의 다양성을 높이기 위해 기존 데이터의 새로운 변형(예: 이미지 회전 또는 뒤집기)을 생성하는 것입니다. 자세한 내용은 YOLO 데이터 증강 가이드를 참조하십시오.
  • vs. 특징 공학: 전처리는 정리와 포맷팅에 관한 것입니다. 특징 공학은 모델 성능을 향상시키기 위해 데이터로부터 키와 몸무게 열에서 "체질량 지수"를 계산하는 것과 같이 의미 있는 새로운 변수를 생성하는 것을 포함합니다.
  • vs. 데이터 라벨링: 라벨링은 객체 주위에 바운딩 박스를 그리는 것과 같이 정답(Ground Truth)을 정의하는 과정입니다. 전처리는 데이터 수집 및 라벨링 이후, 그리고 데이터가 신경망에 입력되기 이전에 수행됩니다.

Link to this section실용적인 예시#

Ultralytics 생태계에서 전처리는 종종 학습 파이프라인 중에 자동으로 처리됩니다. 하지만 OpenCV와 같은 라이브러리를 사용하여 이미지를 직접 전처리할 수도 있습니다. 다음 코드 스니펫은 이미지를 로드하고, YOLO26과 같은 모델에 맞는 표준 입력 크기로 리사이징하고, 픽셀 값을 정규화하는 방법을 보여줍니다.

import cv2
import numpy as np

# Load an image using OpenCV
image = cv2.imread("bus.jpg")

# Resize the image to 640x640, a standard YOLO input size
resized_image = cv2.resize(image, (640, 640))

# Normalize pixel values from 0-255 to 0-1 for model stability
normalized_image = resized_image / 255.0

# Add a batch dimension (H, W, C) -> (1, H, W, C) for inference
input_tensor = np.expand_dims(normalized_image, axis=0)

print(f"Processed shape: {input_tensor.shape}")

대규모 프로젝트의 경우 Ultralytics Platform과 같은 도구를 활용하면 이러한 워크플로우를 간소화할 수 있습니다. 이 플랫폼은 데이터셋 관리를 단순화하여 많은 전처리 및 주석 작업을 자동화함으로써 원시 데이터에서 배포된 모델로의 전환을 가속화합니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.