Yolo 비전 선전
선전
지금 참여하기
용어집

정규화(Normalization)

머신러닝에서 정규화(Normalization)의 강력한 기능을 경험해 보세요! 모델 훈련을 향상시키고, 성능을 높이며, 강력한 AI 솔루션을 보장하는 방법을 알아보세요.

정규화는 데이터를 변환하는 데 사용되는 기본적인 데이터 전처리 기법으로, 일반적으로 데이터 세트 내의 수치적 특징을 데이터 세트 내의 수치적 특징을 공통 척도로 변환하는 데 사용되는 기본적인 데이터 처리 기법으로, 일반적으로 값 범위의 차이를 왜곡하거나 정보를 잃지 않고 값의 차이를 왜곡하거나 정보를 잃지 않습니다. 다음과 같은 맥락에서 머신 러닝(ML)딥 러닝(DL)의 맥락에서 이 프로세스는 다음과 같은 경우에 매우 중요합니다. 입력 데이터가 알고리즘이 효율적으로 처리할 수 있는 형식인지 확인하는 것입니다. 값을 0에서 1 사이의 범위로 조정하여 정규화는 숫자 스케일이 큰 특징이 모델의 학습을 지배하는 것을 방지함으로써 모델 학습 과정에서 모든 입력의 일관된 기여를 보장합니다. 모델 학습 중 모든 입력의 일관된 기여를 보장합니다.

AI에서 정규화가 중요한 이유

정규화의 주요 목표는 최적화 알고리즘의 안정성과 속도를 높이는 것입니다. 최적화 알고리즘의 안정성과 속도를 높이는 것입니다. 많은 알고리즘 다음과 같은 확률적 경사 하강(SGD), 데이터 포인트 사이의 거리 또는 기울기를 계산하는 데 의존합니다. 한 피처의 범위가 0에서 100,000(예: 주택 가격), 다른 하나는 0에서 10까지(예: 객실 수) 범위인 경우 최적화 도구는 손실 함수를 효과적으로 탐색하는 데 어려움을 겪을 수 있습니다.

적절한 정규화는 몇 가지 주요 이점을 제공합니다:

  • 더 빠른 컨버전스: 이 기능을 사용하면 경사 하강 알고리즘이 최적의 솔루션을 향해 최적의 솔루션으로 빠르게 수렴하여 필요한 계산 리소스를 줄일 수 있습니다.
  • 수치 안정성: 값을 작게 유지하면 큰 오차가 발생하는 큰 오차가 누적되어 네트워크 업데이트가 불안정해지는 그래디언트가 누적되어 네트워크 업데이트가 불안정해지는 것과 같은 수치 문제를 방지합니다.
  • 동등한 피처 중요도: 모델이 모든 피처를 동등하게 중요하게 취급하도록 보장합니다. 모든 피처를 동등하게 중요하게 취급하여 규모가 큰 변수에 대한 편향을 방지합니다. 이는 강력한 피처 엔지니어링의 핵심 측면입니다. 피처 엔지니어링의 핵심 측면입니다.

일반적인 정규화 기법

데이터를 정규화하는 방법에는 여러 가지가 있으며, 각각 다른 분포와 알고리즘에 적합합니다.

  • 최소-최대 스케일링: 가장 일반적인 형태의 정규화입니다. 데이터를 고정된 범위(보통 [0, 1])로 데이터를 재조정합니다. 최소값에서 최대값을 빼고 범위(최대 마이너스 최소값)으로 나누어 수행합니다. 수학적 구현은 다음에서 살펴볼 수 있습니다. Scikit-Learn MinMaxScaler 문서를 참조하세요.
  • Z점수 표준화: 흔히 정규화와 혼동하는 경우가 많습니다, 표준화 (또는 Z점수 정규화) 는 데이터가 평균 0, 표준 편차 1이 되도록 데이터를 변환합니다. 이는 데이터가 가우스 분포를 따를 때 유용합니다.
  • 로그 스케일링: 꼬리가 길거나 극단적인 이상값이 있는 데이터의 경우 로그 변환을 적용하면 을 적용하면 값의 범위를 압축하여 분포를 더 관리하기 쉽게 만들 수 있습니다. 신경망(NN).

정규화 대 일괄 정규화

입력 데이터 정규화와 다음을 구분하는 것이 중요합니다. 일괄 정규화.

  • 데이터 정규화: 주석이 달린 데이터 전처리 단계에서 주석이 달린 데이터 전처리 단계에서 발생합니다. 원시 입력(예: 이미지 또는 표 형식 데이터)이 모델에 들어가기 전에 적용됩니다.
  • 일괄 정규화: 심층 신경망 내부에서 사용되는 특정 레이어 기법입니다. 이는 훈련 중 각 미니 배치에 대해 레이어의 활성화를 정규화합니다. 데이터 정규화가 입력을 준비하는 동안 입력을 준비하는 동안, 배치 정규화는 내부 학습 프로세스를 안정화하여 다음과 같은 딥 아키텍처를 지원합니다. YOLO11 과 같은 딥 아키텍처를 더 깊고 빠르게 훈련할 수 있도록 도와줍니다.

실제 애플리케이션

정규화는 인공지능의 다양한 영역에서 보편적으로 사용되고 있습니다.

  1. 컴퓨터 비전(CV): 다음과 같은 작업에서 물체 감지이미지 분류와 같은 작업에서 이미지는 다음과 같이 구성됩니다. 0에서 255 사이의 픽셀 값으로 구성됩니다. 이러한 큰 정수를 네트워크에 직접 입력하면 학습 속도가 느려질 수 있습니다. A 표준 전처리 단계에는 픽셀 값을 255.0으로 나누어 [0, 1] 범위로 정규화하는 작업이 포함됩니다. 이 같은 모델의 입력을 표준화합니다. YOLO11YOLO26과 같은 모델의 입력을 표준화합니다.
  2. 의료 이미지 분석: 다음과 같은 의료 스캔은 의료 분야의 AI는 다양한 강도의 다양한 강도의 기계에서 제공됩니다. 정규화는 MRI 또는 CT 스캔의 픽셀 강도가 환자마다 서로 다른 환자들 간에 비교할 수 있게 해주며, 이는 정확한 종양 감지를 위해 종양 탐지.

구현 예시

다음과 같은 고급 라이브러리는 ultralytics 트레이닝 파이프라인 내에서 이미지 노멀라이제이션을 자동으로 처리하려면 파이프라인 내에서 자동으로 이미지 정규화를 처리하는 경우 기본 로직을 이해하면 도움이 됩니다. 다음은 Python 사용 예 numpy 를 사용하여 이미지 픽셀 데이터를 이미지 픽셀 데이터를 0~255 범위에서 0~1로 정규화하는 방법을 시연합니다.

import numpy as np

# Simulate a 2x2 pixel image with 3 color channels (RGB)
# Values range from 0 to 255
raw_image = np.array([[[10, 255, 128], [0, 50, 200]], [[255, 255, 255], [100, 100, 100]]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# Since the known min is 0 and max is 255, we simply divide by 255.0
normalized_image = raw_image / 255.0

print(f"Original Max: {raw_image.max()}")
print(f"Normalized Max: {normalized_image.max()}")
print(f"Normalized Data Sample:\n{normalized_image[0][0]}")

이 간단한 작업으로 학습 데이터를 준비하여 학습 데이터를 준비하여 레이어 내의 수학적 연산이 최적으로 작동하도록 합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기