Yolo 비전 선전
선전
지금 참여하기
용어집

역전파

역전파가 신경망을 훈련하고, 오류율을 줄이며, 이미지 인식 및 NLP와 같은 AI 애플리케이션에 효율적으로 전력을 공급하는 방법에 대해 알아보세요.

'오류의 역전파'의 줄임말인 역전파는 인공 신경망을 효과적으로 훈련하는 데 사용되는 기본 알고리즘으로 인공 신경망을 효과적으로 훈련하는 데 사용되는 기본 알고리즘입니다. 역전파는 수학적 엔진 역할을 하며 머신 러닝 모델이 실수로부터 학습할 수 있도록 내부 매개변수를 반복적으로 조정하여 실수로부터 학습할 수 있도록 하는 수학적 엔진 역할을 합니다. 손실 함수의 기울기를 계산하여 네트워크의 각 가중치에 대한 손실 함수의 역전파는 각 뉴런이 전체 오류에 기여한 정도를 정확히 결정합니다. 이 과정을 통해 복잡한 복잡한 딥 러닝(DL) 아키텍처를 효율적으로 훈련할 수 있습니다. 무작위 초기화를 시각 인식 및 언어 이해와 같은 작업을 수행할 수 있는 매우 정확한 시스템으로 이해와 같은 작업을 수행할 수 있는 매우 정확한 시스템으로 변환할 수 있습니다.

역전파가 학습을 촉진하는 방법

신경망의 훈련 과정은 전진 통과와 후진 통과로 구성된 주기로 시각화할 수 있습니다. 패스로 구성된 주기로 시각화할 수 있습니다. 역전파는 특히 '역방향' 단계를 처리하지만, 컨텍스트를 이해하는 것이 필수적입니다.

  1. 포워드 패스: 입력 데이터는 네트워크 레이어를 통해 이동하며, 모델 가중치와 모델 가중치활성화 함수를 통해 변환을 거칩니다. 네트워크는 예측을 생성하고 예측을 생성하고, 이 예측은 손실 함수를 사용하여 오차 값을 계산하기 위해 실제 실측 자료와 비교됩니다.
  2. 백워드 패스(역전파): 이 알고리즘은 출력에서 계산된 오류를 가져와서 네트워크 레이어를 통해 역전파하는 알고리즘입니다. 이 알고리즘은 미적분학의 미적분학의 연쇄 규칙을 활용하여 모든 웨이트의 가중치. 개념적으로 이 단계에서는 최종 오류에 대해 각 연결에 "책임" 또는 "공로"를 할당합니다. 오류.
  3. 가중치 업데이트: 그라데이션이 계산되면 최적화 알고리즘이 이 정보를 사용하여 가중치를 업데이트하여 오차를 최소화하는 방향으로 가중치를 약간 조정합니다.

이 주기는 여러 시대에 걸쳐 반복되며 점차적으로 모델의 정확도를 모델의 정확도를 점차 개선합니다. 다음과 같은 최신 프레임워크는 PyTorchTensorFlow 은 자동 미분이라는 프로세스를 통해 복잡한 역전파 계산을 라는 프로세스를 통해 복잡한 역전파 계산을 자동으로 처리합니다.

역전파 대 최적화

역전파를 최적화 단계와 혼동하는 경우가 많지만, 이 두 단계는 모델 학습 루프 내에서 모델 훈련 루프 내에서 별개의 프로세스입니다.

  • 역전파는 진단 도구입니다. 이 도구는 기울기를 계산하여 오류 환경의 기울기를 보여주는 지도를 효과적으로 그려줍니다. "오류를 줄이기 위해 어느 방향으로 이동해야 오류를 줄이기 위해 어느 방향으로 이동해야 할까요?"라는 질문에 답합니다.
  • 최적화가 바로 실행입니다. 다음과 같은 알고리즘 확률적 그라디언트 하강(SGD) 또는 Adam 옵티마이저와 같은 알고리즘은 역전파를 통해 제공된 기울기를 기울기를 취하고 가중치를 업데이트합니다. 역전파가 지도라면 최적화 도구는 등산객이 걸음 수를 계산합니다.

실제 애플리케이션

역전파는 거의 모든 최신 AI 성공의 기본 메커니즘입니다.

  • 컴퓨터 비전: In 다음과 같은 모델을 사용하는 객체 감지 작업 YOLO11와 같은 모델을 사용하는 물체 감지 작업에서 역전파를 통해 네트워크가 공간 계층을 학습할 수 있습니다. 공간 계층 구조를 학습할 수 있습니다. 이는 모델이 특정 가장자리가 모양을 형성하고 이러한 모양이 자동차나 보행자와 같은 객체를 형성한다는 것을 이해하는 데 도움이 됩니다. 객체를 형성한다는 것을 이해하는 데 도움이 됩니다. 앞으로 Ultralytics 차세대 모델인 YOLO26을 개발 중입니다. 2025년 후반을 목표로 하고 있으며, 효율적인 역전파에 크게 의존하는 고급 엔드투엔드 트레이닝 기법을 활용하여 더 작고, 더 빠르고, 더 정확한 아키텍처를 달성하기 위해 효율적인 역전파에 크게 의존하는 고급 엔드투엔드 학습 기법을 활용할 것입니다.
  • 자연어 처리(NLP): 대상 다음과 같은 대규모 언어 모델(LLM)의 경우 의 경우, 역전파를 통해 시스템이 문장에서 다음 단어의 문장에서 다음 단어의 확률을 학습할 수 있습니다. 잘못된 텍스트 예측의 오류를 전파함으로써 모델은 다음을 학습합니다. 미묘한 문법과 문맥을 학습할 수 있으며, 이는 다음과 같은 애플리케이션에 필수적인 기계 번역.

역전파의 과제

이 알고리즘은 강력하지만 딥 네트워크에서는 여러 가지 문제에 직면해 있습니다. 바로 소실 그라 데이션 문제는 그라데이션이 뒤로 갈수록 가 뒤로 갈수록 너무 작아져 초기 레이어가 학습을 멈추게 될 때 발생합니다. 반대로 폭발하는 그라디언트에는 그라디언트 가 크게 불안정한 값으로 누적됩니다. 다음과 같은 기법 배치 정규화 및 전문화 배치 노멀라이제이션과 같은 기술은 이러한 문제를 완화하기 위해 종종 사용됩니다.

Python 코드 예제

다음과 같은 고급 라이브러리는 ultralytics 교육 중에 이 과정을 추상화합니다, torch PyTorch를 사용하면 메커니즘을 직접 확인할 수 있습니다. 그리고 .backward() 메서드가 트리거하는 역전파 프로세스를 트리거합니다.

import torch

# specialized tensor that tracks operations for backpropagation
w = torch.tensor([2.0], requires_grad=True)
x = torch.tensor([3.0])

# Forward pass: compute prediction and loss
loss = (w * x - 10) ** 2

# Backward pass: This command executes backpropagation
loss.backward()

# The gradient is now stored in w.grad, showing how to adjust 'w'
print(f"Gradient (dL/dw): {w.grad.item()}")

추가 읽기

역전파가 AI 개발의 더 넓은 범위에 어떻게 적용되는지 이해하려면 다음과 같은 개념을 살펴보는 것이 좋습니다. 데이터 증강의 개념을 살펴보면 알고리즘을 효과적으로 일반화하는 데 필요한 알고리즘을 효과적으로 일반화하는 데 필요한 다양한 예제를 제공하기 때문입니다. 또한, 성공 여부를 평가하는 데 사용되는 구체적인 다음과 같이 훈련의 성공 여부를 평가하는 데 사용되는 메트릭을 이해하는 것도 도움이 됩니다. 평균 평균 정밀도(mAP)와 같은 특정 메트릭을 이해하면 다음과 같이 도움이 됩니다. 역전파 프로세스가 모델을 얼마나 잘 최적화하고 있는지 해석하는 데 도움이 됩니다. 이론에 대해 더 자세히 알아보려면 스탠포드 CS231n 강의 노트는 훌륭한 기술 분석을 제공합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기