YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

드롭아웃 레이어

드롭아웃 레이어가 일반화, 견고성 및 모델 성능을 향상시켜 신경망에서 과적합을 어떻게 방지하는지 알아보세요.

드롭아웃 레이어는 과적합을 방지하기 위해 신경망(NN)에서 사용되는 강력하면서도 간단한 정규화 기술입니다. 과적합은 모델이 훈련 데이터의 노이즈와 특이성을 포함하여 훈련 데이터를 너무 잘 학습하여 새로운 미지의 데이터로 일반화하는 능력을 손상시키는 경우에 발생합니다. Geoffrey Hinton과 그의 동료들이 획기적인 2014년 논문에서 소개한 드롭아웃의 핵심 아이디어는 각 훈련 단계에서 뉴런과 그 연결을 무작위로 "드롭아웃"하거나 일시적으로 제거하는 것입니다. 이렇게 하면 뉴런이 서로 지나치게 의존하는 것을 방지하여 네트워크가 더 강력하고 중복된 표현을 학습하도록 강제합니다.

드롭아웃 레이어 작동 방식

모델 훈련 과정에서 드롭아웃 레이어는 이전 레이어에 있는 뉴런의 활성화를 임의로 0으로 설정합니다. "드롭아웃 비율"은 뉴런이 드롭될 확률을 정의하는 하이퍼파라미터입니다. 예를 들어 드롭아웃 비율이 0.5이면 각 뉴런이 주어진 훈련 반복 동안 무시될 확률이 50%임을 의미합니다. 이 과정은 가중치를 공유하는 많은 수의 축소된 네트워크를 훈련하는 것으로 생각할 수 있습니다.

드롭아웃은 네트워크 아키텍처를 지속적으로 변경함으로써 뉴런의 출력이 몇몇 특정 다른 뉴런의 존재에 크게 의존하는 복잡한 공적응을 방지합니다. 대신 각 뉴런은 보다 독립적으로 유용한 특징 감지기가 되도록 권장됩니다. 테스트 또는 추론 단계에서는 드롭아웃 레이어가 꺼지고 모든 뉴런이 사용됩니다. 훈련 중보다 더 많은 뉴런이 활성화되어 있다는 사실을 보상하기 위해 레이어의 출력은 드롭아웃 비율만큼 축소됩니다. 이를 통해 각 뉴런의 예상 출력이 훈련과 테스트 간에 일관되게 유지됩니다. PyTorchTensorFlow와 같은 프레임워크는 드롭아웃 레이어 구현에서 이 스케일링을 자동으로 처리합니다.

실제 애플리케이션

드롭아웃은 다양한 인공 지능(AI)머신 러닝(ML) 영역에서 널리 사용됩니다.

  1. 컴퓨터 비전: 컴퓨터 비전(CV)에서 드롭아웃은 Ultralytics YOLO와 같은 모델이 객체 탐지, 이미지 분류인스턴스 분할과 같은 작업에서 더 나은 성능을 발휘하도록 돕습니다. 예를 들어 자율 주행 시스템에서 드롭아웃은 탐지 모델이 조명, 날씨 또는 폐색의 변화에 더 강력하게 대처하여 안전성과 신뢰성을 향상시킬 수 있습니다. 이러한 모델의 학습은 Ultralytics HUB와 같은 플랫폼을 사용하여 효과적으로 관리할 수 있습니다.
  2. 자연어 처리(NLP): 드롭아웃은 NLP 모델TransformersBERT에서 일반적으로 적용됩니다. 기계 번역 또는 감정 분석과 같은 애플리케이션에서 드롭아웃은 모델이 훈련 데이터에서 특정 구문이나 문장 구조를 암기하는 것을 방지합니다. 이는 새로운 텍스트의 더 나은 이해와 생성을 유도하여 챗봇텍스트 요약 도구의 성능을 향상시킵니다.

관련 개념 및 구별

드롭아웃은 딥러닝에서 정규화에 사용되는 여러 기술 중 하나입니다. 다른 기술은 다음과 같습니다.

  • L1 및 L2 정규화: 이러한 방법은 모델 가중치의 크기에 따라 손실 함수에 페널티를 추가하여 모델 복잡성을 줄이기 위해 더 작은 가중치를 장려합니다. L1/L2 정규화에 대해 자세히 알아볼 수 있습니다. 대조적으로 드롭아웃은 가중치에 페널티를 주는 대신 훈련 중에 네트워크 구조를 직접 수정합니다.
  • 배치 정규화: 배치 정규화(BN)는 레이어 내에서 활성화를 정규화하여 훈련을 안정화하고 때로는 약한 정규화 효과를 제공하여 강력한 드롭아웃의 필요성을 잠재적으로 줄일 수 있습니다. BN은 내부 공변량 이동을 해결하는 반면, 드롭아웃은 중복성을 강제하여 모델 복잡성을 직접적으로 목표로 합니다.
  • 데이터 증강: 이미지 회전, 스케일링 또는 자르기(데이터 증강)와 같은 기술은 훈련 데이터 세트의 다양성을 인위적으로 증가시킵니다. 이는 또한 과적합을 방지하고 일반화를 개선하는 데 도움이 됩니다. 드롭아웃과 데이터 증강은 종종 함께 사용하여 훨씬 더 강력한 결과를 얻습니다.

요약하자면, 드롭아웃 레이어는 고급 컴퓨터 비전에서 NLP에 이르기까지 다양한 애플리케이션에서 강력한 딥 러닝 모델을 훈련하는 데 필수적인 간단하면서도 강력한 정규화 기술입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.