용어집

라벨 스무딩

일반화 개선: 모델이 학습 데이터의 정확한 패턴에 너무 특화되는 것을 방지함으로써( 과적합 감소), 보이지 않는 새로운 데이터에서 더 나은 성능을 발휘하는 경우가 많습니다. 일반화는 ML의 핵심 목표입니다.
더 나은 모델 보정: 라벨 평활화로 학습된 모델은 예측이 정확할 실제 가능성을 더 잘 반영하는 확률 점수를 생성하는 경향이 있습니다. 즉, 80%의 예측 신뢰도는 80%의 실제 정확도와 일치할 가능성이 더 높습니다. 신뢰할 수 있는 AI 시스템을 구축하려면 모델 보정을 이해하는 것이 중요합니다.
과신 감소: 불확실성이 존재하는 실제 애플리케이션에서 문제가 될 수 있는 예측에 거의 절대적인 확실성을 부여하는 모델의 문제를 직접적으로 해결합니다. 과신은 잘못된 의사 결정으로 이어질 수 있습니다.
정규화 효과: 드롭아웃이나 가중치 감쇠와 같은 기법과 유사한 정규화의 한 형태로, 라벨에 노이즈를 추가하여 학습된 모델 가중치의 복잡성을 제한하는 역할을 합니다.

일반화를 개선하고 과신을 줄이는 검증된 기술인 라벨 평활화로 AI 모델의 정확도와 견고성을 향상하세요.

라벨 평활화는 주로 머신러닝(ML) 과 딥러닝(DL)의 분류 작업에 사용되는 정규화 기법입니다. 주요 목적은 모델이 학습 데이터를 기반으로 예측을 지나치게 확신하는 것을 방지하는 것입니다. 지도 학습을 사용하는 표준 분류 훈련에서 모델은 일반적으로 올바른 클래스에는 확률 1이 할당되고 다른 모든 클래스에는 0이 할당되는 원핫 인코딩 형식으로 표현되는 "하드" 레이블을 사용하여 훈련됩니다. 라벨 평활화는 이러한 하드 타깃을 "소프트" 타깃으로 수정하여 올바른 클래스에 할당되는 신뢰도를 약간 낮추고 잘못된 클래스에는 소량의 확률 질량을 분산시킵니다. 이렇게 하면 모델이 덜 확실해지고 잠재적으로 보이지 않는 데이터에 대해 더 잘 일반화할 수 있습니다.

라벨 평활화 작동 방식

올바른 클래스에는 엄격한 1을 사용하고 그렇지 않은 클래스에는 0을 사용하는 대신(원핫 인코딩), 라벨 평활화는 이러한 목표 확률을 조정합니다. 예를 들어 다음과 같은 경우 K 클래스 및 평활화 계수 alpha로 설정하면 올바른 클래스에 대한 목표 확률은 다음과 같습니다. 1 - alpha로 설정하면 각 잘못된 클래스에 대한 확률은 다음과 같습니다. alpha / (K-1). 이 작은 조정은 대상 레이블 자체가 절대적인 확실성을 표현하지 않기 때문에 훈련 중에 단일 클래스에 매우 높은 확률(1에 가까운)을 할당하는 경우 모델에 불이익을 준다는 의미입니다. 이 기법은 특히 고급 이미지 분류 모델을 훈련할 때 "컴퓨터 비전을 위한 인셉션 아키텍처 다시 생각하기" 종이.