능동적 학습
더 적은 레이블로 정확도를 높이는 비용 효율적인 머신 러닝 방법인 액티브 러닝에 대해 알아보세요. AI 학습을 어떻게 혁신하는지 알아보세요!
능동형 학습은 머신러닝(ML) 의 특수한 학습 방법론으로, 학습 알고리즘이 사용자 또는 다른 정보 소스('오라클')를 대화형으로 쿼리하여 새로운 데이터 포인트에 레이블을 지정할 수 있습니다. 핵심 아이디어는 모델이 학습할 데이터를 선택할 수 있다면 훨씬 적은 학습 데이터로 더 높은 정확도를 달성할 수 있다는 것입니다. 이는 데이터 라벨링에 비용이 많이 들고 시간이 많이 걸리거나 전문 지식이 필요한 영역에서 특히 유용합니다. 능동형 학습은 전체 데이터 세트에 한 번에 라벨을 붙이는 대신 가장 '유익한' 샘플에 우선순위를 부여하여 모델 학습 프로세스를 훨씬 더 효율적으로 만듭니다.
능동적 학습의 작동 방식
능동적 학습 프로세스는 주기적이며 종종 휴먼 인 더 루프 워크플로로 설명됩니다. 일반적으로 다음 단계를 따릅니다:
- 초기 모델 훈련: 초기에 레이블이 지정된 작은 데이터 세트에 대해 Ultralytics YOLO11 탐지기와 같은 모델을 먼저 학습합니다.
- 레이블이 지정되지 않은 데이터 쿼리: 부분적으로 학습된 모델을 사용하여 라벨이 지정되지 않은 대규모 데이터 풀에 대한 예측을 수행합니다. 이러한 예측을 기반으로 모델은 가장 '불확실'한 샘플의 하위 집합을 선택합니다.
- 인간 주석: 이러한 불확실한 샘플은 인간 전문가(오라클)에게 제공되며, 오라클은 올바른 레이블을 제공합니다.
- 데이터 세트 증강: 새로 레이블이 지정된 샘플이 학습 세트에 추가됩니다.
- 재교육: 업데이트된 더 큰 데이터 세트에 대해 모델을 재학습합니다. 이 주기는 모델의 성능이 원하는 임계값에 도달하거나 라벨링 예산이 소진될 때까지 반복됩니다.
이 프로세스의 핵심은 쿼리 전략에 있습니다. 일반적인 전략에는 불확실성 샘플링(모델이 가장 확신하지 못하는 사례 선택), 위원회별 쿼리(여러 모델을 사용하고 동의하지 않는 사례 선택) 또는 예상되는 모델 변경 추정 등이 있습니다. 이에 대한 좋은 개요는 이 능동적 학습 설문조사에서 확인할 수 있습니다.
실제 애플리케이션
능동적 학습은 전문가의 주석이 병목 현상을 일으키는 전문 분야에서 매우 효과적입니다.
- 의료 영상 분석: 의료 스캔에서 암과 같은 질병을 감지하도록 AI를 학습시킬 때, 수백만 개의 이미지가 있지만 방사선 전문의의 시간은 한정되어 있을 수 있습니다. 능동형 학습 시스템은 무작위로 이미지에 라벨을 붙이는 대신 가장 모호하거나 드문 사례를 정확히 찾아내 검토할 수 있습니다. 이를 통해 전문가의 노력이 가장 필요한 곳에 집중되어 뇌종양 감지와 같은 작업을 위한 매우 정확한 모델 개발을 가속화할 수 있습니다. 이 분야의 연구에 따르면 생물의학 이미지 분할에 대한 연구에서와 같이 라벨링 작업이 크게 줄어든 것으로 나타났습니다.
- 자율 주행: 자율주행 차량의 인식 시스템은 수많은 주행 시나리오를 포함하는 방대하고 다양한 데이터 세트를 학습해야 합니다. 액티브 러닝은 수집된 주행 데이터에서 장애물에 가려진 보행자나 비정상적인 기상 조건과 같이 현재의 물체 감지 모델로는 어려움을 겪는 '엣지 케이스'를 식별할 수 있습니다. 개발자는 이러한 까다로운 장면에 주석을 달기 위해 우선순위를 지정함으로써 모델의 견고성과 안전성을 보다 효과적으로 개선할 수 있습니다.
능동적 학습과 관련 개념
능동적 학습을 라벨링되지 않은 데이터를 활용하는 다른 학습 패러다임과 구별하는 것이 중요합니다:
- 반지도 학습: 학습 중에 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 동시에 사용합니다. 능동 학습과 달리 일반적으로 특정 인스턴스에 대해 선택적으로 레이블을 쿼리하지 않고 사용 가능한 모든 레이블이 없는 데이터를 수동적으로 사용합니다.
- 자기 주도 학습: 사전 작업(예: 이미지의 가려진 부분 예측)을 생성하여 레이블이 없는 데이터에서 표현을 학습합니다. 사전 학습 단계에서 사람의 주석이 필요하지 않은 반면, 능동 학습은 레이블을 위해 오라클에 의존합니다. 딥마인드는 이 영역을 광범위하게 탐구해 왔습니다.
- 강화 학습: 환경과의 상호작용을 통해 시행착오를 겪으며 행동에 대한 보상이나 벌칙을 받음으로써 학습합니다. 능동 학습처럼 명시적인 레이블을 쿼리하지 않습니다.
- 연합 학습: 데이터를 로컬로 유지하면서 분산된 디바이스 전반에서 모델을 학습시키는 데 중점을 두며, 주로 데이터 프라이버시 문제를 해결합니다. 능동 학습은 효율적인 라벨 획득에 중점을 둡니다. 이러한 기술은 때때로 결합될 수 있습니다.
도구 및 구현
액티브 러닝을 구현하려면 종종 ML 모델을 주석 도구와 통합하고 데이터 워크플로우를 관리해야 합니다. scikit-learn과 같은 프레임워크는 일부 기능을 제공하며, 특정 작업을 위한 전문 라이브러리도 존재합니다. Label Studio와 같은 주석 소프트웨어를 활성 학습 파이프라인에 통합하여 주석자가 쿼리된 샘플에 라벨을 제공할 수 있도록 할 수 있습니다. 진화하는 데이터 세트와 학습된 모델을 효과적으로 관리하는 것은 매우 중요하며, Ultralytics HUB와 같은 플랫폼은 개발 수명 주기 전반에 걸쳐 이러한 자산을 구성하기 위한 인프라를 제공합니다. 고급 ML 기법 구현에 대한 자세한 내용은 Ultralytics GitHub 리포지토리를 살펴보세요.