자동화된 머신러닝(AutoML)
AutoML로 머신 러닝 프로젝트를 간소화하세요! 데이터 준비, 모델 선택 및 튜닝을 자동화하여 시간을 절약하고 모든 사람이 AI에 접근할 수 있도록 하세요.
자동화된 머신러닝(AutoML)은 머신러닝(ML) 모델 개발의 시간 소모적인 반복 작업을 자동화하는 프로세스입니다. AutoML은 고성능 ML 모델을 비전문가도 쉽게 사용할 수 있도록 하고, 특징, 알고리즘 및 파라미터 선택을 자동화하여 데이터 과학자의 생산성을 높이는 것을 목표로 합니다. 데이터 전처리부터 모델 배포까지 작업을 처리함으로써 AutoML은 전체 워크플로우를 간소화하여 더 빠른 실험과 더 정확하고 효율적인 모델 생성을 가능하게 합니다. 이러한 자동화는 고급 AI를 보다 쉽게 접근하고 확장할 수 있도록 하는 핵심 단계입니다.
AutoML 작동 방식
AutoML 시스템은 머신러닝 파이프라인에서 가장 반복적인 부분을 자동화합니다. 일반적인 AutoML 프로세스에는 다음과 같은 주요 단계가 포함됩니다.
- 데이터 준비 및 특징 엔지니어링(Data Preparation and Feature Engineering): 원시 데이터를 자동으로 정리하고 모델에 의미 있는 특징을 생성합니다. 여기에는 누락된 값 처리, 정규화 및 기존 변수에서 새로운 예측 변수를 만드는 것이 포함될 수 있습니다.
- 모델 선택: 광범위한 가능성 중에서 주어진 문제에 가장 적합한 알고리즘(의사 결정 트리, 서포트 벡터 머신 또는 신경망 등)을 선택합니다.
- 하이퍼파라미터 최적화: 선택한 모델에 대한 최적의 하이퍼파라미터를 자동으로 찾습니다. 이는 베이지안 최적화, 그리드 검색 또는 진화 알고리즘과 같은 정교한 검색 전략을 사용하여 수행되는 경우가 많습니다. Ultralytics는 하이퍼파라미터 튜닝과 같은 작업을 위해 이를 도구에 통합합니다.
- 모델 평가 및 반복: 정확도 또는 F1-점수와 같은 메트릭을 사용하여 모델의 성능을 평가하고 더 나은 결과를 얻기 위해 프로세스를 반복합니다.
실제 애플리케이션
AutoML은 개발을 가속화하고 결과를 개선하기 위해 수많은 산업 분야에서 적용되고 있습니다.
- 헬스케어 분야의 AI: 의료 영상 분석에서 AutoML은 스캔에서 종양을 감지하기 위해 다양한 이미지 분할 모델을 신속하게 테스트할 수 있습니다. 시스템은 뇌종양 데이터 세트와 같은 데이터 세트에서 다양한 아키텍처를 자동으로 훈련하고 평가하여 연구자가 배포 가능한 진단 도구를 개발하는 데 필요한 시간을 크게 줄일 수 있습니다.
- 금융 서비스: 은행은 AutoML을 사용하여 사기 탐지 모델을 구축합니다. 과거 거래 데이터를 AutoML 플랫폼에 공급함으로써 데이터 과학자의 광범위한 수동 작업이 필요한 작업을 수행하지 않고도 사기 패턴을 매우 정확하게 식별하는 모델을 자동으로 생성하고 최적화할 수 있습니다. 이는 금융 분야의 컴퓨터 비전에서 더 자세히 살펴봅니다.
AutoML vs. 관련 개념
AutoML을 관련 분야와 구별하는 것이 유용합니다.
- AutoML vs. MLOps: AutoML은 모델 구축(선택, 학습, 튜닝) 자동화를 구체적으로 목표로 하는 반면, 머신러닝 운영(MLOps)는 전체 ML 수명 주기를 다룹니다. MLOps는 배포, 모니터링, 관리 및 거버넌스를 포함하여 모델이 프로덕션에서 안정적으로 작동하도록 보장합니다. AutoML은 종종 더 큰 MLOps 프레임워크 내의 구성 요소로, 모델 배포 및 모델 모니터링 전에 초기 개발 단계를 간소화합니다.
- AutoML vs. NAS: 신경망 아키텍처 검색(NAS)은 신경망 아키텍처를 자동으로 설계하는 데 특히 중점을 둔 AutoML의 하위 분야입니다. NAS는 네트워크 설계를 자동화하는 반면, 더 광범위한 AutoML 도구는 NN뿐만 아니라 다양한 모델 유형에 대한 특징 엔지니어링 및 하이퍼파라미터 튜닝도 자동화할 수 있습니다.
AutoML 도구 및 플랫폼
수많은 도구와 플랫폼이 AutoML을 용이하게 합니다.