YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

LightGBM

대규모 데이터 세트를 위한 빠르고 효율적인 그래디언트 부스팅 프레임워크인 LightGBM을 알아보고, 머신 러닝 애플리케이션에서 높은 정확도를 제공하는 방법을 알아보세요.

Light Gradient Boosting Machine의 약자인 LightGBM은 Microsoft에서 개발한 고성능 오픈 소스 Gradient Boosting 프레임워크입니다. 속도와 효율성을 위해 설계되었으며, 대규모 데이터 세트를 포함하고 빠른 학습 시간이 필요한 머신러닝(ML) 작업에 탁월한 선택입니다. 의사 결정 트리 알고리즘을 기반으로 하는 LightGBM은 새로운 Leaf-wise 트리 성장 전략을 사용하여 다른 부스팅 알고리즘보다 훨씬 빠르게 수렴합니다. 빅 데이터 처리 효율성 덕분에 산업 응용 분야와 데이터 과학 경진 대회에서 널리 사용되는 도구가 되었습니다.

LightGBM이 고성능을 달성하는 방법

LightGBM의 속도와 낮은 메모리 사용량은 다른 gradient boosting 방법과 차별화되는 몇 가지 주요 혁신 덕분입니다. 이러한 기술은 정확도를 희생하지 않고 학습 프로세스를 최적화하기 위해 함께 작동합니다.

  • Leaf-wise 트리 성장: 트리를 레벨별로 성장시키는 기존 알고리즘과 달리 LightGBM은 leaf-by-leaf 방식으로 트리를 성장시킵니다. 최대 델타 손실을 가진 leaf를 선택하여 성장시키므로 모델이 더 빠르게 수렴하고 동일한 반복 횟수에 대해 더 낮은 손실을 초래하는 경우가 많습니다.
  • Gradient-based One-Side Sampling (GOSS): 이 방법은 더 큰 기울기를 가진 데이터 인스턴스(즉, 잘못 예측된 인스턴스)에 초점을 맞춥니다. 큰 기울기를 가진 모든 인스턴스를 유지하고 작은 기울기를 가진 인스턴스에서 무작위로 샘플링하여 정확도와 훈련 속도 간의 균형을 유지합니다.
  • Exclusive Feature Bundling (EFB): 고차원 희소 데이터를 처리하기 위해 EFB는 상호 배타적인 특징을 함께 묶습니다. 이 번들링은 고려되는 특징의 수를 줄여 모델 훈련 프로세스 속도를 크게 향상시킵니다.

더 자세한 기술적 내용은 원본 LightGBM 연구 논문에서 아키텍처 및 알고리즘에 대한 포괄적인 세부 정보를 제공합니다.

실제 애플리케이션

LightGBM은 구조화되었거나 테이블 형태의 데이터를 다루는 다양한 애플리케이션에 적합합니다.

  1. 사기 탐지: 금융 분야에서 LightGBM은 수백만 건의 거래 기록을 신속하게 처리하여 거의 실시간으로 사기 행위를 나타내는 미묘한 패턴을 식별할 수 있습니다. LightGBM의 속도는 시기적절한 개입에 매우 중요하며, 사기 탐지 시스템금융 AI의 효율성으로부터 큰 이점을 얻습니다.
  2. 예측 유지보수: 제조업의 AI는 LightGBM을 사용하여 기계의 센서 데이터를 분석합니다. 장비 성능 및 고장의 과거 데이터를 기반으로 훈련함으로써 모델은 발생하기 전에 잠재적인 고장을 예측할 수 있으므로 사전 예방적 유지보수가 가능하고 가동 중지 시간이 줄어듭니다. 예측 유지보수의 핵심 개념에 대해 자세히 알아볼 수 있습니다.

다른 일반적인 응용 분야로는 고객 이탈 예측, 추천 시스템, 클릭률 예측, 신용 점수 평가 등이 있습니다. 이러한 성능 덕분에 Kaggle에서 주최하는 것과 같은 데이터 과학 경진대회에서 인기 있는 선택이 되었습니다.

LightGBM vs. 기타 모델

LightGBM은 gradient boosting 모델의 한 종류이며 다른 유형의 ML 모델과 구별되어야 합니다.

  • XGBoost 및 CatBoost와 비교: LightGBM은 XGBoostCatBoost와 자주 비교됩니다. 모두 강력한 그래디언트 부스팅 라이브러리이기 때문입니다. 주요 차이점은 트리 성장 알고리즘에 있습니다. LightGBM의 리프 중심 성장은 일반적으로 XGBoost에서 사용되는 레벨 중심 성장보다 빠릅니다. CatBoost는 범주형 기능에 대한 내장 처리 기능이 뛰어나고 LightGBM과 XGBoost는 종종 이러한 데이터에 대한 전처리가 필요합니다. 이들 간의 선택은 종종 특정 데이터 세트 및 성능 요구 사항에 따라 달라집니다.
  • 딥 러닝 모델과 비교: LightGBM은 기존 ML 작업을 위한 테이블 형식 데이터에 뛰어나지만 Ultralytics YOLO와 같은 모델과는 다릅니다. YOLO 모델은 비정형 이미지 또는 비디오 데이터에 대한 객체 감지, 이미지 분류이미지 분할과 같은 컴퓨터 비전(CV) 작업을 위해 설계된 특수 딥 러닝(DL) 아키텍처입니다. Ultralytics HUB와 같은 플랫폼은 이러한 고급 CV 모델의 개발 및 배포를 용이하게 합니다. LightGBM은 대규모 데이터 세트에서 속도와 효율성이 가장 중요한 구조화된 데이터 문제에 중요한 도구로 남아 있습니다. 공식 LightGBM 문서를 탐색하여 구현을 시작할 수 있습니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.