Yolo 비전 선전
선전
지금 참여하기
용어집

LightGBM

대규모 데이터 세트를 위한 빠르고 효율적인 그래디언트 부스팅 프레임워크인 LightGBM을 알아보고, 머신 러닝 애플리케이션에서 높은 정확도를 제공하는 방법을 알아보세요.

LightGBM, 즉 라이트 그라데이션 부스팅 머신은 Microsoft에서 개발한 고성능 오픈 소스 그라데이션 부스팅 Microsoft 순위, 분류 및 기타 기계 학습(ML) 작업에 널리 사용되는 머신 러닝(ML) 작업에 사용됩니다. 특히 높은 효율성과 낮은 메모리 사용량으로 대규모 데이터를 처리하도록 설계되었습니다. 다른 많은 알고리즘과 달리 대규모 데이터 세트에 어려움을 겪는 다른 많은 알고리즘과 달리, LightGBM은 속도에 최적화되어 있어 산업 애플리케이션과 경쟁이 치열한 데이터 과학 환경. 트리 기반 학습 알고리즘을 활용하여 예측을 반복적으로 개선하여 다음과 같은 최첨단 결과를 얻을 수 있습니다.

핵심 메커니즘 및 효율성

LightGBM의 주요 장점은 의사 결정 트리를 구성하는 고유한 접근 방식에 있습니다. 의사 결정 트리. 기존의 부스팅 알고리즘은 은 일반적으로 레벨 우선(깊이 우선) 성장 전략을 사용하는 반면, LightGBM은 리프 우선(최선 우선) 전략을 사용합니다. 이 방법은 델타 손실이 가장 큰 리프를 선택하여 성장시키므로 모델이 훨씬 더 빠르게 수렴하고 더 높은 정확도를 달성할 수 있습니다.

정밀도를 저하시키지 않으면서 성능을 더욱 향상시키기 위해 LightGBM은 두 가지 새로운 기술을 통합했습니다:

  • 그래디언트 기반 일측 샘플링(GOSS): 이 기술은 데이터 인스턴스를 다운샘플링합니다. 이 기법은 기울기가 큰(오차가 큰) 모든 인스턴스를 유지하고 기울기가 작은 인스턴스에 대해 무작위 샘플링을 수행합니다. 이 접근 방식은 기울기가 작은 데이터 포인트가 이미 잘 학습되어 있다고 가정하므로, 최적화 알고리즘이 최적화 알고리즘이 더 어려운 사례에 집중할 수 있습니다.
  • 독점 기능 번들링(EFB): 고차원 데이터에서는 많은 기능이 상호 배타적입니다. (동시에 0이 아닌 경우는 없습니다). EFB는 이러한 기능을 번들로 묶어 차원을 줄이고 모델 학습 속도를 높입니다.

실제 애플리케이션

LightGBM은 특히 구조화된 데이터나 표 형식의 데이터에 효과적이며 다양한 산업 분야의 중요 시스템을 지원합니다.

  1. 금융 사기 탐지: 금융 분야에서는 속도가 매우 중요합니다. LightGBM은 수백만 건의 거래 기록을 수백만 건의 거래 기록을 실시간으로 분석하여 의심스러운 활동을 표시하는 데 사용됩니다. 다음과 통합하여 금융 분야의 AI 워크플로우와 통합함으로써 금융 기관은 오탐을 줄이고 사기를 사전에 방지할 수 있습니다.
  2. 의료 진단: 의료 전문가들은 환자의 위험을 평가하기 위해 예측 모델링을 통해 환자의 위험을 평가합니다. 예를 들어, 환자의 병력과 활력 징후를 분석하여 당뇨병이나 심장 질환과 같은 질병의 발생 가능성을 예측할 수 있습니다. 또는 심장 질환과 같은 질병의 가능성을 예측할 수 있습니다. 의료 분야의 AI.

다른 모델과의 비교

ML 환경에서 LightGBM이 어디에 적합한지 이해하려면 유사한 부스팅 라이브러리 및 딥 러닝 프레임워크와 구별해야 합니다.

  • LightGBM과 XGBoost 및 CatBoost 비교: 동안 XGBoost와 CatBoost도 인기 있는 그라데이션 부스팅 라이브러리입니다, 구현 방식이 다릅니다. XGBoost는 전통적으로 레벨 단위 성장을 사용하며, 이는 더 안정적이지만 종종 느립니다. LightGBM의 리프 단위 접근 방식보다 느립니다. CatBoost는 범주형 데이터에 특히 최적화되어 있는 반면, LightGBM은 종종 다음과 같은 전처리가 필요합니다. 카테고리를 최적으로 처리하기 위한 기능 엔지니어링 같은 사전 처리가 필요한 경우가 많습니다.
  • LightGBM과 Ultralytics YOLO: 구조화된 데이터 작업(행 및 열)에 탁월한 성능을 발휘합니다. 반면 대조적으로 Ultralytics YOLO11딥 러닝(DL) 프레임워크로 딥러닝 프레임워크입니다. LightGBM은 고객 이탈을 예측할 수 있지만, YOLO 모델은 다음과 같은 기능을 수행합니다. 객체 감지이미지 분류를 수행합니다. 포괄적인 AI 솔루션의 경우, 개발자는 종종 Ultralytics 플랫폼을 사용하여 비전 관리 모델과 LightGBM과 같은 표 형식 모델을 함께 관리합니다.

코드 예제

다음 Python 스니펫은 합성 데이터에 대해 기본 LightGBM 분류기를 훈련하는 방법을 보여줍니다.

import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)

# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")

기본 알고리즘에 대해 더 자세히 알아보려면 공식 LightGBM 문서를 참조하세요.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기