用語集

XGBoost

分類と回帰タスクにおける正確な予測のための、強力で、高速で、多用途な機械学習アルゴリズムであるXGBoostを発見してください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

XGBoostはExtreme Gradient Boostingの略で、スピードとパフォーマンスのために設計された、強力で広く使われているオープンソースの 機械学習(ML)アルゴリズムである。XGBoostは勾配ブースティング(gradient boosting)フレームワークの一群に属し、新しいモデルが以前のモデルのエラーを修正しながらモデルを順次構築するアンサンブル手法である。XGBoostは、オーバーフィッティングを防ぐための高度な正則化技術(L1正則化やL2正則化など)を取り入れ、より高速な学習と予測のために計算リソースを最適化することで、従来の勾配ブースティングを強化している。これにより、特に構造化されたデータや表形式のデータを扱う分類と 回帰の両方のタスクに非常に効果的です。

グラディエント・ブースティングを理解する

XGBoostは、Jerome H. Friedmanが開発した勾配ブースティングを最適化したものである。勾配ブースティングは、弱い学習者(通常は決定木)のアンサンブルを段階的に構築する。それぞれの新しい木は、先行する木のアンサンブルによる残差(実際の値と予測値の差)を予測しようとする。XGBoostは、効率とモデルの精度を大幅に向上させるいくつかの重要な革新的技術によって、このプロセスを改良している。

主な機能と強化点

XGBoostは、標準的な勾配ブースティング・アルゴリズムに対していくつかの改良を導入している:

  • 正則化:L1(Lasso)とL2(Ridge)の正則化項を目的関数に組み込み、オーバーフィッティングを防ぎ、モデルの汎化を改善します。
  • 並列処理:効率化のために設計されたXGBoostは、マルチコアGPUを活用してトレーニング中の計算を高速化することができます。
  • 欠損値の処理欠損データ値を処理するルーチンが組み込まれており、データ自体から最適なインピュテーション戦略を学習する。
  • 木の枝刈り:標準的な勾配ブースティングと比較して、より高度なツリー刈り込み技術('max_depth'パラメータによる深さ優先刈り込みや、ゲインに基づくポスト刈り込みなど)を採用。
  • 組み込みのクロスバリデーション:ブースティング・プロセスの各反復でクロス・バリデーションを実行することができ、最適なブースティング・ラウンド数を簡単に得ることができます。
  • キャッシュ・アウェアネス:キャッシュ階層を認識することで、ハードウェアの使用を最適化します。
  • 柔軟性:カスタムの目的関数と評価関数をサポートし、標準的な分類や回帰以外のさまざまなタスクに適応します。これは、効果的なハイパーパラメータのチューニングを支援します。

他のアルゴリズムとの比較

XGBoostは表データに非常に有効だが、他の一般的なアルゴリズムとは異なる:

実世界での応用

XGBoostのパフォーマンスとロバスト性は、幅広い予測モデリング・アプリケーションに適している:

  • 金融サービス:信用リスク評価、不正検知、アルゴリズム取引戦略に幅広く使用されている。例えば、銀行はXGBoostを使用して、顧客の申し込みデータに基づいて貸し倒れの可能性を予測するモデルを構築している。金融におけるAIについて詳しく見る。
  • 小売業とEコマース: 顧客行動分析、顧客離れ、売上予測、レコメンデーション・エンジンの構築などの予測に応用。例えば、オンライン小売業者がXGBoostを使って、特定のマーケティングキャンペーンに反応しそうな顧客を予測するような場合です。
  • ヘルスケア臨床データに基づく患者の転帰や疾病リスクの予測、病院運営の最適化に採用。ヘルスケアにおけるAIの詳細を読む。
  • 製造業:予知保全(設備の故障予測)、品質管理分析、生産プロセスの最適化に活用。製造業におけるAIを探る。
  • 競争の激しいデータサイエンスXGBoostは、その高い精度と効率性により、Kaggleで開催されるようなデータサイエンス競技会で好まれているアルゴリズムです。

XGBoostは、その速度、精度、複雑な表データセットを効果的に処理する能力で支持され、機械学習の現場において非常に適切で強力なツールであり続けている。その開発は公式のXGBoostライブラリを通じて続けられており、Scikit-learnのような一般的なMLライブラリや、エンドツーエンドのMLライフサイクルを管理するためのUltralytics HUBのようなプラットフォームとうまく統合されている。

すべて読む