YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Dataset Bias

AIにおけるデータセットの偏り (bias) の原因を探り、その歪みを緩和する方法を学びましょう。Ultralytics PlatformとUltralytics YOLO26を使用して公平性を向上させる方法を解説します。

データセットのバイアスは、機械学習 (ML)モデルの学習に使用される情報に系統的なエラーや偏った分布が含まれている場合に発生し、その結果としてAIシステムがある特定の結果を他よりも優先するように導いてしまう現象です。モデルはパターン認識エンジンとして機能するため、その入力に完全に依存しています。学習データが現実世界の環境の多様性を正確に反映していない場合、モデルはその死角をそのまま引き継いでしまいます。この現象は多くの場合、汎化性能の低下を招きます。つまり、テスト中には高いスコアを達成できても、多様な状況や想定外のシナリオでリアルタイム推論を実行すると、大幅に性能が低下してしまうのです。

Link to this sectionデータの偏りの一般的な原因#

バイアスは開発ライフサイクルのいくつかの段階でデータセットに混入する可能性があり、多くの場合、収集やアノテーションの際の人間による判断に起因します。

  • 選択バイアス: これは、収集されたデータがターゲットとなる母集団をランダムに代表していない場合に生じます。例えば、セレブリティの画像ばかりを使用して顔認識データセットを作成すると、モデルは厚化粧やプロによる照明環境に偏ってしまい、日常的なウェブカメラの画像で失敗する原因となります。
  • ラベリングエラー: データラベリング中の主観性が人間の偏見を持ち込むことがあります。明確なガイドラインがないためにアノテーターが一貫して曖昧なオブジェクトを誤分類すると、モデルはこれらのエラーを正解として学習してしまいます。
  • 表現バイアス: ランダムに選択された場合でも、マイノリティグループがマジョリティクラスによって統計的にかき消されてしまうことがあります。物体検出において、車の画像が10,000枚あるのに対し自転車の画像が100枚しかないデータセットでは、車を検出することに偏ったモデルが出来上がってしまいます。

Link to this section現実世界のアプリケーションと影響#

データセットのバイアスの影響は、特に自動化システムが重要な決定を下したり物理世界とやり取りしたりする場合、さまざまな業界で深刻なものとなります。

自動車業界では、自動車向けAIはカメラを使用して歩行者や障害物を識別します。自動運転車が主に晴天や乾燥した気候で収集されたデータで学習した場合、雪や激しい雨の中で運用すると性能が低下する可能性があります。これは、学習時の分布が運用時の分布と一致していない典型的な例であり、安全上のリスクにつながります。

同様に、医療画像解析においても、診断モデルは過去の患者データで学習されることが一般的です。皮膚疾患を検出するために設計されたモデルが明るい肌のトーンに偏ったデータセットで学習されている場合、暗い肌の患者を診断する際に精度が著しく低下する可能性があります。これに対処するには、すべての人口統計グループにおいてAIにおける公平性を確保する多様なデータセットをキュレートする、協調的な取り組みが求められます。

Link to this section緩和のための戦略#

開発者は、厳格な監査と高度な学習戦略を採用することでデータセットのバイアスを軽減できます。データ拡張などの手法は、過小評価されている例のバリエーションを人為的に作成(反転、回転、輝度の調整など)することでデータセットのバランスを取るのに役立ちます。さらに、合成データを生成することで、現実世界のデータが不足している、あるいは収集が困難な箇所のギャップを埋めることができます。

これらのデータセットを効果的に管理することは不可欠です。Ultralytics Platformを使用すると、チームは学習を開始する前にクラス分布を可視化し、不均衡を特定できます。さらに、NIST AIリスク管理フレームワークのようなガイドラインに従うことは、組織が体系的にリスクを特定し緩和するためのアプローチを構築する助けとなります。

Link to this sectionデータセットのバイアスと関連概念の比較#

エラーがどこから発生しているかを理解するために、データセットのバイアスと類似の用語を区別することが役立ちます。

  • vs. アルゴリズムバイアス: データセットのバイアスはデータ中心であり、「材料」に欠陥があることを意味します。アルゴリズムバイアスはモデル中心であり、アルゴリズム自体の設計や、全体的なメトリクスを最大化するためにマイノリティグループを犠牲にしてマジョリティクラスを優先してしまう最適化アルゴリズムに起因します。
  • vs. モデルドリフト: データセットのバイアスは、学習時に存在する静的な問題です。モデルドリフト(またはデータドリフト)は、モデルがデプロイされた「後」に現実世界のデータが時間とともに変化する際に発生し、継続的なモデルモニタリングが必要となります。

Link to this sectionコード例:バイアスを低減するための拡張#

以下の例は、YOLO26を使用して学習中にデータ拡張を適用する方法を示しています。幾何学的な拡張を増やすことで、モデルはより優れた汎化能力を学び、学習セットに含まれる特定のオブジェクトの向きや位置に対するバイアスを低減できる可能性があります。

from ultralytics import YOLO

# Load YOLO26n, a high-efficiency model ideal for edge deployment
model = YOLO("yolo26n.pt")

# Train with increased augmentation to improve generalization
# 'fliplr' (flip left-right) and 'scale' help the model see diverse variations
results = model.train(
    data="coco8.yaml",
    epochs=50,
    fliplr=0.5,  # 50% probability of horizontal flip
    scale=0.5,  # +/- 50% image scaling
)

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう