YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Data Cleaning

データクレンジングを習得してAIモデルの精度を向上させましょう。エラーの除去、欠損値の処理、Ultralytics YOLO26向けのクリーンなデータセット作成の手法を学びます。

データクリーニングとは、レコードセット、テーブル、またはデータベースから、破損したデータ、不正確なデータ、または無関係なレコードを検出し、修正(または削除)する重要なプロセスです。人工知能 (AI)機械学習 (ML) の領域において、このステップはワークフローの中で最も時間がかかり、かつ不可欠な部分であると見なされています。YOLO26 のようなモデルが効果的にオブジェクトの認識を学習するためには、入力の品質が低いと出力も信頼できないものになるという「ゴミを入れたらゴミが出てくる(Garbage In, Garbage Out)」現象を防ぐために、学習データからエラーを取り除く必要があります。

Link to this sectionAIにおけるデータ整合性の重要性#

高性能な コンピュータビジョン モデルは、使用するデータセットの品質に大きく依存します。データセットにラベル付けが誤った画像、重複、または破損したファイルが含まれている場合、モデルはパターンの一般化に苦労し、過学習 (overfitting)推論精度 の低下を招きます。効果的なデータクリーニングは 予測モデルの信頼性 を向上させ、アルゴリズムがノイズではなく有効な信号から学習することを保証します。

Link to this section一般的なデータクリーニング手法#

実務担当者は、表形式データに対する Pandas や、専門的なビジョンツールなどを使用して、データセットを洗練させるための様々な戦略を採用しています。

  • 欠損値の処理: これには、欠損データを持つレコードを削除するか、統計的な平均値や近傍点に基づいてギャップを埋めるための 補完手法 (imputation techniques) を使用することが含まれます。
  • 重複の削除: 学習セット内に重複する画像があると、意図せずモデルにバイアスがかかる可能性があります。これらを削除することで、モデルが特定の例を記憶することを防ぎ、データセットのバイアス を軽減する助けとなります。
  • 外れ値検出: 統計分析やモデルの重みを歪める可能性があるため、通常から大きく逸脱した 異常値 (anomalies)外れ値 (outliers) を特定し、処理することは極めて重要です。
  • 構造的な修正: これには、クラスの一貫性 を確保するためのクラスラベルの誤字修正(例:「Car」と「car」の修正)などが含まれます。

Link to this section実社会での応用#

データクリーニングは、AIが導入されている様々な業界において極めて重要です。

  • 医療画像分析: ヘルスケアAIアプリケーション では、データセットにアーティファクト、誤った患者メタデータ、または無関係な背景ノイズが含まれていることがよくあります。このデータをクリーニングすることで、医療画像分析 モデルが診断に関連する生物学的マーカーのみに集中できるようになります。
  • 小売在庫管理: 小売向けAI の製品データセットには、廃盤となったアイテムやアスペクト比が誤っている画像が含まれている場合があります。これらのデータセットをクリーニングすることで、オブジェクト検出 モデルが正確に在庫レベルを特定し、実環境での誤検出を減らすことが可能になります。

Link to this sectionデータクリーニングと前処理の区別#

しばしば混同されますが、データクリーニングは データ前処理 とは異なります。データクリーニングはエラーの修正と「悪い」データの除去に焦点を当てています。対照的に、前処理には、きれいなデータをモデルに適した形式へ変換すること、例えば 画像のリサイズ、正規化、あるいは多様性を高めるための データ拡張 (data augmentation) の適用が含まれます。

Link to this section品質チェックの自動化#

Ultralytics Platform で利用可能なものなど、現代のワークフローでは、学習を開始する前に破損した画像やラベルの不整合を特定するための自動チェックが統合されています。以下は、YOLO26 のようなモデルにデータを供給する前の一般的なステップとして、標準の Pillow ライブラリ を使用して、破損した画像ファイルをチェックおよび特定する方法を示すシンプルな Python の例です。

from pathlib import Path

from PIL import Image


def verify_images(dataset_path):
    """Iterates through a directory to identify corrupt images."""
    for img_path in Path(dataset_path).glob("*.jpg"):
        try:
            with Image.open(img_path) as img:
                img.verify()  # Checks file integrity
        except (OSError, SyntaxError):
            print(f"Corrupt file found: {img_path}")


# Run verification on your dataset
verify_images("./coco8/images/train")

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう