用語集

データセントリックAI

データ中心AIを発見しましょう。これは、モデルのパフォーマンスを向上させるためにデータセットの品質を改善するアプローチです。より優れたモデルだけでなく、より優れたデータが堅牢なAIの鍵となる理由を学びましょう。

データ中心AIは、人工知能（AI）システムを開発するための戦略的アプローチである。人工知能（AI）システムを開発するための戦略的アプローチであり、モデル・アーキテクチャを反復することよりも、学習データの質を向上させることに主眼を置いている。従来のワークフローでは、開発者はデータセットを固定入力として扱い、ハイパーパラメータの微調整や複雑な設計に多大な労力を費やしていました。ハイパーパラメータを調整したり、複雑なニューラルネットワーク（NN）構造の設計に多大な労力を費やす。対照的にのアーキテクチャのようなモデルコードを扱う。 Ultralytics YOLO11-を比較的静的なベースラインとして扱う、のようなモデルコードを比較的静的なベースラインとして扱う。パフォーマンスを向上させる。

核となる哲学量より質

機械学習（ML）システムの有効性は機械学習（ML）システムは基本的にガベージ・イン、ガベージ・アウト "の原則によって制限される。どんなに高度なアルゴリズムでもノイズの多い、あるいはラベル付けが正しくない入力から効果的なパターンを学習することはできない。データ中心AIは、多くの実用的なアプリケーションでは、学習データが最も重要であるとしている。多くの実用的なアプリケーションでは、学習データが成功のための最も重要な変数である。このアプローチでは、ノイズの多い膨大なデータセットよりも、少量で質の高いデータセットの方が、より良い結果が得られることが多いことを強調する。膨大でノイズの多いデータセットよりも

アンドリュー・ンなどのこの哲学の支持者は、AIのコミュニティがモデル中心のイノベーションに偏っていると主張している。 AIコミュニティの焦点は、モデル中心のイノベーションに偏っている。ロバストなシステムを構築するためにはエンジニアは能動的な学習プロセスに取り組まなければならないそこでは、故障モードを繰り返し特定し、データセットを改良することでそれを修正する。これには、正確なデータのラベリング、重複の除去、モデルが分類困難と判断したエッジケースの処理などである。エッジケースの処理などである。

主なテクニックと実施方法

データ中心戦略の実施には、データセットの情報密度と一貫性を最大化するためのいくつかの技術的プロセスが含まれる。情報密度と一貫性を最大化するために設計された、いくつかの技術的プロセスが含まれる。

体系的なデータクリーニング：これは、以下のようなアノテーションのエラーを検出し、修正することである。オブジェクトを厳密に包含していないバウンディングボックスオブジェクトをしっかりと包含していないバウンディングボックスを特定したり、クラスのミスマッチエラーを修正したりします。
データの拡張：開発者は人工的にデータセットの多様性を拡大する。データセットの多様性を拡大する。回転、スケーリング、色調整などの変換を適用することで、モデルは未知の環境に対してより良く汎化することを学習する。モデルは未知の環境に対してより良く汎化することを学習する。
合成データの生成：実世界のデータが乏しい場合、チームはデータセットのギャップを埋めるために合成データ合成データを生成してデータセットのギャップを埋めることができる、希少なクラスが適切に表現されるようにする。
エラー分析：精度のような総合的な指標だけを見るのではなくエンジニアは、精度のような総合的な指標だけを見るのではなくモデルを分析し、特定の弱点に対処するためのデータを収集します。

以下のPython コードは、トレーニング中に ultralytics パッケージで提供される。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train with specific data augmentations to improve generalization
# 'degrees' adds rotation, 'mixup' blends images, and 'copy_paste' adds object instances
results = model.train(
    data="coco8.yaml",
    epochs=10,
    degrees=15.0,  # Random rotation up to +/- 15 degrees
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
    copy_paste=0.1,  # Use Copy-Paste augmentation
)

実際のアプリケーション

データ中心のアプローチを採用することは、以下のような産業において非常に重要である。コンピュータ・ビジョン（CV）の精度がデータ中心のアプローチを採用することが重要です。

精密農業：農業におけるAI 農業AIでは健全な作物と初期段階の病害を見分けるには、微妙な視覚的手がかりに頼ることが多い。データ中心のチームは質の高い高品質のコンピューター・ビジョン・データセット様々な照明条件や成長段階における病害の例を具体的に含む、高品質のコンピューター・ビジョン・データセットのキュレーションに焦点を当てるだろう。モデルが無関係な背景の特徴を病気のクラスに関連付けることを学習しないようにするためだ。
工業検査製造業における製造業におけるAIでは、欠陥は万個に1回しか発生しないかもしれない。標準的なモデルのトレーニングでは、このような稀な事象は無視される可能性がある。そこで異常検出ストラテジーを採用しこのような特定の欠陥の画像をより多く調達または合成することで、エンジニアはシステムが品質管理基準に必要な高い想起率を達成できるようにする。品質管理標準に要求される高い再現率を達成することを保証します。 ISOのような組織によって定義されています。

データセントリックAI

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

核となる哲学量より質

主なテクニックと実施方法

実際のアプリケーション

関連概念の区別

このカテゴリの関連記事

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

コンピュータービジョンがより賢いバードウォッチング用双眼鏡を実現している

自己教師付き学習によるノイズ除去：段階的な分解

Ultralytics コミュニティに参加する

データセントリックAI

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

核となる哲学量より質

主なテクニックと実施方法

実際のアプリケーション

関連概念の区別

このカテゴリの関連記事

オークリー メタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

コンピュータービジョンがより賢いバードウォッチング用双眼鏡を実現している

自己教師付き学習によるノイズ除去：段階的な分解

Ultralytics コミュニティに参加する

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する