異常検知
AI/MLにおける異常検知が、データ内の異常なパターンをどのように識別するかを解説します。不正防止、ヘルスケアなどの応用例をご紹介します。
異常検知は、機械学習(ML)で使用される手法であり、データの大部分と大きく異なるため、疑わしいと思われるまれなアイテム、イベント、または観測を識別します。これらの非適合インスタンスは、異常、外れ値、または新規性として知られています。主な目標は、正常なデータポイントと異常なデータポイントを自動的に区別することです。この機能は、機器の故障、金融詐欺、セキュリティ侵害、医療問題などの問題を事前に特定できるため、幅広い分野で重要です。コンピュータビジョン(CV)のコンテキストでは、異常検知には、予想される動作に適合しない画像やビデオ内の異常なパターンまたはオブジェクトを見つけることが含まれます。
異常検知 vs. 物体検出
異常検知と物体検出を区別することが重要です。
- 物体検出: このタスクは、画像内の既知のオブジェクトクラスのインスタンスを識別して位置を特定することに焦点を当てています。たとえば、物体検出モデルは、道路の風景画像内のすべての車、歩行者、および交通標識を見つけるようにトレーニングされています。モデルは、トレーニングデータ内の定義済みカテゴリに基づいて、何を探しているかを知っています。
- 異常検知: このタスクは、「正常」として学習された定義から逸脱するものを識別することです。多くの場合、システムは異常がどのようなものになるかを事前に知りません。例えば、何千もの完璧な製品の画像でトレーニングされ、傷、へこみ、変色など、これまで見たことのない種類の欠陥をあらゆる不完全さとして検出するタスクが与えられます。
Ultralytics YOLOのようなモデルは、特定の欠陥をオブジェクトとして扱うことで、異常検出のバージョンを実行するようにカスタムトレーニングできますが、基本的なアプローチは異なります。従来のオブジェクト検出では、検出する必要があるすべてのクラスの例が必要ですが、多くの異常検出方法では、正常な状態を表すデータのみが必要です。
異常検知の手法
異常検知の手法は、データセット内のラベルの利用可能性に基づいて大きく分類できます。
- Supervised Learning: この手法では、「正常」と「異常」の両方の例でラベル付けされたデータセットが必要です。分類モデルは、2つを区別するようにトレーニングされます。このアプローチは非常に効果的ですが、大規模で適切にラベル付けされたデータセットが必要となるため、制限されます。異常は定義上まれであるため、取得が困難な場合があります。
- 半教師あり学習: これは最も一般的なアプローチであり、モデルは正常な例のデータセットでのみトレーニングされます。システムは正常なパターンを学習し、この学習済みモデルから逸脱するデータポイントを異常としてフラグを立てます。これは、異常が多様で予測不可能なシナリオに非常に実用的です。
- 教師なし学習: この手法は、ラベルなしで機能します。異常は少なく、正常なデータポイントとは異なるという前提で動作します。クラスタリング(例:DBSCAN)や統計的手法などのアルゴリズムを使用してデータポイントをグループ化し、孤立したポイントまたは小さなクラスタを異常として識別します。さまざまな手法の包括的な概要は、「異常検出のための深層学習:サーベイ」などのトピックに関する学術調査にあります。
実際のアプリケーション
異常検知は、多くのインテリジェントシステムの基礎であり、業界全体で重要な洞察を提供します。
- 製造品質管理:組立ラインでは、コンピュータビジョンシステムが製品をリアルタイムで監視できます。完璧なアイテムの画像でトレーニングされたモデルは、亀裂、ずれ、または欠落しているコンポーネントなどの欠陥を即座に特定できます。多くの場合スマートファクトリーで研究されているこの自動検査は、手動チェックよりもはるかに効率的に品質を向上させ、廃棄物を削減します。
- セキュリティと監視: 公共スペースまたはセキュリティ施設では、AI搭載の監視システムが異常なイベントを検出できます。例としては、交通に逆らって運転する車両の識別、空港での放置されたバッグの検出、または制限区域への不正アクセスのフラグ付けなどがあります。これらのシステムは、セキュリティ担当者にリアルタイムアラートを提供できます。
- 医療におけるAI: 異常検知は、スキャンで潜在的な癌細胞を強調表示したり、心電図データから不規則な心拍を識別したりすることにより、医用画像解析に役立ちます。
- 金融不正検出: 銀行および金融機関は、異常検出を使用してトランザクションのストリームを監視し、Kaggleのクレジットカード不正検出データセットのような公開データセットにあるものなど、不正行為を示すパターンを特定します。
- サイバーセキュリティ: ネットワークトラフィックを監視して、サイバー攻撃やデータ侵害を示す可能性のある異常なパターンを検出します。サイバーセキュリティ・インフラストラクチャセキュリティ庁(CISA)のような組織は、そのような予防措置を重視しています。
ツールとテクノロジー
堅牢な異常検知システムを開発するには、標準的なMLライブラリと特殊なプラットフォームの組み合わせが必要となることがよくあります。