異常検知
AI/MLにおける異常検知は、データの異常なパターンを特定し、詐欺防止やヘルスケアなどに応用されます。
アノマリー検出は、機械学習(ML)で使用されるテクニックで、データの大部分と大きく異なることによって疑念を抱かせる稀なアイテム、イベント、または観察を識別するために使用される。これらの不適合なインスタンスは、異常、外れ値、または新規性として知られている。主な目的は、正常なデータ・ポイントと異常なデータ・ポイントを自動的に区別することである。この機能は、機器の故障、金融詐欺、セキュリティ侵害、医療問題などの問題を事前に特定することを可能にするため、幅広い分野で重要である。コンピュータ・ビジョン(CV)の文脈では、異常検知は、画像や映像の中から、期待される動作に適合しない異常なパターンやオブジェクトを見つけることを含む。
異常検知と物体検知の比較
異常検知と物体検知を区別することが重要だ。
- オブジェクト検出:このタスクは、画像内の既知のオブジェクトクラスのインスタンスを識別し、位置を特定することに重点を置く。例えば、オブジェクト検出モデルは、ストリートビュー画像内のすべての車、歩行者、交通標識を見つけるように訓練される。このモデルは、学習データ内の事前定義されたカテゴリに基づいて、何を探しているかを知っている。
- 異常検知:このタスクは、学習された "正常 "の定義から逸脱するものを識別することである。多くの場合、システムは事前に異常がどのように見えるかを知らない。例えば、何千枚もの完璧な製品の画像で学習させ、傷、へこみ、変色など、今まで見たことのないような欠陥にフラグを立てるようにする。
Ultralytics YOLOのようなモデルは、特定の欠陥をオブジェクトとして扱うことで、異常検知のバージョンを実行するようにカスタムトレーニングすることができるが、基本的なアプローチは異なる。伝統的なオブジェクト検出は、見つけなければならないすべてのクラスの例を必要とするのに対し、多くの異常検出方法は正常な状態を表すデータのみを必要とする。
異常検知の方法
異常検知技術は、データセット中のラベルの有無に基づいて大別することができる:
- 教師あり学習:この方法では、「正常」な例と「異常」な例の両方でラベル付けされたデータセットが必要である。分類モデルは、この2つを区別するために学習される。このアプローチは非常に効果的であるが、大規模で十分にラベル付けされたデータセットが必要であるという制約がある。
- 半教師あり学習:これは最も一般的なアプローチで、モデルは正常な例のデータセットのみで学習される。システムは正常なパターンを学習し、この学習されたモデルから逸脱したデータ点を異常としてフラグを立てる。これは、異常が多様で予測不可能なシナリオにおいて非常に実用的である。
- 教師なし学習:この方法はラベルなしで機能する。異常は少数で、正常なデータ点とは異なるという前提で動作する。クラスタリング(例:DBSCAN)や統計的手法のようなアルゴリズムがデータポイントのグループ化に使用され、孤立したポイントや小さなクラスターが異常として識別される。様々な手法の包括的な概要は、「Deep Learning for Anomaly Detection:A Survey"(サーベイ)などがある。
実世界での応用
異常検知は多くのインテリジェント・システムの基礎であり、業界全体にわたって重要な洞察を提供している。
- 製造品質管理:組立ラインでは、コンピュータビジョンシステムがリアルタイムで製品を監視することができます。完璧な製品の画像から学習されたモデルは、ひび割れ、位置のずれ、部品の欠落などの欠陥を即座に発見することができる。スマート・マニュファクチャリングでしばしば検討されるこの自動検査は、手作業による検査よりもはるかに効率的に品質を向上させ、無駄を省きます。
- セキュリティと監視:公共スペースや安全な施設では、AIを搭載した監視システムが異常な出来事を検知することができる。例えば、交通渋滞に逆らって走行する車両を特定したり、空港で放置されたバッグを検出したり、制限区域への不正アクセスにフラグを立てたりすることができる。このようなシステムは、セキュリティ担当者にリアルタイムで警告を発することができます。
- ヘルスケアにおけるAI:異常検知は、スキャン画像から潜在的ながん細胞を強調表示したり、心電図データから不規則な心拍を特定するなど、医療画像解析に役立つ。
- 金融詐欺の検出:銀行や金融機関は、異常検知を使用してトランザクションのストリームを監視し、Kaggleのクレジットカード不正検知データセットのような公開データセットに見られるような不正行為を示すパターンを特定します。
- サイバーセキュリティネットワーク・トラフィックを監視し、サイバー攻撃やデータ侵害のシグナルとなりうる異常なパターンを検出する。Cybersecurity and Infrastructure Security Agency (CISA)のような組織は、このような事前対策を重視している。
ツールとテクノロジー
堅牢な異常検知システムの開発には、標準的なMLライブラリと特殊なプラットフォームの組み合わせが必要になることが多い。