Ultralytics YOLO画像セグメンテーションのパワーを発見してください。ピクセルレベルの精度、種類、アプリケーション、実際のAI使用例をご覧ください。
画像セグメンテーションは、コンピュータビジョン(CV コンピュータビジョン(CV)の中核技術である。 一般に画像セグメントと呼ばれる。主な目的は 画像の表現を単純化し、より意味のある分析しやすいものにすることです。しかし オブジェクト検出とは異なり 矩形のバウンディングボックス内に物体を特定する物体検出とは異なり、画像セグメンテーションでは 画像セグメンテーションは、物体の形状をピクセルレベルで正確にマップする。このプロセスでは、画像内のすべてのピクセルにラベルが割り当てられる。 人工知能(AI)モデルは 人工知能(AI)モデルは、シーン内のエンティティの正確な境界と輪郭を理解できるようになる。
最近の機械学習(ML)ワークフローの多くでは 物体のおおよその位置を知るだけでは不十分である。物理世界とのインタラクションを必要とするアプリケーション ロボットが荷物を掴んだり、自動車が曲がりくねった道を走ったりするような、物理的な世界とのインタラクションを必要とするアプリケーションでは、詳細なジオメトリの理解が要求されます。 ジオメトリが必要となる。画像セグメンテーションは、生の視覚データを分類された領域のセットに変換することで、このギャップを埋める。この この機能は、高度な ディープラーニング(DL)アーキテクチャ、特に 畳み込みニューラルネットワーク(CNN)は、前景オブジェクトと背景を区別するための空間的特徴を抽出する。
適切なモデルアーキテクチャを選択するためには、特定のセグメンテーションタスクを理解することが重要である。3つの主要な の3つに分類される:
セグメンテーションは、さまざまな業界において不可欠なものである:
最近のフレームワークは、セグメンテーションタスクの実装を単純化している。旧来の マスクR-CNNのような旧来の2段階検出器は、精度は高いが処理速度が遅かった。 この分野に革命をもたらした。 リアルタイム推論が可能になった。その Ultralytics YOLO11 モデルなどは、インスタンスのセグメンテーションをネイティブにサポートしている。今後の展望 YOLO26は、これらの機能をさらに最適化するために開発されている。 エンド・ツー・エンド処理で、これらの機能をさらに最適化するために開発されている。
開発者は OpenCVのような標準ライブラリを使うことができる。 のような標準ライブラリを使うことができます。 PyTorchベースのフレームワークを使うことができる。 モデル推論を行う。
ここでは、Python事前に訓練されたYOLO11 モデルを使用してインスタンスのセグメンテーションを実行する方法の簡潔な例を示します:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks overlaid
results[0].show()
このコード・スニペットは、特徴抽出、バウンディング・ボックス回帰、マスク生成といった複雑なタスクを自動的に処理します。 を自動的に処理するので、開発者はセグメンテーション結果を セグメンテーション結果を アプリケーションに統合することに集中できます。


