Scopri come i riquadri di delimitazione definiscono la posizione degli oggetti nella visione artificiale. Esplora i formati delle coordinate, le applicazioni nel mondo reale e come utilizzare Ultralytics .
Un riquadro di delimitazione è una regione rettangolare definita da un insieme di coordinate che racchiude un oggetto specifico all'interno di un'immagine o di un fotogramma video. Nel campo della visione artificiale (CV), questi riquadri fungono da annotazioni fondamentali per insegnare ai sistemi di intelligenza artificiale (AI) come individuare e riconoscere elementi distinti. Anziché classificare semplicemente un'intera immagine come "contenente un' auto", un riquadro di delimitazione consente a un modello di individuare la posizione esatta e l'estensione spaziale dell'auto, separandola dallo sfondo e da altre entità. Questa capacità di localizzazione è essenziale per le attività di rilevamento degli oggetti, dove l'obiettivo è quello di identificare più oggetti contemporaneamente con elevata precisione.
Per elaborare i dati visivi in modo efficace, i modelli di machine learning (ML) si basano su specifici sistemi di coordinate per rappresentare matematicamente i riquadri di delimitazione. Il formato scelto spesso determina il modo in cui i dati vengono preparati per l'addestramento del modello e il modo in cui il modello produce le sue previsioni.
I bounding box sono gli elementi costitutivi di innumerevoli soluzioni di IA in diversi settori. Consentendo una localizzazione precisa , permettono ai sistemi di interagire in modo intelligente con il mondo fisico.
Quando si utilizzano architetture moderne come YOLO26, il modello
prevede i riquadri di delimitazione insieme a un'etichetta di classe e un
punteggio di fiducia. L'esempio seguente mostra come
eseguire l'inferenza su un'immagine e accedere alle coordinate del riquadro di delimitazione utilizzando il ultralytics pacchetto.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])
Sebbene i riquadri di delimitazione siano standard per il rilevamento generale, sono distinti da altri tipi di annotazione utilizzati in attività più granulari.
La creazione di annotazioni di bounding box di alta qualità è un passaggio fondamentale nella pipeline ML. Ultralytics semplifica questo processo offrendo strumenti per l' annotazione dei dati e la gestione dei set di dati. Una corretta annotazione garantisce che i modelli imparino a distinguere gli oggetti in modo accurato, riducendo al minimo errori quali l' overfitting o la confusione dello sfondo. Tecniche avanzate come la soppressione non massima (NMS) vengono utilizzate durante l'inferenza per affinare queste previsioni rimuovendo i riquadri sovrapposti, assicurando che rimanga solo il rilevamento più accurato per ogni oggetto.