Scoprite la potenza del rilevamento degli oggetti: identificate e localizzate gli oggetti nelle immagini o nei video con modelli all'avanguardia come YOLO. Esplorate le applicazioni del mondo reale!
Il rilevamento degli oggetti è una capacità fondamentale nell'ambito della computer vision (CV) che consente ai sistemi software sistemi software di riconoscere non solo ciò che rappresenta un'immagine, ma anche di individuare istanze specifiche di oggetti all'interno di essa. Mentre mentre la classificazione standard assegna una singola etichetta all'intero input visivo, il rilevamento degli oggetti fornisce una comprensione più granulare comprensione più granulare, prevedendo un riquadro di delimitazione intorno a ciascuna entità identificata, accompagnata da un'etichetta di classe specifica e da un punteggio di confidenza. un 'etichetta di classe specifica e un punteggio di confidenza. Questa tecnologia funge da base sensoriale per sensoriale per l'intelligenza intelligenza artificiale (IA) avanzata, consentendo alle macchine di percepire, interpretare e interagire con la complessità del mondo fisico. Dal controllo qualità automatizzato controllo automatizzato della qualità nelle fabbriche alla sorveglianza avanzata, trasforma i dati non strutturati dei pixel in informazioni utili.
I moderni rilevatori si basano principalmente su architetture di apprendimento profondo (DL), in particolare Reti neurali convoluzionali (CNN), per apprendere gerarchie spaziali di caratteristiche. Un'architettura tipica consiste in una come ResNet o CSPNet, che estrae le caratteristiche visive essenziali dall'immagine di caratteristiche visive essenziali dall'immagine di ingresso. Queste caratteristiche vengono poi elaborate da una che fornisce le coordinate per le bounding box e la probabilità di e la probabilità di appartenenza a una classe.
Per ottenere prestazioni elevate, i modelli vengono addestrati su raccolte massive etichettate, come il dataset COCO. COCO , che fornisce uno standard per il benchmarking. Durante l'inferenza, algoritmi spesso generano più caselle sovrapposte per lo stesso oggetto. Tecniche come Non-Maximum Suppression (NMS) vengono applicate per per filtrare queste ridondanze, mantenendo solo il riquadro con la più alta confidenza e la miglior Intersezione su Unione (IoU) con la verità a terra. verità a terra.
I modelli sono generalmente classificati in due tipi:
È fondamentale differenziare il rilevamento degli oggetti da compiti simili di compiti di visione computerizzata.
Il rilevamento degli oggetti è il motore di molte tecnologie trasformative in diversi settori.
Il seguente frammento di codice mostra come eseguire il rilevamento degli oggetti utilizzando un modello YOLO11 pre-addestrato con l'opzione
ultralytics pacchetto. Questo semplice flusso di lavoro carica un modello ed esegue l'inferenza su un'immagine per identificare
oggetti come autobus e persone.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()