Glossario

Rilevamento oggetti

Scoprite la potenza del rilevamento degli oggetti: identificate e localizzate gli oggetti nelle immagini o nei video con modelli all'avanguardia come YOLO. Esplorate le applicazioni del mondo reale!

Il rilevamento degli oggetti è una capacità fondamentale nell'ambito della computer vision (CV) che consente ai sistemi software sistemi software di riconoscere non solo ciò che rappresenta un'immagine, ma anche di individuare istanze specifiche di oggetti all'interno di essa. Mentre mentre la classificazione standard assegna una singola etichetta all'intero input visivo, il rilevamento degli oggetti fornisce una comprensione più granulare comprensione più granulare, prevedendo un riquadro di delimitazione intorno a ciascuna entità identificata, accompagnata da un'etichetta di classe specifica e da un punteggio di confidenza. un 'etichetta di classe specifica e un punteggio di confidenza. Questa tecnologia funge da base sensoriale per sensoriale per l'intelligenza intelligenza artificiale (IA) avanzata, consentendo alle macchine di percepire, interpretare e interagire con la complessità del mondo fisico. Dal controllo qualità automatizzato controllo automatizzato della qualità nelle fabbriche alla sorveglianza avanzata, trasforma i dati non strutturati dei pixel in informazioni utili.

Meccanica del rilevamento degli oggetti

I moderni rilevatori si basano principalmente su architetture di apprendimento profondo (DL), in particolare Reti neurali convoluzionali (CNN), per apprendere gerarchie spaziali di caratteristiche. Un'architettura tipica consiste in una come ResNet o CSPNet, che estrae le caratteristiche visive essenziali dall'immagine di caratteristiche visive essenziali dall'immagine di ingresso. Queste caratteristiche vengono poi elaborate da una che fornisce le coordinate per le bounding box e la probabilità di e la probabilità di appartenenza a una classe.

Per ottenere prestazioni elevate, i modelli vengono addestrati su raccolte massive etichettate, come il dataset COCO. COCO , che fornisce uno standard per il benchmarking. Durante l'inferenza, algoritmi spesso generano più caselle sovrapposte per lo stesso oggetto. Tecniche come Non-Maximum Suppression (NMS) vengono applicate per per filtrare queste ridondanze, mantenendo solo il riquadro con la più alta confidenza e la miglior Intersezione su Unione (IoU) con la verità a terra. verità a terra.

I modelli sono generalmente classificati in due tipi:

Rilevatori di oggetti in due fasi: Sistemi come Faster R-CNN propongono prima le regioni di interesse e poi le classify . Pur essendo storicamente accurati, possono essere computazionalmente costosi.
Rilevatori di oggetti a uno stadio: Architetture moderne, tra cui Ultralytics YOLO11, prevedono le bounding box e le probabilità di classe in un unico passaggio. Questo approccio è ottimizzato per in tempo reale, offrendo un equilibrio ideale tra equilibrio tra velocità e precisione. In prospettiva, Ultralytics sta attualmente sviluppando YOLO26, che mira a perfezionare ulteriormente l'efficienza del rilevamento end-to-end. efficienza.

Distinzione dai compiti curriculari correlati

È fondamentale differenziare il rilevamento degli oggetti da compiti simili di compiti di visione computerizzata.

Classificazione delle immagini: Identifica cosa c 'è in un'immagine (ad esempio, "cane"), ma non dove si trova o quanti ce ne sono.
Segmentazione delle istanze: Come il rilevamento, individua gli oggetti, ma invece di un riquadro, produce una maschera perfetta al pixel che delinea la forma esatta dell'oggetto. forma esatta dell'oggetto.
Tracciamento degli oggetti: Estende il rilevamento al dominio temporale, assegnando un ID univoco agli oggetti rilevati e seguendone la rilevamento nel dominio temporale, assegnando un ID univoco agli oggetti rilevati e seguendo la loro traiettoria attraverso fotogrammi video.

Applicazioni nel mondo reale

Il rilevamento degli oggetti è il motore di molte tecnologie trasformative in diversi settori.

Sistemi autonomi: Nell'industria automobilistica, veicoli autonomi utilizzano modelli di rilevamento per identificare pedoni, segnali stradali e altre auto in pochi millisecondi. I leader del settore, come Waymo e Tesla Autopilot si affidano a queste capacità per queste capacità per navigare in ambienti complessi in modo sicuro.
Diagnostica medica: Nell'IA sanitaria, i modelli di IA sanitaria, i modelli di rilevamento assistono i radiologi radiologi evidenziando le regioni di interesse nelle radiografie o nelle scansioni TC, come i tumori o le fratture. Organizzazioni come il National Institutes of Health (NIH) stanno attivamente ricercando come l 'analisi delle immagini mediche possa ridurre errori diagnostici.
Analitica del commercio al dettaglio: I negozi sfruttano AI nella vendita al dettaglio per automatizzare i processi di checkout e monitorare l'inventario. Sistemi simili ad Amazon Go utilizzano per track degli articoli che i clienti prendono dagli scaffali.

Esempio di implementazione

Il seguente frammento di codice mostra come eseguire il rilevamento degli oggetti utilizzando un modello YOLO11 pre-addestrato con l'opzione ultralytics pacchetto. Questo semplice flusso di lavoro carica un modello ed esegue l'inferenza su un'immagine per identificare oggetti come autobus e persone.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Rilevamento oggetti

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Meccanica del rilevamento degli oggetti

Distinzione dai compiti curriculari correlati

Applicazioni nel mondo reale

Esempio di implementazione

Leggi di più in questa categoria

Comprendere perché l'annotazione human-in-the-loop è fondamentale

Che cos'è la distillazione dei set di dati? Una rapida panoramica

Gli occhiali Oakley Meta AI stanno ridefinendo il concetto di occhiali con Vision AI

Unitevi alla comunità di Ultralytics