Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Ultralytics YOLO

I vantaggi di Ultralytics YOLO11 come rilevatore anchor-free

Comprendi come Ultralytics YOLO11 supporta il rilevamento di oggetti anchor-free e i vantaggi che questa architettura di modello apporta a varie applicazioni.

ABAbirami Vina
5 min read
Rilevamento di oggetti anchor-free con Ultralytics YOLO11

Se diamo uno sguardo alla storia dei modelli di Vision AI, il concetto di object detection - un'attività fondamentale della computer vision che consiste nell'identificare e localizzare oggetti all'interno di un'immagine o di un video - esiste fin dagli anni '60. Tuttavia, il motivo principale della sua importanza nelle innovazioni all'avanguardia di oggi è che le tecniche di object detection e le architetture dei modelli sono avanzate e migliorate rapidamente da allora.

In un precedente articolo, abbiamo discusso l'evoluzione dell'object detection e il percorso che ha portato ai modelli Ultralytics YOLO. Oggi ci concentreremo sull'esplorazione di una pietra miliare più specifica in questo viaggio: il passaggio dai rilevatori basati su anchor ai rilevatori senza anchor.

I rilevatori basati su anchor si affidano a riquadri predefiniti, chiamati "anchor", per prevedere dove si trovano gli oggetti in un'immagine. Al contrario, i rilevatori senza anchor saltano questi riquadri predefiniti e prevedono invece le posizioni degli oggetti direttamente.

Sebbene questo spostamento possa sembrare un cambiamento semplice e logico, ha effettivamente portato a importanti miglioramenti nell'accuratezza e nell'efficienza dell'object detection. In questo articolo, comprenderemo come i rilevatori senza anchor abbiano rimodellato la computer vision attraverso progressi come Ultralytics YOLO11.

Link to this sectionCosa sono i rilevatori basati su anchor?#

I rilevatori basati su anchor utilizzano riquadri predefiniti, noti come anchor, per aiutare a localizzare gli oggetti in un'immagine. Pensa a queste anchor come a una griglia di riquadri di diverse dimensioni e forme sovrapposta all'immagine. Il modello poi regola questi riquadri per adattarli agli oggetti che rileva. Ad esempio, se il modello identifica un'auto, modificherà il riquadro dell'anchor per adattarlo più accuratamente alla posizione e alle dimensioni dell'auto.

Ogni anchor è associato a un possibile oggetto nell'immagine e, durante il training, il modello impara come regolare gli anchor box per adattarsi meglio alla posizione, alla dimensione e alle proporzioni dell'oggetto. Questo consente al modello di rilevare oggetti a diverse scale e orientamenti. Tuttavia, selezionare il set corretto di anchor box può richiedere molto tempo e il processo di fine-tuning può essere soggetto a errori.

Diagramma che spiega cos'è una anchor box

Fig 1. Cos'è un riquadro di anchor?

Mentre i rilevatori basati su anchor, come YOLOv4, hanno funzionato bene in molte applicazioni, presentano alcuni svantaggi. Ad esempio, i riquadri di anchor non sempre si allineano bene con oggetti di forme o dimensioni diverse, rendendo più difficile per il modello rilevare oggetti piccoli o di forma irregolare. Anche il processo di selezione e perfezionamento delle dimensioni dei riquadri di anchor può richiedere molto tempo e un notevole sforzo manuale. Oltre a ciò, i modelli basati su anchor spesso faticano a rilevare oggetti occlusi o sovrapposti, poiché i riquadri predefiniti potrebbero non adattarsi bene a questi scenari più complessi.

Link to this sectionIl passaggio all'object detection senza anchor#

I rilevatori senza anchor hanno iniziato ad attirare l'attenzione nel 2018 con modelli come CornerNet e CenterNet, che hanno adottato un approccio innovativo all'object detection eliminando la necessità di riquadri di anchor predefiniti. A differenza dei modelli tradizionali che si affidano a riquadri di anchor di diverse dimensioni e forme per prevedere dove si trovano gli oggetti, i modelli senza anchor prevedono direttamente le posizioni degli oggetti. Si concentrano su punti chiave o caratteristiche dell'oggetto, come il centro, il che semplifica il processo di rilevamento e lo rende più veloce e accurato.

Ecco come funzionano generalmente i modelli senza anchor:

  • Keypoint detection: Invece di usare riquadri predefiniti, alcuni modelli identificano punti importanti su un oggetto, come il centro o angoli specifici. Questi punti chiave aiutano i modelli a capire dove si trova l'oggetto e quanto è grande.
  • Center prediction: Alcuni modelli si concentrano sulla previsione del centro di un oggetto. Una volta individuato il centro, il modello può prevedere la dimensione e la posizione dell'intero oggetto da lì.
  • Heatmap regression: Molti modelli senza anchor utilizzano le heatmap, dove ogni pixel rappresenta una possibile posizione di un oggetto. Valori più forti della heatmap indicano una maggiore confidenza nel fatto che un oggetto sia presente in quel punto.

Confronto tra rilevamento basato su anchor e rilevamento anchor-free

Fig 2. Rilevamento basato su anchor vs. rilevamento senza anchor.

Poiché i modelli senza anchor non si affidano ai riquadri di anchor, hanno un design più semplice. Ciò significa che sono più efficienti dal punto di vista computazionale. Dato che non devono elaborare molteplici riquadri di anchor, possono rilevare gli oggetti più rapidamente: un vantaggio importante nelle applicazioni in tempo reale come la guida autonoma e la videosorveglianza.

I modelli senza anchor sono anche molto più capaci di gestire oggetti piccoli, irregolari o occlusi. Poiché si concentrano sul rilevamento dei punti chiave invece di cercare di adattare riquadri di anchor, sono molto più flessibili. Questo consente loro di rilevare oggetti accuratamente in ambienti disordinati o complessi in cui i modelli basati su anchor potrebbero fallire.

Link to this sectionUltralytics YOLO11: un rilevatore senza anchor#

Originariamente progettati per velocità ed efficienza, i modelli YOLO sono passati gradualmente da metodi basati su anchor al rilevamento senza anchor, rendendo modelli come YOLO11 più veloci, più flessibili e più adatti a una vasta gamma di applicazioni in tempo reale.

Ecco una rapida occhiata a come il design senza anchor si è evoluto nelle diverse versioni di YOLO:

  • Ultralytics YOLOv5u: Ha introdotto l'Anchor-Free Split Ultralytics Head, eliminando la necessità di riquadri di anchor predefiniti. Invece, il modello prevede direttamente dove si trovano gli oggetti in un'immagine, semplificando il processo e migliorando la flessibilità e la velocità.
  • YOLOv6: È stato utilizzato un nuovo metodo chiamato Anchor-Aided Training (AAT), in cui le anchor venivano usate solo durante l'addestramento. Ciò ha permesso al modello di beneficiare della struttura dei metodi basati su anchor durante l'addestramento, pur continuando a utilizzare il rilevamento senza anchor in fase di esecuzione per una maggiore velocità e adattabilità.
  • Ultralytics YOLOv8: È passato completamente al rilevamento senza anchor utilizzando l'Anchor-Free Split Ultralytics Head. Questo ha reso il modello più veloce e accurato, specialmente per oggetti piccoli o di forma strana che non si adattano bene ai riquadri di anchor.
  • Ultralytics YOLO11: Si basa sull'approccio senza anchor di YOLOv8, ottimizzando ulteriormente il rilevamento eliminando del tutto i riquadri di anchor. Ciò si traduce in un rilevamento più veloce e accurato per applicazioni in tempo reale come il monitoraggio del comportamento animale e l'analisi retail.

Confronto tra Ultralytics YOLOv8 e Ultralytics YOLO11

Fig 3. Confronto tra Ultralytics YOLOv8 e Ultralytics YOLO11.

Link to this sectionApplicazioni reali di YOLO11#

Un ottimo esempio dei vantaggi del rilevamento senza anchor utilizzando YOLO11 è nei veicoli autonomi. Nelle auto a guida autonoma, rilevare rapidamente e accuratamente pedoni, altri veicoli e ostacoli è fondamentale per la sicurezza. L'approccio senza anchor di YOLO11 semplifica il processo di rilevamento prevedendo direttamente i punti chiave degli oggetti, come il centro di un pedone o i confini di un altro veicolo, invece di fare affidamento su riquadri di anchor predefiniti.

Vantaggi del rilevamento anchor-free in YOLO11

Fig 4. Vantaggi del rilevamento senza anchor in YOLO11 (Immagine dell'autore).

YOLO11 non ha bisogno di regolare o adattare una griglia di anchor a ogni oggetto, operazione che può essere computazionalmente costosa e lenta. Invece, si concentra sulle caratteristiche chiave, rendendolo più veloce ed efficiente. Ad esempio, quando un pedone entra nel percorso del veicolo, YOLO11 può identificarne rapidamente la posizione individuando i punti chiave, anche se la persona è parzialmente nascosta o in movimento. La capacità di adattarsi a forme e dimensioni variabili senza riquadri di anchor consente a YOLO11 di rilevare gli oggetti in modo più affidabile e a velocità più elevate, il che è vitale per il processo decisionale in tempo reale nei sistemi di guida autonoma.

Altre applicazioni in cui le capacità senza anchor di YOLO11 risaltano davvero includono:

  • Retail e gestione dell'inventario: YOLO11 rende più semplice monitorare i prodotti sugli scaffali, anche quando sono impilati o parzialmente bloccati. Questo aiuta a ottenere un monitoraggio dell'inventario più rapido e accurato e riduce gli errori.
  • Imaging medico: YOLO11 è efficace anche nel settore sanitario, dove può rilevare tumori o altre anomalie nelle scansioni mediche. La sua capacità di lavorare con oggetti di forma irregolare aiuta a migliorare l'accuratezza nella diagnosi di condizioni complesse.
  • Monitoraggio della fauna selvatica: Nella ricerca sulla fauna selvatica, YOLO11 può tracciare animali in foreste fitte o terreni difficili, aiutando i ricercatori a monitorare il comportamento o a proteggere le specie in via di estinzione.
  • Analisi sportiva: YOLO11 può essere utilizzato per tracciare giocatori, movimenti della palla o altri elementi in tempo reale durante eventi sportivi per fornire approfondimenti preziosi a squadre, allenatori e broadcaster.

Link to this sectionConsiderazioni da fare quando si lavora con modelli senza anchor#

Sebbene i modelli senza anchor come YOLO11 offrano molti vantaggi, presentano alcune limitazioni. Una delle principali considerazioni pratiche da fare è che anche i modelli senza anchor possono avere difficoltà con occlusioni o oggetti altamente sovrapposti. La logica alla base di ciò è che la computer vision mira a replicare la visione umana e, proprio come a volte facciamo fatica a identificare oggetti occlusi, i modelli AI possono affrontare sfide simili.

Un altro fattore interessante è legato all'elaborazione delle previsioni del modello. Sebbene l'architettura dei modelli senza anchor sia più semplice di quella basata su anchor, in alcuni casi diventa necessario un ulteriore affinamento. Ad esempio, tecniche di post-elaborazione come la non-maximum suppression (NMS) potrebbero essere necessarie per ripulire le previsioni sovrapposte o migliorare l'accuratezza in scene affollate.

Link to this sectionAncorati al futuro dell'IA con YOLO11#

Il passaggio dal rilevamento basato su anchor a quello senza anchor è stato un progresso significativo nell'object detection. Con modelli senza anchor come YOLO11, il processo è semplificato, portando a miglioramenti sia nell'accuratezza che nella velocità.

Attraverso YOLO11, abbiamo visto come l'object detection senza anchor eccella in applicazioni in tempo reale come auto a guida autonoma, videosorveglianza e imaging medico, dove un rilevamento rapido e preciso è cruciale. Questo approccio consente a YOLO11 di adattarsi più facilmente a dimensioni di oggetti variabili e scene complesse, fornendo prestazioni migliori in ambienti diversi.

Mentre la computer vision continua a evolversi, l'object detection diventerà solo più veloce, più flessibile e più efficiente.

Esplora il nostro repository GitHub e unisciti alla nostra coinvolgente community per rimanere aggiornato su tutto ciò che riguarda l'IA. Dai un'occhiata a come la vision AI sta influenzando settori come la produzione e l'agricoltura.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning