Rilevatori di oggetti a due stadi
Scopri la potenza dei two-stage object detectors: soluzioni incentrate sulla precisione per il rilevamento preciso di oggetti in complesse attività di computer vision.
I rilevatori di oggetti a due stadi sono una classe di sofisticati modelli di
modelli di apprendimento profondo progettati per identificare e
individuare gli oggetti all'interno delle immagini con un'elevata precisione. A differenza delle loro controparti più veloci, queste architetture dividono il compito di
di rilevamento degli oggetti in due fasi distinte:
identificare le regioni potenziali in cui potrebbero esistere degli oggetti, e poi classificare queste regioni affinandone le coordinate.
coordinate. Questo approccio a processo diviso ha reso storicamente i rilevatori a due fasi il gold standard per le attività in cui l'accuratezza è fondamentale.
precisione è fondamentale, spesso a scapito della velocità e delle risorse
risorse computazionali.
Il flusso di lavoro in due fasi
L'architettura di un rilevatore a due stadi funziona come un imbuto, restringendo i dati da un'immagine ampia a oggetti specifici,
oggetti specifici e classificati. Questo processo prevede in genere una rete
rete dorsale, come ResNet, per estrarre le caratteristiche,
seguito dai due stadi critici:
-
Proposta di regione: La prima fase impiega un componente spesso chiamato Region Proposal Network (RPN).
Questa rete analizza le mappe di caratteristiche generate dal
backbone per identificare le "Regioni di interesse" (RoI). A questo punto, il modello non categorizza l'oggetto.
oggetto; agisce essenzialmente come un filtro di sfondo, segnalando le aree che probabilmente contengono qualcosa rispetto a quelle vuote.
aree vuote. Questo concetto è stato consolidato nel documento di ricerca
Faster R-CNN.
-
Classificazione e affinamento: Nella seconda fase, le regioni proposte vengono raggruppate in una dimensione fissa e
dimensioni fisse e inserite in una specifica testata di rilevamento. Questa testa
svolge due compiti simultanei: assegna all'oggetto un'etichetta di classe specifica (ad es.
"veicolo") all'oggetto e utilizza
regressione del rettangolo di selezione per regolare le coordinate,
per regolare le coordinate, assicurandosi che il riquadro si adatti perfettamente all'oggetto.
Rilevatori a due stadi vs. a uno stadio
Comprendere la differenza tra i rilevatori di oggetti a due e
un solo stadio è fondamentale per scegliere il modello
fondamentale per scegliere il modello giusto per un'applicazione.
-
Rilevatori a due stadi (ad esempio, Faster R-CNN, Mask R-CNN): Questi modelli privilegiano la precisione. Separando la proposta e la classificazione
separando proposta e classificazione, gestiscono molto bene scene complesse con oggetti sovrapposti o piccoli dettagli.
dettagli. Tuttavia, questo meccanismo di doppio controllo introduce una latenza di inferenza più elevata.
latenza dell'inferenza, rendendoli difficili da
difficile da impiegare in ambienti che richiedono risposte immediate.
-
Rivelatori a una fase (ad esempio, YOLO, SSD): Architetture come la
Ultralytics YOLO trattano il rilevamento come un singolo problema di regressione.
regressione. Mappano i pixel dell'immagine direttamente alle coordinate del rettangolo di selezione e alle probabilità di classe in un unico passaggio. Sebbene
storicamente meno accurati rispetto ai modelli a due stadi, le iterazioni moderne come
YOLO11 hanno efficacemente colmato il divario di accuratezza
mantenendo la velocità di inferenza in tempo reale.
Architetture chiave nella storia
Diverse architetture hanno definito l'evoluzione del rilevamento a due stadi:
Applicazioni nel mondo reale
Poiché i rilevatori a due stadi eccellono nella localizzazione di oggetti di piccole dimensioni e nella riduzione al minimo dei
falsi positivi, rimangono fondamentali in settori specifici.
-
Analisi delle immagini mediche:
In radiologia, l'identificazione di piccoli noduli o tumori nelle scansioni TC richiede la massima sensibilità possibile. I modelli a due stadi
per ridurre al minimo il rischio di perdere una diagnosi critica, come illustrato in vari studi sull'IA nel settore sanitario.
studi sull'intelligenza artificiale nel settore sanitario.
-
Ispezione automatizzata della qualità:
Nella produzione, l'identificazione di difetti microscopici su schede di circuiti o parti lavorate richiede un'analisi ad alta risoluzione.
di analisi ad alta risoluzione. Le capacità di localizzazione precisa dei rilevatori a due stadi aiutano a individuare i difetti che potrebbero sfuggire a modelli più veloci e meno granulari.
da modelli più veloci e meno granulari.
Implementazione del rilevamento ad alta precisione
Sebbene Ultralytics sia specializzata in modelli all'avanguardia a uno stadio, le versioni moderne come YOLO11 offrono l'elevata precisione tipicamente associata ai rivelatori a due stadi, ma con una velocità maggiore.
precisione tipicamente associata ai rilevatori a due stadi, ma con una formazione e un'inferenza del modello significativamente più rapide.
formazione e inferenza del modello.
Ecco come implementare un modello YOLO11 pre-addestrato utilizzando il metodo ultralytics per ottenere risultati di
risultati di rilevamento ad alta precisione:
from ultralytics import YOLO
# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Display the results with bounding boxes
results[0].show()
Concetti correlati
-
Caselle di ancoraggio: Forme predefinite di scatole
utilizzate da molti rilevatori a due stadi per stimare le dimensioni e il rapporto d'aspetto degli oggetti durante la fase di proposta.
-
Soppressione non massima (NMS):
Tecnica di post-elaborazione utilizzata nei rilevatori a uno e due stadi per eliminare le caselle sovrapposte ridondanti,
di sovrapposizione ridondanti, assicurando che rimanga solo il rilevamento più sicuro.
-
Intersezione su Unione (IoU):
Una metrica utilizzata per misurare la sovrapposizione tra il riquadro previsto e la verità a terra, essenziale per l'addestramento delle teste RPN e di raffinamento.
e le teste di raffinamento.