Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Rilevatori di oggetti a due stadi

Scopri la potenza dei two-stage object detectors: soluzioni incentrate sulla precisione per il rilevamento preciso di oggetti in complesse attività di computer vision.

I rilevatori di oggetti a due stadi sono una classe di sofisticati modelli di modelli di apprendimento profondo progettati per identificare e individuare gli oggetti all'interno delle immagini con un'elevata precisione. A differenza delle loro controparti più veloci, queste architetture dividono il compito di di rilevamento degli oggetti in due fasi distinte: identificare le regioni potenziali in cui potrebbero esistere degli oggetti, e poi classificare queste regioni affinandone le coordinate. coordinate. Questo approccio a processo diviso ha reso storicamente i rilevatori a due fasi il gold standard per le attività in cui l'accuratezza è fondamentale. precisione è fondamentale, spesso a scapito della velocità e delle risorse risorse computazionali.

Il flusso di lavoro in due fasi

L'architettura di un rilevatore a due stadi funziona come un imbuto, restringendo i dati da un'immagine ampia a oggetti specifici, oggetti specifici e classificati. Questo processo prevede in genere una rete rete dorsale, come ResNet, per estrarre le caratteristiche, seguito dai due stadi critici:

  1. Proposta di regione: La prima fase impiega un componente spesso chiamato Region Proposal Network (RPN). Questa rete analizza le mappe di caratteristiche generate dal backbone per identificare le "Regioni di interesse" (RoI). A questo punto, il modello non categorizza l'oggetto. oggetto; agisce essenzialmente come un filtro di sfondo, segnalando le aree che probabilmente contengono qualcosa rispetto a quelle vuote. aree vuote. Questo concetto è stato consolidato nel documento di ricerca Faster R-CNN.
  2. Classificazione e affinamento: Nella seconda fase, le regioni proposte vengono raggruppate in una dimensione fissa e dimensioni fisse e inserite in una specifica testata di rilevamento. Questa testa svolge due compiti simultanei: assegna all'oggetto un'etichetta di classe specifica (ad es. "veicolo") all'oggetto e utilizza regressione del rettangolo di selezione per regolare le coordinate, per regolare le coordinate, assicurandosi che il riquadro si adatti perfettamente all'oggetto.

Rilevatori a due stadi vs. a uno stadio

Comprendere la differenza tra i rilevatori di oggetti a due e un solo stadio è fondamentale per scegliere il modello fondamentale per scegliere il modello giusto per un'applicazione.

  • Rilevatori a due stadi (ad esempio, Faster R-CNN, Mask R-CNN): Questi modelli privilegiano la precisione. Separando la proposta e la classificazione separando proposta e classificazione, gestiscono molto bene scene complesse con oggetti sovrapposti o piccoli dettagli. dettagli. Tuttavia, questo meccanismo di doppio controllo introduce una latenza di inferenza più elevata. latenza dell'inferenza, rendendoli difficili da difficile da impiegare in ambienti che richiedono risposte immediate.
  • Rivelatori a una fase (ad esempio, YOLO, SSD): Architetture come la Ultralytics YOLO trattano il rilevamento come un singolo problema di regressione. regressione. Mappano i pixel dell'immagine direttamente alle coordinate del rettangolo di selezione e alle probabilità di classe in un unico passaggio. Sebbene storicamente meno accurati rispetto ai modelli a due stadi, le iterazioni moderne come YOLO11 hanno efficacemente colmato il divario di accuratezza mantenendo la velocità di inferenza in tempo reale.

Architetture chiave nella storia

Diverse architetture hanno definito l'evoluzione del rilevamento a due stadi:

Applicazioni nel mondo reale

Poiché i rilevatori a due stadi eccellono nella localizzazione di oggetti di piccole dimensioni e nella riduzione al minimo dei falsi positivi, rimangono fondamentali in settori specifici.

  • Analisi delle immagini mediche: In radiologia, l'identificazione di piccoli noduli o tumori nelle scansioni TC richiede la massima sensibilità possibile. I modelli a due stadi per ridurre al minimo il rischio di perdere una diagnosi critica, come illustrato in vari studi sull'IA nel settore sanitario. studi sull'intelligenza artificiale nel settore sanitario.
  • Ispezione automatizzata della qualità: Nella produzione, l'identificazione di difetti microscopici su schede di circuiti o parti lavorate richiede un'analisi ad alta risoluzione. di analisi ad alta risoluzione. Le capacità di localizzazione precisa dei rilevatori a due stadi aiutano a individuare i difetti che potrebbero sfuggire a modelli più veloci e meno granulari. da modelli più veloci e meno granulari.

Implementazione del rilevamento ad alta precisione

Sebbene Ultralytics sia specializzata in modelli all'avanguardia a uno stadio, le versioni moderne come YOLO11 offrono l'elevata precisione tipicamente associata ai rivelatori a due stadi, ma con una velocità maggiore. precisione tipicamente associata ai rilevatori a due stadi, ma con una formazione e un'inferenza del modello significativamente più rapide. formazione e inferenza del modello.

Ecco come implementare un modello YOLO11 pre-addestrato utilizzando il metodo ultralytics per ottenere risultati di risultati di rilevamento ad alta precisione:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

Concetti correlati

  • Caselle di ancoraggio: Forme predefinite di scatole utilizzate da molti rilevatori a due stadi per stimare le dimensioni e il rapporto d'aspetto degli oggetti durante la fase di proposta.
  • Soppressione non massima (NMS): Tecnica di post-elaborazione utilizzata nei rilevatori a uno e due stadi per eliminare le caselle sovrapposte ridondanti, di sovrapposizione ridondanti, assicurando che rimanga solo il rilevamento più sicuro.
  • Intersezione su Unione (IoU): Una metrica utilizzata per misurare la sovrapposizione tra il riquadro previsto e la verità a terra, essenziale per l'addestramento delle teste RPN e di raffinamento. e le teste di raffinamento.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora