Scoprite cos'è l'Intersection over Union (IoU), come si calcola e il suo ruolo fondamentale nel rilevamento degli oggetti e nella valutazione dei modelli di intelligenza artificiale.
L'Intersection over Union (IoU) è una metrica di valutazione fondamentale utilizzata nella computer vision (CV), in particolare per i compiti di rilevamento degli oggetti. Misura la sovrapposizione tra due confini: il riquadro di delimitazione previsto generato da un modello e il riquadro di delimitazione della verità, ovvero il contorno corretto etichettato a mano. Il punteggio risultante, un valore compreso tra 0 e 1, quantifica l'accuratezza con cui il modello ha localizzato un oggetto in un'immagine. Un punteggio di 1 rappresenta una corrispondenza perfetta, mentre un punteggio di 0 indica l'assenza di sovrapposizione. Questa metrica è fondamentale per valutare l'accuratezza della localizzazione di modelli come Ultralytics YOLO11.
Nel suo nucleo, IoU calcola il rapporto tra l'intersezione (area di sovrapposizione) e l'unione (area totale coperta da entrambi i riquadri) dei riquadri di delimitazione previsti e di quelli della verità. Immaginiamo due quadrati sovrapposti. L'"intersezione" è l'area condivisa in cui si sovrappongono. L'"unione" è l'area totale che i due quadrati coprono insieme, contando la parte sovrapposta una sola volta. Dividendo l'intersezione per l'unione, IoU fornisce una misura standardizzata del grado di allineamento del riquadro previsto con l'oggetto reale. Questo concetto semplice ma potente è una pietra miliare del moderno deep learning (DL) per il rilevamento degli oggetti.
Una parte fondamentale dell'utilizzo dell'IoU è l'impostazione di una "soglia IoU". Questa soglia è un valore predefinito (ad esempio, 0,5) che determina se una previsione è corretta. Se il punteggio IoU di una casella predetta è superiore a questa soglia, viene classificata come "vero positivo". Se il punteggio è inferiore, si tratta di un "falso positivo". Questa soglia influenza direttamente altre metriche di prestazione, come la precisione e il richiamo, ed è un componente critico nel calcolo della precisione media (mAP), una metrica standard per la valutazione dei modelli di rilevamento degli oggetti su set di dati di riferimento come COCO.
L'IoU è essenziale per convalidare le prestazioni di innumerevoli sistemi di intelligenza artificiale. Ecco un paio di esempi:
L'IoU non è solo una metrica di valutazione, ma è anche parte integrante del processo di addestramento stesso. Molte moderne architetture di rilevamento degli oggetti, tra cui le varianti di Ultralytics YOLOv8 e YOLO11, utilizzano l'IoU o le sue variazioni direttamente nelle loro funzioni di perdita. Queste perdite avanzate basate sull'IoU, come l'IoU generalizzato (GIoU), l'IoU a distanza (DIoU) o l'IoU completo (CIoU), aiutano il modello a prevedere riquadri di delimitazione che non solo si sovrappongono bene, ma considerano anche fattori come la distanza tra i centri e la coerenza delle proporzioni. Questo porta a una convergenza più rapida e a migliori prestazioni di localizzazione rispetto alle perdite di regressione tradizionali. È possibile trovare confronti dettagliati tra i diversi modelli YOLO nella nostra documentazione.
Il monitoraggio dell'IoU durante l'addestramento del modello e la regolazione degli iperparametri aiuta gli sviluppatori a perfezionare i modelli per una migliore localizzazione. Strumenti come Ultralytics HUB consentono di monitorare l'IoU e altre metriche, semplificando il ciclo di miglioramento del modello. Nonostante la sua utilità diffusa, l'IoU standard può talvolta essere poco sensibile, soprattutto per i box non sovrapposti. Questa limitazione ha spinto a sviluppare le varianti di IoU sopra citate. Ciononostante, l'IoU rimane una pietra miliare della valutazione della computer vision.
Sebbene l'IoU sia fondamentale, è importante capire la sua relazione con altre metriche: