Migliorare la previsione delle collisioni con i modelliYOLO di Ultralytics

27 novembre 2025
Scoprite come i modelliYOLO di Ultralytics aiutano i sistemi di previsione delle collisioni a prendere decisioni più sicure e rapide in ambienti dinamici.


27 novembre 2025
Scoprite come i modelliYOLO di Ultralytics aiutano i sistemi di previsione delle collisioni a prendere decisioni più sicure e rapide in ambienti dinamici.

Nonostante la prudenza sulla strada, gli incidenti possono sempre accadere. Un'auto cambia corsia, un pedone attraversa le strisce o un ciclista accelera senza preavviso. Questi momenti quotidiani sono esempi di quando i sistemi di previsione delle collisioni possono fare la differenza e contribuire alla sicurezza di tutti.
In precedenza, abbiamo analizzato la previsione della traiettoria del pallone e abbiamo visto come la previsione del percorso di un pallone in rapido movimento aiuti gli analisti sportivi a comprendere il movimento e ad anticipare ciò che accadrà in seguito. La previsione delle collisioni funziona in modo simile.
Questi sistemi di previsione guardano essenzialmente al futuro. Osservando come si muovono i veicoli e i pedoni, possono individuare tempestivamente i rischi e modificare il loro percorso o il loro comportamento prima che le cose prendano una piega pericolosa (altrimenti nota come pianificazione del movimento o pianificazione del percorso).
Le tecnologie informatiche chiave alla base dei sistemi di previsione delle collisioni sono l'intelligenza artificiale e i suoi sottocampi, come la computer vision e i metodi di previsione che aiutano a prevedere come si muoveranno gli oggetti. Ad esempio, modelli di visione artificiale come Ultralytics YOLO11 e l'imminente Ultralytics YOLO26 possono essere utilizzati per detect e track in tempo reale oggetti come veicoli e pedoni, mentre i modelli di previsione utilizzano queste informazioni per stimare i loro prossimi movimenti.

Il risultato è un sistema di intelligenza artificiale che comprende ciò che accade intorno a sé e supporta un processo decisionale più intelligente in ambienti dinamici. In questo articolo esploreremo come funziona la previsione delle collisioni, i metodi che ne sono alla base e il ruolo che la computer vision e i modelli Ultralytics YOLO possono svolgere in questo processo. Iniziamo!
La previsione di collisione è la capacità di un sistema di intelligenza artificiale di capire come si muovono gli oggetti e di prevedere quando potrebbero avvicinarsi o entrare in contatto. I diversi sistemi possono utilizzare queste informazioni in molti modi, tra cui il supporto di funzioni di sicurezza, l'ottimizzazione dei movimenti o il coordinamento delle azioni in spazi condivisi.
Ovunque gli oggetti si muovano in uno spazio condiviso, che si tratti di automobili su un'autostrada, di carrelli elevatori in un corridoio di un magazzino o di pedoni che attraversano una strada, la previsione delle collisioni aiuta i sistemi a capire come possono svolgersi queste interazioni. Nelle applicazioni incentrate sulla sicurezza, questa previsione può essere utilizzata per ridurre i rischi, mentre in altri contesti può supportare attività come la pianificazione del percorso, la tempistica o il movimento coordinato.
Ad esempio, in molti veicoli più recenti dotati di sistemi avanzati di assistenza alla guida (ADAS), telecamere e sensori monitorano la strada davanti a sé e stimano la velocità con cui l'auto si avvicina agli oggetti vicini. Se il sistema rileva che una situazione potrebbe diventare pericolosa, avvisa il conducente e, in alcuni casi, la frenata automatica può contribuire a ridurre l'impatto.
La previsione delle collisioni implica un processo coordinato in cui diversi componenti dell'intelligenza artificiale lavorano insieme per identificare gli oggetti, seguirne il movimento e stimare ciò che potrebbe accadere in seguito. Questi sistemi lavorano in genere attraverso quattro fasi collegate tra loro: il rilevamento degli oggetti, il loro inseguimento, la previsione delle traiettorie e infine la previsione delle collisioni, con ogni fase che si basa sull'accuratezza di quella precedente.
Diamo quindi un'occhiata più da vicino al funzionamento di ciascuna fase.
Il rilevamento degli oggetti è un'attività fondamentale della computer vision in cui i modelli AI di visione identificano e localizzano gli oggetti in un'immagine o in un video. Analizzando i dati dei pixel, un modello di rilevamento degli oggetti può produrre tre risultati principali: riquadri di delimitazione, classi di oggetti e punteggi di confidenza. I riquadri di delimitazione mostrano dove si trova un oggetto, le classi di oggetti indicano di che cosa si tratta, ad esempio un'auto, un pedone o un ciclista, mentre i punteggi di confidenza riflettono il grado di certezza del modello rispetto alla previsione.
I modelli di AI di visione come YOLO11 e YOLO26 si basano su questa base e supportano diverse attività correlate, tra cui il rilevamento di oggetti, il tracciamento di oggetti e il rilevamento di bounding box orientati (OBB). Il rilevamento degli oggetti può indicare a un sistema di previsione cosa c'è in ogni fotogramma, il tracciamento segue gli oggetti mentre si muovono e i riquadri di delimitazione orientati forniscono forme più accurate per gli oggetti che appaiono a diverse angolazioni.
In questa fase, un sistema di previsione delle collisioni si concentra esclusivamente sulla comprensione di ciò che è presente nei dati visivi. Costituisce lo strato di informazioni di base da cui dipendono tutte le fasi successive, ma non considera ancora il modo in cui gli oggetti si muoveranno o interagiranno.
Una volta rilevati gli oggetti, il passo successivo consiste nel track attraverso i fotogrammi, in modo che il sistema possa capire come si muovono nel tempo. Mentre il rilevamento fornisce nuovi riquadri di delimitazione a ogni fotogramma, il tracciamento degli oggetti aggiunge continuità collegando i rilevamenti nel tempo.
Gli algoritmi di tracciamento supportati dal pacchettoUltralytics Python , come ByteTrack o BoT-SORT, funzionano con modelli come YOLO11 utilizzando i dati di rilevamento di ogni fotogramma per seguire gli oggetti mentre si muovono. Questi algoritmi assegnano un ID univoco a ciascun oggetto e lo utilizzano per mantenere tale identità anche quando l'oggetto si muove rapidamente o diventa parzialmente nascosto. In questo modo si crea una storia di tracciamento regolare che cattura il modo in cui l'oggetto si muove.

Ecco un rapido sguardo al funzionamento di questi due metodi di tracciamento:
Per misurare le prestazioni di questi metodi di tracciamento, i ricercatori li valutano su set di dati e benchmark consolidati per il tracciamento di più oggetti (MOT). Inoltre, le metriche comunemente utilizzate includono l'accuratezza del tracciamento di oggetti multipli (MOTA), che riflette la qualità complessiva del tracciamento; il punteggio di identificazione F1 (IDF1), che misura la coerenza con cui vengono mantenute le identità degli oggetti; e l'accuratezza del tracciamento di ordine superiore (HOTA), che offre una visione bilanciata sia delle prestazioni di rilevamento che dell'accuratezza di associazione.
Dopo aver tracciato un oggetto su più fotogrammi, il passo successivo consiste nel prevedere dove andrà successivamente. Questa operazione è nota come previsione della traiettoria. Mentre il rilevamento individua gli oggetti e il tracciamento segue il loro movimento, la previsione guarda avanti e stima le loro posizioni future.
Le informazioni ricavate dal rilevamento e dal tracciamento, come il riquadro di delimitazione dell'oggetto, la posizione nei vari fotogrammi e l'ID assegnato, possono essere utilizzate per calcolare le caratteristiche del movimento, come la velocità, la direzione e i modelli di movimento. Queste informazioni derivate forniscono al modello di previsione i dati necessari per stimare la posizione dell'oggetto nei secondi successivi.
Nei casi in cui i dati di tracciamento contengono lacune o salti bruschi, le tecniche di interpolazione aiutano a ricostruire traiettorie più uniformi e coerenti. In questo modo si garantisce che il modello di previsione riceva un input di movimento di alta qualità piuttosto che dati di posizione rumorosi o incompleti.

Per fare queste previsioni, molti sistemi si affidano a modelli di deep learning progettati per capire come cambia il movimento di un oggetto nel tempo. Analizzando sequenze di posizioni passate e le caratteristiche di movimento da esse derivate, questi modelli apprendono modelli di movimento comuni e utilizzano questa conoscenza per prevedere i percorsi futuri.
Ecco alcuni approcci di deep learning e machine learning comunemente utilizzati per la previsione delle traiettorie:
Questi modelli possono prevedere percorsi sia a breve che a lungo termine. Le previsioni a breve termine, di solito inferiori ai due secondi, tendono a essere le più accurate, mentre le previsioni su finestre più lunghe, come quelle da due a sei secondi, forniscono una maggiore previsione ma sono accompagnate da una maggiore incertezza.
Nella fase finale, la previsione delle collisioni, il sistema utilizza tutto ciò che ha appreso finora: cosa è ogni oggetto (rilevamento), come si è mosso (tracciamento) e dove è probabile che vada dopo (previsione). Questa fase verifica se i percorsi previsti si intersecano in modo da provocare una collisione.

Nel caso dei veicoli autonomi, un sistema di controllo delle collisioni confronta le traiettorie future di oggetti vicini come automobili, pedoni e ciclisti. Se due traiettorie previste si sovrappongono o si avvicinano pericolosamente, il sistema segnala la situazione come una potenziale collisione tra veicoli. Per capire quanto sia urgente il rischio di collisione, il sistema calcola anche un valore noto come tempo di collisione.
Il tempo di collisione (TTC) è una misura fondamentale in ambienti in rapido movimento. Stima il tempo rimanente prima che due oggetti entrino in collisione se continuano a mantenere le velocità e le direzioni attuali. Quando il TTC scende al di sotto di una certa soglia, il sistema può reagire emettendo avvisi, azionando i freni o modificando il percorso pianificato.
La previsione delle collisioni sta diventando fondamentale in molti settori, tra cui la gestione del traffico, le infrastrutture delle città intelligenti, l'automazione industriale e la robotica mobile. Con il continuo progresso dei modelli di previsione e di visione computerizzata, questi sistemi stanno diventando sempre più capaci di anticipare i movimenti.
Ora che abbiamo capito meglio come funzionano la previsione delle collisioni e la previsione delle traiettorie, analizziamo alcuni interessanti studi di ricerca che mostrano come questi metodi possono essere utilizzati in vari ambienti del mondo reale.
La navigazione in ambienti affollati e imprevedibili è una delle sfide più difficili per i sistemi autonomi, soprattutto quando i pedoni si muovono in modi che non seguono schemi chiari. I veicoli di emergenza si trovano ad affrontare questo problema ancora più spesso, poiché devono spostarsi rapidamente ad alta velocità attraverso spazi pubblici densi senza fare affidamento su strade strutturate, segnaletica di corsia o comportamento prevedibile dei pedoni.
In questo tipo di scenari, capire dove si trovano le persone e come potrebbero muoversi nei prossimi secondi diventa essenziale per evitare incidenti. Ad esempio, una recente ricerca ha esplorato questa sfida costruendo una pipeline completa di previsione delle collisioni per un veicolo autonomo di emergenza (EAV) che opera in ambienti ricchi di pedoni.
Ecco una panoramica di come funziona questa metodologia:
Allo stesso modo, un altro approccio alla prevenzione delle collisioni guarda oltre i veicoli e si concentra sulle infrastrutture stesse. Invece di affidarsi ai sensori all'interno dell'auto, questo metodo utilizza telecamere intelligenti installate sulle strisce pedonali e agli incroci per monitorare il movimento di pedoni e veicoli in tempo reale. Questi luoghi sono spesso imprevedibili: le persone possono entrare in strada all'improvviso, i ciclisti possono muoversi nel traffico e i conducenti non sempre rallentano.
Un interessante studio ha esplorato questa idea attraverso un sistema chiamato NAVIBox, un dispositivo di edge-vision progettato per prevedere i rischi per i veicoli e i pedoni direttamente all'incrocio. Il sistema utilizza il sistema Ultralytics YOLOv8 per detect pedoni e i veicoli e un leggero inseguitore di centroidi per seguirli attraverso i fotogrammi. In questo modo si creano storie di movimento brevi e affidabili, che vengono poi perfezionate utilizzando una trasformazione prospettica che converte la vista angolata delle telecamere a circuito chiuso in una più chiara disposizione a volo d'uccello della strada.
Grazie a queste traiettorie raffinate, NAVIBox è in grado di stimare come gli utenti della strada si muoveranno nei prossimi secondi e di verificare se i loro percorsi possono intersecarsi (anche detto test di intersezione). Quando il sistema rileva un'interazione rischiosa, invia immediatamente avvisi tramite display per i conducenti e altoparlanti per i pedoni, senza dover ricorrere a un server remoto o a una connessione di rete. I test condotti in aree urbane reali hanno dimostrato che NAVIBox è sufficientemente veloce da garantire una risposta in tempo reale ed è in grado di identificare con precisione potenziali scenari di collisione, rendendolo uno strumento di sicurezza pratico per le intersezioni urbane più trafficate.

Ecco alcuni vantaggi dell'utilizzo di sistemi predittivi di collisione basati sull'intelligenza artificiale:
Nonostante i vantaggi, i sistemi senza collisioni presentano anche alcuni limiti. Ecco alcune sfide da considerare:
La previsione delle collisioni riunisce due potenti capacità: la visione computerizzata, che consente ai sistemi di capire cosa sta accadendo nell'ambiente in questo momento, e la previsione delle traiettorie, che li aiuta ad anticipare ciò che probabilmente accadrà in seguito.
Combinando questi punti di forza, le macchine possono detect oggetti in movimento in tempo reale e prevedere come questi oggetti potrebbero interagire nei secondi successivi. Con la continua evoluzione delle tecniche di computer vision e di previsione, la previsione delle collisioni diventerà probabilmente fondamentale per costruire sistemi autonomi più sicuri, affidabili e scalabili.
Consultate la nostra comunità e il repository GitHub per saperne di più sull'IA. Esplorate applicazioni come l'IA nella sanità e la computer vision nella produzione nelle nostre pagine dedicate alle soluzioni. Scoprite le nostre opzioni di licenza e iniziate a costruire oggi stesso!