Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Punti salienti di Ultralytics al CVPR 2025

Unitevi a noi per riepilogare l'esperienza di Ultralytics al CVPR 2025, dai punti salienti dello stand ai casi d'uso reali della computer vision e ai momenti memorabili a Nashville.

La scorsa settimana, dall'11 al 15 giugno, il team diUltralytics è stato a Nashville, nel Tennessee, per la CVPR 2025 - la Conferenza IEEE/CVF sulla Computer Vision e il Pattern Recognition. Si tratta di uno dei principali eventi annuali nel settore della computer vision e della ricerca sull'intelligenza artificiale. 

Tenutasi presso il Music City Center, la conferenza di quest'anno ha riunito oltre 12.000 partecipanti da tutto il mondo. Dai ricercatori accademici e ingegneri ai leader del settore e sviluppatori, l'evento era pieno di persone che spingono i confini della Vision AI. 

In particolare, CVPR 2025 ha presentato ricerche all'avanguardia e conversazioni su tutto, dal deep learning nella computer vision e l'apprendimento multimodale ai modelli di IA generativa, i modelli di base e le applicazioni del mondo reale come la guida autonoma e la comprensione di scene 3D.

Fig. 1. CVPR 2025 a Nashville, Tennessee.

Per Ultralytics, la settimana al CVPR 2025 è stata incentrata sul contatto con la comunità della computer vision, sulla condivisione di demo e sull'apprendimento di come i nostri modelliUltralytics YOLO vengono utilizzati in tutti i settori. Allo stand 1512 abbiamo presentato le nostre ultime soluzioni di Vision AI, abbiamo parlato con centinaia di visitatori di casi d'uso pratici e abbiamo visto in prima persona come il nostro lavoro alimenta le innovazioni in settori come la robotica, la vendita al dettaglio, la ricerca e altri ancora. 

Diamo quindi un'occhiata ad alcuni dei nostri momenti preferiti dell'evento, evidenziando i punti chiave, le conversazioni e le connessioni con la community. 

Uno sguardo a CVPR Nashville 2025

CVPR è stata introdotta per la prima volta nel 1983 e ufficialmente supportata dall'IEEE nel 1985. Nel corso degli anni, è cresciuta fino a diventare una delle conferenze più influenti nel campo della computer vision e del riconoscimento di pattern, riunendo ricercatori, ingegneri e innovatori di tutto il mondo. Dal 2012, è co-sponsorizzata dalla Computer Vision Foundation (CVF), un'organizzazione senza scopo di lucro che supporta l'accesso aperto alla ricerca sulla computer vision e svolge un ruolo fondamentale nell'organizzazione dell'evento. 

CVPR, che si tiene ogni anno, è diventata famosa per la sua profondità tecnica e per aver contribuito a plasmare la direzione dell'intero settore, dalle prime scoperte nel riconoscimento degli oggetti agli odierni progressi nella Vision AI e nel deep learning. L'edizione di quest'anno ha visto oltre 13.000 presentazioni di articoli, con un aumento del 13% rispetto allo scorso anno. Con un tasso di accettazione di solo il 22%, la conferenza ha continuato la sua tradizione di mettere in evidenza la ricerca di grande impatto.

Ecco una rapida panoramica di alcuni dei principali temi di ricerca che si sono distinti al CVPR 2025:

  • Comprensione di scene 3D e rendering neurale: I ricercatori stanno esplorando come ricostruire e rappresentare il mondo in tre dimensioni utilizzando viste multiple o input di sensori per far progredire le applicazioni nella robotica, nella realtà aumentata e nella simulazione.
  • Sintesi di immagini e video tramite IA generativa: Quest'area si concentra sulla creazione di immagini di alta qualità a partire da input minimi, come prompt di testo o schizzi, per alimentare strumenti di nuova generazione per i media creativi e i sistemi interattivi.
  • Apprendimento multimodale e modelli di visione-linguaggio: Questi modelli combinano dati visivi e linguistici per migliorare la comprensione, il ragionamento e la comunicazione, aprendo la strada a sistemi di intelligenza artificiale più generali e adattabili.

Allestimento presso il Music City Center per CVPR

Prima dell'inizio ufficiale della conferenza, il nostro team è arrivato a Nashville per preparare tutto per CVPR 2025. 

Abbiamo trascorso la giornata allestendo il Music City Center, dove lo stand 1512 è diventato la nostra base per tre giorni interi di dimostrazioni, conversazioni e creazione di comunità. Con l'attrezzatura al seguito, abbiamo disimballato l'hardware, configurato le demo YOLO dal vivo e organizzato con cura il nostro allestimento per assicurarci che tutto si svolgesse senza intoppi nel frenetico ambiente dell'esposizione. 

Lo spazio si è gradualmente riempito di persone che scaricavano attrezzature, testavano demo e assemblavano i loro stand. Guardare tutto ciò che si univa ci ha ricordato quanto sia veramente globale e collaborativo il CVPR.

Dopo un pomeriggio produttivo, il team ha cambiato marcia e si è diretto alla scoperta del centro di Nashville. Naturalmente, hanno fatto una sosta a Broadway, dove la musica country dal vivo si riversa da ogni bar e ristorante. 

Alcuni membri del team hanno acquistato stivali da cowboy (una novità per alcuni di noi) e hanno concluso la serata con un classico locale preferito: il pollo piccante di Hattie B’s. È stato il mix perfetto di lavoro e divertimento. Lo stand era pronto e il team era ricaricato per vedere cosa aveva in serbo CVPR 2025.

Conversazioni sulla computer vision e la ricerca sull'IA

Il primo giorno della fiera è iniziato con il team di Ultralytics in loco e pronto a partire. Nuvola Ladi, il nostro Digital Content Manager, Zinnia Pourdad, il nostro Events Manager, e Francesco Mattioli, il nostro Machine Learning Engineer, sono arrivati al Music City Center alle 9. Con i controlli finali dell'allestimento e le demo preparate, eravamo pronti ad accogliere i partecipanti non appena si sono aperte le porte.

Alle 10 del mattino la folla ha iniziato a riversarsi e l'energia sul piano espositivo è aumentata immediatamente. Il nostro stand si è riempito rapidamente di visitatori e il nostro merchandising Ultralytics , in particolare le borse e gli adesivi, è andato a ruba in pochi minuti. È stato un divertente rompighiaccio che ha aiutato a iniziare le conversazioni e ad attirare le persone.

Fig. 2. Nuvola Ladi, Zinnia Pourdad e Francesco Mattioli allo stand 1512.

Nel corso della giornata abbiamo avuto la possibilità di parlare con ricercatori, ingegneri e sviluppatori che lavorano su un'ampia gamma di progetti. Le nostre dimostrazioni YOLO dal vivo hanno suscitato grande interesse e abbiamo sentito parlare di casi d'uso in robotica, sanità, produzione, vendita al dettaglio e altro ancora. È stato stimolante vedere l'ampia diffusione dei nostri modelli, dalle prime ricerche accademiche ai sistemi aziendali.

Abbiamo anche avuto modo di riallacciare i contatti con i collaboratori dello spazio AI, tra cui i team di Intel OpenVINO e Sony Semiconductor Solutions. Condividere la sala con altri innovatori ha contribuito a rafforzare la collaborazione e la rapida evoluzione del settore Vision AI.

Verso la fine della giornata, il team si è diretto a Printers Alley per godersi un po' di musica country dal vivo e rilassarsi. Dopo una giornata intensa di conversazioni e un'energia incredibile in fiera, è stato il modo perfetto per concludere la nostra prima giornata al CVPR 2025.

Fig. 3. Il team ha avuto la possibilità di esplorare Printers Alley.

Giorno 2 alla conferenza sulla computer vision a Nashville

Il secondo giorno del CVPR 2025 è ripreso proprio da dove si era interrotto il primo. Lo stand 1512 è stato animato per tutta la giornata, con visitatori abituali e nuovi che si sono fermati per saperne di più sui nostri modelli Ultralytics YOLO e per condividere il proprio lavoro.

Ad esempio, uno dei momenti più memorabili della giornata è stata la visita di Intel Robodog. Vedere in azione hardware avanzato abbinato a modelli di visione pratici ha davvero catturato lo spirito dell'evento.

Figura 4. Intel Robodog ha visitato il team allo stand 1512.

Più tardi, in serata, il nostro team ha partecipato all'After.CVPR() Developer Meetup, ospitato da Intel. È stato uno spazio rilassato e collaborativo, pieno di ingegneri, ricercatori e sviluppatori provenienti da tutto l'ecosistema dell'intelligenza artificiale. 

Il meetup ha offerto dimostrazioni dal vivo e conversazioni significative che si sono protratte fino a notte fonda. Durante l'evento, Francesco Mattioli ha presentato una demo congiunta di Ultralytics e OpenVINO, mostrando come i nostri modelli possano essere integrati in pipeline di inferenza efficienti. 

Ha illustrato come modelli come Ultralytics YOLO11 possono essere esportati nel formato OpenVINO per ottenere un'inferenza più veloce e ottimizzata sull'hardware Intel . La dimostrazione ha evidenziato il supporto per le unità di elaborazione centrale (CPU), le unità di elaborazione grafica (GPU) e le unità di elaborazione neurale (NPU). Ha suscitato un notevole interesse da parte dei team che lavorano sull'intelligenza artificiale e sulle applicazioni in tempo reale.

Fig. 5. Uno sguardo al Developer Meetup After.CVPR().

Deep learning nelle applicazioni di computer vision al CVPR

Anche nell'ultimo giorno di CVPR 2025, il Music City Center era in fermento. I partecipanti stavano ancora esplorando gli stand, intrattenendo conversazioni ponderate e sfruttando al massimo il loro tempo alla conferenza.

Uno dei momenti salienti della giornata è stata la visita alle sessioni di poster, una parte fondamentale del modo in cui la ricerca viene condivisa al CVPR. A differenza delle presentazioni tradizionali sul palco, le sessioni di poster sono più informali e interattive. 

Ogni ricercatore allestisce un grande poster stampato che riassume il proprio lavoro e si posiziona nelle vicinanze per spiegarlo, rispondere alle domande e discutere i propri risultati con chiunque si fermi. È un ottimo modo per conoscere una vasta gamma di argomenti in un breve lasso di tempo e crea spazio per conversazioni reali tra partecipanti e relatori.

Abbiamo visto un'ampia varietà di poster che coprono argomenti che vanno dai modelli di visione-linguaggio e dalla comprensione di scene 3D alle applicazioni reali dell'IA nella robotica e nell'assistenza sanitaria. Le sessioni ci hanno offerto uno sguardo più da vicino alle ultime idee esplorate nel settore e la possibilità di entrare in contatto diretto con le persone che le hanno sviluppate.

Con la conclusione dell'evento, ci siamo sentiti più motivati che mai. La settimana è stata ricca di apprendimento, collaborazione e vero slancio nella Vision AI, e siamo entusiasti di portare avanti queste intuizioni in ciò che verrà.

Punti chiave

CVPR 2025 è stata una fantastica settimana di apprendimento, condivisione e connessione. Dalla ricerca all'avanguardia alle demo pratiche e alle grandi conversazioni, la conferenza ha mostrato quanto velocemente si sta muovendo la Vision AI e quanto sia d'impatto e di supporto la comunità che la sostiene.

È stato stimolante vedere i modelli Ultralytics YOLO in azione in così tante applicazioni reali e di ricerca. Più di ogni altra cosa, il CVPR 2025 ha chiarito che la computer vision è al centro dell'innovazione dell'IA, con molto altro ancora da fare.

Unisciti alla nostra community e immergiti nella Vision AI sul nostro repository GitHub. Scopri le innovazioni come l'AI nel retail e la computer vision nella produzione nelle nostre pagine dedicate alle soluzioni. Dai un'occhiata ai nostri piani di licenza e inizia oggi stesso il tuo percorso nell'AI!

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis