Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Principaux points saillants d'Ultralytics au CVPR 2025

Abirami Vina

3 min de lecture

18 juin 2025

Rejoignez-nous pour récapituler l'expérience d'Ultralytics à CVPR 2025, des moments forts du stand aux cas d'utilisation réels de la vision par ordinateur et aux moments mémorables à Nashville.

La semaine dernière, du 11 au 15 juin, l'équipe Ultralytics était présente à Nashville, dans le Tennessee, pour CVPR 2025 - la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes. C'est l'un des événements annuels clés dans le domaine de la vision par ordinateur et de la recherche en IA. 

Organisée au Music City Center, la conférence de cette année a réuni plus de 12 000 participants du monde entier. Des chercheurs universitaires et ingénieurs aux chefs d'entreprise et développeurs, l'événement était rempli de personnes repoussant les limites de la Vision IA. 

En particulier, CVPR 2025 a présenté des recherches de pointe et des conversations autour de tout, de l'apprentissage profond dans la vision par ordinateur et de l'apprentissage multimodal aux modèles d'IA génératifs, aux modèles de fondation et aux applications du monde réel comme la conduite autonome et la compréhension de scènes 3D.

Fig. 1. CVPR 2025 à Nashville, Tennessee.

Pour Ultralytics, la semaine à CVPR 2025 a été axée sur la connexion avec la communauté de la vision par ordinateur, le partage de démos et l'apprentissage de la façon dont nos modèles Ultralytics YOLO sont utilisés dans divers secteurs. Au stand 1512, nous avons présenté nos dernières solutions de Vision IA, discuté avec des centaines de visiteurs des cas d'utilisation pratiques et constaté directement comment notre travail alimente les innovations dans des secteurs tels que la robotique, la vente au détail, la recherche, etc. 

Alors, jetons un coup d'œil à certains de nos moments préférés de l'événement, en soulignant les principaux points à retenir, les conversations et les connexions communautaires. 

Un aperçu de CVPR Nashville 2025

CVPR a été introduit pour la première fois en 1983 et officiellement soutenu par l'IEEE en 1985. Au fil des ans, il est devenu l'une des conférences les plus influentes dans le domaine de la vision par ordinateur et de la reconnaissance de formes, rassemblant des chercheurs, des ingénieurs et des innovateurs du monde entier. Depuis 2012, il est co-parrainé par la Computer Vision Foundation (CVF), une organisation à but non lucratif qui soutient l'accès libre à la recherche en vision par ordinateur et joue un rôle essentiel dans l'organisation de l'événement. 

Organisée chaque année, la CVPR est devenue célèbre pour sa profondeur technique et pour avoir contribué à façonner l'orientation de l'ensemble du domaine, des premières percées dans la reconnaissance d'objets aux avancées actuelles dans le domaine de la Vision IA et du deep learning. L'édition de cette année a enregistré plus de 13 000 soumissions d'articles, soit une augmentation de 13 % par rapport à l'année dernière. Avec un taux d'acceptation de seulement 22 %, la conférence a perpétué sa tradition de mettre en lumière les recherches à fort impact.

Voici un bref aperçu de certains des principaux thèmes de recherche qui se sont démarqués lors de la CVPR 2025 :

  • Compréhension de scènes 3D et rendu neuronal : Les chercheurs étudient comment reconstruire et représenter le monde en trois dimensions en utilisant plusieurs vues ou entrées de capteurs pour faire progresser les applications dans la robotique, la réalité augmentée et la simulation.
  • Synthèse d'images et de vidéos à l'aide de l'IA générative :Ce domaine se concentre sur la création de visuels de haute qualité à partir d'un minimum d'entrées, comme des invites textuelles ou des croquis, afin d'alimenter les outils de nouvelle génération pour les médias créatifs et les systèmes interactifs.
  • Apprentissage multimodal et modèles vision-langage : Ces modèles combinent des données visuelles et linguistiques pour améliorer la compréhension, le raisonnement et la communication, ouvrant la voie à des systèmes d'IA plus généraux et adaptables.

Installation au Music City Center pour CVPR

Avant le lancement officiel de la conférence, notre équipe est arrivée à Nashville pour tout mettre en place pour CVPR 2025. 

Nous avons passé la journée à nous installer au Music City Center, où le stand 1512 est devenu notre base d'attache pour trois jours complets de démonstrations, de conversations et de développement de la communauté. Avec notre équipement en remorque, nous avons déballé le matériel, configuré des démonstrations YOLO en direct et soigneusement organisé notre installation pour nous assurer que tout se déroulerait sans problème dans l'environnement d'exposition trépidant. 

L'espace s'est progressivement rempli de personnes déchargeant du matériel, testant des démos et assemblant leurs stands. Voir tout cela se concrétiser nous a rappelé à quel point CVPR est un événement mondial et collaboratif.

Après un après-midi productif, l'équipe a changé de cap et est partie explorer le centre-ville de Nashville. Naturellement, ils se sont arrêtés à Broadway, où la musique country en direct se déverse de tous les bars et restaurants. 

Certains membres de l'équipe ont acheté des bottes de cowboy (une première pour certains d'entre nous), et ils ont terminé la soirée avec un classique local : du poulet épicé de chez Hattie B's. C'était le mélange parfait de travail et de plaisir. Le stand était prêt, et l'équipe était rechargée pour voir ce que le CVPR 2025 leur réservait.

Conversations sur la vision par ordinateur et la recherche en IA

Le premier jour de l'exposition a commencé avec l'équipe Ultralytics sur place et prête à démarrer. Nuvola Ladi, notre responsable du contenu numérique, Zinnia Pourdad, notre responsable des événements, et Francesco Mattioli, notre ingénieur en apprentissage automatique, sont arrivés au Music City Center à 9 heures du matin. Une fois les derniers contrôles de configuration terminés et les démonstrations préparées, nous étions prêts à accueillir les participants dès l'ouverture des portes.

À 10 heures du matin, la foule a commencé à affluer et l'énergie sur le sol de l'exposition a immédiatement augmenté. Notre stand s'est rapidement rempli de visiteurs et nos produits Ultralytics, en particulier les sacs fourre-tout et les autocollants, ont disparu en quelques minutes. C'était un brise-glace amusant qui a aidé à démarrer des conversations et à attirer les gens.

Fig. 2. Nuvola Ladi, Zinnia Pourdad, et Francesco Mattioli au stand 1512.

​​Tout au long de la journée, nous avons eu l'occasion de parler à des chercheurs, des ingénieurs et des développeurs travaillant sur un large éventail de projets. Nos démos YOLO en direct ont suscité beaucoup d'intérêt et nous avons entendu parler de cas d'utilisation dans la robotique, les soins de santé, la fabrication, la vente au détail et au-delà. Il était inspirant de voir à quel point nos modèles sont largement utilisés, de la recherche universitaire précoce aux systèmes d'entreprise déployés.

Nous avons également eu l'occasion de renouer avec des collaborateurs dans le domaine de l'IA, notamment des équipes d'Intel OpenVINO et de Sony Semiconductor Solutions. Partager l'espace avec d'autres innovateurs a renforcé l'idée que le domaine de la Vision IA continue d'être collaboratif et en évolution rapide.

Vers la fin de la journée, l'équipe s'est rendue à Printers Alley pour profiter de musique country en direct et se détendre. Après une journée bien remplie de conversations et d'une énergie incroyable sur le terrain, c'était le moyen idéal pour clore notre première journée au CVPR 2025.

Fig 3. L'équipe a eu l'occasion d'explorer Printers Alley.

Jour 2 à la conférence sur la vision par ordinateur à Nashville

Le deuxième jour de CVPR 2025 a repris là où le premier jour s'était arrêté. Le stand 1512 est resté animé tout au long de la journée, avec des visiteurs de retour et de nouveaux participants qui se sont arrêtés pour en savoir plus sur nos modèles Ultralytics YOLO et partager leur propre travail.

Par exemple, l'un des moments les plus mémorables de la journée a été la visite d'Intel Robodog. Le fait de voir du matériel de pointe associé à des modèles de vision pratiques en action a vraiment capturé l'esprit de l'événement.

Fig. 4. Intel Robodog a rendu visite à l'équipe au stand 1512.

Plus tard dans la soirée, notre équipe a assisté au After.CVPR() Developer Meetup, organisé par Intel. C'était un espace détendu et collaboratif rempli d'ingénieurs, de chercheurs et de développeurs de tout l'écosystème de l'IA. 

La rencontre a été marquée par des démonstrations en direct et des conversations enrichissantes qui se sont prolongées tard dans la nuit. Au cours de l'événement, Francesco Mattioli a présenté une démonstration conjointe mettant en vedette Ultralytics et OpenVINO, montrant comment nos modèles peuvent être intégrés dans des pipelines d'inférence efficaces. 

Il a expliqué comment des modèles comme Ultralytics YOLO11 peuvent être exportés au format OpenVINO pour obtenir une inférence plus rapide et optimisée sur le matériel Intel. La démonstration a mis en évidence la prise en charge des unités centrales de traitement (CPU), des unités de traitement graphique (GPU) et des unités de traitement neuronal (NPU). Elle a suscité un intérêt considérable de la part des équipes travaillant sur l'IA en périphérie et les applications en temps réel.

Fig. 5. Un aperçu de la rencontre des développeurs After.CVPR().

L'apprentissage profond dans les applications de vision par ordinateur à CVPR

Même lors de la dernière journée de CVPR 2025, le Music City Center était en pleine effervescence. Les participants continuaient d'explorer les stands, d'avoir des conversations intéressantes et de profiter au maximum de leur temps à la conférence.

L'un des points forts de la journée a été la visite des sessions d'affiches, un élément essentiel de la manière dont la recherche est partagée à la CVPR. Contrairement aux présentations traditionnelles sur scène, les sessions d'affiches sont plus informelles et interactives. 

Chaque chercheur installe un grand poster imprimé résumant son travail et se tient à proximité pour l'expliquer, répondre aux questions et discuter de ses conclusions avec toute personne qui s'arrête. C'est un excellent moyen de se renseigner sur un large éventail de sujets en peu de temps, et cela crée un espace pour de véritables conversations entre les participants et les présentateurs.

Nous avons vu une grande variété de posters couvrant tous les sujets, des modèles de vision-langage et de la compréhension de scènes 3D aux applications concrètes de l'IA dans la robotique et les soins de santé. Les sessions nous ont permis d'examiner de plus près les dernières idées explorées dans le domaine et de communiquer directement avec les personnes qui les ont conçues.

L'événement touchant à sa fin, nous sommes repartis plus motivés que jamais. La semaine a été riche en apprentissage, en collaboration et en véritable élan dans le domaine de la Vision IA, et nous sommes ravis de transposer ces idées dans les prochaines étapes.

Principaux points à retenir

CVPR 2025 a été une excellente semaine d'apprentissage, de partage et de connexion. De la recherche de pointe aux démonstrations pratiques et aux excellentes conversations, la conférence a montré à quel point la Vision AI évolue rapidement et à quel point la communauté qui la soutient est percutante et solidaire.

Il était inspirant de voir les modèles Ultralytics YOLO en action dans un si grand nombre d'applications réelles et de recherche. Plus que tout, CVPR 2025 a clairement démontré que la vision par ordinateur est au cœur de l'innovation en matière d'IA, et qu'il reste encore beaucoup à venir.

Rejoignez notre communauté et plongez dans l'IA de vision sur notre dépôt GitHub. Découvrez les innovations telles que l'IA dans le commerce de détail et la vision par ordinateur dans la fabrication sur nos pages de solutions. Consultez nos plans de licence et commencez votre parcours dans l'IA dès aujourd'hui !

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement