Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Principaux faits marquants d'Ultralytics à CVPR 2025

Rejoignez-nous pour récapituler l'expérience d'Ultralytics à CVPR 2025, des points forts du stand aux cas d'utilisation réels de la vision par ordinateur, en passant par les moments mémorables à Nashville.

La semaine dernière, du 11 au 15 juin, l'équipe d'Ultralytics était à Nashville, dans le Tennessee, pour CVPR 2025 - la conférence IEEE/CVF sur la vision artificielle et la reconnaissance des formes. Il s'agit de l'un des principaux événements annuels dans le domaine de la vision par ordinateur et de la recherche en IA. 

Organisée au Music City Center, la conférence de cette année a réuni plus de 12 000 participants du monde entier. Des chercheurs universitaires et ingénieurs aux chefs d'entreprise et développeurs, l'événement était rempli de personnes repoussant les limites de la Vision IA. 

En particulier, CVPR 2025 a présenté des recherches de pointe et des conversations autour de tout, de l'apprentissage profond dans la vision par ordinateur et de l'apprentissage multimodal aux modèles d'IA génératifs, aux modèles de fondation et aux applications du monde réel comme la conduite autonome et la compréhension de scènes 3D.

Fig. 1. CVPR 2025 à Nashville, Tennessee.

Pour Ultralytics, la semaine à CVPR 2025 a été axée sur la connexion avec la communauté de la vision par ordinateur, le partage de démonstrations et l'apprentissage de l'utilisation de nos modèlesUltralytics YOLO dans toutes les industries. Au stand 1512, nous avons présenté nos dernières solutions Vision AI, discuté avec des centaines de visiteurs sur des cas d'utilisation pratiques, et vu de première main comment notre travail alimente les innovations dans des secteurs tels que la robotique, la vente au détail, la recherche, et plus encore. 

Alors, jetons un coup d'œil à certains de nos moments préférés de l'événement, en soulignant les principaux points à retenir, les conversations et les connexions communautaires. 

Un aperçu de CVPR Nashville 2025

CVPR a été introduit pour la première fois en 1983 et officiellement soutenu par l'IEEE en 1985. Au fil des ans, il est devenu l'une des conférences les plus influentes dans le domaine de la vision par ordinateur et de la reconnaissance de formes, rassemblant des chercheurs, des ingénieurs et des innovateurs du monde entier. Depuis 2012, il est co-parrainé par la Computer Vision Foundation (CVF), une organisation à but non lucratif qui soutient l'accès libre à la recherche en vision par ordinateur et joue un rôle essentiel dans l'organisation de l'événement. 

Organisée chaque année, la CVPR est devenue célèbre pour sa profondeur technique et pour avoir contribué à façonner l'orientation de l'ensemble du domaine, des premières percées dans la reconnaissance d'objets aux avancées actuelles dans le domaine de la Vision IA et du deep learning. L'édition de cette année a enregistré plus de 13 000 soumissions d'articles, soit une augmentation de 13 % par rapport à l'année dernière. Avec un taux d'acceptation de seulement 22 %, la conférence a perpétué sa tradition de mettre en lumière les recherches à fort impact.

Voici un bref aperçu de certains des principaux thèmes de recherche qui se sont démarqués lors de la CVPR 2025 :

  • Compréhension de scènes 3D et rendu neuronal : Les chercheurs étudient comment reconstruire et représenter le monde en trois dimensions en utilisant plusieurs vues ou entrées de capteurs pour faire progresser les applications dans la robotique, la réalité augmentée et la simulation.
  • Synthèse d'images et de vidéos à l'aide de l'IA générative :Ce domaine se concentre sur la création de visuels de haute qualité à partir d'un minimum d'entrées, comme des invites textuelles ou des croquis, afin d'alimenter les outils de nouvelle génération pour les médias créatifs et les systèmes interactifs.
  • Apprentissage multimodal et modèles vision-langage : Ces modèles combinent des données visuelles et linguistiques pour améliorer la compréhension, le raisonnement et la communication, ouvrant la voie à des systèmes d'IA plus généraux et adaptables.

Installation au Music City Center pour CVPR

Avant le lancement officiel de la conférence, notre équipe est arrivée à Nashville pour tout mettre en place pour CVPR 2025. 

Nous avons passé la journée à nous installer au Music City Center, où le stand 1512 est devenu notre base pour trois jours entiers de démonstrations, de conversations et de création de communautés. Nous avons déballé le matériel, configuré des démonstrations YOLO en direct et soigneusement organisé notre installation pour nous assurer que tout se passerait bien dans l'environnement rapide de l'exposition. 

L'espace s'est progressivement rempli de personnes déchargeant du matériel, testant des démos et assemblant leurs stands. Voir tout cela se concrétiser nous a rappelé à quel point CVPR est un événement mondial et collaboratif.

Après un après-midi productif, l'équipe a changé de cap et est partie explorer le centre-ville de Nashville. Naturellement, ils se sont arrêtés à Broadway, où la musique country en direct se déverse de tous les bars et restaurants. 

Certains membres de l'équipe ont acheté des bottes de cowboy (une première pour certains d'entre nous), et ils ont terminé la soirée avec un classique local : du poulet épicé de chez Hattie B's. C'était le mélange parfait de travail et de plaisir. Le stand était prêt, et l'équipe était rechargée pour voir ce que le CVPR 2025 leur réservait.

Conversations sur la vision par ordinateur et la recherche en IA

Le premier jour de l'exposition a commencé avec l'équipe d'Ultralytics sur place et prête à partir. Nuvola Ladi, notre responsable du contenu numérique, Zinnia Pourdad, notre responsable des événements, et Francesco Mattioli, notre ingénieur en apprentissage automatique, sont arrivés au Music City Center à 9 h. Une fois les dernières vérifications effectuées et les démonstrations préparées, nous étions prêts à accueillir les participants dès l'ouverture des portes.

Dès 10 heures, la foule a commencé à affluer et l'énergie s'est immédiatement accrue sur le site de l'exposition. Notre stand s'est rapidement rempli de visiteurs et nos produits Ultralytics , en particulier les sacs fourre-tout et les autocollants, se sont envolés en quelques minutes. C'était un moyen amusant de briser la glace qui a permis d'entamer des conversations et d'attirer les gens.

Fig. 2. Nuvola Ladi, Zinnia Pourdad, et Francesco Mattioli au stand 1512.

Tout au long de la journée, nous avons eu l'occasion de discuter avec des chercheurs, des ingénieurs et des développeurs travaillant sur un large éventail de projets. Nos démonstrations en direct de YOLO ont suscité beaucoup d'intérêt et nous avons entendu parler de cas d'utilisation dans les domaines de la robotique, des soins de santé, de la fabrication, de la vente au détail et autres. Il était très stimulant de voir à quel point nos modèles sont utilisés, depuis les premières recherches universitaires jusqu'aux systèmes d'entreprise déployés.

Nous avons également pu renouer avec des collaborateurs dans le domaine de l'IA, notamment des équipes d'Intel OpenVINO et de Sony Semiconductor Solutions. Le fait de partager l'espace avec d'autres innovateurs a contribué à renforcer la collaboration et la rapidité d'évolution du domaine de l'IA de la vision.

Vers la fin de la journée, l'équipe s'est rendue à Printers Alley pour profiter de musique country en direct et se détendre. Après une journée bien remplie de conversations et d'une énergie incroyable sur le terrain, c'était le moyen idéal pour clore notre première journée au CVPR 2025.

Fig 3. L'équipe a eu l'occasion d'explorer Printers Alley.

Jour 2 à la conférence sur la vision par ordinateur à Nashville

Le deuxième jour de la CVPR 2025 a repris là où le premier jour s'était arrêté. Le stand 1512 est resté animé tout au long de la journée, les visiteurs habituels et les nouveaux venus s'arrêtant pour en savoir plus sur nos modèles Ultralytics YOLO et partager leurs propres travaux.

Par exemple, l'un des moments les plus mémorables de la journée a été la visite d'Intel Robodog. Le fait de voir du matériel avancé associé à des modèles de vision pratiques en action a vraiment capturé l'esprit de l'événement.

Fig 4. Intel Robodog a rendu visite à l'équipe au stand 1512.

Plus tard dans la soirée, notre équipe a assisté au After.CVPR() Developer Meetup, organisé par Intel. Il s'agissait d'un espace détendu et collaboratif rempli d'ingénieurs, de chercheurs et de développeurs issus de l'ensemble de l'écosystème de l'IA. 

La rencontre a donné lieu à des démonstrations en direct et à des conversations intéressantes qui se sont poursuivies jusqu'à tard dans la nuit. Au cours de l'événement, Francesco Mattioli a présenté une démonstration conjointe d'Ultralytics et d'OpenVINO, montrant comment nos modèles peuvent être intégrés dans des pipelines d'inférence efficaces. 

Il a expliqué comment des modèles comme Ultralytics YOLO11 peuvent être exportés vers le format OpenVINO afin d'obtenir une inférence plus rapide et optimisée sur le matériel Intel . La démonstration a mis en évidence la prise en charge des unités centrales de traitement (CPU), des unités de traitement graphique (GPU) et des unités de traitement neuronal (NPU). Elle a suscité un vif intérêt de la part des équipes travaillant sur l'intelligence artificielle et les applications en temps réel.

Fig. 5. Un aperçu de la rencontre des développeurs After.CVPR().

L'apprentissage profond dans les applications de vision par ordinateur à CVPR

Même lors de la dernière journée de CVPR 2025, le Music City Center était en pleine effervescence. Les participants continuaient d'explorer les stands, d'avoir des conversations intéressantes et de profiter au maximum de leur temps à la conférence.

L'un des points forts de la journée a été la visite des sessions d'affiches, un élément essentiel de la manière dont la recherche est partagée à la CVPR. Contrairement aux présentations traditionnelles sur scène, les sessions d'affiches sont plus informelles et interactives. 

Chaque chercheur installe un grand poster imprimé résumant son travail et se tient à proximité pour l'expliquer, répondre aux questions et discuter de ses conclusions avec toute personne qui s'arrête. C'est un excellent moyen de se renseigner sur un large éventail de sujets en peu de temps, et cela crée un espace pour de véritables conversations entre les participants et les présentateurs.

Nous avons vu une grande variété de posters couvrant tous les sujets, des modèles de vision-langage et de la compréhension de scènes 3D aux applications concrètes de l'IA dans la robotique et les soins de santé. Les sessions nous ont permis d'examiner de plus près les dernières idées explorées dans le domaine et de communiquer directement avec les personnes qui les ont conçues.

L'événement touchant à sa fin, nous sommes repartis plus motivés que jamais. La semaine a été riche en apprentissage, en collaboration et en véritable élan dans le domaine de la Vision IA, et nous sommes ravis de transposer ces idées dans les prochaines étapes.

Principaux points à retenir

CVPR 2025 a été une excellente semaine d'apprentissage, de partage et de connexion. De la recherche de pointe aux démonstrations pratiques et aux excellentes conversations, la conférence a montré à quel point la Vision AI évolue rapidement et à quel point la communauté qui la soutient est percutante et solidaire.

Il était inspirant de voir les modèlesYOLO d'Ultralytics en action dans tant d'applications du monde réel et de la recherche. Plus que tout, CVPR 2025 a montré clairement que la vision par ordinateur est au cœur de l'innovation en matière d'IA, et qu'il reste encore beaucoup à faire.

Rejoignez notre communauté et plongez dans l'IA de vision sur notre dépôt GitHub. Découvrez les innovations telles que l'IA dans le commerce de détail et la vision par ordinateur dans la fabrication sur nos pages de solutions. Consultez nos plans de licence et commencez votre parcours dans l'IA dès aujourd'hui !

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement