Ultralytics au CVPR 2025 : Principaux faits marquants

Un aperçu de la CVPR Nashville 2025

Installation au Music City Center pour la CVPR

Conversations sur la vision artificielle et la recherche en IA

Deuxième jour de la conférence sur la vision artificielle à Nashville

Apprentissage profond dans les applications de vision par ordinateur à CVPR

La semaine dernière, du 11 au 15 juin, l'équipe d'Ultralytics était à Nashville, dans le Tennessee, pour CVPR 2025 - la conférence IEEE/CVF sur la vision artificielle et la reconnaissance des formes. Il s'agit de l'un des principaux événements annuels dans le domaine de la vision par ordinateur et de la recherche en IA.

Organisée au Music City Center, la conférence de cette année a rassemblé plus de 12 000 participants du monde entier. Des chercheurs et ingénieurs universitaires aux leaders de l'industrie et aux développeurs, l'événement était rempli de personnes qui repoussent les limites de l'IA visionnaire.

En particulier, CVPR 2025 a présenté des recherches de pointe et des conversations sur tous les sujets, de l'apprentissage profond dans la vision par ordinateur et l'apprentissage multimodal aux modèles d'IA génératifs, aux modèles de fondation et aux applications du monde réel comme la conduite autonome et la compréhension de scènes en 3D.

Fig 1. CVPR 2025 à Nashville, Tennessee.

‍

Pour Ultralytics, la semaine à CVPR 2025 a été axée sur la connexion avec la communauté de la vision par ordinateur, le partage de démonstrations et l'apprentissage de l'utilisation de nos modèles Ultralytics YOLO dans toutes les industries. Au stand 1512, nous avons présenté nos dernières solutions Vision AI, discuté avec des centaines de visiteurs sur des cas d'utilisation pratiques, et vu de première main comment notre travail alimente les innovations dans des secteurs tels que la robotique, la vente au détail, la recherche, et plus encore.

Jetons donc un coup d'œil à quelques-uns de nos moments préférés de l'événement, en soulignant les principaux enseignements, les conversations et les liens avec la communauté.

Un aperçu de la CVPR Nashville 2025

La CVPR a été introduite pour la première fois en 1983 et soutenue officiellement par l'IEEE en 1985. Au fil des ans, elle est devenue l'une des conférences les plus influentes dans le domaine de la vision par ordinateur et de la reconnaissance des formes, réunissant des chercheurs, des ingénieurs et des innovateurs du monde entier. Depuis 2012, elle est coparrainée par la Computer Vision Foundation (CVF), une organisation à but non lucratif qui soutient le libre accès à la recherche en vision par ordinateur et joue un rôle essentiel dans l'organisation de l'événement.

Organisée chaque année, la CVPR est réputée pour sa profondeur technique et pour sa contribution à l'orientation de l'ensemble du domaine, depuis les premières percées en matière de reconnaissance d'objets jusqu'aux avancées actuelles en matière d'IA visionnaire et d'apprentissage profond. Cette année, plus de 13 000 articles ont été soumis, soit une augmentation de 13 % par rapport à l'année dernière. Avec un taux d'acceptation de seulement 22 %, la conférence a poursuivi sa tradition de mise en lumière des recherches à fort impact.

Voici un aperçu des principaux thèmes de recherche qui se sont distingués lors de la CVPR 2025 :

Compréhension des scènes en 3D et rendu neuronal : Les chercheurs étudient comment reconstruire et représenter le monde en trois dimensions en utilisant des vues multiples ou des entrées de capteurs pour faire progresser les applications en robotique, en réalité augmentée et en simulation.
‍
Synthèse d'images et de vidéos à l'aide de l'IA générative l'IA générative: Ce domaine se concentre sur la création de visuels de haute qualité à partir d'entrées minimales, telles que des invites textuelles ou des croquis, afin d'alimenter les outils de nouvelle génération pour les médias créatifs et les systèmes interactifs.
‍
Apprentissage multimodal et modèles vision-langage : Ces modèles combinent des données visuelles et linguistiques pour améliorer la compréhension, le raisonnement et la communication, ouvrant ainsi la voie à des systèmes d'IA plus généraux et adaptables.

Installation au Music City Center pour la CVPR

Avant le coup d'envoi officiel de la conférence, notre équipe est arrivée à Nashville pour tout mettre en place pour la CVPR 2025.

Nous avons passé la journée à nous installer au Music City Center, où le stand 1512 est devenu notre base pour trois jours entiers de démonstrations, de conversations et de création de communautés. Nous avons déballé le matériel, configuré les démonstrations YOLO en direct et soigneusement organisé notre installation pour nous assurer que tout se passerait bien dans l'environnement rapide de l'exposition.

L'espace s'est progressivement rempli de personnes déchargeant du matériel, testant des démos et assemblant leurs stands. Le fait de voir tout cela se mettre en place nous a rappelé à quel point la CVPR est une organisation mondiale et collaborative.

Après un après-midi productif, l'équipe a changé de vitesse et est partie à la découverte du centre-ville de Nashville. Elle s'est naturellement arrêtée sur Broadway, où la musique country est présente dans tous les bars et restaurants.

Certains membres de l'équipe ont acheté des bottes de cow-boy (une première pour quelques-uns d'entre nous) et ont terminé la soirée en dégustant un classique local : du poulet chaud de chez Hattie B's. C'était le mélange parfait de travail et de plaisir. Le stand était prêt et l'équipe était ravigotée pour voir ce que CVPR 2025 avait en réserve.

Conversations sur la vision artificielle et la recherche en IA

Le premier jour de l'exposition a commencé avec l'équipe d'Ultralytics sur place et prête à partir. Nuvola Ladi, notre responsable du contenu numérique, Zinnia Pourdad, notre responsable des événements, et Francesco Mattioli, notre ingénieur en apprentissage automatique, sont arrivés au Music City Center à 9 h. Une fois les dernières vérifications effectuées et les démonstrations préparées, nous étions prêts à accueillir les participants dès l'ouverture des portes.

Dès 10 heures, la foule a commencé à affluer et l'énergie s'est immédiatement accrue sur le site de l'exposition. Notre stand s'est rapidement rempli de visiteurs et nos produits Ultralytics, en particulier les sacs fourre-tout et les autocollants, se sont envolés en quelques minutes. C'était un moyen amusant de briser la glace qui a permis d'entamer des conversations et d'attirer les gens.

Fig 2. Nuvola Ladi, Zinnia Pourdad et Francesco Mattioli au stand 1512.

‍

Tout au long de la journée, nous avons eu l'occasion de discuter avec des chercheurs, des ingénieurs et des développeurs travaillant sur un large éventail de projets. Nos démonstrations en direct de YOLO ont suscité beaucoup d'intérêt et nous avons entendu parler de cas d'utilisation dans les domaines de la robotique, des soins de santé, de la fabrication, de la vente au détail et autres. Il était très stimulant de voir à quel point nos modèles sont utilisés, depuis les premières recherches universitaires jusqu'aux systèmes d'entreprise déployés.

Nous avons également pu renouer avec des collaborateurs dans le domaine de l'IA, notamment des équipes d'Intel OpenVINO et de Sony Semiconductor Solutions. Le fait de partager l'espace avec d'autres innovateurs a contribué à renforcer la collaboration et la rapidité d'évolution du domaine de l'IA de la vision.

Vers la fin de la journée, l'équipe s'est rendue à Printers Alley pour écouter de la musique country et se détendre. Après une journée bien remplie de conversations et une énergie incroyable sur le terrain, c'était la manière parfaite de clôturer notre première journée à CVPR 2025.

Fig. 3. L'équipe a eu l'occasion d'explorer la Printers Alley.

‍

Deuxième jour de la conférence sur la vision artificielle à Nashville

Le deuxième jour de la CVPR 2025 a repris là où le premier jour s'était arrêté. Le stand 1512 est resté animé tout au long de la journée, les visiteurs habituels et les nouveaux venus s'arrêtant pour en savoir plus sur nos modèles Ultralytics YOLO et partager leurs propres travaux.

Par exemple, l'un des moments les plus mémorables de la journée a été la visite d'Intel Robodog. Le fait de voir du matériel de pointe associé à des modèles de vision pratiques en action a vraiment capturé l'esprit de l'événement.

Fig 4. Intel Robodog a rendu visite à l'équipe au stand 1512.

‍

Plus tard dans la soirée, notre équipe a assisté au After.CVPR() Developer Meetup, organisé par Intel. Il s'agissait d'un espace détendu et collaboratif rempli d'ingénieurs, de chercheurs et de développeurs de l'ensemble de l'écosystème de l'IA.

La rencontre a donné lieu à des démonstrations en direct et à des conversations intéressantes qui se sont poursuivies jusqu'à tard dans la nuit. Au cours de l'événement, Francesco Mattioli a présenté une démonstration conjointe d'Ultralytics et d'OpenVINO, montrant comment nos modèles peuvent être intégrés dans des pipelines d'inférence efficaces.

Il a expliqué comment des modèles comme Ultralytics YOLO11 peuvent être exportés vers le format OpenVINO afin d'obtenir une inférence plus rapide et optimisée sur le matériel Intel. La démonstration a mis en évidence la prise en charge des unités centrales de traitement (CPU), des unités de traitement graphique (GPU) et des unités de traitement neuronal (NPU). Elle a suscité un vif intérêt de la part des équipes travaillant sur l'intelligence artificielle et les applications en temps réel.

Fig 5. Un aperçu de la rencontre des développeurs After.CVPR().

‍

Apprentissage profond dans les applications de vision par ordinateur à CVPR

Même le dernier jour de la CVPR 2025, le Music City Center bourdonnait d'activité. Les participants continuaient d'explorer les stands, d'avoir des conversations réfléchies et de tirer le meilleur parti de leur temps à la conférence.

L'un des moments forts de la journée a été la découverte des sessions de posters, qui constituent un élément essentiel de la diffusion de la recherche à la CVPR. Contrairement aux présentations traditionnelles sur scène, les sessions de posters sont plus informelles et interactives.

Chaque chercheur installe un grand poster imprimé résumant son travail et se tient à proximité pour l'expliquer, répondre aux questions et discuter de ses résultats avec tous ceux qui s'arrêtent. C'est un excellent moyen de s'informer sur un large éventail de sujets en peu de temps, et cela crée un espace pour de vraies conversations entre les participants et les présentateurs.

Nous avons vu une grande variété de posters couvrant tous les domaines, des modèles de langage visuel à la compréhension de scènes en 3D, en passant par les applications réelles de l'IA en robotique et dans les soins de santé. Les sessions nous ont permis d'examiner de plus près les dernières idées explorées dans ce domaine et d'entrer en contact direct avec les personnes qui en sont à l'origine.

Alors que l'événement touche à sa fin, nous sommes repartis plus motivés que jamais. La semaine a été riche en apprentissage, en collaboration et en véritable élan dans le domaine de Vision AI, et nous sommes impatients de mettre à profit ces connaissances pour la suite des événements.

Principaux enseignements

La conférence CVPR 2025 a été une excellente semaine d'apprentissage, de partage et de connexion. De la recherche de pointe aux démonstrations pratiques en passant par les grandes conversations, la conférence a montré à quel point Vision AI évolue rapidement et à quel point la communauté qui la soutient est importante et solidaire.

Il était inspirant de voir les modèles YOLO d'Ultralytics en action dans tant d'applications du monde réel et de la recherche. Plus que tout, CVPR 2025 a montré clairement que la vision par ordinateur est au cœur de l'innovation en matière d'IA, et qu'il reste encore beaucoup à faire.

Rejoignez notre communauté et plongez dans Vision AI sur notre dépôt GitHub. Découvrez des innovations telles que l 'IA dans le commerce de détail et la vision par ordinateur dans l'industrie manufacturière sur nos pages de solutions. Consultez nos plans de licence et commencez votre voyage dans l'IA dès aujourd'hui !

Principaux faits marquants d'Ultralytics à CVPR 2025

Un aperçu de la CVPR Nashville 2025

Installation au Music City Center pour la CVPR

Conversations sur la vision artificielle et la recherche en IA

Deuxième jour de la conférence sur la vision artificielle à Nashville

‍

Apprentissage profond dans les applications de vision par ordinateur à CVPR

Principaux enseignements

Plus d'informations dans cette catégorie

Points forts d'Ultralytics au WAIC 2025 à Shanghai

Principaux faits marquants d'Ultralytics à CVPR 2025

Ultralytics au Congrès mondial des solutions IOT 2025

Construisons ensemble le futur
de l'IA !

Principaux faits marquants d'Ultralytics à CVPR 2025

Un aperçu de la CVPR Nashville 2025

Installation au Music City Center pour la CVPR

Conversations sur la vision artificielle et la recherche en IA

Deuxième jour de la conférence sur la vision artificielle à Nashville

‍

Apprentissage profond dans les applications de vision par ordinateur à CVPR

Principaux enseignements

Plus d'informations dans cette catégorie

Points forts d'Ultralytics au WAIC 2025 à Shanghai

Principaux faits marquants d'Ultralytics à CVPR 2025

Ultralytics au Congrès mondial des solutions IOT 2025

Construisons ensemble le futur de l'IA !

Construisons ensemble le futur
de l'IA !