Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

Die wichtigsten Highlights von Ultralytics auf der CVPR 2025

Seien Sie dabei, wenn wir die Erfahrungen von Ultralytics auf der CVPR 2025 rekapitulieren, von den Highlights am Stand bis hin zu realen Anwendungsfällen der Computer Vision und denkwürdigen Momenten in Nashville.

Letzte Woche, vom 11. bis 15. Juni, war das Ultralytics in Nashville, Tennessee, auf der CVPR 2025 - der IEEE/CVF Conference on Computer Vision and Pattern Recognition - anwesend. Sie ist eine der wichtigsten jährlichen Veranstaltungen im Bereich der Computer Vision und KI-Forschung. 

Die diesjährige Konferenz, die im Music City Center stattfand, brachte über 12.000 Teilnehmer aus der ganzen Welt zusammen. Von akademischen Forschern und Ingenieuren bis hin zu Branchenführern und Entwicklern war die Veranstaltung voll von Menschen, die die Grenzen der Vision AI erweitern. 

Insbesondere präsentierte die CVPR 2025 hochmoderne Forschung und Gespräche rund um Deep Learning in Computer Vision und multimodales Lernen bis hin zu generativen KI-Modellen, Foundation Models und realen Anwendungen wie autonomes Fahren und 3D-Szenenverständnis.

Abb. 1. CVPR 2025 in Nashville, Tennessee.

Für Ultralytics stand die Woche auf der CVPR 2025 ganz im Zeichen des Austauschs mit der Computer-Vision-Community, des Austauschs von Demos und des Lernens, wie unsere Ultralytics YOLO in verschiedenen Branchen eingesetzt werden. Am Stand 1512 präsentierten wir unsere neuesten Vision AI-Lösungen, sprachen mit Hunderten von Besuchern über praktische Anwendungsfälle und sahen aus erster Hand, wie unsere Arbeit Innovationen in Bereichen wie Robotik, Einzelhandel, Forschung und mehr vorantreibt. 

Werfen wir also einen Blick auf einige unserer Lieblingsmomente der Veranstaltung und beleuchten wir die wichtigsten Erkenntnisse, Gespräche und Community-Kontakte. 

Ein Blick auf die CVPR Nashville 2025

Die CVPR wurde erstmals 1983 vorgestellt und 1985 offiziell von der IEEE unterstützt. Im Laufe der Jahre hat sie sich zu einer der einflussreichsten Konferenzen auf dem Gebiet der Computer Vision und Mustererkennung entwickelt, die Forscher, Ingenieure und Innovatoren aus der ganzen Welt zusammenbringt. Seit 2012 wird sie von der Computer Vision Foundation (CVF) mitgetragen, einer gemeinnützigen Organisation, die den offenen Zugang zur Computer-Vision-Forschung unterstützt und eine wichtige Rolle bei der Organisation der Veranstaltung spielt. 

Die jährlich stattfindende CVPR ist bekannt für ihre technische Tiefe und dafür, dass sie die Richtung des gesamten Feldes mitbestimmt, von frühen Durchbrüchen in der Objekterkennung bis hin zu den heutigen Fortschritten in den Bereichen Vision AI und Deep Learning. In diesem Jahr wurden mehr als 13.000 Beiträge eingereicht, eine Steigerung von 13 % gegenüber dem Vorjahr. Mit einer Akzeptanzrate von nur 22 % setzte die Konferenz ihre Tradition fort, hochkarätige Forschungsergebnisse ins Rampenlicht zu rücken.

Hier ist ein kurzer Einblick auf einige der wichtigsten Forschungsthemen, die auf der CVPR 2025 herausragten:

  • 3D-Szenenverständnis und neuronales Rendering: Forscher untersuchen, wie die Welt in drei Dimensionen unter Verwendung mehrerer Ansichten oder Sensoreingaben rekonstruiert und dargestellt werden kann, um Anwendungen in der Robotik, Augmented Reality und Simulation voranzutreiben.
  • Bild- und Videosynthese unter Verwendung von generativer KI: Dieser Bereich konzentriert sich auf die Erstellung hochwertiger Visualisierungen aus minimalen Eingaben, wie z. B. Textaufforderungen oder Skizzen, um Next-Gen-Tools für kreative Medien und interaktive Systeme zu betreiben.
  • Multimodales Lernen und Vision-Language-Modelle: Diese Modelle kombinieren visuelle und sprachliche Daten, um das Verständnis, die Argumentation und die Kommunikation zu verbessern und den Weg für allgemeinere und anpassungsfähigere KI-Systeme zu ebnen.

Aufbau im Music City Center für CVPR

Bevor die Konferenz offiziell begann, kam unser Team in Nashville an, um alles für die CVPR 2025 vorzubereiten. 

Wir verbrachten den Tag damit, uns im Music City Center einzurichten, wo der Stand 1512 für drei volle Tage mit Demos, Gesprächen und Community-Building zu unserer Heimatbasis wurde. Mit der Ausrüstung im Schlepptau packten wir die Hardware aus, konfigurierten die YOLO und richteten unser Setup sorgfältig ein, um sicherzustellen, dass alles in der schnelllebigen Messeumgebung reibungslos ablaufen würde. 

Der Raum füllte sich allmählich mit Leuten, die Ausrüstung ausluden, Demos testeten und ihre Stände aufbauten. All das zusammen zu sehen, erinnerte uns daran, wie global und kollaborativ CVPR wirklich ist.

Nach einem produktiven Nachmittag schaltete das Team einen Gang höher und erkundete die Innenstadt von Nashville. Natürlich machten sie einen Stopp am Broadway, wo Live-Country-Musik aus jeder Bar und jedem Restaurant dringt. 

Einige aus dem Team besorgten sich Cowboy-Stiefel (für einige von uns war es das erste Mal) und ließen den Abend mit einem klassischen lokalen Favoriten ausklingen: Hot Chicken von Hattie B’s. Es war die perfekte Mischung aus Arbeit und Spaß. Der Stand war fertig und das Team war bereit, zu sehen, was die CVPR 2025 zu bieten hat.

Gespräche über Computer Vision und KI-Forschung

Der erste Tag der Messe begann mit dem Ultralytics vor Ort, das sofort einsatzbereit war. Nuvola Ladi, unsere Digital Content Managerin, Zinnia Pourdad, unsere Eventmanagerin, und Francesco Mattioli, unser Ingenieur für maschinelles Lernen, trafen um 9 Uhr im Music City Center ein. Nachdem die letzten Vorbereitungen abgeschlossen und die Demos vorbereitet waren, waren wir bereit, die Besucher zu begrüßen, sobald die Türen geöffnet wurden.

Um 10 Uhr morgens strömten die Menschen in Scharen herbei, und die Energie auf der Ausstellungsfläche nahm sofort zu. Unser Stand füllte sich schnell mit Besuchern, und unsere Ultralytics , insbesondere die Tragetaschen und Aufkleber, waren innerhalb weniger Minuten weg. Es war ein lustiger Eisbrecher, der dazu beitrug, Gespräche zu beginnen und die Leute anzulocken.

Abb. 2. Nuvola Ladi, Zinnia Pourdad und Francesco Mattioli am Stand 1512.

Den ganzen Tag über hatten wir die Gelegenheit, mit Forschern, Ingenieuren und Entwicklern zu sprechen, die an einer Vielzahl von Projekten arbeiten. Das Interesse an unseren YOLO war groß, und wir hörten von Anwendungsfällen in den Bereichen Robotik, Gesundheitswesen, Fertigung, Einzelhandel und darüber hinaus. Es war inspirierend zu sehen, wie breit unsere Modelle eingesetzt werden, von der frühen akademischen Forschung bis hin zu den eingesetzten Unternehmenssystemen.

Wir hatten auch Gelegenheit, uns mit Kollegen aus dem KI-Bereich auszutauschen, darunter Teams von Intel OpenVINO und Sony Semiconductor Solutions. Der Austausch mit anderen Innovatoren hat uns gezeigt, wie kollaborativ und schnelllebig der Bereich Vision AI ist.

Gegen Ende des Tages machte sich das Team auf den Weg zum Printers Alley, um Live-Country-Musik zu genießen und zu entspannen. Nach einem vollgepackten Tag mit Gesprächen und unglaublicher Energie auf der Ausstellungsfläche war dies der perfekte Abschluss unseres ersten Tages auf der CVPR 2025.

Abb. 3. Das Team hatte die Möglichkeit, Printers Alley zu erkunden.

Tag 2 auf der Computer-Vision-Konferenz in Nashville

Tag zwei der CVPR 2025 machte genau da weiter, wo der erste Tag aufgehört hatte. Am Stand 1512 herrschte den ganzen Tag über reges Treiben. Wiederkehrende und neue Besucher schauten vorbei, um mehr über unsere Ultralytics YOLO zu erfahren und ihre eigene Arbeit vorzustellen.

Einer der denkwürdigsten Momente des Tages war zum Beispiel der Besuch von Intel Robodog. Hochentwickelte Hardware gepaart mit praktischen Visionsmodellen in Aktion zu sehen, hat den Geist der Veranstaltung wirklich eingefangen.

Abbildung 4. Intel Robodog besuchte das Team am Stand 1512.

Später am Abend nahm unser Team am After.CVPR() Developer Meetup teil, das von Intel veranstaltet wurde. Es war ein entspannter und kollaborativer Ort, gefüllt mit Ingenieuren, Forschern und Entwicklern aus dem gesamten KI-Ökosystem. 

Auf dem Treffen gab es Live-Demos und interessante Gespräche, die bis in die Nacht hinein andauerten. Während der Veranstaltung präsentierte Francesco Mattioli eine gemeinsame Demo von Ultralytics und OpenVINO, in der gezeigt wurde, wie unsere Modelle in effiziente Inferenzpipelines integriert werden können. 

Er erläuterte, wie Modelle wie Ultralytics YOLO11 in das OpenVINO exportiert werden können, um eine schnellere, optimierte Inferenz auf Intel zu erreichen. In der Demo wurde die Unterstützung für CPUs (Central Processing Units), GPUs (Graphics Processing Units) und NPUs (Neural Processing Units) hervorgehoben. Sie stieß auf großes Interesse bei Teams, die an KI- und Echtzeitanwendungen arbeiten.

Abb. 5. Ein Einblick in das After.CVPR() Developer Meetup.

Deep Learning in Computer-Vision-Anwendungen auf der CVPR

Selbst am letzten Tag der CVPR 2025 herrschte im Music City Center reges Treiben. Die Teilnehmer erkundeten weiterhin Stände, führten angeregte Gespräche und nutzten ihre Zeit auf der Konferenz optimal.

Einer der Höhepunkte des Tages war der Besuch der Postersessions – ein zentraler Bestandteil der Art und Weise, wie Forschung auf der CVPR ausgetauscht wird. Im Gegensatz zu traditionellen Bühnenpräsentationen sind Postersessions informeller und interaktiver. 

Jeder Forscher erstellt ein großes gedrucktes Poster, das seine Arbeit zusammenfasst, und steht in der Nähe, um sie zu erklären, Fragen zu beantworten und seine Ergebnisse mit allen zu diskutieren, die vorbeikommen. Es ist eine großartige Möglichkeit, in kurzer Zeit etwas über ein breites Themenspektrum zu erfahren, und es schafft Raum für echte Gespräche zwischen Teilnehmern und Vortragenden.

Wir haben eine Vielzahl von Postern gesehen, die alles von Vision-Language-Modellen und 3D-Szenenverständnis bis hin zu realen Anwendungen von KI in der Robotik und im Gesundheitswesen abdeckten. Die Sitzungen gaben uns einen genaueren Einblick in die neuesten Ideen, die in diesem Bereich erforscht werden, und die Möglichkeit, uns direkt mit den Menschen dahinter auszutauschen.

Als die Veranstaltung zu Ende ging, gingen wir motivierter denn je. Die Woche war vollgepackt mit Lernen, Zusammenarbeit und echter Dynamik im Bereich Vision AI, und wir freuen uns darauf, diese Erkenntnisse in die nächste Phase zu übertragen.

Wesentliche Erkenntnisse

Die CVPR 2025 war eine großartige Woche des Lernens, des Austauschs und der Vernetzung. Von modernster Forschung über praktische Demos bis hin zu anregenden Gesprächen hat die Konferenz gezeigt, wie schnell sich Vision AI entwickelt und wie wirkungsvoll und unterstützend die Community dahinter ist.

Es war inspirierend, dieYOLO Ultralytics in so vielen realen und Forschungsanwendungen in Aktion zu sehen. Die CVPR 2025 hat vor allem deutlich gemacht, dass die Computer Vision das Herzstück der KI-Innovation ist und dass noch so viel mehr kommen wird.

Treten Sie unserer Community bei und tauchen Sie auf unserem GitHub-Repository in die Welt der Vision AI ein. Erfahren Sie mehr über Innovationen wie KI im Einzelhandel und Computer Vision in der Fertigung auf unseren Lösungsseiten. Sehen Sie sich unsere Lizenzpläne an und beginnen Sie noch heute Ihre KI-Reise!

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten