Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Cookie-Einstellungen
Wenn Sie auf "Alle Cookies akzeptieren" klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Navigation auf der Website zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Mehr Infos
Seien Sie dabei, wenn wir die Erfahrungen von Ultralytics auf der CVPR 2025 rekapitulieren, von den Highlights am Stand bis hin zu realen Anwendungsfällen der Computer Vision und denkwürdigen Momenten in Nashville.
Letzte Woche, vom 11. bis 15. Juni, war das Ultralytics-Team in Nashville, Tennessee, auf der CVPR 2025 - der IEEE/CVF Conference on Computer Vision and Pattern Recognition - anwesend. Sie ist eine der wichtigsten jährlichen Veranstaltungen im Bereich der Computer Vision und KI-Forschung.
Die diesjährige Konferenz, die im Music City Center stattfand, brachte über 12.000 Teilnehmer aus der ganzen Welt zusammen. Von akademischen Forschern und Ingenieuren bis hin zu Branchenführern und Entwicklern - die Veranstaltung war vollgepackt mit Menschen, die die Grenzen von Vision AI ausloten.
Die CVPR 2025 bot Spitzenforschung und Gespräche über alles, was mit Deep Learning in Computer Vision und multimodalem Lernen zu tun hat, sowie generative KI-Modelle, Grundlagenmodelle und reale Anwendungen wie autonomes Fahren und 3D-Szenenverständnis.
Abb. 1. CVPR 2025 in Nashville, Tennessee.
Für Ultralytics stand die Woche auf der CVPR 2025 ganz im Zeichen des Austauschs mit der Computer-Vision-Community, des Austauschs von Demos und des Lernens, wie unsere Ultralytics YOLO-Modelle in verschiedenen Branchen eingesetzt werden. Am Stand 1512 präsentierten wir unsere neuesten Vision AI-Lösungen, sprachen mit Hunderten von Besuchern über praktische Anwendungsfälle und sahen aus erster Hand, wie unsere Arbeit Innovationen in Bereichen wie Robotik, Einzelhandel, Forschung und mehr vorantreibt.
Werfen wir also einen Blick auf einige unserer Lieblingsmomente der Veranstaltung und heben wir die wichtigsten Erkenntnisse, Gespräche und Verbindungen zur Gemeinschaft hervor.
Ein Blick auf die CVPR Nashville 2025
Die CVPR wurde 1983 ins Leben gerufen und 1985 offiziell von der IEEE unterstützt. Im Laufe der Jahre hat sie sich zu einer der einflussreichsten Konferenzen auf dem Gebiet der Computer Vision und Mustererkennung entwickelt, die Forscher, Ingenieure und Innovatoren aus aller Welt zusammenbringt. Seit 2012 wird sie von der Computer Vision Foundation (CVF) gesponsert, einer gemeinnützigen Organisation, die den freien Zugang zur Bildverarbeitungsforschung unterstützt und eine wichtige Rolle bei der Organisation der Veranstaltung spielt.
Die jährlich stattfindende CVPR ist bekannt für ihre technische Tiefe und dafür, dass sie die Richtung des gesamten Fachgebiets mitbestimmt, von den frühen Durchbrüchen in der Objekterkennung bis hin zu den heutigen Fortschritten in den Bereichen Vision AI und Deep Learning. Für die diesjährige Ausgabe wurden mehr als 13.000 Beiträge eingereicht, eine Steigerung von 13 % gegenüber dem Vorjahr. Mit einer Annahmequote von nur 22 % setzte die Konferenz ihre Tradition fort, hochwirksame Forschungsarbeiten in den Mittelpunkt zu stellen.
Hier ein kurzer Einblick in einige der wichtigsten Forschungsthemen, die auf der CVPR 2025 im Vordergrund standen:
3D-Szenenverständnis und neuronales Rendering: Forscher erforschen, wie die Welt in drei Dimensionen rekonstruiert und dargestellt werden kann, indem mehrere Ansichten oder Sensoreingaben verwendet werden, um Anwendungen in der Robotik, der erweiterten Realität und der Simulation voranzubringen.
Bild- und Videosynthese durch generativer KI: Dieser Bereich konzentriert sich auf die Erstellung von qualitativ hochwertigem Bildmaterial aus minimalen Eingaben wie Textaufforderungen oder Skizzen, um Werkzeuge der nächsten Generation für kreative Medien und interaktive Systeme zu betreiben.
Multimodales Lernen und Vision-Language-Modelle: Diese Modelle kombinieren visuelle und sprachliche Daten, um das Verständnis, die Argumentation und die Kommunikation zu verbessern und den Weg für allgemeinere und anpassungsfähigere KI-Systeme zu ebnen.
Aufbau im Music City Center für die CVPR
Bevor die Konferenz offiziell begann, traf unser Team in Nashville ein, um alles für die CVPR 2025 vorzubereiten.
Wir verbrachten den Tag damit, uns im Music City Center einzurichten, wo der Stand 1512 für drei volle Tage mit Demos, Gesprächen und Community-Building zu unserer Heimatbasis wurde. Mit der Ausrüstung im Schlepptau packten wir die Hardware aus, konfigurierten die YOLO-Live-Demos und richteten unser Setup sorgfältig ein, um sicherzustellen, dass alles in der schnelllebigen Messeumgebung reibungslos ablaufen würde.
Der Raum füllte sich allmählich mit Menschen, die ihre Ausrüstung ausluden, Demos testeten und ihre Stände aufbauten. Zu sehen, wie alles zusammenkam, erinnerte uns daran, wie global und gemeinschaftlich die CVPR wirklich ist.
Nach einem produktiven Nachmittag machte sich das Team auf den Weg, um die Innenstadt von Nashville zu erkunden. Natürlich machten sie einen Zwischenstopp am Broadway, wo aus jeder Bar und jedem Restaurant Live-Country-Musik ertönt.
Einige aus dem Team trugen Cowboystiefel (für einige von uns eine Premiere), und zum Abschluss gab es ein klassisches lokales Lieblingsessen: heißes Hähnchen von Hattie B's. Es war die perfekte Mischung aus Arbeit und Spaß. Der Stand war fertig, und das Team war voller Tatendrang, um zu sehen, was die CVPR 2025 zu bieten hatte.
Gespräche über Computer Vision und KI-Forschung
Der erste Tag der Messe begann mit dem Ultralytics-Team vor Ort, das sofort einsatzbereit war. Nuvola Ladi, unsere Digital Content Managerin, Zinnia Pourdad, unsere Eventmanagerin, und Francesco Mattioli, unser Ingenieur für maschinelles Lernen, trafen um 9 Uhr im Music City Center ein. Nachdem die letzten Vorbereitungen abgeschlossen und die Demos vorbereitet waren, waren wir bereit, die Besucher zu begrüßen, sobald die Türen geöffnet wurden.
Um 10 Uhr morgens strömten die Menschen in Scharen herbei, und die Energie auf der Ausstellungsfläche nahm sofort zu. Unser Stand füllte sich schnell mit Besuchern, und unsere Ultralytics-Artikel, insbesondere die Tragetaschen und Aufkleber, waren innerhalb weniger Minuten weg. Es war ein lustiger Eisbrecher, der dazu beitrug, Gespräche zu beginnen und die Leute anzulocken.
Den ganzen Tag über hatten wir die Gelegenheit, mit Forschern, Ingenieuren und Entwicklern zu sprechen, die an einer Vielzahl von Projekten arbeiten. Das Interesse an unseren YOLO-Live-Demos war groß, und wir hörten von Anwendungsfällen in den Bereichen Robotik, Gesundheitswesen, Fertigung, Einzelhandel und darüber hinaus. Es war inspirierend zu sehen, wie breit unsere Modelle eingesetzt werden, von der frühen akademischen Forschung bis hin zu den eingesetzten Unternehmenssystemen.
Wir hatten auch Gelegenheit, uns mit Kollegen aus dem KI-Bereich auszutauschen, darunter Teams von Intel OpenVINO und Sony Semiconductor Solutions. Der Austausch mit anderen Innovatoren hat uns gezeigt, wie kollaborativ und schnelllebig der Bereich Vision AI ist.
Gegen Ende des Tages begab sich das Team in die Printers Alley, um bei Country-Livemusik zu entspannen. Nach einem ereignisreichen Tag mit vielen Gesprächen und einer unglaublichen Energie auf dem Parkett war dies die perfekte Art und Weise, unseren ersten Tag auf der CVPR 2025 zu beenden.
Abb. 3. Das Team hatte die Gelegenheit, die Printers Alley zu erkunden.
Tag 2 auf der Computer Vision Konferenz in Nashville
Tag zwei der CVPR 2025 machte genau da weiter, wo der erste Tag aufgehört hatte. Am Stand 1512 herrschte den ganzen Tag über reges Treiben. Wiederkehrende und neue Besucher schauten vorbei, um mehr über unsere Ultralytics YOLO-Modelle zu erfahren und ihre eigene Arbeit vorzustellen.
Einer der denkwürdigsten Momente des Tages war zum Beispiel der Besuch von Intel Robodog. Hochentwickelte Hardware gepaart mit praktischen Visionsmodellen in Aktion zu sehen, hat den Geist der Veranstaltung wirklich eingefangen.
Abbildung 4. Intel Robodog besuchte das Team am Stand 1512.
Später am Abend nahm unser Team am After.CVPR() Developer Meetup teil, das von Intel veranstaltet wurde. Es war ein entspannter und kollaborativer Ort, gefüllt mit Ingenieuren, Forschern und Entwicklern aus dem gesamten KI-Ökosystem.
Auf dem Treffen gab es Live-Demos und interessante Gespräche, die bis in die Nacht hinein andauerten. Während der Veranstaltung präsentierte Francesco Mattioli eine gemeinsame Demo von Ultralytics und OpenVINO, in der gezeigt wurde, wie unsere Modelle in effiziente Inferenzpipelines integriert werden können.
Er erläuterte, wie Modelle wie Ultralytics YOLO11 in das OpenVINO-Format exportiert werden können, um schnellere, optimierte Inferenzen auf Intel-Hardware zu erzielen. In der Demo wurde die Unterstützung für CPUs (Central Processing Units), GPUs (Graphics Processing Units) und NPUs (Neural Processing Units) hervorgehoben. Sie stieß auf großes Interesse bei Teams, die an KI- und Echtzeitanwendungen arbeiten.
Abb. 5. Ein Blick auf das After.CVPR() Developer Meetup.
Deep Learning in Computer Vision-Anwendungen auf der CVPR
Selbst am letzten Tag der CVPR 2025 herrschte im Music City Center noch reges Treiben. Die Teilnehmer erkundeten noch immer die Stände, führten nachdenkliche Gespräche und nutzten ihre Zeit auf der Konferenz optimal.
Einer der Höhepunkte des Tages war der Besuch der Postersitzungen - ein zentraler Bestandteil des Forschungsaustauschs auf der CVPR. Im Gegensatz zu den traditionellen Bühnenpräsentationen sind die Postersitzungen informeller und interaktiver.
Jeder Forscher stellt ein großes gedrucktes Poster auf, auf dem er seine Arbeit zusammenfasst, und steht in der Nähe, um sie zu erläutern, Fragen zu beantworten und seine Ergebnisse mit allen zu diskutieren, die vorbeikommen. Auf diese Weise kann man sich in kurzer Zeit über ein breites Spektrum von Themen informieren, und es entsteht Raum für echte Gespräche zwischen den Teilnehmern und den Vortragenden.
Wir sahen eine Vielzahl von Postern, die alles abdeckten, von Modellen für die Bildsprache und 3D-Szenenverständnis bis hin zu realen Anwendungen der KI in der Robotik und im Gesundheitswesen. Die Sitzungen boten uns einen näheren Einblick in die neuesten Ideen, die in diesem Bereich erforscht werden, und die Möglichkeit, direkt mit den Menschen, die dahinter stehen, in Kontakt zu treten.
Am Ende der Veranstaltung fühlten wir uns motivierter als je zuvor. Die Woche war vollgepackt mit Lernen, Zusammenarbeit und echten Impulsen für Vision AI, und wir freuen uns darauf, diese Erkenntnisse in die nächsten Schritte mitzunehmen.
Die wichtigsten Erkenntnisse
Die CVPR 2025 war eine großartige Woche des Lernens, des Austauschs und der Vernetzung. Von innovativer Forschung bis hin zu praktischen Demos und großartigen Gesprächen zeigte die Konferenz, wie schnell sich Vision AI entwickelt und wie einflussreich und unterstützend die dahinter stehende Gemeinschaft wirklich ist.
Es war inspirierend, die YOLO-Modelle von Ultralytics in so vielen realen und Forschungsanwendungen in Aktion zu sehen. Die CVPR 2025 hat vor allem deutlich gemacht, dass die Computer Vision das Herzstück der KI-Innovation ist und dass noch so viel mehr kommen wird.