Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Основные моменты от Ultralytics на CVPR 2025

Абирами Вина

3 мин чтения

18 июня 2025 г.

Присоединяйтесь к нам, и мы подведем итоги участия Ultralytics в CVPR 2025: от основных моментов на стенде до реальных примеров использования компьютерного зрения и памятных моментов в Нэшвилле.

На прошлой неделе, с 11 по 15 июня, команда Ultralytics находилась в Нэшвилле, штат Теннесси, на CVPR 2025 — конференции IEEE/CVF по компьютерному зрению и распознаванию образов. Это одно из ключевых ежегодных мероприятий в области компьютерного зрения и исследований в области ИИ. 

Конференция этого года, проходившая в Music City Center, собрала более 12 000 участников со всего мира. От академических исследователей и инженеров до лидеров отрасли и разработчиков, мероприятие было заполнено людьми, расширяющими границы Vision AI. 

В частности, на CVPR 2025 были представлены передовые исследования и обсуждения всего, начиная от глубокого обучения в компьютерном зрении и мультимодального обучения до генеративных моделей ИИ, фундаментальных моделей и реальных приложений, таких как автономное вождение и понимание 3D-сцен.

Рис. 1. CVPR 2025 в Нэшвилле, штат Теннесси.

Для Ultralytics неделя на CVPR 2025 была посвящена общению с сообществом компьютерного зрения, обмену демонстрациями и изучению того, как наши модели Ultralytics YOLO используются в различных отраслях. На стенде 1512 мы продемонстрировали наши новейшие решения Vision AI, поговорили с сотнями посетителей о практических вариантах использования и увидели воочию, как наша работа способствует инновациям в таких секторах, как робототехника, розничная торговля, исследования и многое другое. 

Итак, давайте посмотрим на некоторые из наших любимых моментов с мероприятия, выделив ключевые выводы, беседы и связи с сообществом. 

Обзор CVPR Nashville 2025

CVPR был впервые представлен в 1983 году и официально поддержан IEEE в 1985 году. За прошедшие годы он превратился в одну из самых влиятельных конференций в области компьютерного зрения и распознавания образов, объединяющую исследователей, инженеров и новаторов со всего мира. С 2012 года он совместно спонсируется Computer Vision Foundation (CVF), некоммерческой организацией, которая поддерживает открытый доступ к исследованиям в области компьютерного зрения и играет жизненно важную роль в организации мероприятия. 

Проводимая ежегодно, конференция CVPR стала известна своей технической глубиной и тем, что помогает формировать направление всей области, от ранних прорывов в распознавании объектов до сегодняшних достижений в Vision AI и глубоком обучении. В этом году было подано более 13 000 заявок на доклады, что на 13% больше, чем в прошлом году. С уровнем принятия всего 22%, конференция продолжила свою традицию освещения исследований, оказывающих значительное влияние.

Вот краткий обзор основных тем исследований, которые были выделены на CVPR 2025:

  • 3D-восприятие сцен и нейронный рендеринг: Исследователи изучают, как реконструировать и представлять мир в трех измерениях, используя несколько видов или входных данных датчиков, чтобы продвигать приложения в робототехнике, дополненной реальности и моделировании.
  • Синтез изображений и видео с использованием генеративного ИИ: Эта область фокусируется на создании высококачественных визуальных эффектов из минимального ввода, такого как текстовые подсказки или эскизы, для питания инструментов нового поколения для творческих медиа и интерактивных систем.
  • Мультимодальное обучение и модели «зрение-язык»: Эти модели объединяют визуальные и языковые данные для улучшения понимания, рассуждения и коммуникации, открывая путь к более общим и адаптивным системам ИИ.

Подготовка к работе в Music City Center для CVPR

Перед официальным началом конференции наша команда прибыла в Нэшвилл, чтобы подготовить все к CVPR 2025. 

Мы провели день, обустраиваясь в Music City Center, где стенд 1512 стал нашей базой на три полных дня демонстраций, бесед и создания сообщества. Прихватив с собой оборудование, мы распаковали технику, настроили демонстрации YOLO в реальном времени и тщательно организовали все, чтобы обеспечить бесперебойную работу в динамичной обстановке выставки. 

Пространство постепенно заполнялось людьми, выгружающими оборудование, тестирующими демоверсии и собирающими свои стенды. Наблюдение за тем, как все это собирается вместе, напомнило нам, насколько глобальным и совместным является CVPR на самом деле.

После продуктивного дня команда сменила обстановку и отправилась исследовать центр Нэшвилла. Естественно, они остановились на Бродвее, где живая музыка кантри льется из каждого бара и ресторана. 

Некоторые члены команды приобрели ковбойские сапоги (впервые для некоторых из нас), а вечером они завершили день классическим местным фаворитом: острой курицей от Hattie B’s. Это было идеальное сочетание работы и развлечений. Стенд был готов, и команда была полна сил, чтобы увидеть, что приготовила CVPR 2025.

Обсуждения исследований в области компьютерного зрения и искусственного интеллекта

Первый день выставки начался с того, что команда Ultralytics была на месте и готова к работе. Nuvola Ladi, наш менеджер по цифровому контенту, Zinnia Pourdad, наш менеджер по мероприятиям, и Francesco Mattioli, наш инженер по машинному обучению, прибыли в Music City Center к 9 утра. После завершения финальных проверок и подготовки демонстраций мы были готовы приветствовать посетителей, как только открылись двери.

К 10 утра толпа начала прибывать, и энергия на выставочной площадке сразу возросла. Наш стенд быстро заполнился посетителями, а наши товары Ultralytics, особенно сумки и наклейки, разлетелись в считанные минуты. Это был отличный способ разрядить обстановку, завязать разговор и привлечь людей.

Рис. 2. Nuvola Ladi, Zinnia Pourdad и Francesco Mattioli на стенде 1512.

​​В течение дня у нас была возможность пообщаться с исследователями, инженерами и разработчиками, работающими над широким спектром проектов. Большой интерес вызвали наши живые демонстрации YOLO, и мы узнали о вариантах использования в робототехнике, здравоохранении, производстве, розничной торговле и за ее пределами. Было очень интересно увидеть, насколько широко используются наши модели, от ранних академических исследований до развернутых корпоративных систем.

Мы также смогли восстановить связи с партнерами в области ИИ, включая команды из Intel OpenVINO и Sony Semiconductor Solutions. Обмен опытом с другими новаторами помог убедиться в том, насколько динамичной и основанной на сотрудничестве остается область Vision AI.

Ближе к концу дня команда отправилась в Printers Alley, чтобы насладиться живой музыкой кантри и отдохнуть. После насыщенного дня разговоров и невероятной энергии на площадке это был идеальный способ завершить наш первый день на CVPR 2025.

Рис. 3. У команды была возможность исследовать Printers Alley.

День 2 на конференции по компьютерному зрению в Нэшвилле

Второй день CVPR 2025 начался там, где закончился первый. Стенд 1512 оставался оживленным в течение всего дня: посетители возвращались, а новые участники заходили, чтобы узнать больше о наших моделях Ultralytics YOLO и поделиться своими работами.

Например, одним из самых запоминающихся моментов дня был визит Intel Robodog. Наблюдение за тем, как передовое оборудование сочетается с практическими моделями машинного зрения в действии, действительно отразило дух мероприятия.

Рис. 4. Intel Robodog посетил команду на стенде 1512.

Позже вечером наша команда посетила встречу разработчиков After.CVPR(), организованную компанией Intel. Это было непринужденное пространство для сотрудничества, заполненное инженерами, исследователями и разработчиками со всей AI-экосистемы. 

Встреча включала живые демонстрации и содержательные беседы, которые продолжались далеко за полночь. Во время мероприятия Франческо Маттиоли представил совместную демонстрацию с участием Ultralytics и OpenVINO, продемонстрировав, как наши модели могут быть интегрированы в эффективные конвейеры инференса. 

Он рассказал о том, как такие модели, как Ultralytics YOLO11, можно экспортировать в формат OpenVINO для достижения более быстрого и оптимизированного вывода на оборудовании Intel. Демонстрация подчеркнула поддержку центральных процессоров (CPU), графических процессоров (GPU) и нейронных процессоров (NPU). Это вызвало большой интерес у команд, работающих над периферийным ИИ и приложениями реального времени.

Рис. 5. Краткий обзор встречи разработчиков After.CVPR().

Глубокое обучение в приложениях компьютерного зрения на CVPR

Даже в последний день CVPR 2025 в Music City Center кипела деятельность. Участники все еще изучали стенды, вели содержательные беседы и максимально использовали свое время на конференции.

Одним из самых ярких моментов дня было посещение стендовых сессий — основной части обмена результатами исследований на CVPR. В отличие от традиционных сценических презентаций, стендовые сессии носят более неформальный и интерактивный характер. 

Каждый исследователь устанавливает большой печатный плакат, обобщающий его работу, и стоит рядом, чтобы объяснить ее, ответить на вопросы и обсудить свои выводы со всеми, кто подходит. Это отличный способ узнать о широком круге тем за короткое время, и это создает пространство для реальных разговоров между участниками и докладчиками.

Мы увидели множество постеров, охватывающих все темы, от моделей vision-language и понимания 3D-сцен до реальных приложений ИИ в робототехнике и здравоохранении. Сессии позволили нам ближе познакомиться с новейшими идеями, разрабатываемыми в этой области, и напрямую пообщаться с людьми, стоящими за ними.

С приближением окончания мероприятия мы почувствовали себя более мотивированными, чем когда-либо. Неделя была насыщена обучением, сотрудничеством и реальным прогрессом в Vision AI, и мы рады перенести эти знания в будущее.

Основные выводы

CVPR 2025 стала отличной неделей обучения, обмена опытом и общения. От передовых исследований до практических демонстраций и отличных бесед — конференция показала, как быстро развивается Vision AI и насколько влиятельным и поддерживающим является сообщество, стоящее за ним.

Было очень приятно видеть модели Ultralytics YOLO в действии во многих реальных и исследовательских приложениях. Прежде всего, CVPR 2025 ясно показал, что компьютерное зрение лежит в основе инноваций в области ИИ, и впереди еще много всего.

Присоединяйтесь к нашему сообществу и погрузитесь в мир Vision AI в нашем репозитории GitHub. Узнайте о таких инновациях, как искусственный интеллект в розничной торговле и компьютерное зрение в производстве, на страницах наших решений. Ознакомьтесь с нашими планами лицензирования и начните свой путь в мир ИИ уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно