Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Основные моменты выступления Ultralytics на CVPR 2025

Присоединяйтесь к нам, чтобы рассказать об опыте Ultralytics на CVPR 2025, от ярких моментов на стенде до реальных примеров использования компьютерного зрения и памятных моментов в Нэшвилле.

На прошлой неделе, с 11 по 15 июня, командаUltralytics принимала участие в конференции CVPR 2025 - IEEE/CVF Conference on Computer Vision and Pattern Recognition - в Нэшвилле, штат Теннесси. Это одно из ключевых ежегодных событий в области компьютерного зрения и исследований ИИ. 

Конференция этого года, проходившая в Music City Center, собрала более 12 000 участников со всего мира. От академических исследователей и инженеров до лидеров отрасли и разработчиков, мероприятие было заполнено людьми, расширяющими границы Vision AI. 

В частности, на CVPR 2025 были представлены передовые исследования и обсуждения всего, начиная от глубокого обучения в компьютерном зрении и мультимодального обучения до генеративных моделей ИИ, фундаментальных моделей и реальных приложений, таких как автономное вождение и понимание 3D-сцен.

Рис. 1. CVPR 2025 в Нэшвилле, штат Теннесси.

Для Ultralytics неделя на CVPR 2025 была посвящена общению с представителями сообщества компьютерного зрения, обмену демонстрациями и изучению того, как наши моделиUltralytics YOLO используются в различных отраслях. На стенде 1512 мы продемонстрировали наши новейшие решения в области искусственного зрения, пообщались с сотнями посетителей о практических примерах использования и воочию убедились, как наша работа способствует инновациям в таких отраслях, как робототехника, розничная торговля, научные исследования и т. д. 

Итак, давайте посмотрим на некоторые из наших любимых моментов с мероприятия, выделив ключевые выводы, беседы и связи с сообществом. 

Обзор CVPR Nashville 2025

CVPR был впервые представлен в 1983 году и официально поддержан IEEE в 1985 году. За прошедшие годы он превратился в одну из самых влиятельных конференций в области компьютерного зрения и распознавания образов, объединяющую исследователей, инженеров и новаторов со всего мира. С 2012 года он совместно спонсируется Computer Vision Foundation (CVF), некоммерческой организацией, которая поддерживает открытый доступ к исследованиям в области компьютерного зрения и играет жизненно важную роль в организации мероприятия. 

Проводимая ежегодно, конференция CVPR стала известна своей технической глубиной и тем, что помогает формировать направление всей области, от ранних прорывов в распознавании объектов до сегодняшних достижений в Vision AI и глубоком обучении. В этом году было подано более 13 000 заявок на доклады, что на 13% больше, чем в прошлом году. С уровнем принятия всего 22%, конференция продолжила свою традицию освещения исследований, оказывающих значительное влияние.

Вот краткий обзор основных тем исследований, которые были выделены на CVPR 2025:

  • 3D-восприятие сцен и нейронный рендеринг: Исследователи изучают, как реконструировать и представлять мир в трех измерениях, используя несколько видов или входных данных датчиков, чтобы продвигать приложения в робототехнике, дополненной реальности и моделировании.
  • Синтез изображений и видео с использованием генеративного ИИ: Эта область фокусируется на создании высококачественных визуальных эффектов из минимального ввода, такого как текстовые подсказки или эскизы, для питания инструментов нового поколения для творческих медиа и интерактивных систем.
  • Мультимодальное обучение и модели «зрение-язык»: Эти модели объединяют визуальные и языковые данные для улучшения понимания, рассуждения и коммуникации, открывая путь к более общим и адаптивным системам ИИ.

Подготовка к работе в Music City Center для CVPR

Перед официальным началом конференции наша команда прибыла в Нэшвилл, чтобы подготовить все к CVPR 2025. 

Мы провели день в Music City Center, где стенд 1512 стал нашей домашней базой на три полных дня демонстраций, бесед и создания сообщества. Мы распаковывали оборудование, настраивали демонстрационные ролики YOLO и тщательно продумывали настройки, чтобы убедиться, что все будет работать гладко в быстро меняющейся обстановке выставки. 

Пространство постепенно заполнялось людьми, выгружающими оборудование, тестирующими демоверсии и собирающими свои стенды. Наблюдение за тем, как все это собирается вместе, напомнило нам, насколько глобальным и совместным является CVPR на самом деле.

После продуктивного дня команда сменила обстановку и отправилась исследовать центр Нэшвилла. Естественно, они остановились на Бродвее, где живая музыка кантри льется из каждого бара и ресторана. 

Некоторые члены команды приобрели ковбойские сапоги (впервые для некоторых из нас), а вечером они завершили день классическим местным фаворитом: острой курицей от Hattie B’s. Это было идеальное сочетание работы и развлечений. Стенд был готов, и команда была полна сил, чтобы увидеть, что приготовила CVPR 2025.

Обсуждения исследований в области компьютерного зрения и искусственного интеллекта

Первый день выставки начался с того, что команда Ultralytics была на месте и готова к работе. Нувола Лади, наш менеджер по цифровому контенту, Зинния Пурдад, наш менеджер по мероприятиям, и Франческо Маттиоли, наш инженер по машинному обучению, прибыли в Music City Center к 9 утра. После окончательной проверки настроек и подготовки демонстраций мы были готовы приветствовать посетителей, как только открылись двери.

К 10 часам утра толпа начала прибывать, и энергия на выставочной площадке сразу же возросла. Наш стенд быстро заполнился посетителями, а товары Ultralytics , особенно сумки и наклейки, разошлись в считанные минуты. Это был забавный ледокол, который помог завязать разговор и привлечь людей.

Рис. 2. Nuvola Ladi, Zinnia Pourdad и Francesco Mattioli на стенде 1512.

В течение всего дня мы имели возможность пообщаться с исследователями, инженерами и разработчиками, работающими над широким спектром проектов. Большой интерес вызвали наши живые демонстрации YOLO , и мы услышали о случаях использования в робототехнике, здравоохранении, производстве, розничной торговле и других областях. Было вдохновляюще видеть, как широко используются наши модели - от ранних академических исследований до развернутых корпоративных систем.

Мы также смогли вновь встретиться с коллегами, работающими в области ИИ, включая команды Intel OpenVINO и Sony Semiconductor Solutions. Совместное выступление с другими новаторами позволило убедиться в том, насколько совместной и быстро развивающейся остается область Vision AI.

Ближе к концу дня команда отправилась в Printers Alley, чтобы насладиться живой музыкой кантри и отдохнуть. После насыщенного дня разговоров и невероятной энергии на площадке это был идеальный способ завершить наш первый день на CVPR 2025.

Рис. 3. У команды была возможность исследовать Printers Alley.

День 2 на конференции по компьютерному зрению в Нэшвилле

Второй день CVPR 2025 начался там же, где закончился первый. Стенд 1512 оставался оживленным в течение всего дня: посетители и новички заходили на него, чтобы узнать больше о наших моделях Ultralytics YOLO и поделиться своими собственными наработками.

Например, одним из самых запоминающихся моментов дня стал визит Intel Robodog. Вид передового оборудования в сочетании с практическими моделями видения в действии действительно передал дух мероприятия.

Рис. 4. Intel Robodog посетил команду на стенде 1512.

Позже вечером наша команда посетила встречу разработчиков After.CVPR(), организованную компанией Intel. Это было непринужденное место для совместной работы, наполненное инженерами, исследователями и разработчиками из всей экосистемы ИИ. 

Встреча включала в себя живые демонстрации и содержательные беседы, которые продолжались до самой ночи. В ходе мероприятия Франческо Маттиоли представил совместную демонстрацию Ultralytics и OpenVINO, показывающую, как наши модели могут быть интегрированы в эффективные конвейеры вывода. 

Он рассказал о том, как работают такие модели, как Ultralytics YOLO11 можно экспортировать в формат OpenVINO , чтобы добиться более быстрого и оптимизированного вывода на оборудовании Intel . Демонстрация показала поддержку центральных процессоров (CPU), графических процессоров (GPU) и нейронных процессоров (NPU). Она вызвала значительный интерес у команд, работающих над краевым ИИ и приложениями реального времени.

Рис. 5. Краткий обзор встречи разработчиков After.CVPR().

Глубокое обучение в приложениях компьютерного зрения на CVPR

Даже в последний день CVPR 2025 в Music City Center кипела деятельность. Участники все еще изучали стенды, вели содержательные беседы и максимально использовали свое время на конференции.

Одним из самых ярких моментов дня было посещение стендовых сессий — основной части обмена результатами исследований на CVPR. В отличие от традиционных сценических презентаций, стендовые сессии носят более неформальный и интерактивный характер. 

Каждый исследователь устанавливает большой печатный плакат, обобщающий его работу, и стоит рядом, чтобы объяснить ее, ответить на вопросы и обсудить свои выводы со всеми, кто подходит. Это отличный способ узнать о широком круге тем за короткое время, и это создает пространство для реальных разговоров между участниками и докладчиками.

Мы увидели множество постеров, охватывающих все темы, от моделей vision-language и понимания 3D-сцен до реальных приложений ИИ в робототехнике и здравоохранении. Сессии позволили нам ближе познакомиться с новейшими идеями, разрабатываемыми в этой области, и напрямую пообщаться с людьми, стоящими за ними.

С приближением окончания мероприятия мы почувствовали себя более мотивированными, чем когда-либо. Неделя была насыщена обучением, сотрудничеством и реальным прогрессом в Vision AI, и мы рады перенести эти знания в будущее.

Основные выводы

CVPR 2025 стала отличной неделей обучения, обмена опытом и общения. От передовых исследований до практических демонстраций и отличных бесед — конференция показала, как быстро развивается Vision AI и насколько влиятельным и поддерживающим является сообщество, стоящее за ним.

Было вдохновляюще интересно увидеть модели Ultralytics YOLO в действии во многих реальных и исследовательских приложениях. Больше всего CVPR 2025 дала понять, что компьютерное зрение находится в самом сердце инноваций в области ИИ, и многое еще впереди.

Присоединяйтесь к нашему сообществу и погрузитесь в мир Vision AI в нашем репозитории GitHub. Узнайте о таких инновациях, как искусственный интеллект в розничной торговле и компьютерное зрение в производстве, на страницах наших решений. Ознакомьтесь с нашими планами лицензирования и начните свой путь в мир ИИ уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно