Основные моменты выступления Ultralytics на CVPR 2025

Абирами Вина

3 мин. чтения

18 июня 2025 г.

Присоединяйтесь к нам, чтобы рассказать об опыте Ultralytics на CVPR 2025, от ярких моментов на стенде до реальных примеров использования компьютерного зрения и запоминающихся моментов в Нэшвилле.

На прошлой неделе, с 11 по 15 июня, команда Ultralytics принимала участие в конференции CVPR 2025 - IEEE/CVF Conference on Computer Vision and Pattern Recognition - в Нэшвилле, штат Теннесси. Это одно из ключевых ежегодных событий в области компьютерного зрения и исследований ИИ. 

Конференция, проходившая в Music City Center, в этом году собрала более 12 000 участников со всего мира. От академических исследователей и инженеров до лидеров индустрии и разработчиков - на мероприятии собралось множество людей, расширяющих границы Vision AI. 

В частности, на CVPR 2025 были представлены передовые исследования и дискуссии по всем направлениям: от глубокого обучения в компьютерном зрении и мультимодального обучения до генеративных моделей ИИ, моделей фундамента и реальных приложений, таких как автономное вождение и понимание 3D-сцен.

Рис. 1. CVPR 2025 в Нэшвилле, штат Теннесси.

Для Ultralytics неделя на CVPR 2025 была посвящена общению с представителями сообщества компьютерного зрения, обмену демонстрациями и изучению того, как наши модели Ultralytics YOLO используются в различных отраслях. На стенде 1512 мы продемонстрировали наши новейшие решения в области искусственного зрения, пообщались с сотнями посетителей о практических примерах использования и воочию увидели, как наша работа способствует инновациям в таких отраслях, как робототехника, розничная торговля, научные исследования и т. д. 

Итак, давайте посмотрим на некоторые из наших любимых моментов мероприятия, выделив ключевые моменты, разговоры и связи с сообществом. 

Взгляд на CVPR Nashville 2025

CVPR была впервые представлена в 1983 году и официально поддержана IEEE в 1985 году. За прошедшие годы она превратилась в одну из самых влиятельных конференций в области компьютерного зрения и распознавания образов, собирающую исследователей, инженеров и новаторов по всему миру. С 2012 года одним из спонсоров конференции является Фонд компьютерного зрения (CVF) - некоммерческая организация, поддерживающая открытый доступ к исследованиям в области компьютерного зрения и играющая важную роль в организации мероприятия. 

Ежегодно проводимый CVPR известен своей технической глубиной и тем, что помогает определить направление развития всей области, от ранних прорывов в распознавании объектов до современных достижений в области искусственного интеллекта и глубокого обучения. В этом году на конференцию было подано более 13 000 докладов, что на 13 % больше, чем в прошлом году. При этом доля принятых докладов составила всего 22 %, что позволило конференции продолжить традицию привлечения внимания к наиболее значимым исследованиям.

Вот краткий обзор некоторых основных тем исследований, которые были отмечены на CVPR 2025:

  • Понимание трехмерных сцен и нейронный рендеринг: Исследователи изучают способы воссоздания и представления трехмерного мира с использованием нескольких видов или сенсорных входов для развития приложений в робототехнике, дополненной реальности и моделировании.
  • Синтез изображений и видео с помощью генеративного ИИ: Эта область фокусируется на создании высококачественных визуальных эффектов на основе минимальных исходных данных, таких как текстовые подсказки или эскизы, для обеспечения работы инструментов нового поколения для креативных медиа и интерактивных систем.
  • Мультимодальное обучение и зрительно-языковые модели: Эти модели объединяют визуальные и языковые данные для улучшения понимания, рассуждений и коммуникации, прокладывая путь к более общим и адаптируемым системам ИИ.

Установка в Music City Center для CVPR

Еще до официального начала конференции наша команда прибыла в Нэшвилл, чтобы подготовить все необходимое для CVPR 2025. 

Мы провели день в Music City Center, где стенд 1512 стал нашей домашней базой на три полных дня демонстраций, бесед и создания сообщества. Мы распаковывали оборудование, настраивали демонстрационные ролики YOLO и тщательно продумывали настройки, чтобы убедиться, что все будет работать гладко в быстро меняющейся обстановке выставки. 

Постепенно пространство заполнялось людьми, разгружающими оборудование, тестирующими демо-версии и собирающими свои стенды. Наблюдение за тем, как все это объединяется, напомнило нам о том, насколько глобальным и совместным является CVPR.

После продуктивной второй половины дня команда переключилась и отправилась исследовать центр Нэшвилла. Естественно, они сделали остановку на Бродвее, где из каждого бара и ресторана льется живая музыка в стиле кантри. 

Некоторые из команды надели ковбойские сапоги (для некоторых из нас это было впервые), а завершили вечер классическим местным блюдом: горячим цыпленком из Hattie B's. Это было идеальное сочетание работы и веселья. Стенд был готов, а команда зарядилась энергией, чтобы увидеть, что ждет CVPR 2025.

Беседы о компьютерном зрении и исследованиях в области искусственного интеллекта

Первый день выставки начался с того, что команда Ultralytics была на месте и готова к работе. Нувола Лади, наш менеджер по цифровому контенту, Зинния Пурдад, наш менеджер по мероприятиям, и Франческо Маттиоли, наш инженер по машинному обучению, прибыли в Music City Center к 9 утра. После окончательной проверки настроек и подготовки демонстраций мы были готовы приветствовать посетителей, как только открылись двери.

К 10 часам утра толпа начала прибывать, и энергия на выставочной площадке сразу же возросла. Наш стенд быстро заполнился посетителями, а товары Ultralytics, особенно сумки и наклейки, разошлись в считанные минуты. Это был забавный ледокол, который помог завязать разговор и привлечь людей.

Рис. 2. Нувола Лади, Зинния Пурдад и Франческо Маттиоли на стенде 1512.

В течение всего дня мы имели возможность пообщаться с исследователями, инженерами и разработчиками, работающими над широким спектром проектов. Большой интерес вызвали наши живые демонстрации YOLO, и мы услышали о случаях использования в робототехнике, здравоохранении, производстве, розничной торговле и других областях. Было вдохновляюще видеть, как широко используются наши модели - от ранних академических исследований до развернутых корпоративных систем.

Мы также смогли вновь встретиться с коллегами, работающими в области ИИ, включая команды Intel OpenVINO и Sony Semiconductor Solutions. Совместное выступление с другими новаторами позволило убедиться в том, насколько совместной и быстро развивающейся остается область Vision AI.

В конце дня команда отправилась в Printers Alley, чтобы насладиться живой музыкой в стиле кантри и расслабиться. После насыщенного разговорами и невероятной энергией дня это был идеальный способ завершить наш первый день на CVPR 2025.

Рис. 3. У команды была возможность исследовать Аллею печатников.

День 2 на конференции по компьютерному зрению в Нэшвилле

Второй день CVPR 2025 начался там же, где закончился первый. Стенд 1512 оставался оживленным в течение всего дня: посетители и новички заходили на него, чтобы узнать больше о наших моделях Ultralytics YOLO и поделиться своими собственными наработками.

Например, одним из самых запоминающихся моментов дня стал визит Intel Robodog. Вид передового оборудования в сочетании с практическими моделями видения в действии действительно передал дух мероприятия.

Рис. 4. Intel Robodog посетил команду на стенде 1512.

Позже вечером наша команда посетила встречу разработчиков After.CVPR(), организованную компанией Intel. Это было непринужденное место для совместной работы, наполненное инженерами, исследователями и разработчиками из всей экосистемы ИИ. 

Встреча включала в себя живые демонстрации и содержательные беседы, которые продолжались до самой ночи. В ходе мероприятия Франческо Маттиоли представил совместную демонстрацию Ultralytics и OpenVINO, показывающую, как наши модели могут быть интегрированы в эффективные конвейеры вывода. 

Он рассказал о том, как такие модели, как Ultralytics YOLO11, можно экспортировать в формат OpenVINO, чтобы добиться более быстрого и оптимизированного вывода на оборудовании Intel. Демонстрация показала поддержку центральных процессоров (CPU), графических процессоров (GPU) и нейронных процессоров (NPU). Она вызвала значительный интерес у команд, работающих над краевым ИИ и приложениями реального времени.

Рис. 5. Мелькание на встрече разработчиков After.CVPR().

Глубокое обучение в приложениях компьютерного зрения на CVPR

Даже в последний день CVPR 2025 в Music City Center царила оживленная атмосфера. Посетители продолжали изучать стенды, вести вдумчивые беседы и максимально эффективно использовать время, проведенное на конференции.

Одним из самых ярких событий дня стало посещение постерных сессий - основного способа распространения информации об исследованиях на CVPR. В отличие от традиционных презентаций на сцене, постерные сессии носят более неформальный и интерактивный характер. 

Каждый исследователь устанавливает большой печатный плакат с кратким описанием своей работы и стоит рядом, чтобы рассказать о ней, ответить на вопросы и обсудить свои результаты с каждым, кто заглянет к нему. Это отличный способ узнать о широком спектре тем за короткое время и создать пространство для реальных разговоров между участниками и докладчиками.

Мы увидели широкий спектр постеров, охватывающих самые разные темы - от моделей на языке зрения и понимания 3D-сцен до реальных применений ИИ в робототехнике и здравоохранении. Сессии позволили нам поближе познакомиться с новейшими идеями в этой области и напрямую пообщаться с теми, кто за ними стоит.

Мероприятие подошло к концу, и мы уехали, чувствуя себя более мотивированными, чем когда-либо. Неделя была наполнена обучением, сотрудничеством и реальным движением в области Vision AI, и мы с нетерпением ждем, когда сможем перенести эти знания в будущее.

Основные выводы

CVPR 2025 стала отличной неделей обучения, обмена опытом и общения. От передовых исследований до практических демонстраций и замечательных бесед - конференция показала, насколько быстро развивается Vision AI и насколько влиятельным и поддерживающим является сообщество, стоящее за ним.

Было вдохновляюще интересно увидеть модели Ultralytics YOLO в действии во многих реальных и исследовательских приложениях. Больше всего CVPR 2025 дала понять, что компьютерное зрение находится в самом сердце инноваций в области ИИ, и многое еще впереди.

Присоединяйтесь к нашему сообществу и погрузитесь в тему Vision AI в нашем репозитории GitHub. Узнайте о таких инновациях, как ИИ в розничной торговле и компьютерное зрение в производстве, на страницах наших решений. Ознакомьтесь с нашими лицензионными планами и начните свой путь к ИИ уже сегодня!

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена