Настройтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 - 18:00 БСТ
Гибридное мероприятие
Видение Йоло 2024

Основные выводы Ultralytics из YOLO Vision 2025!

Абирами Вина

5 минут чтения

29 сентября 2025 г.

Присоединяйтесь к нам, чтобы подвести итоги крупнейшего мероприятия года, организованного Ultralytics, показать запуск Ultralytics YOLO26, вдохновляющие дискуссии и ключевые моменты сообщества.

Сообщество специалистов по искусственному интеллекту и компьютерному зрению собралось 25 сентября на YOLO Vision 2025 (YV25), ежегодном мероприятии Ultralytics по гибридному искусственному зрению. Мероприятие, проходившее в Лондоне в The Pelligon и транслировавшееся по всему миру, собрало разнообразную группу исследователей, инженеров и энтузиастов ИИ, чтобы поделиться идеями и узнать о новых инновациях, таких как Ultralytics YOLO26.

Мероприятие проводится уже четвертый год, и его масштабы и влияние продолжают расти. Прямая трансляция YV25 уже собрала более 6 800 просмотров, произвела более 49 000 впечатлений и собрала почти 2 000 часов просмотра.

Конференция YV25 началась со вступительного слова нашего ведущего Ойсина Лунни, который задал тон всему дню, призвав участников общаться, делиться опытом и извлекать максимум пользы из мероприятия. По его словам, "YOLO Vision 2025 - это конференция, которая объединяет сообщество ИИ с открытым исходным кодом, чтобы сосредоточиться на данных, машинном обучении и достижениях в области компьютерного зрения".

В этой статье мы расскажем о ключевых моментах YOLO Vision 2025, включая запуск продукта, основные доклады, панель, живые демонстрации и моменты, которые сделали этот день особенным. Давайте начнем!

Переход от одного графического процессора к серии А финансирования в размере 30 млн долларов.

В преддверии мероприятия было много волнений вокруг запуска нового продукта, и Гленн Джочер, наш основатель и генеральный директор, начал день с развития этой энергии. 

Он рассказал о пути Ultralytics, напомнив, как в 2020 году он проводил эксперименты на одном-единственном 1080 Ti, подключенном к MacBook, и сегодня эта система уже устарела. Из тех скромных начинаний Ultralytics превратилась в глобальное сообщество с миллиардами ежедневных выводов, основанных на моделях YOLO.

Гленн также рассказал о том, что недавно Ultralytics завершила раунд финансирования серии А в размере 30 миллионов долларов. Он объяснил, как эти инвестиции обеспечат следующий этап роста компании, позволив ей увеличить численность команды, расширить исследования и обеспечить вычислительные ресурсы, необходимые для дальнейшего расширения границ компьютерного зрения. 

Ultralytics YOLO26: более совершенная, быстрая и компактная модель YOLO

Далее Гленн объявил о двух новых разработках компании Ultralytics. Первая - Ultralytics YOLO26, последняя модель в семействе Ultralytics YOLO, разработанная для того, чтобы быть меньше, быстрее и эффективнее, достигая при этом еще большей точности. Вторая - Ultralytics Platform, новое комплексное рабочее пространство SaaS, объединяющее данные, обучение, развертывание и мониторинг, чтобы сделать создание решений для компьютерного зрения более простым, чем когда-либо, о чем ожидается анонс в ближайшем будущем.

Рис. 1. Гленн Джочер анонсирует Ultralytics YOLO26 на сцене YOLO Vision 2025.

YOLO26 создан для повышения производительности, оставаясь при этом практичным для реального использования. Самая маленькая версия уже работает на 43 % быстрее на центральных процессорах при сохранении высокой точности, что делает ее идеальной для приложений от мобильных устройств до крупных корпоративных систем. YOLO26 станет общедоступной к концу октября.

Вот краткое описание основных характеристик YOLO26:

  • Оптимизированная архитектура: Удален модуль распределения фокусных потерь (DFL), который ранее замедлял работу моделей. Теперь YOLO26 работает более эффективно, не жертвуя точностью.
  • Более быстрые прогнозы: В YOLO26 появилась возможность пропускать этап не-максимального подавления (NMS), что позволяет быстрее получать результаты и облегчает развертывание в режиме реального времени.
  • Лучше различать мелкие объекты: Новые методы обучения повышают стабильность и значительно увеличивают точность, особенно при обнаружении мелких деталей в сложных сценах.
  • Более эффективное обучение: Новый оптимизатор MuSGD сочетает в себе сильные стороны двух методов обучения, помогая модели обучаться быстрее и достигать более высокой точности.

Первый взгляд на платформу Ultralytics

После представления YOLO26 Гленн пригласил Пратека Бхатнагара, руководителя отдела разработки продуктов, для демонстрации следующего проекта - платформы Ultralytics. Созданная для упрощения всего рабочего процесса компьютерного зрения, платформа призвана объединить в одном месте наборы данных, аннотацию, обучение, развертывание и мониторинг.

Пратик сравнил это с тюнингом автомобиля: вместо того чтобы посещать разные мастерские для установки шин, двигателей и трансмиссий, все происходит в одном гараже. Таким же образом платформа предоставляет разработчикам интегрированное рабочее пространство для управления полным жизненным циклом модели искусственного интеллекта.

На демонстрации были показаны инструменты аннотирования с помощью искусственного интеллекта, ускоряющие подготовку наборов данных, настраиваемые варианты обучения для экспертов и новичков, а также мониторинг тренировок в режиме реального времени. 

Результаты панельной дискуссии по развертыванию пограничных сетей

Еще одним ярким событием YV25 стала панель, посвященная развертыванию на границе, модератором которой выступил Ойсин Лунни. В заседании приняли участие Юки Цудзи из Sony Semiconductor Solutions, Дэвид Плауман из Raspberry Pi и Гленн Джочер. 

В ходе дискуссии обсуждалось, как перенос ИИ на периферию сокращает задержки, снижает затраты и повышает уровень конфиденциальности. Юки продемонстрировал сенсор Sony IMX500, который может выполнять вычисления непосредственно на чипе. В то же время Дэвид рассказал о том, как Raspberry Pi выходит за пределы своих мейкерских корней и находит масштабные коммерческие применения.

Рис. 2. Панель по развертыванию краев с участием Ойсина Лунни, Юки Цудзи, Дэвида Плаумана и Глена Джочера.

Участники дискуссии также затронули одну из самых серьезных проблем для разработчиков: обеспечение плавной работы моделей на различных устройствах. Именно здесь ключевую роль играет пакет Ultralytics Python

Широкие возможности экспорта позволяют легко перенести подготовленную модель в производство на мобильных устройствах, встраиваемых системах или корпоративном оборудовании. Устраняя боль от преобразования моделей, Ultralytics помогает командам сосредоточиться на создании решений, а не на борьбе с проблемами совместимости.

Как объяснил Дэвид: "На своем горьком опыте я знаю, что конвертировать модели - это ужасно, и если кто-то другой сделает это за меня, то жизнь станет намного проще. Именно здесь Ultralytics действительно улучшает историю и предлагает что-то ценное для наших пользователей". 

Ускорение инноваций и аппаратное обеспечение ИИ

Программные достижения в области ИИ происходят параллельно с аппаратными, и вместе они вызывают новую волну инноваций в компьютерном зрении. Хотя такие модели, как Ultralytics YOLO, продолжают продвигать точность, их влияние на реальный мир также зависит от платформ, на которых они работают.

Например, Seeed Studio продемонстрировала, как модульное и недорогое оборудование, такое как их платы reCamera и XIAO, с предустановленными моделями Ultralytics YOLO, позволяет разработчикам легко перейти от создания прототипов к реальным системам ИИ. Подобная программно-аппаратная интеграция снижает барьер для входа и показывает, как инновации на аппаратном уровне непосредственно ускоряют внедрение.

Вот несколько ключевых моментов из других выступлений на YV25, в которых подчеркивалось, как совместная разработка аппаратного и программного обеспечения открывает новые возможности:

  • Квантование позволяет добиться значительного прироста скорости: Intel показала, как преобразование моделей Ultralytics YOLO в OpenVINO с квантованием увеличило скорость вывода с 54 кадров в секунду до 606 кадров в секунду всего за 30 минут, демонстрируя силу оптимизации.
  • Инструменты полного стека делают развертывание ИИ на границе практичным: NVIDIA показала, как устройства Jetson, TensorRT, Triton Inference Server и DeepStream SDK работают вместе, чтобы упростить развертывание высокопроизводительного ИИ на границе.
  • Открытые экосистемы ускоряют создание прототипов: AMD подчеркнула свою сквозную платформу, построенную на базе графических процессоров и программного стека ROCm, помогая разработчикам быстро перейти от прототипа к развертыванию, контролируя при этом затраты.
  • Чипы с низким энергопотреблением расширяют возможности ИИ в устройствах с ограниченными возможностями: Компания DEEPX представила процессоры DX-M1 и DX-M2, обеспечивающие десятки TOPS при мощности менее 5 Вт и позволяющие проводить расширенный анализ в компактных системах с ограниченным энергопотреблением.

Последние тенденции в компьютерном зрении

Благодаря достижениям в области программного и аппаратного обеспечения, работающего рука об руку, компьютерное зрение развивается быстрее, чем когда-либо. Эти параллельные разработки не только повышают точность и скорость, но и определяют способы применения искусственного зрения в реальном мире. На конференции YV25 участники смогли услышать выступления экспертов в области робототехники, внедрения пограничных технологий и мультимодального ИИ, каждый из которых предложил свой взгляд на то, куда движется эта область.

Например, в своем выступлении Майкл Харт из D-Robotics продемонстрировал, как сочетание моделей Ultralytics YOLO с компактной платой RDK X5 (небольшой встроенный модуль искусственного зрения) позволяет роботам запускать передовые модели зрения в режиме реального времени. Его демонстрация вживую показала, насколько далеко шагнула робототехника, превратившись из лабораторных экспериментов в практические системы, работающие на основе ИИ.

Рис. 3. Майкл Харт рассказал о том, как современные роботы с искусственным интеллектом зависят от компьютерного зрения.

Кроме того, Алексис Кроуэлл и Стивен Хунше из компании Axelera AI рассказали о проблемах и возможностях развертывания искусственного интеллекта на границе. На живых демонстрациях они рассказали, как в блоках обработки ИИ Metis AI (AIPU) компании Axelera AI сочетаются RISC-V и цифровые вычисления in-memory, обеспечивающие высокую производительность при очень низком энергопотреблении. Упакованные в привычные форм-факторы, такие как M.2 и PCIe, программно-аппаратные решения платформы делают масштабирование граничного ИИ практичным и эффективным.

На другой сессии Мерве Ноян из Hugging Face рассказала о развитии мультимодального ИИ, когда модели сочетают зрение с текстом, аудио и другими данными. Она рассказала о примерах использования, начиная от анализа документов и заканчивая воплощенными агентами, подчеркнув, что инновации с открытым исходным кодом ускоряют внедрение ИИ.

Баланс между техническим прогрессом и человеческими ценностями

На YV25 прозвучали вдохновляющие доклады о больших перспективах, но были и глубоко практические сессии. Иржи Боровец из Lightning AI провел практическое занятие, показав, как обучать и настраивать модели Ultralytics YOLO с помощью PyTorch Lightning и поддержки нескольких GPU. 

Он прошелся по примерам кода и рассказал, как инструменты с открытым исходным кодом, понятная документация и гибкие фреймворки облегчают разработчикам масштабирование обучения, проверку каждого этапа и адаптацию рабочих процессов к собственным проектам. Это было напоминание о том, насколько важны сообщество и доступные инструменты для реального прогресса в области компьютерного зрения.

На другом конце спектра докладчики призывали аудиторию задуматься о более широкой роли ИИ в обществе. Герд Леонхард, футурист, гуманист и генеральный директор The Futures Agency, в своей программной речи утверждал, что "технология морально нейтральна, пока мы ее не используем", подчеркивая, что главный вопрос не в том, что может делать ИИ, а в том, что он должен делать. Он предостерег от попадания в такие ловушки, как редукционизм и неправдоподобие, и призвал к созданию ИИ, который действительно служит долгосрочным интересам человечества.

Рис. 4. Герд Леонхард делится своими мыслями о создании ИИ-решений, ориентированных на человека.

Этот акцент на ответственности продолжился в беседе у камина с Кариссой Велиз из Оксфордского университета, которая сделала акцент на конфиденциальности и безопасности. Она отметила, что сообщества разработчиков с открытым исходным кодом жизненно важны для проверки и улучшения кода, а также что этика и дизайн неразделимы. Ее мысль была ясна: разработчики должны предвидеть злоупотребления и создавать системы, в которых человеческое достоинство и социальное благополучие стоят на первом месте.

Нетворкинг в Лондоне на YV25

Не ограничиваясь докладами и демонстрациями, YV25 также создала пространство для общения. Во время кофе-брейков и обеда участники общались, делились опытом, сравнивали подходы и завязывали новые сотрудничества.

Для команды Ultralytics это также была прекрасная возможность встретиться лично. Поскольку члены команды разбросаны по всему миру, такие моменты помогают укрепить связи и вместе отпраздновать прогресс.

Рис. 5. Команда Ultralytics завершает вдохновляющий день на YOLO Vision 2025.

День завершился вечеринкой, на которой участники смогли расслабиться и продолжить общение. Это был момент, чтобы поразмыслить, восстановить силы и посмотреть вперед на следующую главу инноваций в Vision AI.

Совместное расширение границ Vision AI

YOLO Vision 2025 стал праздником идей, инноваций и сообщества. Запуск Ultralytics YOLO26 положил начало мероприятию, после чего состоялись увлекательные выступления по вопросам развертывания на границе и человеко-ориентированного ИИ, которые подчеркнули быстрый прогресс Vision AI и его растущее влияние на мир.

Помимо основных сессий, мероприятие объединило людей. Исследователи, разработчики и энтузиасты делились опытом, вели содержательные беседы и исследовали новые возможности для будущего. Мероприятие завершилось на высокой ноте, участники были воодушевлены будущим моделей Ultralytics YOLO и компьютерного зрения.

Готовы изучать искусственный интеллект? Присоединяйтесь к нашему сообществу и репозиторию GitHub, чтобы узнать больше об искусственном интеллекте и компьютерном зрении. Посетите страницы наших решений, чтобы узнать о применении компьютерного зрения в сельском хозяйстве и ИИ в робототехнике. Ознакомьтесь с нашими вариантами лицензирования и начните работать с компьютерным зрением уже сегодня!

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена