Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Основные выводы Ultralytics из YOLO Vision 2025!

Присоединяйтесь к нам, чтобы подвести итоги крупнейшего мероприятия года, организованного Ultralytics, показать запуск Ultralytics YOLO26, вдохновляющие дискуссии и ключевые моменты сообщества.

Сообщество специалистов по искусственному интеллекту и компьютерному зрению собралось 25 сентября на YOLO Vision 2025 (YV25), ежегодном мероприятии Ultralyticsпо гибридному искусственному зрению. Мероприятие, проходившее в Лондоне в The Pelligon и транслировавшееся по всему миру, собрало разнообразную группу исследователей, инженеров и энтузиастов ИИ, чтобы поделиться идеями и узнать о новых инновациях, таких как Ultralytics YOLO26.

Отмечая свой четвертый год, мероприятие продолжает расти с точки зрения охвата и воздействия. Прямая трансляция YV25 уже набрала более 6800 просмотров, сгенерировала более 49 000 показов и собрала около 2000 часов просмотра.

Конференция YV25 началась со вступительного слова нашего ведущего Ойсина Лунни, который задал тон всему дню, призвав участников общаться, делиться опытом и извлекать максимум пользы из мероприятия. По его словам, "YOLO Vision 2025 - это конференция, которая объединяет сообщество ИИ с открытым исходным кодом, чтобы сосредоточиться на данных, машинном обучении и достижениях в области компьютерного зрения".

В этой статье мы расскажем о ключевых моментах YOLO Vision 2025, включая запуск продукта, основные доклады, панель, живые демонстрации и моменты, которые сделали этот день особенным. Давайте начнем!

Переход от одного GPU к серии А финансирования в размере 30 млн долларов.

В преддверии мероприятия царило большое волнение по поводу запуска нового продукта, и Гленн Джохер, наш основатель и генеральный директор, начал день с наращивания этой энергии. 

Он рассказал о пути Ultralytics, напомнив, как в 2020 году он проводил эксперименты на одной-единственной 1080 Ti, подключенной к его MacBook, и сегодня эта система уже устарела. Из тех скромных начинаний Ultralytics превратилась в глобальное сообщество с миллиардами ежедневных выводов, основанных на моделях YOLO .

Гленн также рассказал о том, что недавно Ultralytics завершила раунд финансирования серии А в размере 30 миллионов долларов. Он объяснил, как эти инвестиции обеспечат следующий этап роста компании, позволив ей увеличить численность команды, расширить исследования и обеспечить вычислительные ресурсы, необходимые для дальнейшего расширения границ компьютерного зрения. 

Ultralytics YOLO26: более совершенная, быстрая и компактная модель YOLO

Далее Гленн объявил о двух новых разработках компании Ultralytics. Первая - Ultralytics YOLO26, последняя модель в семействе Ultralytics YOLO , разработанная для того, чтобы быть меньше, быстрее и эффективнее, достигая при этом еще большей точности. Вторая - Ultralytics Platform, новое комплексное рабочее пространство SaaS, объединяющее данные, обучение, развертывание и мониторинг, чтобы сделать создание решений для компьютерного зрения более простым, чем когда-либо, о чем ожидается анонс в ближайшем будущем.

Рис. 1. Гленн Джочер анонсирует Ultralytics YOLO26 на сцене YOLO Vision 2025.

YOLO26 создана для повышения производительности, оставаясь при этом практичной для реального использования. Самая маленькая версия уже работает на 43% быстрее на ЦП, при этом повышая точность, что делает ее идеальной для приложений от мобильных устройств до крупных корпоративных систем. YOLO26 станет общедоступной к концу октября.

Вот краткий обзор ключевых особенностей YOLO26:

  • Оптимизированная архитектура: Модуль Distribution Focal Loss (DFL), который ранее замедлял работу моделей, был удален. Теперь YOLO26 работает более эффективно без ущерба для точности.
  • Более быстрые прогнозы: В YOLO26 появилась возможность пропускать этап не-максимального подавленияNMS), что позволяет быстрее получать результаты и облегчает развертывание в режиме реального времени.
  • Лучше обнаруживает мелкие объекты: Новые методы обучения повышают стабильность и значительно увеличивают точность, особенно при обнаружении мелких деталей в сложных сценах.
  • Более эффективное обучение: Новый оптимизатор MuSGD сочетает в себе сильные стороны двух методов обучения, помогая модели учиться быстрее и достигать большей точности.

Первый взгляд на платформу Ultralytics

После представления YOLO26 Гленн пригласил Пратека Бхатнагара, руководителя отдела разработки продуктов, для демонстрации следующего проекта - платформы Ultralytics . Созданная для упрощения всего рабочего процесса компьютерного зрения, платформа призвана объединить в одном месте наборы данных, аннотацию, обучение, развертывание и мониторинг.

Prateek сравнил это с настройкой автомобиля: вместо посещения разных магазинов для шин, двигателей и трансмиссий, все происходит в одном гараже. Точно так же платформа предоставляет разработчикам интегрированное рабочее пространство для управления полным жизненным циклом модели машинного зрения.

На демонстрации были представлены инструменты аннотации с помощью ИИ, которые ускоряют подготовку набора данных, настраиваемые параметры обучения как для экспертов, так и для начинающих, а также мониторинг выполнения обучения в реальном времени. 

Выводы из панельной дискуссии о развертывании edge-вычислений

Еще одним ярким событием YV25 стала панельная дискуссия о периферийном развертывании под модерацией Ойсина Ланни. В сессии приняли участие Юки Цудзи из Sony Semiconductor Solutions, Дэвид Плауман из Raspberry Pi и Гленн Джохер. 

В ходе обсуждения было рассмотрено, как перенос ИИ на периферию снижает задержку, снижает затраты и повышает конфиденциальность. Юки продемонстрировала датчик Sony IMX500, который может выполнять вывод непосредственно на чипе. Между тем, Дэвид рассказал о том, как Raspberry Pi расширяется от своих корней производителя до крупных коммерческих приложений.

Рис. 2. Панельная дискуссия о развертывании на периферии с участием Ойсина Ланни, Юки Цудзи, Дэвида Плаумана и Гленна Джокера.

Участники дискуссии также затронули одну из самых серьезных проблем для разработчиков: обеспечение плавной работы моделей на различных устройствах. Именно здесь ключевую роль играет пакетUltralytics Python

Широкие возможности экспорта позволяют легко перенести подготовленную модель в производство на мобильных устройствах, встраиваемых системах или корпоративном оборудовании. Устраняя боль от преобразования моделей, Ultralytics помогает командам сосредоточиться на создании решений, а не на борьбе с проблемами совместимости.

Как объяснил Дэвид: "На своем горьком опыте я знаю, что конвертировать модели - это ужасно, и если кто-то другой сделает это за меня, то жизнь станет намного проще. Именно здесь Ultralytics действительно улучшает историю и предлагает что-то ценное для наших пользователей". 

Ускорение инноваций и AI-оборудования

Программные достижения в области ИИ происходят параллельно с аппаратными, и вместе они вызывают новую волну инноваций в компьютерном зрении. Хотя такие модели, как Ultralytics YOLO , продолжают продвигать точность, их влияние на реальный мир также зависит от платформ, на которых они работают.

Например, Seeed Studio продемонстрировала, как модульное и недорогое оборудование, такое как их платы reCamera и XIAO, с предустановленными моделями Ultralytics YOLO , позволяет разработчикам легко перейти от создания прототипов к реальным системам ИИ. Подобная программно-аппаратная интеграция снижает барьер для входа и показывает, как инновации на аппаратном уровне непосредственно ускоряют внедрение.

Вот основные выводы из других докладов YV25, в которых подчеркивалось, как совместное проектирование аппаратного и программного обеспечения открывает новые возможности:

  • Квантование позволяет добиться значительного прироста скорости: Intel показала, как преобразование моделей Ultralytics YOLO в OpenVINO с квантованием увеличило скорость вывода с 54 кадров в секунду до 606 кадров в секунду всего за 30 минут, демонстрируя силу оптимизации.
  • Инструменты полного стека делают развертывание ИИ на границе практичным: NVIDIA показала, как устройства Jetson, TensorRT, Triton Inference Server и DeepStream SDK работают вместе, чтобы упростить развертывание высокопроизводительного ИИ на границе.
  • Открытые экосистемы ускоряют прототипирование: AMD подчеркнула свою сквозную платформу, построенную на графических процессорах и программном стеке ROCm, помогая разработчикам быстро переходить от прототипа к развертыванию, контролируя при этом затраты.
  • Энергоэффективные чипы расширяют возможности ИИ для устройств с ограниченными ресурсами: DEEPX представила свои процессоры DX-M1 и DX-M2, обеспечивающие десятки TOPS при мощности менее 5 Вт, что позволяет использовать расширенные возможности логического вывода в компактных системах с ограниченным энергопотреблением.

Современные тенденции в области компьютерного зрения

Благодаря прогрессу как в программном, так и в аппаратном обеспечении, компьютерное зрение развивается быстрее, чем когда-либо. Эти параллельные разработки не только повышают точность и скорость, но и формируют способы развертывания Vision AI в реальном мире. На YV25 участники смогли услышать экспертов в области робототехники, периферийных вычислений и мультимодального ИИ, каждый из которых предложил свой взгляд на будущее этой области.

Например, в своем выступлении Майкл Харт из D-Robotics продемонстрировал, как сочетание моделей Ultralytics YOLO с компактной платой RDK X5 (небольшой встроенный модуль искусственного зрения) позволяет роботам запускать передовые модели зрения в режиме реального времени. Его демонстрация вживую показала, насколько далеко шагнула робототехника, превратившись из лабораторных экспериментов в практические системы, работающие на основе ИИ.

Рис. 3. Майкл Харт подчеркнул, что современные роботы с поддержкой ИИ зависят от компьютерного зрения.

Аналогично, Алексис Кроуэлл и Стивен Хунше из Axelera AI подчеркнули проблемы и возможности развертывания Vision AI на периферии. С помощью живых демонстраций они объяснили, как блоки обработки AI Metis (AIPU) от Axelera AI сочетают RISC-V и цифровые вычисления в памяти для обеспечения высокой производительности при очень низком энергопотреблении. Платформа, выполненная в привычных форм-факторах, таких как M.2 и PCIe, благодаря совместной разработке аппаратного и программного обеспечения делает масштабирование Edge AI практичным и эффективным.

На другой сессии Мерве Ноян из Hugging Face рассказала о развитии мультимодального ИИ, когда модели сочетают зрение с текстом, аудио и другими данными. Она рассказала о примерах использования, начиная от анализа документов и заканчивая воплощенными агентами, подчеркнув, что инновации с открытым исходным кодом ускоряют внедрение ИИ.

Сбалансированный технический прогресс с человеческими ценностями

На YV25 прозвучали вдохновляющие доклады о больших перспективах, но были и глубоко практические сессии. Иржи Боровец из Lightning AI провел практическое занятие, показав, как обучать и настраивать модели Ultralytics YOLO с помощью PyTorch Lightning и поддержки нескольких GPU . 

Он прошелся по примерам кода и подчеркнул, как инструменты с открытым исходным кодом, четкая документация и гибкие фреймворки облегчают разработчикам масштабирование обучения, проверку каждого этапа и адаптацию рабочих процессов к своим собственным проектам. Это стало напоминанием о том, насколько важны сообщество и доступные инструменты для реального прогресса в области компьютерного зрения.

С другой стороны спектра, спикеры призвали аудиторию задуматься о более широкой роли ИИ в обществе. В своем основном докладе Герд Леонхард, футурист, гуманист и генеральный директор The Futures Agency, утверждал, что «технологии морально нейтральны, пока мы их не используем», подчеркивая, что реальный вопрос заключается не только в том, что ИИ может делать, но и в том, что он должен делать. Он предостерег от попадания в ловушки, такие как редукционизм и беспринципность, и призвал к созданию ИИ, который действительно служит долгосрочным интересам человечества.

Рис. 4. Герд Леонхард делится своими мыслями о создании AI-решений, сохраняя их ориентированными на человека.

Этот акцент на ответственности был продолжен в беседе у камина с Кариссой Велиз из Оксфордского университета, которая подчеркнула важность конфиденциальности и безопасности. Она отметила, что сообщества с открытым исходным кодом жизненно важны для проверки и улучшения кода, и что этика и дизайн неразделимы. Ее послание было ясным: разработчики должны предвидеть злоупотребления и создавать системы, которые ставят во главу угла человеческое достоинство и социальное благополучие.

Нетворкинг в Лондоне на YV25

Выходя за рамки докладов и демонстраций, YV25 также создала пространство для общения. Во время кофе-брейков и обеда участники общались, делились опытом, сравнивали подходы и налаживали новые связи.

Для командыUltralytics это также была отличная возможность встретиться лично. Поскольку члены команды разбросаны по всему миру, такие моменты помогают укрепить связи и вместе отпраздновать прогресс.

Рис. 5. Команда Ultralytics завершает вдохновляющий день на YOLO Vision 2025.

День завершился вечеринкой, где участники смогли расслабиться и продолжить общение. Это был момент, чтобы поразмышлять, перезарядиться и взглянуть в будущее следующей главы инноваций в Vision AI.

Вместе расширяем границы Vision AI

YOLO Vision 2025 стал праздником идей, инноваций и сообщества. Запуск Ultralytics YOLO26 положил начало мероприятию, после чего состоялись увлекательные выступления по вопросам развертывания на границе и человеко-ориентированного ИИ, которые подчеркнули быстрый прогресс Vision AI и его растущее влияние на мир.

Помимо основных сессий, мероприятие объединило людей. Исследователи, разработчики и энтузиасты делились опытом, вели содержательные беседы и исследовали новые возможности для будущего. Мероприятие завершилось на высокой ноте, участники были воодушевлены будущим моделей Ultralytics YOLO и компьютерного зрения.

Готовы изучить ИИ? Присоединяйтесь к нашему сообществу и репозиторию на GitHub, чтобы узнать больше об ИИ и компьютерном зрении. Посетите страницы наших решений, чтобы изучить другие приложения компьютерного зрения в сельском хозяйстве и ИИ в робототехнике. Ознакомьтесь с нашими вариантами лицензирования и начните работу с компьютерным зрением уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно