Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Основные моменты от Ultralytics с YOLO Vision 2025!

Абирами Вина

5 мин чтения

29 сентября 2025 г.

Присоединяйтесь к нам, чтобы подвести итоги крупнейшего события Ultralytics в этом году, продемонстрировав запуск Ultralytics YOLO26, вдохновляющие панели и основные моменты сообщества.

25 сентября сообщество специалистов по ИИ и компьютерному зрению собралось на YOLO Vision 2025 (YV25), ежегодном гибридном мероприятии Ultralytics, посвященном Vision AI. Мероприятие, проходившее в Лондоне в The Pelligon и транслировавшееся по всему миру, приветствовало разнообразную группу исследователей, инженеров и энтузиастов ИИ для обмена идеями и изучения новых инноваций, таких как Ultralytics YOLO26.

Отмечая свой четвертый год, мероприятие продолжает расти с точки зрения охвата и воздействия. Прямая трансляция YV25 уже набрала более 6800 просмотров, сгенерировала более 49 000 показов и собрала около 2000 часов просмотра.

YV25 началась с приветственного слова нашего ведущего Ойсина Ланни, который задал тон мероприятию, призвав участников общаться, делиться опытом и максимально использовать возможности конференции. Как он выразился, «YOLO Vision 2025 — это конференция, объединяющая сообщество Vision AI с открытым исходным кодом для обсуждения данных, машинного обучения и достижений в области компьютерного зрения».

В этой статье мы подведем итоги основных моментов YOLO Vision 2025, включая запуск продукта, основные доклады, панельную дискуссию, живые демонстрации и моменты сообщества, которые сделали этот день особенным. Начнем!

Переход от одного GPU к финансированию Серии A в размере 30 миллионов долларов

В преддверии мероприятия царило большое волнение по поводу запуска нового продукта, и Гленн Джохер, наш основатель и генеральный директор, начал день с наращивания этой энергии. 

Он поделился историей Ultralytics, вспоминая, как в 2020 году он проводил эксперименты на одной 1080 Ti, подключенной к его MacBook, — настройка, которая сегодня устарела. С этого скромного начала Ultralytics превратилась в глобальное сообщество с миллиардами ежедневных выводов, основанных на моделях YOLO.

Гленн также рассказал о недавнем закрытии Ultralytics раунда финансирования серии A на сумму 30 миллионов долларов. Он объяснил, как эти инвестиции поддержат следующий этап роста, позволив компании расширить команду, расширить исследования и обеспечить вычислительные ресурсы, необходимые для дальнейшего расширения границ компьютерного зрения. 

Ultralytics YOLO26: улучшенная, более быстрая и компактная модель YOLO

Гленн объявил о двух новых разработках от Ultralytics. Первая — Ultralytics YOLO26, новейшая модель в семействе Ultralytics YOLO, разработанная как меньшая, более быстрая и эффективная, при этом достигающая еще большей точности. Вторая — платформа Ultralytics, новая сквозная SaaS-среда, которая объединяет данные, обучение, развертывание и мониторинг, чтобы упростить создание решений компьютерного зрения, о которой, как ожидается, будет объявлено в ближайшем будущем.

Рис. 1. Гленн Джохер объявляет о выходе Ultralytics YOLO26 на сцене YOLO Vision 2025.

YOLO26 создана для повышения производительности, оставаясь при этом практичной для реального использования. Самая маленькая версия уже работает на 43% быстрее на ЦП, при этом повышая точность, что делает ее идеальной для приложений от мобильных устройств до крупных корпоративных систем. YOLO26 станет общедоступной к концу октября.

Вот краткий обзор ключевых особенностей YOLO26:

  • Оптимизированная архитектура: Модуль Distribution Focal Loss (DFL), который ранее замедлял работу моделей, был удален. Теперь YOLO26 работает более эффективно без ущерба для точности.
  • Более быстрые прогнозы: YOLO26 представляет возможность пропустить шаг Non-Maximum Suppression (NMS), что позволяет ему быстрее предоставлять результаты и облегчает развертывание в режиме реального времени.
  • Лучше обнаруживает мелкие объекты: Новые методы обучения повышают стабильность и значительно увеличивают точность, особенно при обнаружении мелких деталей в сложных сценах.
  • Более эффективное обучение: Новый оптимизатор MuSGD сочетает в себе сильные стороны двух методов обучения, помогая модели учиться быстрее и достигать большей точности.

Первый взгляд на платформу Ultralytics

Представив YOLO26, Гленн пригласил Пратика Бхатнагара, нашего руководителя отдела разработки продуктов, продемонстрировать следующий проект, Ultralytics Platform. Платформа, созданная для упрощения всего рабочего процесса компьютерного зрения, призвана объединить наборы данных, аннотации, обучение, развертывание и мониторинг в одном месте.

Prateek сравнил это с настройкой автомобиля: вместо посещения разных магазинов для шин, двигателей и трансмиссий, все происходит в одном гараже. Точно так же платформа предоставляет разработчикам интегрированное рабочее пространство для управления полным жизненным циклом модели машинного зрения.

На демонстрации были представлены инструменты аннотации с помощью ИИ, которые ускоряют подготовку набора данных, настраиваемые параметры обучения как для экспертов, так и для начинающих, а также мониторинг выполнения обучения в реальном времени. 

Выводы из панельной дискуссии о развертывании edge-вычислений

Еще одним ярким событием YV25 стала панельная дискуссия о периферийном развертывании под модерацией Ойсина Ланни. В сессии приняли участие Юки Цудзи из Sony Semiconductor Solutions, Дэвид Плауман из Raspberry Pi и Гленн Джохер. 

В ходе обсуждения было рассмотрено, как перенос ИИ на периферию снижает задержку, снижает затраты и повышает конфиденциальность. Юки продемонстрировала датчик Sony IMX500, который может выполнять вывод непосредственно на чипе. Между тем, Дэвид рассказал о том, как Raspberry Pi расширяется от своих корней производителя до крупных коммерческих приложений.

Рис. 2. Панельная дискуссия о развертывании на периферии с участием Ойсина Ланни, Юки Цудзи, Дэвида Плаумана и Гленна Джокера.

Участники дискуссии также затронули одну из самых больших проблем для разработчиков: обеспечение бесперебойной работы моделей на различных устройствах. Именно здесь пакет Ultralytics Python играет ключевую роль. 

Благодаря широкому спектру опций экспорта, он упрощает перенос обученной модели в производство на мобильных, встраиваемых системах или корпоративном оборудовании. Избавляя от сложностей преобразования моделей, Ultralytics помогает командам сосредоточиться на создании решений, а не на решении проблем совместимости.

Как объяснил Дэвид: «Я знаю по своему горькому опыту, что преобразование моделей — ужасно, и если кто-то сделает это за меня, это значительно облегчит жизнь. Именно здесь Ultralytics действительно улучшает ситуацию и предлагает что-то ценное для своих пользователей». 

Ускорение инноваций и AI-оборудования

Развитие программного обеспечения ИИ происходит параллельно с развитием аппаратного обеспечения, и вместе они стимулируют новую волну инноваций в компьютерном зрении. В то время как такие модели, как Ultralytics YOLO, продолжают повышать точность, их реальное воздействие также зависит от платформ, на которых они работают.

Например, Seeed Studio продемонстрировала, как модульное недорогое оборудование, такое как их платы reCamera и XIAO, предварительно загруженные моделями Ultralytics YOLO, упрощает разработчикам переход от прототипирования к реальным системам искусственного интеллекта. Такая интеграция оборудования и программного обеспечения снижает входной барьер и показывает, как инновации на уровне оборудования напрямую ускоряют внедрение.

Вот основные выводы из других докладов YV25, в которых подчеркивалось, как совместное проектирование аппаратного и программного обеспечения открывает новые возможности:

  • Квантование обеспечивает значительный прирост скорости: Intel продемонстрировала, как преобразование моделей Ultralytics YOLO в OpenVINO с квантованием увеличило скорость вывода с 54 FPS до 606 FPS всего за 30 минут, что подчеркивает возможности оптимизации.
  • Комплексные инструменты делают развертывание edge AI практичным: NVIDIA подчеркнула, как устройства Jetson, TensorRT, Triton Inference Server и DeepStream SDK работают вместе, чтобы упростить развертывание высокопроизводительного vision AI на границе сети.
  • Открытые экосистемы ускоряют прототипирование: AMD подчеркнула свою сквозную платформу, построенную на графических процессорах и программном стеке ROCm, помогая разработчикам быстро переходить от прототипа к развертыванию, контролируя при этом затраты.
  • Энергоэффективные чипы расширяют возможности ИИ для устройств с ограниченными ресурсами: DEEPX представила свои процессоры DX-M1 и DX-M2, обеспечивающие десятки TOPS при мощности менее 5 Вт, что позволяет использовать расширенные возможности логического вывода в компактных системах с ограниченным энергопотреблением.

Современные тенденции в области компьютерного зрения

Благодаря прогрессу как в программном, так и в аппаратном обеспечении, компьютерное зрение развивается быстрее, чем когда-либо. Эти параллельные разработки не только повышают точность и скорость, но и формируют способы развертывания Vision AI в реальном мире. На YV25 участники смогли услышать экспертов в области робототехники, периферийных вычислений и мультимодального ИИ, каждый из которых предложил свой взгляд на будущее этой области.

Например, в своем основном докладе Майкл Харт из D-Robotics продемонстрировал, как объединение моделей Ultralytics YOLO с их компактной платой RDK X5 (небольшой встроенный модуль AI vision) позволяет роботам запускать передовые модели машинного зрения в режиме реального времени. Его живая демонстрация показала, как далеко продвинулась робототехника, превратившись из лабораторных экспериментов в практические системы с использованием искусственного интеллекта.

Рис. 3. Майкл Харт подчеркнул, что современные роботы с поддержкой ИИ зависят от компьютерного зрения.

Аналогично, Алексис Кроуэлл и Стивен Хунше из Axelera AI подчеркнули проблемы и возможности развертывания Vision AI на периферии. С помощью живых демонстраций они объяснили, как блоки обработки AI Metis (AIPU) от Axelera AI сочетают RISC-V и цифровые вычисления в памяти для обеспечения высокой производительности при очень низком энергопотреблении. Платформа, выполненная в привычных форм-факторах, таких как M.2 и PCIe, благодаря совместной разработке аппаратного и программного обеспечения делает масштабирование Edge AI практичным и эффективным.

А на другой сессии Мерве Ноян из Hugging Face рассказала о развитии мультимодального ИИ, где модели объединяют зрение с текстом, аудио и другими входными данными. Она рассказала о вариантах использования, начиная от анализа документов и заканчивая воплощенными агентами, подчеркнув, как инновации с открытым исходным кодом ускоряют внедрение ИИ.

Сбалансированный технический прогресс с человеческими ценностями

В то время как YV25 включала вдохновляющие доклады о перспективах, она также включала глубоко практические сессии. Jiri Borovec из Lightning AI провел практическое руководство, показывающее, как обучать и тонко настраивать модели Ultralytics YOLO с помощью PyTorch Lightning и поддержки нескольких GPU. 

Он прошелся по примерам кода и подчеркнул, как инструменты с открытым исходным кодом, четкая документация и гибкие фреймворки облегчают разработчикам масштабирование обучения, проверку каждого этапа и адаптацию рабочих процессов к своим собственным проектам. Это стало напоминанием о том, насколько важны сообщество и доступные инструменты для реального прогресса в области компьютерного зрения.

С другой стороны спектра, спикеры призвали аудиторию задуматься о более широкой роли ИИ в обществе. В своем основном докладе Герд Леонхард, футурист, гуманист и генеральный директор The Futures Agency, утверждал, что «технологии морально нейтральны, пока мы их не используем», подчеркивая, что реальный вопрос заключается не только в том, что ИИ может делать, но и в том, что он должен делать. Он предостерег от попадания в ловушки, такие как редукционизм и беспринципность, и призвал к созданию ИИ, который действительно служит долгосрочным интересам человечества.

Рис. 4. Герд Леонхард делится своими мыслями о создании AI-решений, сохраняя их ориентированными на человека.

Этот акцент на ответственности был продолжен в беседе у камина с Кариссой Велиз из Оксфордского университета, которая подчеркнула важность конфиденциальности и безопасности. Она отметила, что сообщества с открытым исходным кодом жизненно важны для проверки и улучшения кода, и что этика и дизайн неразделимы. Ее послание было ясным: разработчики должны предвидеть злоупотребления и создавать системы, которые ставят во главу угла человеческое достоинство и социальное благополучие.

Нетворкинг в Лондоне на YV25

Выходя за рамки докладов и демонстраций, YV25 также создала пространство для общения. Во время кофе-брейков и обеда участники общались, делились опытом, сравнивали подходы и налаживали новые связи.

Для команды Ultralytics это также была отличная возможность встретиться лично. Поскольку члены команды разбросаны по всему миру, такие моменты помогают укрепить связи и вместе отметить прогресс.

Рис. 5. Команда Ultralytics завершает вдохновляющий день на YOLO Vision 2025.

День завершился вечеринкой, где участники смогли расслабиться и продолжить общение. Это был момент, чтобы поразмышлять, перезарядиться и взглянуть в будущее следующей главы инноваций в Vision AI.

Вместе расширяем границы Vision AI

YOLO Vision 2025 стал праздником идей, инноваций и сообщества. Запуск Ultralytics YOLO26 задал тон, за которым последовали интересные доклады о развертывании на периферии и человеко-ориентированном ИИ, которые подчеркнули быстрый прогресс Vision AI и его растущее влияние на мир.

В дополнение к основным докладам, мероприятие объединило людей. Исследователи, разработчики и энтузиасты делились опытом, инициировали содержательные беседы и изучали новые возможности для будущего. Мероприятие завершилось на высокой ноте, участники были в восторге от будущего моделей Ultralytics YOLO и компьютерного зрения.

Готовы изучить ИИ? Присоединяйтесь к нашему сообществу и репозиторию на GitHub, чтобы узнать больше об ИИ и компьютерном зрении. Посетите страницы наших решений, чтобы изучить другие приложения компьютерного зрения в сельском хозяйстве и ИИ в робототехнике. Ознакомьтесь с нашими вариантами лицензирования и начните работу с компьютерным зрением уже сегодня!

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно