Присоединяйтесь к нам, чтобы подвести итоги крупнейшего события Ultralytics в этом году, продемонстрировав запуск Ultralytics YOLO26, вдохновляющие панели и основные моменты сообщества.
Присоединяйтесь к нам, чтобы подвести итоги крупнейшего события Ultralytics в этом году, продемонстрировав запуск Ultralytics YOLO26, вдохновляющие панели и основные моменты сообщества.
25 сентября сообщество специалистов по ИИ и компьютерному зрению собралось на YOLO Vision 2025 (YV25), ежегодном гибридном мероприятии Ultralytics, посвященном Vision AI. Мероприятие, проходившее в Лондоне в The Pelligon и транслировавшееся по всему миру, приветствовало разнообразную группу исследователей, инженеров и энтузиастов ИИ для обмена идеями и изучения новых инноваций, таких как Ultralytics YOLO26.
Отмечая свой четвертый год, мероприятие продолжает расти с точки зрения охвата и воздействия. Прямая трансляция YV25 уже набрала более 6800 просмотров, сгенерировала более 49 000 показов и собрала около 2000 часов просмотра.
YV25 началась с приветственного слова нашего ведущего Ойсина Ланни, который задал тон мероприятию, призвав участников общаться, делиться опытом и максимально использовать возможности конференции. Как он выразился, «YOLO Vision 2025 — это конференция, объединяющая сообщество Vision AI с открытым исходным кодом для обсуждения данных, машинного обучения и достижений в области компьютерного зрения».
В этой статье мы подведем итоги основных моментов YOLO Vision 2025, включая запуск продукта, основные доклады, панельную дискуссию, живые демонстрации и моменты сообщества, которые сделали этот день особенным. Начнем!
В преддверии мероприятия царило большое волнение по поводу запуска нового продукта, и Гленн Джохер, наш основатель и генеральный директор, начал день с наращивания этой энергии.
Он поделился историей Ultralytics, вспоминая, как в 2020 году он проводил эксперименты на одной 1080 Ti, подключенной к его MacBook, — настройка, которая сегодня устарела. С этого скромного начала Ultralytics превратилась в глобальное сообщество с миллиардами ежедневных выводов, основанных на моделях YOLO.
Гленн также рассказал о недавнем закрытии Ultralytics раунда финансирования серии A на сумму 30 миллионов долларов. Он объяснил, как эти инвестиции поддержат следующий этап роста, позволив компании расширить команду, расширить исследования и обеспечить вычислительные ресурсы, необходимые для дальнейшего расширения границ компьютерного зрения.
Гленн объявил о двух новых разработках от Ultralytics. Первая — Ultralytics YOLO26, новейшая модель в семействе Ultralytics YOLO, разработанная как меньшая, более быстрая и эффективная, при этом достигающая еще большей точности. Вторая — платформа Ultralytics, новая сквозная SaaS-среда, которая объединяет данные, обучение, развертывание и мониторинг, чтобы упростить создание решений компьютерного зрения, о которой, как ожидается, будет объявлено в ближайшем будущем.

YOLO26 создана для повышения производительности, оставаясь при этом практичной для реального использования. Самая маленькая версия уже работает на 43% быстрее на ЦП, при этом повышая точность, что делает ее идеальной для приложений от мобильных устройств до крупных корпоративных систем. YOLO26 станет общедоступной к концу октября.
Вот краткий обзор ключевых особенностей YOLO26:
Представив YOLO26, Гленн пригласил Пратика Бхатнагара, нашего руководителя отдела разработки продуктов, продемонстрировать следующий проект, Ultralytics Platform. Платформа, созданная для упрощения всего рабочего процесса компьютерного зрения, призвана объединить наборы данных, аннотации, обучение, развертывание и мониторинг в одном месте.
Prateek сравнил это с настройкой автомобиля: вместо посещения разных магазинов для шин, двигателей и трансмиссий, все происходит в одном гараже. Точно так же платформа предоставляет разработчикам интегрированное рабочее пространство для управления полным жизненным циклом модели машинного зрения.
На демонстрации были представлены инструменты аннотации с помощью ИИ, которые ускоряют подготовку набора данных, настраиваемые параметры обучения как для экспертов, так и для начинающих, а также мониторинг выполнения обучения в реальном времени.
Еще одним ярким событием YV25 стала панельная дискуссия о периферийном развертывании под модерацией Ойсина Ланни. В сессии приняли участие Юки Цудзи из Sony Semiconductor Solutions, Дэвид Плауман из Raspberry Pi и Гленн Джохер.
В ходе обсуждения было рассмотрено, как перенос ИИ на периферию снижает задержку, снижает затраты и повышает конфиденциальность. Юки продемонстрировала датчик Sony IMX500, который может выполнять вывод непосредственно на чипе. Между тем, Дэвид рассказал о том, как Raspberry Pi расширяется от своих корней производителя до крупных коммерческих приложений.

Участники дискуссии также затронули одну из самых больших проблем для разработчиков: обеспечение бесперебойной работы моделей на различных устройствах. Именно здесь пакет Ultralytics Python играет ключевую роль.
Благодаря широкому спектру опций экспорта, он упрощает перенос обученной модели в производство на мобильных, встраиваемых системах или корпоративном оборудовании. Избавляя от сложностей преобразования моделей, Ultralytics помогает командам сосредоточиться на создании решений, а не на решении проблем совместимости.
Как объяснил Дэвид: «Я знаю по своему горькому опыту, что преобразование моделей — ужасно, и если кто-то сделает это за меня, это значительно облегчит жизнь. Именно здесь Ultralytics действительно улучшает ситуацию и предлагает что-то ценное для своих пользователей».
Развитие программного обеспечения ИИ происходит параллельно с развитием аппаратного обеспечения, и вместе они стимулируют новую волну инноваций в компьютерном зрении. В то время как такие модели, как Ultralytics YOLO, продолжают повышать точность, их реальное воздействие также зависит от платформ, на которых они работают.
Например, Seeed Studio продемонстрировала, как модульное недорогое оборудование, такое как их платы reCamera и XIAO, предварительно загруженные моделями Ultralytics YOLO, упрощает разработчикам переход от прототипирования к реальным системам искусственного интеллекта. Такая интеграция оборудования и программного обеспечения снижает входной барьер и показывает, как инновации на уровне оборудования напрямую ускоряют внедрение.
Вот основные выводы из других докладов YV25, в которых подчеркивалось, как совместное проектирование аппаратного и программного обеспечения открывает новые возможности:
Благодаря прогрессу как в программном, так и в аппаратном обеспечении, компьютерное зрение развивается быстрее, чем когда-либо. Эти параллельные разработки не только повышают точность и скорость, но и формируют способы развертывания Vision AI в реальном мире. На YV25 участники смогли услышать экспертов в области робототехники, периферийных вычислений и мультимодального ИИ, каждый из которых предложил свой взгляд на будущее этой области.
Например, в своем основном докладе Майкл Харт из D-Robotics продемонстрировал, как объединение моделей Ultralytics YOLO с их компактной платой RDK X5 (небольшой встроенный модуль AI vision) позволяет роботам запускать передовые модели машинного зрения в режиме реального времени. Его живая демонстрация показала, как далеко продвинулась робототехника, превратившись из лабораторных экспериментов в практические системы с использованием искусственного интеллекта.

Аналогично, Алексис Кроуэлл и Стивен Хунше из Axelera AI подчеркнули проблемы и возможности развертывания Vision AI на периферии. С помощью живых демонстраций они объяснили, как блоки обработки AI Metis (AIPU) от Axelera AI сочетают RISC-V и цифровые вычисления в памяти для обеспечения высокой производительности при очень низком энергопотреблении. Платформа, выполненная в привычных форм-факторах, таких как M.2 и PCIe, благодаря совместной разработке аппаратного и программного обеспечения делает масштабирование Edge AI практичным и эффективным.
А на другой сессии Мерве Ноян из Hugging Face рассказала о развитии мультимодального ИИ, где модели объединяют зрение с текстом, аудио и другими входными данными. Она рассказала о вариантах использования, начиная от анализа документов и заканчивая воплощенными агентами, подчеркнув, как инновации с открытым исходным кодом ускоряют внедрение ИИ.
В то время как YV25 включала вдохновляющие доклады о перспективах, она также включала глубоко практические сессии. Jiri Borovec из Lightning AI провел практическое руководство, показывающее, как обучать и тонко настраивать модели Ultralytics YOLO с помощью PyTorch Lightning и поддержки нескольких GPU.
Он прошелся по примерам кода и подчеркнул, как инструменты с открытым исходным кодом, четкая документация и гибкие фреймворки облегчают разработчикам масштабирование обучения, проверку каждого этапа и адаптацию рабочих процессов к своим собственным проектам. Это стало напоминанием о том, насколько важны сообщество и доступные инструменты для реального прогресса в области компьютерного зрения.
С другой стороны спектра, спикеры призвали аудиторию задуматься о более широкой роли ИИ в обществе. В своем основном докладе Герд Леонхард, футурист, гуманист и генеральный директор The Futures Agency, утверждал, что «технологии морально нейтральны, пока мы их не используем», подчеркивая, что реальный вопрос заключается не только в том, что ИИ может делать, но и в том, что он должен делать. Он предостерег от попадания в ловушки, такие как редукционизм и беспринципность, и призвал к созданию ИИ, который действительно служит долгосрочным интересам человечества.

Этот акцент на ответственности был продолжен в беседе у камина с Кариссой Велиз из Оксфордского университета, которая подчеркнула важность конфиденциальности и безопасности. Она отметила, что сообщества с открытым исходным кодом жизненно важны для проверки и улучшения кода, и что этика и дизайн неразделимы. Ее послание было ясным: разработчики должны предвидеть злоупотребления и создавать системы, которые ставят во главу угла человеческое достоинство и социальное благополучие.
Выходя за рамки докладов и демонстраций, YV25 также создала пространство для общения. Во время кофе-брейков и обеда участники общались, делились опытом, сравнивали подходы и налаживали новые связи.
Для команды Ultralytics это также была отличная возможность встретиться лично. Поскольку члены команды разбросаны по всему миру, такие моменты помогают укрепить связи и вместе отметить прогресс.

День завершился вечеринкой, где участники смогли расслабиться и продолжить общение. Это был момент, чтобы поразмышлять, перезарядиться и взглянуть в будущее следующей главы инноваций в Vision AI.
YOLO Vision 2025 стал праздником идей, инноваций и сообщества. Запуск Ultralytics YOLO26 задал тон, за которым последовали интересные доклады о развертывании на периферии и человеко-ориентированном ИИ, которые подчеркнули быстрый прогресс Vision AI и его растущее влияние на мир.
В дополнение к основным докладам, мероприятие объединило людей. Исследователи, разработчики и энтузиасты делились опытом, инициировали содержательные беседы и изучали новые возможности для будущего. Мероприятие завершилось на высокой ноте, участники были в восторге от будущего моделей Ultralytics YOLO и компьютерного зрения.
Готовы изучить ИИ? Присоединяйтесь к нашему сообществу и репозиторию на GitHub, чтобы узнать больше об ИИ и компьютерном зрении. Посетите страницы наших решений, чтобы изучить другие приложения компьютерного зрения в сельском хозяйстве и ИИ в робототехнике. Ознакомьтесь с нашими вариантами лицензирования и начните работу с компьютерным зрением уже сегодня!