Основные выводы Ultralytics из YOLO Vision 2024!

Абирами Вина

4 мин. чтения

8 октября 2024 г.

Ознакомьтесь с основными моментами ежегодного мероприятия Ultralytics и переживите гибридный опыт YOLO Vision. Мы расскажем о запуске YOLO11 от Ultralytics, интересных панелях и многом другом.

27 сентября компания Ultralytics собрала сообщество специалистов по искусственному интеллекту и компьютерному зрению на ежегодном гибридном мероприятии YOLO Vision 2024 (YV24). Мероприятие прошло в кампусе Google for Startups в Мадриде и транслировалось по всему миру. На нем собрались эксперты, разработчики и энтузиасты, чтобы обсудить последние достижения в области искусственного интеллекта, такие как новая модель Ultralytics YOLO11. Прямая трансляция мероприятия уже достигла более 5 400 просмотров, более 10 600 впечатлений и 469,5 часов просмотра, привлекая инноваторов по всему миру.

YV24 начался с теплого приветствия нашего ведущего, Ойсина Лунни, который подчеркнул важность сообщества и связей, сказав: "Я очень верю в силу великих идей и великих сообществ, и то, что Ultralytics создала с YOLO Vision, - это именно это: великое сообщество великих людей с великими идеями".

В этой статье мы расскажем о ключевых моментах YOLO Vision 2024: от увлекательных панельных дискуссий до захватывающих реальных примеров использования компьютерного зрения. Мы также рассмотрим технические доклады, начиная с краевого ИИ и заканчивая аппаратным ускорением, а также моменты налаживания контактов и создания сообщества, которые обеспечили успех мероприятия. Если вас интересуют инновации в области ИИ, ключевые анонсы или будущее Vision AI, в этом обзоре мероприятия YOLO Vision 2024 вы найдете все самые важные моменты! 

Запуск Ultralytics YOLO11 на выставке YOLO Vision

Анонс продукта, о котором говорили еще до начала YOLO Vision 2024, наконец-то состоялся во время первого выступления Глена Джочера, основателя и генерального директора Ultralytics. Гленн представил Ultralytics YOLO11- следующее поколение моделей компьютерного зрения, разработка которых велась несколько месяцев. Во время презентации Гленн дал интервью в эфире The Ravit Show и поделился своими впечатлениями о разработке YOLO11.

Во время своего выступления Гленн также рассказал о пути компании, начав с изучения физики элементарных частиц, и о том, как его увлечение пониманием Вселенной привело его к машинному обучению и компьютерному зрению.

__wf_reserved_inherit
Рис. 1. Ultralytics YOLO11 была официально анонсирована Гленом Джошером на сцене YOLO Vision 2024.

Он рассказал, что его ранняя работа в области физики, где исследователи анализировали взаимодействие частиц, была похожа на обнаружение объектов в компьютерном зрении. Его любопытство и стремление работать над передовыми технологиями в конечном итоге привели к созданию Ultralytics YOLOv5. На протяжении всего своего выступления Гленн подчеркивал важность сотрудничества и вклада в сообщество разработчиков с открытым исходным кодом и благодарил разработчиков со всего мира, которые оставляли отзывы и помогали улучшать YOLOv5 и Ultralytics YOLOv8 с течением времени.

Затем он представил ключевые особенности Ultralytics YOLO11 и объяснил, что она быстрее, точнее и эффективнее предыдущих моделей. Фактически, YOLO11m использует на 22 % меньше параметров, чем YOLOv8m, но при этом обеспечивает более высокую точность на наборе данных COCO, что делает YOLO11 идеальной для приложений реального времени, где скорость и точность имеют решающее значение.

Гленн подчеркнул масштаб запуска: "Всего мы запускаем 30 моделей, 25 из них - с открытым исходным кодом, с пятью разными размерами для пяти разных задач. Эти задачи включают классификацию изображений, обнаружение объектов, сегментацию экземпляров, оценку позы и ориентированные ограничительные рамки". Что касается корпоративной части, то он объявил, что в следующем месяце будут доступны надежные модели, обученные на собственном наборе данных из 1 миллиона изображений. Нет необходимости говорить о том, что этот анонс положил начало мероприятию на высокой ноте, оставив присутствующих в предвкушении узнать больше о потенциале YOLO11 для инноваций в таких областях, как производство и самоуправляемые автомобили.

Панельные дискуссии на конференции YOLO Vision: Конференция по искусственному интеллекту

Панельные дискуссии YOLO Vision 2024, модератором которых выступил Ойсин Лунни, позволили узнать много нового об искусственном интеллекте, компьютерном зрении и создании сообществ. 

В первой панели выступили Гленн Джочер, Цзин Цю (ключевая фигура в разработке моделей YOLO в Ultralytics) и Ао Ванг из Университета Цинхуа, соавтор YOLOv10. Участники дискуссии обсудили последние достижения в области генеративного ИИ и компьютерного зрения, обратив внимание на их сходства, различия и влияние каждой области на другую. Несмотря на недавнее развитие больших языковых моделей (LLM), участники дискуссии отметили, что традиционное компьютерное зрение по-прежнему необходимо для решения специфических задач в таких отраслях, как здравоохранение

Следующая панель была посвящена проблемам, с которыми сталкиваются женщины в сфере AI-лидерства: Директор по росту Ultralytics Пола Дерренгер, бывший CPO и COO в SaaS Бруна де Гимарайнш, руководитель отделения Latinas in Tech Madrid Мариана Эрнандес и основательница Dare to Data Кристина Статопулос поделились своим опытом, обсудив важность наставничества и необходимость для женщин предпринимать активные шаги в поисках руководящих ролей. Эрнандес посоветовала: "Будьте проактивны, не ждите, пока все произойдет само собой", и призвала женщин в аудитории заявить о себе и активно искать возможности. Участники дискуссии также обсудили ценность создания более благоприятной рабочей среды.

__wf_reserved_inherit
Рис. 2. Панель, посвященная женщинам в технологиях, слева направо: Кристина Статопулус, Паула Дерренгер, Мариана Эрнандес, Ойсин Лунни, Бруна де Гимарайнш присоединилась удаленно.

На заключительной дискуссии обсуждалось, как создание сильных сообществ может способствовать инновациям в области ИИ. Бурхан Каддуми, Харприт Сахота и Барт Фаррелл обсудили способы взаимодействия с технической аудиторией как в Интернете, так и на очных мероприятиях. Высказывание Фаррелла "Вы должны встретиться с ними там, где они находятся" говорит о важности общения с членами сообщества на их условиях, чтобы стимулировать сотрудничество и совместное обучение.

__wf_reserved_inherit
Рис. 3. Группа экспертов по созданию сообществ, слева направо: Харприт Сахота, Бурхан Каддуми, Барт Фаррелл и Ойсин Лунни.

Реальные примеры инноваций в области искусственного интеллекта в YOLO Vision

Несколько докладов на YV24 пролили свет на то, как модели YOLO применяются для решения реальных задач в различных отраслях. Джим Гриффин, ведущий подкаста AI Master Group, рассказал о проекте, в котором модели YOLOv8 используются для мониторинга перемещения акул вдоль побережья Калифорнии с помощью беспилотников. Система оповещает спасателей, владельцев магазинов для серфинга и родителей, обеспечивая безопасность отдыхающих на пляже благодаря обнаружению акул с высоты 200 футов над океаном. Гриффин объяснил, что настоящей проблемой была не сама модель искусственного интеллекта, а обширные полеты беспилотников и сбор данных, необходимых для обучения модели.

__wf_reserved_inherit
Рис. 4. Джим Гриффин рассказал о том, как YOLOv8 используется для наблюдения за перемещениями акул вдоль побережья Калифорнии с помощью беспилотников.

Дэвид Скотт из The Main Branch также рассказал о расширении сферы применения компьютерного зрения от простого обнаружения объектов до анализа поведения. В его докладе были представлены реальные приложения, такие как отслеживание поведения крупного рогатого скота и выявление подозрительных действий в розничных магазинах. Скотт рассказал о том, как YOLOv8 можно использовать для отслеживания состояния здоровья крупного рогатого скота, анализируя специфическое поведение, такое как прием пищи, питье и ходьба.

Кроме того, особенно проникновенно прозвучал доклад Усмана Умара из NASCO Feeding Minds, в котором он рассказал о том, как его организация меняет жизнь людей, предоставляя ИТ-образование в Гане. Его фонд создал 17 ИКТ-центров, в которых обучаются более 65 000 студентов, с целью создания местных рабочих мест в сфере информационных технологий для решения таких проблем, как нелегальная иммиграция. Мощная история Умара показала, как образование и технологии вместе могут привести к долгосрочным изменениям в малообеспеченных сообществах.

Технологические переговоры: Основные выступления докладчиков YOLO Vision

На YV24 также были представлены различные доклады, посвященные тому, как ИИ и аппаратное обеспечение объединяются, чтобы зародить новые идеи. Эксперты из таких компаний, как Intel, Sony и NVIDIA, рассказали о развертывании моделей YOLO на граничных устройствах и оптимизации производительности. Дмитрий Пастушенков и Адриан Богушевски из Intel рассказали о том, как их аппаратное обеспечение поддерживает модели YOLO в NPU, CPU и GPU, а Амир Серви из Sony и Вэй Танг поделились тем, как YOLO интегрируется с платформой AITRIOS для эффективного развертывания ИИ на грани. Гай Дахан (Guy Dahan ) из NVIDIA рассказал об использовании архитектуры GPU для улучшения вывода моделей YOLO. 

__wf_reserved_inherit
Рис. 5. Гай Дахан рассказывает об оптимизации вывода модели YOLO с помощью архитектуры NVIDIA GPU.

Другие компании, такие как Qualcomm, Hugging Face и Lightning AI, также продемонстрировали, как их платформы облегчают разработчикам интеграцию и развертывание моделей YOLO. Деванг Аггарвал из Qualcomm представил, как такие модели, как YOLOv8, могут быть оптимизированы для устройств Snapdragon с помощью Qualcomm AI Hub.

Павел Лакубовский из Hugging Face также рассказал о том, как их инструменты с открытым исходным кодом позволяют легко интегрировать модели типа YOLOv8 в различные рабочие процессы, а Лука Антига из Lightning AI рассказал, как разработчики могут легко внедрять модели типа YOLOv8 на уровне кода для ускорения создания прототипов и итераций.

Неделя в Мадриде: сетевые сессии YOLO Vision

За неделю до начала YV24 команда Ultralytics собралась в Мадриде, чтобы принять участие в семинарах, совместных встречах и выездных мероприятиях. Эти мероприятия выходили за рамки работы, способствуя укреплению отношений и создавая позитивную атмосферу в преддверии мероприятия. После праздничной вечеринки участники и докладчики получили возможность пообщаться, поделиться ключевыми выводами и обсудить перспективы сотрудничества. Сочетание командной работы и товарищества обеспечило YV24 профессиональный успех и незабываемые впечатления.

__wf_reserved_inherit
Рис. 6. Команда Ultralytics празднует удивительный день на YOLO Vision 2024.

Инновации YOLO Vision AI и то, что ждет нас впереди

YV24 объединил инновации, сотрудничество и взгляд на будущее компьютерного зрения. В ходе презентации YOLO11, интересных панелей и дискуссий об аппаратных и граничных решениях ИИ мероприятие сосредоточилось на том, как ИИ в области компьютерного зрения может изменить мир к лучшему и как меняются технологии, чтобы идти в ногу с развитием ИИ. Мероприятие также способствовало укреплению связей внутри сообщества. Эксперты и энтузиасты делились идеями и исследовали потенциал компьютерного зрения и YOLO. Мероприятие завершилось веселой викториной, в ходе которой разыгрывались толстовки Ultralytics, и все остались в предвкушении новых инноваций, подобных YOLO11, в будущем.

Посетите наш репозиторий GitHub и присоединитесь к нашему процветающему сообществу, чтобы узнать больше об искусственном интеллекте. Узнайте, как Vision AI переосмысливает инновации в таких отраслях, как здравоохранение и сельское хозяйство. 🚀

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена