Изучите основные моменты ежегодного мероприятия Ultralytics и переживите гибридный опыт YOLO Vision. Мы расскажем о запуске Ultralytics YOLO11, интересных панельных дискуссиях и многом другом.
Изучите основные моменты ежегодного мероприятия Ultralytics и переживите гибридный опыт YOLO Vision. Мы расскажем о запуске Ultralytics YOLO11, интересных панельных дискуссиях и многом другом.
27 сентября Ultralytics собрала сообщество ИИ и компьютерного зрения на нашем захватывающем ежегодном гибридном мероприятии YOLO Vision 2024 (YV24). Мероприятие, проходившее в кампусе Google for Startups в Мадриде и транслировавшееся по всему миру, собрало экспертов, разработчиков и энтузиастов для обсуждения последних достижений в области Vision AI, таких как новая модель Ultralytics YOLO11. Прямая трансляция мероприятия уже набрала более 5400 просмотров, более 10 600 показов и 469,5 часов просмотра, привлекая новаторов со всего мира.
YV24 начался с теплого приветствия от нашего ведущего, Ойсина Ланни, который подчеркнул важность сообщества и связей, сказав: "Я твердо верю в силу великих идей и великих сообществ, и то, что Ultralytics создала с помощью YOLO Vision, является именно этим - великим сообществом великих людей с великими идеями".
В этой статье мы выделим основные моменты YOLO Vision 2024, начиная с увлекательных панельных дискуссий и заканчивая захватывающими реальными примерами использования компьютерного зрения. Мы также рассмотрим технические доклады, начиная от периферийного ИИ и заканчивая аппаратным ускорением, а также моменты налаживания связей и создания сообщества, которые сделали это мероприятие успешным. Если вы интересуетесь инновациями в области ИИ, ключевыми анонсами или будущим Vision AI, этот отчет о мероприятии YOLO Vision 2024 охватывает все основные выводы!
Запуск продукта, который был анонсирован перед YOLO Vision 2024, был наконец представлен во время вступительного доклада Гленна Джохера, основателя и генерального директора Ultralytics. Гленн представил Ultralytics YOLO11, ознаменовав следующее поколение моделей компьютерного зрения, которые находились в разработке в течение нескольких месяцев. Добавляя волнения к запуску, Гленн позже дал интервью на The Ravit Show и поделился своими мыслями о разработке YOLO11.
В своем основном докладе Гленн также поделился историей пути компании, начиная со своего опыта в физике элементарных частиц и тем, как его увлечение пониманием Вселенной в конечном итоге привело его к машинному обучению и компьютерному зрению.

Он объяснил, что его ранняя работа в физике, где исследователи анализировали взаимодействие частиц, была похожа на обнаружение объектов в компьютерном зрении. Его любопытство и стремление работать с передовыми технологиями в конечном итоге привели к созданию Ultralytics YOLOv5. В ходе своего выступления Гленн подчеркнул важность сотрудничества и вклада в сообщество открытого исходного кода, а также поблагодарил разработчиков со всего мира, которые предоставили отзывы и помогли улучшить YOLOv5 и Ultralytics YOLOv8 с течением времени.
Затем он представил ключевые особенности Ultralytics YOLO11 и объяснил, что она быстрее, точнее и эффективнее предыдущих моделей. Фактически, YOLO11m использует на 22% меньше параметров, чем YOLOv8m, но при этом обеспечивает лучшую точность на наборе данных COCO, что делает YOLO11 идеальной для приложений реального времени, где скорость и точность имеют основополагающее значение.
Гленн подчеркнул масштаб запуска, сказав: "Всего мы запускаем 30 моделей, 25 из которых имеют открытый исходный код, с пятью различными размерами для пяти различных задач. Эти задачи: классификация изображений, обнаружение объектов, сегментация экземпляров, оценка позы и ориентированные ограничивающие рамки." Что касается корпоративного сектора, он объявил, что в следующем месяце будут доступны надежные модели, обученные на проприетарном наборе данных из 1 миллиона изображений. Само собой разумеется, это объявление дало отличный старт мероприятию, оставив участников полными желания узнать больше о потенциале YOLO11 для инноваций в таких областях, как производство и автомобили с автоматическим управлением.
Панельные дискуссии, модерируемые Оисином Ланни, на YOLO Vision 2024 предоставили ряд идей об ИИ, компьютерном зрении и построении сообщества.
В первой панели приняли участие Гленн Джохер, Цзин Цю (ключевая фигура в разработке моделей YOLO в Ultralytics) и Ао Ван из Университета Цинхуа, соавтор YOLOv10. На панели обсуждались последние разработки в области генеративного ИИ и компьютерного зрения, с акцентом на их сходства, различия и влияние каждой области друг на друга. Несмотря на недавний рост больших языковых моделей (LLM), участники дискуссии отметили, что традиционное компьютерное зрение по-прежнему необходимо для решения конкретных задач в таких отраслях, как здравоохранение.
Следующая панельная дискуссия была посвящена проблемам, с которыми сталкиваются женщины на руководящих должностях в сфере ИИ, со спикерами: директором по развитию Ultralytics Полой Дерренгер, бывшим CPO и COO в SaaS Бруной де Гимарайнш, руководителем отделения Latinas in Tech в Мадриде Марианой Эрнандес и основателем Dare to Data Кристиной Статопулус, которые поделились своим опытом, обсуждая важность наставничества и необходимость для женщин предпринимать активные шаги в поиске руководящих ролей. Эрнандес посоветовала: "Будьте активны, не ждите, пока что-то произойдет для вас", и призвала женщин в аудитории проявлять себя и активно искать возможности. На панели также обсуждалась ценность создания более благоприятной рабочей среды.

На заключительной панели обсудили, как создание сильных сообществ может способствовать инновациям в области ИИ. Бурхан Каддуми, Харприт Сахота и Барт Фаррелл обсудили способы взаимодействия с технической аудиторией, как онлайн, так и на мероприятиях. Инсайт Фаррелла: "Нужно встречать людей там, где они находятся", подчеркнул важность взаимодействия с членами сообщества на их условиях для стимулирования сотрудничества и обмена знаниями.

Несколько докладов на YV24 пролили свет на то, как модели YOLO применяются для решения реальных задач в различных отраслях. Джим Гриффин, ведущий подкаста AI Master Group, рассказал о проекте, в котором используются модели YOLOv8 для мониторинга передвижения акул вдоль побережья Калифорнии с помощью наблюдения с дронов. Система оповещает спасателей, владельцев магазинов для серфинга и родителей, обеспечивая безопасность отдыхающих на пляже, обнаруживая акул с высоты 200 футов над океаном. Гриффин объяснил, что настоящая проблема заключалась не в самой модели ИИ, а в обширных полетах дронов и сборе данных, необходимых для обучения модели.

Аналогично, Дэвид Скотт из The Main Branch рассказал о расширении области применения компьютерного зрения от простого обнаружения объектов до анализа поведения. В его докладе были представлены реальные примеры использования, такие как отслеживание поведения крупного рогатого скота и выявление подозрительной деятельности в розничных магазинах. Скотт поделился информацией о том, как YOLOv8 можно использовать для мониторинга здоровья скота путем анализа конкретных моделей поведения, таких как прием пищи, питье и ходьба.
Кроме того, особенно трогательным было основное выступление Усмана Умара из NASCO Feeding Minds, где он рассказал о том, как его организация меняет жизни людей, предоставляя IT-образование в Гане. Его фонд создал 17 ИКТ-центров, обучив более 65 000 студентов, с целью создания местных рабочих мест в сфере технологий для решения таких проблем, как нелегальная иммиграция. Поучительная история Умара показала, как образование и технологии вместе могут привести к долгосрочным изменениям в малообеспеченных сообществах.
На YV24 также были представлены различные доклады, посвященные объединению искусственного интеллекта и аппаратного обеспечения для стимулирования новых идей. Эксперты из таких компаний, как Intel, Sony и NVIDIA, рассказали о развертывании моделей YOLO на периферийных устройствах и оптимизации производительности. Дмитрий Пастушенков и Адриан Богушевский из Intel рассказали о том, как их оборудование поддерживает модели YOLO на NPU, CPU и GPU, а Амир Серви и Вэй Тан из Sony поделились информацией о том, как YOLO интегрируется с платформой AITRIOS для эффективного развертывания периферийного ИИ. Гай Дахан из NVIDIA рассказал об использовании их архитектуры GPU для улучшения инференса моделей YOLO.

Другие компании, такие как Qualcomm, Hugging Face и Lightning AI, также продемонстрировали, как их платформы упрощают разработчикам интеграцию и развертывание моделей YOLO. Devang Aggarwal из Qualcomm рассказал о том, как модели, такие как YOLOv8, можно оптимизировать для устройств Snapdragon через Qualcomm AI Hub.
Аналогично, Павел Якубовский из Hugging Face рассказал о том, как их инструменты с открытым исходным кодом обеспечивают бесшовную интеграцию моделей, таких как YOLOv8, в различные рабочие процессы, а Лука Антига из Lightning AI показал, как разработчики могут легко интегрировать модели, такие как YOLOv8, на уровне кода для более быстрого прототипирования и итераций.
За неделю до YV24 команда Ultralytics собралась в Мадриде для участия в семинарах, совместных встречах и выездных мероприятиях. Эти мероприятия выходили за рамки работы, укрепляя отношения и создавая позитивную атмосферу в преддверии мероприятия. Завершаясь праздничной вечеринкой, участники и докладчики имели возможность пообщаться, поделиться ключевыми выводами и изучить возможности будущего сотрудничества. Сочетание командной работы и духа товарищества сделало YV24 профессиональным успехом и незабываемым опытом во всех отношениях.

YV24 объединил инновации, сотрудничество и взгляд в будущее компьютерного зрения. Благодаря запуску YOLO11, интересным панельным дискуссиям и обсуждениям об аппаратном обеспечении для ИИ и периферийных решениях, мероприятие было сосредоточено на том, как Vision AI может изменить ситуацию и как технологии меняются, чтобы не отставать от достижений в области ИИ. Это также укрепило связи внутри сообщества. Эксперты и энтузиасты обменивались идеями и изучали потенциал компьютерного зрения и YOLO. Мероприятие завершилось веселой викториной, где можно было выиграть толстовки Ultralytics, что оставило у всех восторженное предвкушение новых инноваций, таких как YOLO11, в будущем.
Посетите наш репозиторий на GitHub и присоединяйтесь к нашему активному сообществу, чтобы узнать больше об ИИ. Узнайте, как Vision AI меняет инновации в таких секторах, как здравоохранение и сельское хозяйство. 🚀