Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Все, что вам нужно знать об Ultralytics YOLO11 и ее приложениях

Абирами Вина

4 мин чтения

4 октября 2024 г.

Узнайте все о новой модели Ultralytics YOLO11, ее функциях и приложениях в реальном времени в различных отраслях. Мы расскажем вам обо всем, что вам нужно знать.

В понедельник, 30 сентября, Ultralytics официально запустила Ultralytics YOLO11, последнее достижение в области компьютерного зрения, после ее дебюта на ежегодном гибридном мероприятии Ultralytics YOLO Vision 2024 (YV24). Сообщество ИИ взволнованно спешит изучить возможности модели. Благодаря более быстрой обработке, более высокой точности и моделям, оптимизированным как для периферийных устройств, так и для облачного развертывания, YOLO11 переопределяет возможности в приложениях компьютерного зрения в реальном времени.

В интервью основатель и генеральный директор Ultralytics Гленн Джохер поделился: «Мир движется к чистой энергии, но недостаточно быстро. Мы хотим, чтобы наши модели можно было обучать за меньшее количество эпох, с меньшим количеством дополнений и меньшим количеством данных, поэтому мы усердно над этим работаем. Самая маленькая модель обнаружения объектов, YOLO11n, имеет всего 2,6 миллиона параметров — примерно размер JPEG, что действительно безумно. Самая большая модель обнаружения объектов, YOLO11x, имеет около 56 миллионов параметров, и даже это невероятно мало по сравнению с другими моделями. Вы можете обучать их на дешевом графическом процессоре, например, на пятилетнем графическом процессоре Nvidia, просто с энтузиазмом и небольшим количеством кофе».

В этой статье мы подробно рассмотрим YOLO11, изучим ее особенности, улучшения, эталонные показатели производительности и реальные приложения, чтобы помочь вам понять, на что способна эта модель. Давайте начнем!

Понимание YOLO11: Улучшения по сравнению с прошлыми версиями

YOLO11 — это последнее достижение в серии моделей компьютерного зрения YOLO (You Only Look Once), предлагающее значительные улучшения по сравнению с предыдущими версиями, такими как YOLOv5 и YOLOv8. Команда Ultralytics учла отзывы сообщества и передовые исследования, чтобы сделать YOLO11 быстрее, точнее и эффективнее. YOLO11 также поддерживает те же задачи компьютерного зрения, что и YOLOv8, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Фактически, пользователи могут легко переключиться на YOLO11 без необходимости изменять существующие рабочие процессы.

Одной из ключевых особенностей YOLO11 является ее превосходная производительность как по точности, так и по скорости по сравнению с ее предшественниками. Имея на 22% меньше параметров, чем YOLOv8m, YOLO11m достигает более высокого среднего значения точности (mAP) на наборе данных COCO, что означает, что она может обнаруживать объекты более точно и эффективно. С точки зрения скорости обработки YOLO11 превосходит более ранние модели, что делает ее идеальной для приложений реального времени, где критически важны быстрое обнаружение и реагирование и важна каждая миллисекунда.

График сравнительного анализа ниже показывает, как YOLO11 выделяется среди предыдущих моделей. По горизонтальной оси показана средняя точность COCO Box (AP), которая измеряет точность обнаружения объектов. По вертикальной оси отображается задержка с использованием TensorRT10 FP16 на NVIDIA T4 GPU, что указывает на то, как быстро модель обрабатывает данные. 

__wf_reserved_inherit
Рис. 1. YOLO11 предоставляет современные возможности детекции объектов в реальном времени.

Запуск модели YOLO11: варианты с открытым исходным кодом и корпоративные варианты

С запуском Ultralytics YOLO11 Ultralytics расширяет серию YOLO, предлагая как модели с открытым исходным кодом, так и корпоративные модели для удовлетворения растущего спроса в различных отраслях.

__wf_reserved_inherit
Рис. 2. С этим запуском Ultralytics предлагает 30 новых моделей.

YOLO11 включает в себя пять различных размеров моделей: Nano, Small, Medium, Large и X. Пользователи могут выбрать лучшую модель в зависимости от конкретных потребностей своего приложения компьютерного зрения. Пять размеров обеспечивают гибкость при выполнении таких задач, как классификация изображений, обнаружение объектов, сегментация экземпляров, отслеживание, оценка позы и обнаружение объектов с ориентированными ограничивающими рамками (OBB). Для каждого размера существует модель для каждой задачи, в результате чего получается в общей сложности 25 моделей с открытым исходным кодом, которые составляют основу предложений Ultralytics. Эти модели идеально подходят для широкого спектра приложений, от простых задач на периферийных устройствах, где модель YOLO11n предлагает впечатляющую эффективность, до более масштабных приложений, требующих модели YOLO11l и YOLO11x.

Впервые Ultralytics представляет корпоративные модели, что является важной вехой в наших продуктовых предложениях, и мы рады поделиться этими новыми инновациями с нашими пользователями. YOLO11 представляет пять запатентованных моделей, разработанных специально для коммерческого использования. Эти корпоративные модели, которые будут доступны в следующем месяце, обучены на новом запатентованном наборе данных Ultralytics, состоящем из более чем 1 миллиона изображений, что обеспечивает более надежные предварительно обученные модели. Они разработаны для требовательных реальных приложений, таких как анализ медицинских изображений и обработка спутниковых изображений, где решающее значение имеет точное обнаружение объектов.

Изучение функций YOLO11 нового поколения

Теперь, когда мы обсудили, что предлагает YOLO11, давайте посмотрим, что делает YOLO11 таким особенным.

Одной из ключевых задач при разработке YOLO11 был поиск правильного баланса между конкурирующими приоритетами: уменьшением размера моделей, повышением их скорости и точности. Как объяснил Гленн Джохер, основатель и генеральный директор Ultralytics: «Работа над исследованиями и разработками YOLO действительно сложна, потому что вы хотите двигаться в трех разных направлениях: вы хотите уменьшить размер моделей, вы хотите, чтобы они стали более точными, но вы также хотите, чтобы они работали быстрее на разных платформах, таких как ЦП и ГП. Все это конкурирующие интересы, поэтому вам приходится идти на компромиссы и выбирать, где вносить изменения». Несмотря на эти проблемы, YOLO11 достигает впечатляющего баланса, обеспечивая как скорость, так и повышение точности по сравнению с предыдущими версиями, такими как YOLOv8.

__wf_reserved_inherit
Рис. 3. Пример использования YOLO11 для обнаружения объектов.

YOLO11 предлагает значительные улучшения, такие как улучшенное извлечение признаков благодаря переработанной архитектуре backbone и neck, что приводит к более точному обнаружению объектов. Модель также оптимизирована для скорости и эффективности, обеспечивая более быстрое время обработки при сохранении высокой точности. В дополнение к этим преимуществам, YOLO11 обладает высокой адаптивностью в различных средах, бесперебойно работая на периферийных устройствах, облачных платформах и системах, использующих графические процессоры NVIDIA. Эта адаптивность делает его идеальным выбором для пользователей, которым требуются гибкие варианты развертывания на различных аппаратных конфигурациях, от мобильных устройств до крупномасштабных серверов.

Приложения YOLO11 в реальном времени

Универсальность YOLO11 делает ее надежным инструментом во многих отраслях, особенно при работе со сложными вариантами использования. Например, она безупречно работает на периферийных устройствах и может использоваться для приложений, требующих анализа в реальном времени в средах с ограниченной вычислительной мощностью. Отличным примером этого является автономное вождение, где транспортным средствам необходимо принимать решения за доли секунды, чтобы обеспечить безопасность всех участников движения. YOLO11 помогает обнаруживать и анализировать объекты на дороге, такие как пешеходы или другие автомобили, даже в сложных условиях, таких как слабое освещение или когда объекты частично скрыты. Быстрое и точное обнаружение помогает предотвратить несчастные случаи и гарантирует, что автомобили с автоматическим управлением могут безопасно перемещаться.

__wf_reserved_inherit
Рис. 4. Гленн Джохер на сцене YV24 рассказывает о применении YOLO11.

Еще один интересный пример возможностей YOLO11 — это ее способность обрабатывать ориентированные ограничивающие рамки (OBB). Это важно для обнаружения объектов, которые не идеально выровнены. Обнаружение объектов OBB — это функция, которая особенно полезна в таких отраслях, как сельское хозяйство, картография и наблюдение, где изображения часто содержат повернутые объекты, такие как посевы или здания на аэрофотоснимках или спутниковых снимках. В отличие от традиционных моделей, YOLO11 может идентифицировать объекты под любым углом и обеспечивать гораздо более точные результаты для задач, требующих точности.

YOLO11 для AI-разработчиков: Попробуйте сами

Начать работу с YOLO11 просто и доступно, независимо от того, предпочитаете ли вы кодирование или вариант без кода. Для работы с YOLO11 через код вы можете использовать пакет Ultralytics Python для легкого обучения и развертывания моделей. Если вы предпочитаете подход без кода, Ultralytics HUB позволяет вам опробовать YOLO11 всего за несколько кликов.

Пошаговое руководство по коду YOLO11

Чтобы использовать YOLO11 с Python, вам сначала необходимо установить пакет Ultralytics. В зависимости от ваших предпочтений, вы можете сделать это с помощью pip, conda или Docker. Подробные инструкции и рекомендации, связанные с процессом установки, можно найти в нашем Руководстве по установке Ultralytics. Если при установке необходимых пакетов для YOLO11 у вас возникнут какие-либо трудности, обратитесь к нашему Руководству по распространенным проблемам для поиска решений и советов.

После установки пакета Ultralytics использовать YOLO11 очень просто. Следующий фрагмент кода проведет вас через процесс загрузки модели, ее обучения, тестирования ее производительности и экспорта в формат ONNX. Для получения более подробных примеров и расширенного использования обязательно обратитесь к официальной документации Ultralytics, где вы найдете подробные руководства и лучшие практики для максимального использования YOLO11.

__wf_reserved_inherit
Рис. 5. Использование YOLO11 через пакет Ultralytics. 

Для пользователей, предпочитающих подход без кода, Ultralytics HUB предоставляет простой способ обучения и развертывания моделей YOLO11 всего несколькими щелчками мыши. Чтобы начать работу с HUB, просто создайте учетную запись на платформе Ultralytics HUB, и вы сможете начать обучение и управление своими моделями через интуитивно понятный интерфейс.

YOLO11: формируя будущее Vision AI

AI-сообщество постоянно продвигает область компьютерного зрения, стремясь разрабатывать более быстрые и точные модели для реальных приложений. Ultralytics YOLO11 является важной вехой в этих усилиях, обеспечивая улучшенную скорость, точность и гибкость. Она разработана для приложений реального времени и периферийных вычислений, что делает ее идеальной для таких отраслей, как здравоохранение и автономное вождение. Независимо от того, используете ли вы Python-пакет Ultralytics или no-code платформу Ultralytics Hub, YOLO11 упрощает сложные задачи Vision AI. Она предоставляет мощные возможности компьютерного зрения, что делает ее отличным выбором для разработчиков и бизнеса.

Посетите наш репозиторий GitHub и присоединяйтесь к нашему активному сообществу, чтобы узнать больше об ИИ. Узнайте, как Vision AI стимулирует инновации в таких секторах, как здравоохранение и сельское хозяйство.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена