Ultralytics YOLO11 для устройств Apple через CoreML

После того как Apple представила такие функции, как Apple Intelligence, стало ясно, что искусственный интеллект на устройстве становится центральной частью того, как мы используем наши телефоны. Для разработчиков этот сдвиг означает, что пользователи принимают приложения для iOS , которые используют такие возможности, как компьютерное зрение, для обеспечения более умного и отзывчивого опыта.

Компьютерное зрение - это вид искусственного интеллекта (ИИ), который позволяет компьютерам понимать и анализировать визуальную информацию, например, изображения или видео. На мобильных устройствах он может использоваться в режиме реального времени для detect, classify и взаимодействия с объектами через камеру телефона. Модели визуального ИИ, такие как Ultralytics YOLO11 могут быть настроены на распознавание конкретных объектов в зависимости от потребностей вашего приложения.

Однако YOLO11 не предназначен для работы на iOS прямо из коробки. Чтобы развернуть YOLO11 на iPhone или других устройствах Apple, особенно для автономного использования, его необходимо преобразовать в формат, оптимизированный для экосистемы Apple.

Именно для решения таких проблем и был создан CoreML . CoreML - это фреймворк Apple для машинного обучения, созданный для локального запуска моделей и беспрепятственной интеграции в приложения для iOS и macOS. ИнтеграцияCoreML , поддерживаемая Ultralytics, позволяет легко экспортировать модель для локального развертывания на iPhone.

В этой статье мы подробно рассмотрим, как экспортировать модель YOLO11 в формат CoreML . Мы также рассмотрим примеры использования в реальном времени, которые демонстрируют преимущества запуска моделей компьютерного зрения непосредственно на iOS . Давайте начнем!

Что такое CoreML?

CoreML - это фреймворк машинного обучения (ML), разработанный компанией Apple, который позволяет разработчикам интегрировать обученные ML-модели непосредственно в приложения в экосистеме Apple, включая iOS (iPhone и iPad), macOS (Mac), watchOS (Apple Watch) и tvOS (Apple TV). Она призвана сделать машинное обучение доступным и эффективным на устройствах Apple, позволяя запускать модели непосредственно на устройстве, не требуя подключения к Интернету.

В основе CoreML лежит унифицированный формат моделей, поддерживающий широкий спектр задач ИИ, таких как классификация изображений, распознавание объектов, распознавание речи и обработка естественного языка. Фреймворк оптимизирован для максимально эффективного использования аппаратного обеспечения Apple, используя CPU (центральный процессор), GPU (графический процессор) и ANE (Apple Neural Engine) для быстрого и эффективного выполнения моделей.

CoreML поддерживает множество типов моделей и совместим с популярными библиотеками машинного обучения, включая TensorFlow, PyTorch, scikit-learn, XGBoost и LibSVM. Таким образом, разработчикам становится проще внедрять расширенные возможности ML в повседневные приложения, обеспечивая их бесперебойную работу на устройствах Apple.

Рис. 1. CoreML поддерживает модели из других популярных фреймворков ИИ(Источник).

‍

Ключевые особенности CoreML

Вот некоторые ключевые особенности, которые делают CoreML надежным инструментом для интеграции искусственного интеллекта в приложения Apple:

Оптимизация модели: CoreML поддерживает такие методы сжатия, как квантование и обрезка, для уменьшения размера модели и повышения эффективности во время выполнения.
Персонализация на устройстве: ML-фреймворк Apple поддерживает персонализацию на устройстве, позволяя обучать и обновлять модели локально на основе взаимодействия с пользователем.
Асинхронные прогнозы: Эта структура позволяет вашему приложению выполнять прогнозы в фоновом режиме, обеспечивая плавность и отзывчивость пользовательского интерфейса при обработке задач ИИ.
Многозадачное обучение: CoreML поддерживает модели, которые могут выполнять несколько задач одновременно, например, обнаруживать объекты и распознавать текст на одном и том же изображении.

Как экспортировать YOLO11 в формат CoreML

Теперь, когда мы лучше понимаем фреймворк CoreML , давайте рассмотрим, как использовать интеграцию CoreML , поддерживаемую Ultralytics , для экспорта модели YOLO11 в формат CoreML .

Шаг 1: Настройка окружения

Чтобы получить доступ к функциям интеграции, предоставляемым Ultralytics, начните с установки пакетаUltralytics Python . Это легкая и простая в использовании библиотека, которая упрощает такие задачи, как обучение, оценка, прогнозирование и экспорт моделей Ultralytics YOLO .

Вы можете установить пакет Ultralytics Python , выполнив команду "pip install ultralytics" в командном терминале. Если вы используете такую среду, как Jupyter Notebook или Google Colab, включите восклицательный знак (!) перед командой: "!pip install ultralytics".

Если у вас возникли проблемы при установке или экспорте в CoreML, обратитесь за помощью к официальной документации Ultralytics или руководству по общим проблемам.

Шаг 2: Экспорт YOLO11 в CoreML

После успешной установки пакета вы можете загрузить модель YOLO11 и конвертировать ее в формат CoreML .

Если вы не уверены, какую предварительно обученную модель YOLO11 использовать, вы можете изучить ряд моделей, поддерживаемых Ultralytics. Каждая из них предлагает различный баланс скорости, размера и точности, и вы можете выбрать наиболее подходящую для вашего проекта. Вы также можете использовать пользовательскую модель YOLO11 , если вы обучали ее на своем собственном наборе данных.

В приведенном ниже фрагменте кода используется предварительно обученный файл модели YOLO11 с именем "yolo11n.pt". В процессе экспорта он преобразуется в пакет CoreML под названием "yolo11n.mlpackage".

Модель "yolo11n" – это нано-версия, оптимизированная для скорости и низкого потребления ресурсов. В зависимости от потребностей вашего проекта вы также можете выбрать другие размеры моделей, такие как "s" для малых, "m" для средних, "l" для больших или "x" для очень больших. Каждая версия предлагает различный баланс между производительностью и точностью.

‍

from ultralytics import YOLO model = YOLO("yolo11n.pt") model.export(format="coreml")

‍

Шаг 3: Проведение расчетов с использованием экспортированной модели CoreML

После экспорта в формат CoreML YOLO11 можно легко интегрировать в приложения для iOS , что позволяет решать задачи компьютерного зрения в реальном времени, такие как обнаружение объектов, на таких устройствах, как iPhone, iPad и Mac.

Например, приведенный ниже фрагмент кода демонстрирует, как загрузить экспортированную модель CoreML и выполнить вывод. Вывод - это процесс использования обученной модели для предсказаний на новых данных. В данном случае модель анализирует изображение семьи, играющей с мячом.

‍

coreml_model = YOLO("yolo11n.mlpackage") results = coreml_model("https://images.pexels.com/photos/4933841/pexels-photo-4933841.jpeg", save=True)

‍

После выполнения кода выходное изображение будет сохранено в папке "detect".

Рис. 2. Использование экспортированной модели YOLO11 в формате CoreML для detect объектов. Изображение автора.

‍

Где можно использовать экспортированные модели CoreML ?

Экспорт YOLO11 в CoreML обеспечивает гибкость при создании разнообразных приложений для компьютерного зрения, которые могут эффективно работать на iPhone, iPad и Mac. Далее рассмотрим несколько реальных сценариев, в которых эта интеграция может быть особенно полезна.

Дополненная реальность и игровые приложения на основе моделей CoreML

Дополненная реальность (AR) сочетает цифровой контент с реальным миром, накладывая виртуальные элементы на изображения с камеры в реальном времени. Она становится ключевой частью мобильных игр, создавая более интерактивные и захватывающие впечатления.

С помощью YOLO11 , экспортированного в формат CoreML , разработчики iOS могут создавать AR-игры, которые распознают реальные объекты, такие как скамейки, деревья или знаки, с помощью камеры телефона. Затем игра может наложить виртуальные предметы, такие как монеты, подсказки или существа, поверх этих объектов, чтобы улучшить окружение игрока.

Для этого используются функции обнаружения и отслеживания объектов. YOLO11 обнаруживает и идентифицирует объекты в режиме реального времени, а трекинг удерживает эти объекты в поле зрения при движении камеры, обеспечивая соответствие виртуальных элементов реальному миру.

Игроки могут наводить свои телефоны, исследовать окружающую среду и взаимодействовать с тем, что они видят, чтобы собирать предметы или выполнять быстрые задания. Все это может работать непосредственно на устройстве без необходимости подключения к Интернету, что делает взаимодействие плавным и увлекательным.

Приложения для iOS , интегрированные с моделями CoreML для ANPR в режиме реального времени

Автоматическое распознавание номерных знаков (ANPR) - это приложение компьютерного зрения, используемое для detect и считывания номерных знаков автомобилей. Оно широко используется в системах безопасности, мониторинга дорожного движения и контроля доступа. Благодаря CoreML и таким моделям, как YOLO11, ANPR теперь может эффективно работать на устройствах iOS .

Наличие приложения ANPR на вашем iPhone может быть особенно полезным в средах, ориентированных на безопасность. Например, оно может помочь командам быстро определить, разрешено ли транспортному средству въезжать в запретную зону или нет.

Такое приложение может использовать модель искусственного интеллекта Vision AI, например YOLO11, интегрированную через CoreML, для detect автомобилей и определения местоположения их номерных знаков в режиме реального времени с помощью камеры устройства. После обнаружения номерного знака технология оптического распознавания символов (OCR) считывает его. Затем приложение может сравнить этот номер с локальной или облачной базой данных, чтобы проверить доступ или отметить неавторизованные автомобили.

Рис. 3. ИИ может использоваться для detect и считывания номерных знаков.(Источник).

‍

Приложения, ориентированные на доступность, могут использовать модели CoreML

ИИ оказал огромное влияние на доступность, помогая преодолеть барьеры для людей с нарушениями зрения. С помощью таких инструментов, как CoreML , и моделей компьютерного зрения, таких как YOLO11, разработчики могут создавать приложения для iOS , которые описывают окружающий мир в реальном времени, делая повседневные задачи более простыми и независимыми.

Например, человек с ослабленным зрением может направить камеру своего iPhone на окружающую среду. Приложение использует обнаружение объектов для распознавания ключевых элементов, таких как транспортные средства, люди или дорожные знаки, и рассказывает, что видит. Это можно использовать в таких ситуациях, как навигация по оживленной улице или понимание чрезвычайной ситуации.

Рис. 4. Пример использования YOLO11 для detect людей

‍

Основные выводы

Экспорт YOLO11 в формат CoreML создает новые возможности для приложений реального времени, включая автономное обнаружение объектов на устройствах iOS . Эта комбинация позволяет разработчикам создавать интеллектуальные, эффективные и ориентированные на конфиденциальность приложения, работающие исключительно на устройстве, - от сельского хозяйства и безопасности до доступности.

Всего за несколько простых шагов вы можете преобразовать модель YOLO11 и добавить надежные функции компьютерного зрения в iPhone. Самое главное, что это работает без подключения к Интернету. В целом, интеграция CoreML привносит мощь передового ИИ в повседневные мобильные приложения, делая их быстрее, отзывчивее и готовыми к работе в любом месте.

Хотите узнать больше об ИИ? Изучите наш репозиторий на GitHub, присоединяйтесь к нашему сообществу и ознакомьтесь с нашими вариантами лицензирования, чтобы дать старт своему проекту в области компьютерного зрения. Узнайте, как инновации, такие как ИИ в розничной торговле и компьютерное зрение в логистике, формируют будущее на страницах с нашими решениями.

Передача Ultralytics YOLO11 на устройства Apple с помощью CoreML

Что такое CoreML?

Ключевые особенности CoreML

Как экспортировать YOLO11 в формат CoreML

Шаг 1: Настройка окружения

Шаг 2: Экспорт YOLO11 в CoreML

Шаг 3: Проведение расчетов с использованием экспортированной модели CoreML

Где можно использовать экспортированные модели CoreML ?

Дополненная реальность и игровые приложения на основе моделей CoreML

Приложения для iOS , интегрированные с моделями CoreML для ANPR в режиме реального времени

Приложения, ориентированные на доступность, могут использовать модели CoreML

Основные выводы

Читать больше в этой категории

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Автоматизация управления дорожными происшествиями с помощью Ultralytics

Изучаем, почему Ultralytics проще внедрить в производство!

Давайте строить будущее
ИИ вместе!

Передача Ultralytics YOLO11 на устройства Apple с помощью CoreML

Что такое CoreML?

Ключевые особенности CoreML

Как экспортировать YOLO11 в формат CoreML

Шаг 1: Настройка окружения

Шаг 2: Экспорт YOLO11 в CoreML

Шаг 3: Проведение расчетов с использованием экспортированной модели CoreML

Где можно использовать экспортированные модели CoreML ?

Дополненная реальность и игровые приложения на основе моделей CoreML

Приложения для iOS , интегрированные с моделями CoreML для ANPR в режиме реального времени

Приложения, ориентированные на доступность, могут использовать модели CoreML

Основные выводы

Читать больше в этой категории

Обзор использованияYOLO Ultralytics YOLO для обнаружения угроз с помощью искусственного интеллекта

Автоматизация управления дорожными происшествиями с помощью Ultralytics

Изучаем, почему Ultralytics проще внедрить в производство!

Давайте строить будущее ИИ вместе!

Давайте строить будущее
ИИ вместе!