Передача Ultralytics YOLO11 на устройства Apple с помощью CoreML

Абирами Вина

4 мин. чтения

30 июля 2025 года

Узнайте, как легко перенести Ultralytics YOLO11 на устройства Apple с помощью CoreML и обеспечить быстрое выполнение автономных задач компьютерного зрения в приложениях для iOS в режиме реального времени.

После того как Apple представила такие функции, как Apple Intelligence, стало ясно, что искусственный интеллект на устройстве становится центральной частью того, как мы используем наши телефоны. Для разработчиков этот сдвиг означает, что пользователи принимают приложения для iOS, которые используют такие возможности, как компьютерное зрение, для обеспечения более умного и отзывчивого опыта.

Компьютерное зрение - это вид искусственного интеллекта (ИИ), который позволяет компьютерам понимать и анализировать визуальную информацию, например, изображения или видео. На мобильных устройствах он может использоваться в режиме реального времени для обнаружения, классификации и взаимодействия с объектами через камеру телефона. Модели искусственного интеллекта, подобные Ultralytics YOLO11, могут быть настроены на распознавание конкретных объектов в зависимости от потребностей вашего приложения. 

Однако YOLO11 не предназначен для работы на iOS прямо из коробки. Чтобы развернуть YOLO11 на iPhone или других устройствах Apple, особенно для автономного использования, его необходимо преобразовать в формат, оптимизированный для экосистемы Apple. 

Именно для решения таких проблем и был создан CoreML. CoreML - это фреймворк Apple для машинного обучения, созданный для локального запуска моделей и беспрепятственной интеграции в приложения для iOS и macOS. Интеграция CoreML, поддерживаемая Ultralytics, позволяет легко экспортировать модель для локального развертывания на iPhone.

В этой статье мы подробно рассмотрим, как экспортировать модель YOLO11 в формат CoreML. Мы также рассмотрим примеры использования в реальном времени, которые демонстрируют преимущества запуска моделей компьютерного зрения непосредственно на iOS-устройствах. Давайте начнем!

Что такое CoreML?

CoreML - это фреймворк машинного обучения (ML), разработанный компанией Apple, который позволяет разработчикам интегрировать обученные ML-модели непосредственно в приложения в экосистеме Apple, включая iOS (iPhone и iPad), macOS (Mac), watchOS (Apple Watch) и tvOS (Apple TV). Она призвана сделать машинное обучение доступным и эффективным на устройствах Apple, позволяя запускать модели непосредственно на устройстве, не требуя подключения к Интернету.

В основе CoreML лежит унифицированный формат моделей, поддерживающий широкий спектр задач ИИ, таких как классификация изображений, распознавание объектов, распознавание речи и обработка естественного языка. Фреймворк оптимизирован для максимально эффективного использования аппаратного обеспечения Apple, используя CPU (центральный процессор), GPU (графический процессор) и ANE (Apple Neural Engine) для быстрого и эффективного выполнения моделей.

CoreML поддерживает множество типов моделей и совместим с популярными библиотеками машинного обучения, включая TensorFlow, PyTorch, scikit-learn, XGBoost и LibSVM. Таким образом, разработчикам становится проще внедрять расширенные возможности ML в повседневные приложения, обеспечивая их бесперебойную работу на устройствах Apple.

Рис. 1. CoreML поддерживает модели из других популярных фреймворков ИИ(Источник).

Ключевые особенности CoreML

Вот некоторые ключевые особенности, которые делают CoreML надежным инструментом для интеграции искусственного интеллекта в приложения Apple:

  • Оптимизация модели: CoreML поддерживает такие методы сжатия, как квантование и обрезка, для уменьшения размера модели и повышения эффективности во время выполнения.
  • Персонализация на устройстве: Система ML от Apple поддерживает персонализацию на устройстве, позволяя обучать и обновлять модели локально, основываясь на взаимодействии с пользователем.
  • Асинхронные предсказания: Этот фреймворк позволяет вашему приложению выполнять предсказания в фоновом режиме, сохраняя плавность и отзывчивость пользовательского интерфейса при выполнении задач искусственного интеллекта.
  • Многозадачное обучение: CoreML поддерживает модели, которые могут выполнять несколько задач одновременно, например, обнаруживать объекты и распознавать текст на одном и том же изображении.

Как экспортировать YOLO11 в формат CoreML

Теперь, когда мы лучше понимаем фреймворк CoreML, давайте рассмотрим, как использовать интеграцию CoreML, поддерживаемую Ultralytics, для экспорта модели YOLO11 в формат CoreML.

Шаг 1: Настройка среды

Чтобы получить доступ к интеграционным функциям, предоставляемым Ultralytics, начните с установки пакета Ultralytics Python. Это легкая и простая в использовании библиотека, которая упрощает такие задачи, как обучение, оценка, прогнозирование и экспорт моделей Ultralytics YOLO.

Вы можете установить пакет Ultralytics Python, выполнив команду "pip install ultralytics" в командном терминале. Если вы используете такую среду, как Jupyter Notebook или Google Colab, включите восклицательный знак (!) перед командой: "!pip install ultralytics".

Если у вас возникли проблемы при установке или экспорте в CoreML, обратитесь за помощью к официальной документации Ultralytics или руководству по общим проблемам.

Шаг 2: Экспорт YOLO11 в CoreML

После успешной установки пакета вы можете загрузить модель YOLO11 и конвертировать ее в формат CoreML.

Если вы не уверены, какую предварительно обученную модель YOLO11 использовать, вы можете изучить ряд моделей, поддерживаемых Ultralytics. Каждая из них предлагает различный баланс скорости, размера и точности, и вы можете выбрать наиболее подходящую для вашего проекта. Вы также можете использовать пользовательскую модель YOLO11, если вы обучали ее на своем собственном наборе данных.

В приведенном ниже фрагменте кода используется предварительно обученный файл модели YOLO11 с именем "yolo11n.pt". В процессе экспорта он преобразуется в пакет CoreML под названием "yolo11n.mlpackage".

Модель "yolo11n" - это нано-версия, оптимизированная для скорости и низкого потребления ресурсов. В зависимости от потребностей вашего проекта вы можете выбрать и другие размеры модели, такие как "s" для маленькой, "m" для средней, "l" для большой или "x" для сверхбольшой. Каждая версия предлагает свой баланс между производительностью и точностью.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

model.export(format="coreml")

Шаг 3: Проведение расчетов с использованием экспортированной модели CoreML

После экспорта в формат CoreML YOLO11 можно легко интегрировать в приложения для iOS, что позволяет решать задачи компьютерного зрения в реальном времени, такие как обнаружение объектов, на таких устройствах, как iPhone, iPad и Mac.

Например, приведенный ниже фрагмент кода демонстрирует, как загрузить экспортированную модель CoreML и выполнить вывод. Вывод - это процесс использования обученной модели для предсказаний на новых данных. В данном случае модель анализирует изображение семьи, играющей с мячом.

coreml_model = YOLO("yolo11n.mlpackage")

results = coreml_model("https://images.pexels.com/photos/4933841/pexels-photo-4933841.jpeg", save=True)

После выполнения кода выходное изображение будет сохранено в папке "runs/detect/predict".

Рис. 2. Использование экспортированной модели YOLO11 в формате CoreML для обнаружения объектов. Изображение автора.

Где можно использовать экспортированные модели CoreML?

Экспорт YOLO11 в CoreML обеспечивает гибкость при создании разнообразных приложений для компьютерного зрения, которые могут эффективно работать на iPhone, iPad и Mac. Далее рассмотрим несколько реальных сценариев, в которых эта интеграция может быть особенно полезна.

Дополненная реальность и игровые приложения на основе моделей CoreML

Дополненная реальность (AR) объединяет цифровой контент с реальным миром, накладывая виртуальные элементы на изображение с камеры. Она становится ключевой частью мобильных игр, создавая более интерактивный и захватывающий опыт.

С помощью YOLO11, экспортированного в формат CoreML, разработчики iOS могут создавать AR-игры, которые распознают реальные объекты, такие как скамейки, деревья или знаки, с помощью камеры телефона. Затем игра может наложить виртуальные предметы, такие как монеты, подсказки или существа, поверх этих объектов, чтобы улучшить окружение игрока.

Для этого используются функции обнаружения и отслеживания объектов. YOLO11 обнаруживает и идентифицирует объекты в режиме реального времени, а трекинг удерживает эти объекты в поле зрения при движении камеры, обеспечивая соответствие виртуальных элементов реальному миру.

Игроки могут направлять свои телефоны, исследовать окружающую среду и взаимодействовать с тем, что они видят, чтобы собирать предметы или выполнять быстрые задания. Все это может работать прямо на устройстве, не требуя подключения к Интернету, что делает процесс плавным и увлекательным.

Приложения для iOS, интегрированные с моделями CoreML для ANPR в режиме реального времени

Автоматическое распознавание номерных знаков (ANPR) - это приложение компьютерного зрения, используемое для обнаружения и считывания номерных знаков автомобилей. Оно широко используется в системах безопасности, мониторинга дорожного движения и контроля доступа. Благодаря CoreML и таким моделям, как YOLO11, ANPR теперь может эффективно работать на устройствах iOS. 

Приложение ANPR на вашем iPhone может быть особенно полезным в сфере безопасности. Например, с его помощью можно быстро определить, разрешен ли въезд автомобиля в запретную зону или нет.

Такое приложение может использовать модель искусственного интеллекта Vision AI, например YOLO11, интегрированную через CoreML, для обнаружения автомобилей и определения местоположения их номерных знаков в режиме реального времени с помощью камеры устройства. После обнаружения номерного знака технология оптического распознавания символов (OCR) считывает его. Затем приложение может сравнить этот номер с локальной или облачной базой данных, чтобы проверить доступ или отметить неавторизованные автомобили.

Рис. 3. ИИ может использоваться для обнаружения и считывания номерных знаков.(Источник).

Приложения, ориентированные на доступность, могут использовать модели CoreML

ИИ оказал огромное влияние на доступность, помогая преодолеть барьеры для людей с нарушениями зрения. С помощью таких инструментов, как CoreML, и моделей компьютерного зрения, таких как YOLO11, разработчики могут создавать приложения для iOS, которые описывают окружающий мир в реальном времени, делая повседневные задачи более простыми и независимыми.

Например, человек с ослабленным зрением может направить камеру iPhone на окружающее пространство. Приложение использует функцию обнаружения объектов для распознавания ключевых элементов, таких как транспортные средства, люди или уличные знаки, и рассказывает о том, что видит. Это можно использовать в таких ситуациях, как навигация по оживленной улице или понимание чрезвычайной ситуации.

Рис. 4. Пример использования YOLO11 для обнаружения людей

Основные выводы

Экспорт YOLO11 в формат CoreML создает новые возможности для приложений реального времени, включая автономное обнаружение объектов на устройствах iOS. Эта комбинация позволяет разработчикам создавать интеллектуальные, эффективные и ориентированные на конфиденциальность приложения, работающие исключительно на устройстве, - от сельского хозяйства и безопасности до доступности.

Всего за несколько простых шагов вы можете преобразовать модель YOLO11 и добавить надежные функции компьютерного зрения в iPhone. Самое главное, что это работает без подключения к Интернету. В целом, интеграция CoreML привносит мощь передового ИИ в повседневные мобильные приложения, делая их быстрее, отзывчивее и готовыми к работе в любом месте.

Хотите узнать больше об искусственном интеллекте? Изучите наш репозиторий GitHub, общайтесь с нашим сообществом и ознакомьтесь с нашими вариантами лицензирования, чтобы начать свой проект по компьютерному зрению. Узнайте, как такие инновации, как ИИ в розничной торговле и компьютерное зрение в логистике, формируют будущее на страницах наших решений.

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена