Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Построение системы ANPR с помощью Ultralytics YOLO11 и GPT-4o Mini

Абирами Вина

5 мин чтения

10 февраля 2025 г.

Узнайте, как построить систему ANPR, используя Ultralytics YOLO11 для распознавания номерных знаков и GPT-4o Mini для распознавания текста с точностью до реального времени.

Поиск парковки на переполненной стоянке, ожидание в длинных очередях на пунктах оплаты или застревание на пунктах досмотра — все это вызывает разочарование. Ручная проверка транспортных средств часто занимает слишком много времени и приводит к задержкам. Без автоматизированной системы эффективное отслеживание автомобилей может быть затруднено. 

Компьютерное зрение изменило ситуацию, позволив в режиме реального времени распознавать номерные знаки по изображениям и видеопотокам. Например, Ultralytics YOLO11 это продвинутая модель компьютерного зрения, способная выполнять такие задачи ИИ, как обнаружение объектов, классификация и отслеживание. Используя возможности YOLO11 по обнаружению объектов, вы можете точно detect номерные знаки автомобилей на изображениях. 

Ultralytics предлагает комплексные блокнотыGoogle Colab, которые упрощают процесс создания решений на базе искусственного интеллекта Vision. Эти блокноты поставляются с готовыми конфигурациями, необходимыми зависимостями, моделями и пошаговыми руководствами, что упрощает создание приложений. В частности, существует специальный блокнот Colab для ANPR (автоматического распознавания номерных знаков).

В этой статье, используя ноутбук Ultralytics Colab для ANPR, мы рассмотрим, как построить ANPR-решение, используя Ultralytics YOLO11 для обнаружения номерных знаков и GPT-4o Mini для распознавания текста. 

Понимание ANPR 

Отслеживание автомобилей вручную отнимает много времени и чревато ошибками, особенно если они быстро движутся. Проверка каждого номерного знака по очереди замедляет процесс и повышает риск ошибок. Автоматическое распознавание номерных знаков решает эту проблему, используя компьютерное зрение для мгновенного detect и считывания номерных знаков, что делает мониторинг и безопасность движения более эффективными.

Системы ANPR могут захватывать изображения или видео проезжающих транспортных средств и использовать обнаружение объектов в реальном времени для идентификации номерных знаков. После обнаружения используется распознавание текста для автоматического извлечения номеров знаков без участия человека. Этот процесс обеспечивает точные результаты, даже когда транспортные средства движутся быстро или номерные знаки частично закрыты.

__wf_reserved_inherit
Рис. 1. Пример использования YOLO11 для detect номерного знака.

В настоящее время пункты взимания платы, парковочные системы и правоохранительные органы все чаще полагаются на ANPR для эффективного track транспортных средств.

Проблемы, связанные с технологией ANPR

Хотя ANPR быстро идентифицирует транспортные средства, все еще существуют некоторые проблемы, которые могут повлиять на его точность. Вот несколько распространенных проблем, которые могут повлиять на то, насколько хорошо работает система ANPR:

  • Плохое освещение и плохая погода: Номера становятся труднее читаемыми ночью и в плохую погоду. Туман, дождь и блики фар могут размыть текст, делая его нечитаемым.
  • Размытые или заблокированные номера: Быстро движущийся автомобиль может оставить размытое изображение, особенно если выдержка камеры слишком мала. Грязь, царапины или закрытые части номерного знака также могут вызвать проблемы с распознаванием. Использование высококачественных камер с правильными настройками помогает получить более четкие результаты.
  • Неоднородный дизайн номерных знаков: Не все номерные знаки выглядят одинаково. На некоторых используются необычные шрифты, дополнительный текст или логотипы, которые сбивают систему с толку.
  • Риски конфиденциальности и безопасность данных: Важно безопасно хранить данные об автомобиле. Правильные меры безопасности могут предотвратить несанкционированный доступ и сохранить информацию защищенной. При наличии надлежащих мер защиты системы ANPR могут быть одновременно безопасными и надежными.

Как YOLO11 улучшает системы ANPR

Ultralytics YOLO11 позволяет сделать системы ANPR более быстрыми и точными. Он быстро обрабатывает изображения, сохраняя при этом точность, и не требует больших вычислительных мощностей, поэтому хорошо подходит для любых систем - от небольших камер наблюдения до крупных дорожных систем.

При индивидуальном обучении YOLO11 может быть адаптирован к различным стилям номерных знаков, языкам и условиям окружающей среды. Кроме того, он отлично справляется с такими сложными условиями, как слабое освещение, размытость движения и сложные ракурсы, если его обучить на специализированных наборах данных, включающих изображения в таких условиях.

Благодаря мгновенной идентификации автомобилей YOLO11 помогает сократить время ожидания, предотвратить ошибки и повысить безопасность. Это делает движение более плавным, а работу парковок, пунктов взимания платы и систем видеонаблюдения - более эффективной.

Построение системы ANPR с помощью YOLO11 и GPT-4o Mini

Далее мы рассмотрим, как построить систему ANPR с помощью YOLO11 и GPT-4o Mini. 

Для этого решения мы будем использовать код, представленный в блокноте Ultralytics Google Collab. Блокнот Google Colab прост в использовании, и каждый может создать систему ANPR, не прибегая к сложной настройке.

Шаг 1: Настройка среды

Для начала нам необходимо установить наши зависимости, то есть основные пакеты программного обеспечения и библиотеки, необходимые для работы нашей системы ANPR. Эти зависимости помогают в таких задачах, как обнаружение объектов, обработка изображений и распознавание текста, обеспечивая эффективную работу системы.

Мы установим пакетUltralytics Python , как показано ниже. Этот пакет предоставляет предварительно обученные модели, утилиты для обучения и инструменты для вывода, облегчающие detect и распознавание номерных знаков с помощью YOLO11.

__wf_reserved_inherit
Рис. 2. Установка пакета Ultralytics Python .

Нам также потребуется настроить GPT-4o Mini для распознавания текста. Поскольку GPT-4o Mini отвечает за извлечение текста с обнаруженных номерных знаков, нам нужен ключ API для доступа к модели. Этот ключ можно получить, зарегистрировавшись в API GPT-4o Mini. Получив ключ, его можно добавить в блокнот Colab, чтобы система могла подключаться к модели и обрабатывать номера знаков.

После завершения настройки и запуска кода установки YOLO11 будет готов к detect номерных знаков, а GPT-4o Mini - к распознаванию и извлечению из них текста.

Шаг 2: Загрузите специально обученную модель

Теперь, когда все готово, следующим шагом будет загрузка модели YOLO11 , которая была специально обучена для detect номерных знаков. Поскольку эта модель уже была обучена detect номерные знаки, нет необходимости обучать ее с нуля. Вы можете просто загрузить ее, и она будет готова к использованию. Это экономит время и значительно упрощает процесс.

Кроме того, мы загрузим образец видеофайла для тестирования системы. При желании вы также можете запустить это решение на своих собственных видеофайлах. После загрузки модель и видеофайлы будут сохранены в среде блокнота.

__wf_reserved_inherit
Рис. 3. Загрузка модели и видеофайла.

Шаг 3: Загрузите видео и начните обнаружение

Когда модель готова, пора посмотреть на нее в действии. Сначала видеофайл загружается для обработки, обеспечивая его корректное открытие. Затем настраивается программа записи видео, чтобы сохранить обработанный материал с обнаруженными номерными знаками, сохранив при этом исходный размер и частоту кадров. Наконец, загружается модель для detect номерных знаков в каждом кадре видео.

__wf_reserved_inherit
Рис. 4. Чтение видео и загрузка модели.

После загрузки модели система начнет анализировать каждый кадр видеозаписи, чтобы detect номерные знаки. Когда номерной знак найден, система выделяет его рамкой для обнаружения, что облегчает его идентификацию. Этот шаг гарантирует, что будут захвачены только важные детали, отфильтровывая ненужную фоновую информацию. После успешного обнаружения номеров видео готово к следующему этапу.

Шаг 4: Извлечение текста из номерных знаков

После обнаружения номерного знака следующим шагом является распознавание текста. Система сначала вырезает номерной знак из видеокадра, удаляя любые отвлекающие факторы для четкого обзора. Это помогает сосредоточиться на деталях, повышая точность даже в сложных условиях, таких как слабое освещение или размытие в движении.

После выделения номерного знака GPT-4o Mini анализирует изображение, извлекает цифры и буквы и преобразует их в читаемый текст. Распознанный текст затем добавляется обратно в видео, маркируя каждый обнаруженный номерной знак в режиме реального времени.

После выполнения этих шагов система ANPR становится полностью функциональной и готовой к легкому распознаванию номерных знаков. 

Шаг 5: Сохранение обработанного видео

На последнем этапе обработанное видео сохраняется, а временные файлы удаляются, что обеспечивает бесперебойную работу. 

Каждый обработанный кадр, с обнаруженными номерами и распознанным текстом, записывается в итоговое выходное видео. После обработки всех кадров система закрывает видеофайл, из которого она читала, освобождая память и системные ресурсы. Она также завершает и сохраняет выходное видео, подготавливая его к воспроизведению или дальнейшему анализу.

__wf_reserved_inherit
Рис. 5. Использование YOLO11 и GPT-4o Mini для ANPR.

Развертывание системы автоматического распознавания номерных знаков (ANPR)

После создания и тестирования решения ANPR следующим шагом будет его развертывание в реальной среде. Большинство моделей Vision AI зависят от высокопроизводительных вычислений, но Ultralytics YOLO11 оптимизирован для Edge AI. Она может эффективно работать на небольших устройствах, не требуя облачных вычислений или постоянного подключения к Интернету, что делает ее отличным выбором для мест с ограниченными ресурсами.

Например, в закрытом поселке можно установить YOLO11 на пограничное устройство для идентификации автомобилей при въезде, что избавит вас от необходимости использовать крупные серверы. Все данные обрабатываются на месте в режиме реального времени, обеспечивая беспрепятственный доступ, уменьшение заторов и повышение безопасности.

__wf_reserved_inherit
Рис. 6. Обнаружение номерных знаков с помощью YOLO11.

В то же время в районах со стабильным интернет-соединением облачные системы ANPR могут работать с несколькими камерами одновременно. Например, в торговом центре она может track автомобили на разных въездах и сохранять номера в центральной системе, облегчая мониторинг парковки, повышая безопасность и удаленно управляя потоком автомобилей.

Перспективы ANPR

Создать систему автоматического распознавания номерных знаков (ANPR) очень просто с помощью Ultralytics YOLO11. Она точно распознает номерные знаки и может быть настроена для адаптации к различным условиям и требованиям.

Системы ANPR повышают безопасность, оптимизируют управление парковкой и улучшают мониторинг дорожного движения. Автоматизируя распознавание номерных знаков, они снижают количество ошибок, ускоряют идентификацию и делают отслеживание транспортных средств более эффективным в различных приложениях.

Присоединяйтесь к нашему сообществу и посетите наш репозиторий GitHub, чтобы увидеть ИИ в действии. Изучите наши варианты лицензирования и узнайте больше о Vision AI в производстве и ИИ в самоуправляемых автомобилях на страницах наших решений.

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно