Construya un sistema ANPR con Ultralytics YOLO11 y GPT-4o Mini

Abirami Vina

5 minutos de lectura

10 de febrero de 2025

Aprenda a construir un sistema ANPR utilizando Ultralytics YOLO11 para la detección de matrículas y GPT-4o Mini para el reconocimiento de texto con precisión en tiempo real.

Encontrar aparcamiento en un aparcamiento abarrotado, esperar en las largas colas de los peajes o quedarse atascado en los controles de seguridad es frustrante. Los controles manuales de vehículos suelen llevar demasiado tiempo y provocar retrasos. Sin un sistema automatizado, hacer un seguimiento eficaz de los vehículos puede resultar complicado. 

La visión por ordenador ha cambiado esta situación al permitir el reconocimiento de matrículas en tiempo real a partir de imágenes y secuencias de vídeo. Por ejemplo, Ultralytics YOLO11 es un modelo avanzado de visión por ordenador que puede realizar tareas avanzadas de IA de visión como detección, clasificación y seguimiento de objetos. Gracias a las capacidades de detección de objetos de YOLO11, es posible detectar con precisión matrículas de vehículos en imágenes. 

Ultralytics ofrece completas libretas de Google Colab que simplifican el proceso de creación de soluciones basadas en Vision AI. Estos cuadernos vienen preconfigurados con dependencias esenciales, modelos y guías paso a paso, lo que facilita la creación de aplicaciones. En particular, hay un cuaderno Colab dedicado para ANPR (reconocimiento automático de matrículas).

En este artículo, utilizando el cuaderno Ultralytics Colab para ANPR, exploraremos cómo construir una solución ANPR utilizando Ultralytics YOLO11 para la detección de matrículas y GPT-4o Mini para el reconocimiento de texto. 

Comprender el ANPR 

El seguimiento manual de los coches lleva mucho tiempo y es propenso a errores, sobre todo cuando se mueven rápidamente. Comprobar una a una las matrículas ralentiza el proceso y aumenta el riesgo de errores. El reconocimiento automático de matrículas resuelve este problema utilizando la visión por ordenador para detectar y leer las matrículas al instante, lo que aumenta la eficacia de la vigilancia del tráfico y la seguridad.

Los sistemas ANPR pueden capturar imágenes o vídeos de los vehículos que pasan y utilizar la detección de objetos en tiempo real para identificar las matrículas. Una vez detectadas, se utiliza el reconocimiento de texto para extraer los números de matrícula automáticamente, sin necesidad de intervención humana. Este proceso garantiza resultados precisos, incluso cuando los vehículos se mueven rápidamente o las matrículas están parcialmente ocultas.

__wf_reserved_inherit
Fig. 1. Ejemplo de uso de YOLO11 para detectar una matrícula.

Hoy en día, las cabinas de peaje, los sistemas de aparcamiento y las fuerzas de seguridad confían cada vez más en el ANPR para realizar un seguimiento eficaz de los vehículos.

Retos relacionados con la tecnología ANPR

Aunque el sistema ANPR identifica rápidamente los vehículos, existen algunos problemas que pueden afectar a su precisión. Estos son algunos de los problemas más comunes que pueden afectar al funcionamiento de un sistema ANPR:

  • Poca luz y mal tiempo: Las matrículas son más difíciles de leer por la noche y con mal tiempo. La niebla, la lluvia y el resplandor de los faros pueden difuminar el texto y hacerlo ilegible.
  • Placas borrosas o bloqueadas: Un coche a gran velocidad puede dejar una imagen borrosa, sobre todo si la velocidad de obturación de la cámara es demasiado lenta. La suciedad, los arañazos o las partes de la matrícula tapadas también pueden causar problemas de reconocimiento. El uso de cámaras de alta calidad con los ajustes adecuados ayuda a obtener resultados más nítidos.
  • Diseños de placas incoherentes: No todas las placas tienen el mismo aspecto. Algunas tienen fuentes extravagantes, texto adicional o logotipos que confunden al sistema.
  • Riesgos para la privacidad y seguridad de los datos: Almacenar los datos del vehículo de forma segura es importante. Las medidas de seguridad adecuadas pueden impedir el acceso no autorizado y mantener la información protegida. Con las salvaguardias adecuadas, los sistemas ANPR pueden ser seguros y fiables.

Cómo mejora YOLO11 los sistemas ANPR

Ultralytics YOLO11 puede hacer que los sistemas ANPR sean más rápidos y precisos. Procesa las imágenes con rapidez manteniendo la precisión y no requiere una gran potencia de cálculo, por lo que funciona bien en todo tipo de sistemas, desde pequeñas cámaras de seguridad hasta grandes sistemas de tráfico.

Con un entrenamiento personalizado, YOLO11 puede adaptarse a diferentes estilos de matrículas, idiomas y entornos. También funciona bien en condiciones difíciles, como poca luz, desenfoque de movimiento y ángulos difíciles, cuando se entrena de forma personalizada en conjuntos de datos especializados que incluyen imágenes de estas condiciones.

Al identificar los vehículos al instante, YOLO11 ayuda a reducir los tiempos de espera, evitar errores y mejorar la seguridad. Esto hace que el tráfico sea más fluido y las operaciones más eficientes en aparcamientos, cabinas de peaje y sistemas de vigilancia.

Creación de un sistema ANPR con YOLO11 y GPT-4o Mini

A continuación, vamos a ver cómo construir un sistema ANPR utilizando YOLO11 y GPT-4o Mini. 

Exploraremos el código mostrado en el cuaderno Google Collab de Ultralytics para esta solución. El cuaderno Google Col ab es fácil de usar y cualquiera puede crear un sistema ANPR sin necesidad de una configuración complicada.

Paso 1: Configuración del entorno

Para empezar, tendremos que instalar nuestras dependencias, o los paquetes de software y bibliotecas esenciales necesarios para ejecutar nuestro sistema ANPR. Estas dependencias ayudan con tareas como la detección de objetos, el procesamiento de imágenes y el reconocimiento de texto, garantizando que el sistema funcione de manera eficiente.

Instalaremos el paquete Ultralytics Python como se muestra a continuación. Este paquete proporciona modelos preentrenados, utilidades de entrenamiento y herramientas de inferencia, lo que facilita la detección y el reconocimiento de matrículas con YOLO11.

__wf_reserved_inherit
Fig. 2. Instalación del paquete Python de Ultralytics.

También necesitaremos configurar GPT-4o Mini para el reconocimiento de texto. Dado que GPT-4o Mini se encarga de extraer el texto de las placas detectadas, necesitamos una clave API para acceder al modelo. Esta clave puede obtenerse registrándose en la API de GPT-4o Mini. Una vez que tenga la clave, puede añadirla al cuaderno Colab para que el sistema pueda conectarse al modelo y procesar los números de matrícula.

Después de completar la configuración y ejecutar el código de instalación, YOLO11 estará listo para detectar matrículas, y GPT-4o Mini estará configurado para reconocer y extraer texto de ellas.

Paso 2: Descargar el modelo entrenado a medida

Ahora que todo está configurado, el siguiente paso es descargar el modelo YOLO11 que ha sido entrenado a medida para detectar matrículas. Como este modelo ya ha sido entrenado para detectar matrículas, no hay necesidad de entrenarlo desde cero. Basta con descargarlo y ya está listo para usar. Esto ahorra tiempo y facilita mucho el proceso.

Además, descargaremos un archivo de vídeo de muestra para probar el sistema. Si lo deseas, también puedes ejecutar esta solución con tus propios archivos de vídeo. Una vez descargados, el modelo y los archivos de vídeo se almacenarán en el entorno del portátil.

__wf_reserved_inherit
Fig. 3. Descarga del modelo y del archivo de vídeo.

Paso 3: Cargar el vídeo e iniciar la detección

Una vez que el modelo está listo, es hora de verlo en acción. En primer lugar, se carga el archivo de vídeo para procesarlo, asegurándose de que se abre correctamente. A continuación, se configura un grabador de vídeo para guardar las secuencias procesadas con las matrículas detectadas manteniendo el tamaño y la frecuencia de imagen originales. Por último, se carga el modelo para detectar matrículas en cada fotograma del vídeo.

__wf_reserved_inherit
Fig. 4. Lectura del vídeo y carga del modelo.

Una vez cargado el modelo, el sistema empezará a analizar cada fotograma del vídeo para detectar matrículas. Cuando encuentra una matrícula, el sistema la resalta con un recuadro de detección, lo que facilita su identificación. Este paso garantiza que sólo se capturen los detalles relevantes, filtrando la información de fondo innecesaria. Una vez detectadas las matrículas, el vídeo está listo para la siguiente fase.

Paso 4: Extraer el texto de las matrículas

Tras detectar una matrícula, el siguiente paso es el reconocimiento del texto. En primer lugar, el sistema recorta la matrícula del fotograma de vídeo, eliminando cualquier distracción para obtener una visión clara. Esto ayuda a centrarse en los detalles, mejorando la precisión incluso en condiciones difíciles como poca luz o movimiento borroso.

Una vez aislada la placa, GPT-4o Mini analiza la imagen, extrae los números y las letras y los convierte en texto legible. El texto reconocido se añade de nuevo al vídeo, etiquetando cada placa detectada en tiempo real.

Una vez completados estos pasos, el sistema ANPR es totalmente funcional y está listo para reconocer matrículas con facilidad. 

Paso 5: Guardar el vídeo procesado

El último paso guarda el vídeo procesado y limpia los archivos temporales, garantizando que todo funcione sin problemas. 

Cada fotograma procesado, con las placas detectadas y el texto reconocido, se escribe en el vídeo de salida final. Una vez procesados todos los fotogramas, el sistema cierra el archivo de vídeo del que estaba leyendo, liberando memoria y recursos del sistema. También finaliza y guarda el vídeo de salida, dejándolo listo para su reproducción o análisis posterior.

__wf_reserved_inherit
Fig. 5. Uso de YOLO11 y GPT-4o Mini para ANPR.

Implantación de un sistema ANPR

Después de construir y probar una solución ANPR, el siguiente paso es desplegarla en un entorno real. La mayoría de los modelos Vision AI dependen de la informática de alto rendimiento, pero Ultralytics YOLO11 está optimizado para Edge AI. Puede ejecutarse eficazmente en dispositivos pequeños sin necesidad de procesamiento en la nube ni de una conexión constante a Internet, lo que la convierte en una gran opción para lugares con recursos limitados.

Por ejemplo, una comunidad cerrada puede desplegar YOLO11 en un dispositivo de borde para identificar los vehículos a medida que entran, eliminando la necesidad de grandes servidores. Todo se procesa in situ en tiempo real, lo que garantiza un acceso fluido, reduce la congestión y mejora la seguridad.

__wf_reserved_inherit
Fig. 6. Detección de matrículas con YOLO11.

Mientras tanto, en zonas con conectividad estable a Internet, el ANPR basado en la nube puede gestionar varias cámaras simultáneamente. Por ejemplo, en un centro comercial, puede rastrear vehículos en distintas entradas y almacenar los números de matrícula en un sistema central, lo que facilita la supervisión del aparcamiento, la mejora de la seguridad y la gestión remota del flujo de vehículos.

El camino que queda por recorrer para el ANPR

Configurar un sistema de reconocimiento automático de matrículas (ANPR) es sencillo con Ultralytics YOLO11. Detecta con precisión las matrículas y puede personalizarse para adaptarse a distintos entornos y requisitos.

Los sistemas ANPR aumentan la seguridad, agilizan la gestión de los aparcamientos y mejoran la vigilancia del tráfico. Al automatizar el reconocimiento de matrículas, reducen los errores, aceleran la identificación y hacen más eficiente el seguimiento de vehículos en diversas aplicaciones.

Únase a nuestra comunidad y visite nuestro repositorio de GitHub para ver la IA en acción. Explore nuestras opciones de licencia y descubra más sobre Vision AI en fabricación e IA en coches autoconducidos en nuestras páginas de soluciones.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles