Glosario

Reconocimiento de imágenes

Descubra cómo el reconocimiento de imágenes permite a la IA clasificar y comprender imágenes, impulsando la innovación en los sectores de la sanidad, el comercio minorista y la seguridad, entre otros.

El reconocimiento de imágenes es una rama crucial de la inteligencia artificial (IA) y la visión por ordenador (CV) que permite a las máquinas identificar e interpretar la información visual de imágenes o vídeos. No se limita a ver píxeles, sino que implica comprender el contenido (objetos, personas, escenas y acciones) de los datos visuales. Esta tecnología constituye la base de innumerables aplicaciones y permite a los sistemas "ver" y comprender el mundo de forma similar a los humanos.

Cómo funciona el reconocimiento de imágenes

En esencia, el reconocimiento de imágenes se basa en gran medida en el aprendizaje automático (AM), en particular en algoritmos de aprendizaje profundo (AD). Las redes neuronales convolucionales (CNN) son un componente fundamental, diseñado para aprender de forma automática y adaptativa jerarquías espaciales de características a partir de imágenes. El proceso suele implicar el entrenamiento de un modelo en grandes conjuntos de datos de imágenes etiquetadas, como el famoso conjunto de datos ImageNet, donde cada imagen se etiqueta con información sobre su contenido, a menudo organizada utilizando estructuras como la jerarquía WordNet. Durante el entrenamiento, el modelo aprende a asociar patrones y características visuales específicas (como bordes, texturas, formas) con diferentes etiquetas o categorías. Arquitecturas como ResNet tienen un rendimiento significativamente superior en estas tareas. Una vez entrenado, el modelo puede analizar imágenes nuevas no vistas y predecir los objetos o conceptos presentes en ellas. La comprensión de estos conceptos puede profundizarse a través de recursos como la Especialización en Aprendizaje Profundo. Aunque ImageNet es clave para la clasificación, conjuntos de datos como COCO también son vitales para tareas de comprensión visual más amplias. El entrenamiento eficaz de modelos requiere una planificación y ejecución cuidadosas.

Distinciones entre términos afines

Aunque está relacionado con otras tareas de visión por ordenador, el reconocimiento de imágenes suele utilizarse como un término más amplio que engloba varias capacidades específicas. Es importante distinguirlo de tareas más limitadas:

El reconocimiento de imágenes puede referirse a veces específicamente a la clasificación de imágenes, pero a menudo implica la capacidad más amplia de comprender el contenido de las imágenes, lo que puede implicar la detección o la segmentación en función de las necesidades de la aplicación.

Aplicaciones reales

El reconocimiento de imágenes impulsa una amplia gama de aplicaciones en diversos sectores:

Este campo está en constante evolución, impulsado por la investigación compartida en lugares como la Conferencia sobre Visión por Ordenador y Reconocimiento de Patrones (CVPR) y organizaciones como la Fundación de Visión por Ordenador (CVF). Lea información práctica en el blog de Google Cloud AI.

Herramientas y formación

El desarrollo de aplicaciones de reconocimiento de imágenes suele implicar el uso de bibliotecas y marcos especializados. Entre las tecnologías clave se incluyen:

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles