Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Visión Artificial (CV)

Explora los fundamentos de la visión artificial (CV). Descubre cómo Ultralytics y la Ultralytics permiten la detección de objetos, la segmentación y mucho más.

La visión artificial (CV) es un sofisticado campo de la inteligencia artificial (IA) que permite a los ordenadores y sistemas obtener información significativa a partir de imágenes digitales, vídeos y otras entradas visuales. Mientras que la visión humana tiene la capacidad innata de percibir y comprender el entorno al instante, los ordenadores deben ser entrenados para reconocer patrones e interpretar píxeles. Al aprovechar el aprendizaje automático (ML) y, en concreto, los algoritmos de aprendizaje profundo (DL), los sistemas de CV pueden tomar datos visuales, procesarlos y hacer recomendaciones o tomar medidas basadas en esa información.

Cómo funciona la visión artificial

En esencia, un ordenador ve una imagen como una matriz de valores numéricos que representan píxeles. La visión artificial moderna se basa en gran medida en las redes neuronales convolucionales (CNN), que están diseñadas para imitar el patrón de conectividad de las neuronas del cerebro humano. Estas redes aprenden a identificar una jerarquía de características, desde simples bordes y texturas hasta formas y objetos complejos, a través de un proceso denominado extracción de características.

Para funcionar de manera eficaz, estos modelos requieren grandes cantidades de datos de entrenamiento. Por ejemplo, para reconocer un coche, un modelo necesita procesar miles de imágenes etiquetadas de coches en diversas condiciones. Herramientas como la Ultralytics agilizan este flujo de trabajo, permitiendo a los usuarios anotar conjuntos de datos, entrenar modelos en la nube e implementarlos de manera eficiente.

Tareas básicas en visión por ordenador

La visión artificial no es una función única, sino un conjunto de tareas distintas, cada una de las cuales resuelve un problema específico:

  • Clasificación de imágenes: esta tarea asigna una etiqueta de clase a una imagen completa, respondiendo a la pregunta «¿Qué hay en esta imagen?» (por ejemplo, distinguiendo entre un gato y un perro).
  • Detección de objetos: yendo un paso más allá, la detección identifica objetos distintos dentro de una imagen y dibuja un cuadro delimitador a su alrededor. Esto es crucial para contar elementos o localizar características específicas.
  • Segmentación de instancias: Proporciona una máscara precisa a nivel de píxel para cada objeto detectado, separando las instancias individuales de la misma clase. Es vital para aplicaciones que requieren alta precisión, como el análisis de imágenes médicas.
  • Estimación de la postura: Implica detectar puntos clave específicos en un objeto, como las articulaciones de un cuerpo humano, para track y la postura.

Aplicaciones en el mundo real

La utilidad de la visión artificial abarca prácticamente todos los sectores, automatizando tareas que antes requerían la intervención humana .

  • Fabricación y control de calidad: En entornos industriales, el CV se conoce a menudo como visión artificial. Se utiliza para automatizar la inspección de calidad, detectando defectos minúsculos en los productos de una cadena de montaje de forma más rápida y precisa que los inspectores humanos. Por ejemplo, la IA en la fabricación permite la supervisión en tiempo real de los equipos para evitar fallos.
  • Transporte autónomo: los coches autónomos dependen totalmente del CV para circular de forma segura. Al procesar la información procedente de cámaras y sensores LiDAR, estos vehículos realizan detección de objetos en 3D para identificar peatones, otros vehículos y señales de tráfico en tiempo real. Este es un componente crítico para alcanzar altos niveles de automatización de los vehículos.
  • Atención sanitaria y diagnósticos: los radiólogos utilizan el aprendizaje automático para ayudar a identificar anomalías en radiografías, resonancias magnéticas y tomografías computarizadas. La IA en la atención sanitaria ayuda a la detección precoz de enfermedades, como la identificación de tumores, resaltando regiones de interés que podrían pasar desapercibidas a simple vista .

Visión Artificial vs. Procesamiento de Imágenes

Es importante distinguir el CV del procesamiento de imágenes, aunque a menudo funcionan juntos.

  • El procesamiento de imágenes consiste en manipular una imagen para mejorarla o extraer información (por ejemplo, ajustar el brillo, el contraste o aplicar filtros como los de Adobe Photoshop). El resultado suele ser otra imagen.
  • La visión artificial toma una imagen como entrada y genera información o una interpretación (por ejemplo, «Hay tres personas en esta habitación»). La visión artificial utiliza técnicas de procesamiento de imágenes para preparar las imágenes para su análisis por redes neuronales.

Implementación de la visión artificial con Python

Las bibliotecas modernas han facilitado la implementación de potentes modelos de CV. El siguiente ejemplo muestra cómo cargar el último modelo YOLO26 modelo para detect en una imagen utilizando el ultralytics paquete.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

Este sencillo script utiliza un modelo preentrenado para realizar complejas tareas de inferencia, lo que demuestra la accesibilidad de las herramientas modernas de IA. Para los desarrolladores que desean ir más allá de las imágenes estáticas, la CV también impulsa la comprensión de vídeos y los sistemas de seguimiento en tiempo real utilizados en la seguridad y el análisis deportivo. Al integrarse con bibliotecas como OpenCV, los desarrolladores pueden crear aplicaciones completas que capturan, procesan y analizan el mundo visual.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora