Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Incrustaciones (Embeddings)

Descubra cómo las incrustaciones conectan los datos humanos y la lógica de las máquinas. Aprenda a generar representaciones vectoriales para tareas de IA utilizando Ultralytics y explore la Ultralytics .

Las incrustaciones son representaciones vectoriales densas, de baja dimensión y continuas de variables discretas, que sirven como traductor fundamental entre los datos humanos y la lógica de las máquinas. En el ámbito de la inteligencia artificial (IA), los ordenadores no pueden comprender de forma intuitiva datos desordenados y no estructurados, como texto, imágenes o audio. Las incrustaciones resuelven este problema convirtiendo estas entradas en listas de números reales, conocidos como vectores, que existen en un espacio matemático de alta dimensión. A diferencia de las codificaciones tradicionales, que pueden asignar un ID aleatorio a un objeto, las incrustaciones se aprenden mediante el entrenamiento, lo que garantiza que los elementos semánticamente similares, como las palabras «rey» y «reina», o las imágenes de dos gatos diferentes, se sitúen muy cerca entre sí en el espacio vectorial.

Cómo funcionan las incrustaciones

La creación de una incrustación implica introducir datos sin procesar en una red neuronal diseñada para la extracción de características. Durante el entrenamiento, el modelo aprende a comprimir las características esenciales de la entrada en una forma numérica compacta. Por ejemplo, un modelo de visión por ordenador (CV) que analiza una fotografía no solo ve píxeles, sino que mapea formas, texturas y colores en una coordenada específica en un gráfico multidimensional. Al medir la similitud, los sistemas calculan la distancia entre estas coordenadas utilizando métricas como la similitud coseno o la distancia euclidiana. Esta proximidad matemática permite a los algoritmos realizar tareas complejas como la clasificación y la agrupación con gran eficiencia.

Aplicaciones en el mundo real

Las incrustaciones actúan como motor de muchas funciones inteligentes utilizadas en los productos de software modernos.

  • Búsqueda semántica: Los motores de búsqueda tradicionales suelen basarse en la coincidencia exacta de palabras clave, lo que falla si un usuario busca «auto» pero el documento contiene «coche». Las incrustaciones capturan el significado detrás de las palabras. Al representar la consulta de búsqueda y los documentos de la base de datos como vectores, el sistema puede recuperar resultados que coincidan con la intención del usuario, incluso si las palabras específicas difieren.
  • Sistemas de recomendación: Los servicios de streaming y los sitios de comercio electrónico utilizan incrustaciones para personalizar las experiencias de los usuarios. Si un usuario ve una película de ciencia ficción, el sistema identifica el vector de incrustación de esa película y busca otras películas con vectores similares en la base de datos. Esto permite realizar sugerencias precisas basadas en la similitud del contenido, en lugar de solo en etiquetas o categorías manuales .
  • Aprendizaje sin disparos: Los modelos avanzados utilizan incrustaciones conjuntas para vincular diferentes modalidades, como texto e imágenes. Esto permite que un sistema reconozca objetos que nunca ha visto explícitamente durante el entrenamiento, asociando la incrustación de la imagen con la incrustación del texto del nombre del objeto.

Generación de incrustaciones con Python

Modelos de última generación como YOLO26 se puede utilizar para generar incrustaciones de imágenes robustas de manera eficiente. El siguiente ejemplo muestra cómo extraer un vector de características de una imagen utilizando el ultralytics Paquete Python .

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

Incrustaciones vs. Conceptos Relacionados

Para implementar eficazmente soluciones de IA, resulta útil distinguir los embeddings de términos técnicos estrechamente relacionados.

  • Incrustaciones frente a búsqueda vectorial: La incrustación es la representación de datos en sí misma (la lista de números). La búsqueda vectorial es el proceso posterior de consultar una base de datos para encontrar los vecinos más cercanos a esa incrustación. A menudo se utilizan herramientas especializadas conocidas como bases de datos vectoriales para almacenar y buscar estas incrustaciones a gran escala.
  • Incrustaciones frente a tokenización: En el procesamiento del lenguaje natural (NLP), la tokenización es el paso preliminar de dividir el texto en fragmentos más pequeños (tokens). Estos tokens se asignan a continuación a incrustaciones. Por lo tanto, la tokenización prepara los datos, mientras que las incrustaciones representan el significado de los datos.
  • Incrustaciones frente a aprendizaje profundo: El aprendizaje profundo es el campo más amplio del aprendizaje automático basado en redes neuronales. Las incrustaciones son un resultado o capa específicos dentro de una arquitectura de aprendizaje profundo, que a menudo sirven de puente entre las entradas sin procesar y las capas de toma de decisiones del modelo.

Los desarrolladores que deseen gestionar el ciclo de vida de sus conjuntos de datos, incluyendo la anotación y el entrenamiento de modelos para generar incrustaciones personalizadas, pueden utilizar la Ultralytics . Esta herramienta integral simplifica el flujo de trabajo, desde la gestión de datos hasta la implementación, garantizando que las incrustaciones que alimentan sus aplicaciones se deriven de datos de alta calidad y bien seleccionados. Tanto si utiliza marcos como PyTorch o TensorFlow, dominar las incrustaciones es un paso crucial en la creación de sofisticados sistemas de reconocimiento de patrones.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora