Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Similaridad coseno

Descubre cómo la similitud coseno mide la similitud entre vectores en la IA. Calcula incrustaciones visuales con Ultralytics y amplía tu capacidad con Ultralytics .

La similitud coseno es una métrica matemática fundamental que se utiliza en el aprendizaje automático (ML) y la inteligencia artificial (IA) para medir el grado de similitud entre dos matrices multidimensionales o vectores, independientemente de su tamaño o magnitud. Al calcular el ángulo entre dos puntos en un espacio vectorial, determina si apuntan aproximadamente en la misma dirección. Este enfoque angular es fundamental para procesar datos en los que la orientación importa más que la longitud total, lo que lo hace muy eficaz para comparar representaciones abstractas de datos como las incrustaciones.

Comprender las matemáticas que hay detrás del sistema métrico

Para calcular esta métrica, se calcula el producto escalar de dos vectores y se divide por el producto de sus respectivas magnitudes (longitudes). La puntuación resultante siempre se sitúa dentro de un intervalo fijo comprendido entre -1 y 1:

  • Una puntuación de 1 significa que los vectores apuntan exactamente en la misma dirección, lo que indica una similitud máxima.
  • Una puntuación de 0 significa que los vectores son completamente ortogonales (forman un ángulo de 90 grados), lo que implica que no hay similitud direccional.
  • Una puntuación de -1 significa que apuntan en direcciones exactamente opuestas.

En muchos marcos modernos de aprendizaje profundo diseñados para la visión artificial (CV), se puede acceder fácilmente a funciones optimizadas para esta operación matemática, como el módulo «functional»PyTorch o TensorFlow .

Diferenciar conceptos relacionados

Resulta útil diferenciar la similitud coseno de otras medidas de análisis de datos que se utilizan con frecuencia para saber cuándo utilizarla:

  • Distancia coseno: Aunque están estrechamente relacionados, estos términos son inversamente proporcionales. La distancia coseno se calcula simplemente como 1 menos la similitud coseno. Por lo tanto, una distancia menor indica una mayor similitud entre vectores.
  • Distancia euclidiana: Esta métrica mide la distancia física en línea recta entre dos puntos, lo que la hace muy sensible al tamaño o magnitud global de los vectores. Por el contrario, la similitud coseno solo tiene en cuenta el ángulo. Por ejemplo, en el análisis de textos, un documento largo y una frase corta pueden tener una gran distancia euclidiana, pero si comparten el mismo tema, su similitud coseno seguirá siendo alta.

Aplicaciones reales de la IA

La similitud coseno constituye el motor central de numerosos productos de software modernos, tendiendo un puente entre los datos brutos y la intención humana.

Medición de la similitud visual con Ultralytics

Se pueden extraer vectores de características de alta dimensión directamente a partir de datos visuales utilizando modelos de visión de última generación. El siguiente Python muestra cómo cargar un modelo Ultralytics para la clasificación de imágenes, generar incrustaciones para dos imágenes y realizar un cálculo de similitud coseno para medir su parecido visual.

import torch
import torch.nn.functional as F
from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embedding vectors for two separate images
results = model.embed(["bus.jpg", "car.jpg"])

# Calculate the cosine similarity between the two visual embeddings
similarity = F.cosine_similarity(torch.tensor(results[0]), torch.tensor(results[1]), dim=0)
print(f"Visual Similarity Score: {similarity.item():.4f}")

Para los desarrolladores que deseen ampliar estas capacidades de búsqueda semántica, es fundamental entrenar modelos base de gran precisión. La Ultralytics agiliza este proceso al ofrecer herramientas sólidas para la anotación de datos, el entrenamiento escalable en la nube y la implementación fluida de modelos, lo que garantiza que tus incrustaciones subyacentes sean lo más precisas y significativas posible.

¡Construyamos juntos el futuro de la IA!

Comience su viaje con el futuro del aprendizaje automático