¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Base de datos vectorial

Descubra cómo las bases de datos vectoriales revolucionan la IA al permitir búsquedas de similitud eficientes, búsqueda semántica y detección de anomalías para sistemas inteligentes.

Una base de datos vectorial es un tipo especializado de base de datos diseñada para almacenar, gestionar y buscar datos de alta dimensión conocidos como embeddings vectoriales. A diferencia de las bases de datos relacionales tradicionales que están optimizadas para datos estructurados y coincidencias exactas, las bases de datos vectoriales sobresalen en la búsqueda de elementos basados en su similitud. Esta capacidad es fundamental para una amplia gama de aplicaciones de IA modernas, desde motores de recomendación hasta búsqueda visual, lo que las convierte en un componente crítico en la infraestructura de machine learning. Sirven como la memoria a largo plazo para los modelos de IA, lo que les permite aprovechar los patrones complejos aprendidos durante el entrenamiento.

Cómo funcionan las bases de datos vectoriales

La función principal de una base de datos vectorial es ejecutar eficientemente una búsqueda vectorial. El proceso comienza cuando los datos no estructurados, como una imagen, un bloque de texto o un clip de audio, se pasan a través de un modelo de aprendizaje profundo para crear una representación numérica llamada vector de incrustación (embedding). Estas incrustaciones capturan el significado semántico de los datos originales.

La base de datos vectorial luego almacena estas incrustaciones y las indexa utilizando algoritmos especializados. Cuando se realiza una consulta (por ejemplo, buscar con una imagen), los datos de la consulta también se convierten en un vector. La base de datos luego compara este vector de consulta con los vectores almacenados utilizando métricas de similitud como la Similitud Coseno o la Distancia Euclídea para encontrar los elementos "más cercanos" o más similares. Para realizar esto a escala con millones o miles de millones de vectores, a menudo se basan en algoritmos de Vecino Más Cercano Aproximado (ANN) altamente eficientes.

Aplicaciones en el mundo real

Las bases de datos vectoriales impulsan muchas funciones inteligentes con las que los usuarios interactúan a diario.

  1. Búsqueda Visual en el Comercio Electrónico: Un usuario puede subir una foto de un producto que le guste. Un modelo de visión artificial, como un modelo Ultralytics YOLO11, genera un embedding para la imagen. Este embedding se utiliza para consultar la base de datos vectorial del sitio de comercio electrónico, que contiene embeddings para todo su catálogo de productos. La base de datos devuelve los vectores más similares, lo que permite al sitio mostrar productos visualmente idénticos o estilísticamente relacionados, una característica clave en la IA para el comercio minorista.
  2. Búsqueda Semántica de Documentos: Una empresa puede crear embeddings para todos sus documentos internos, como informes y tickets de soporte. Un empleado puede entonces buscar utilizando una pregunta en lenguaje natural como "¿Cuáles fueron nuestras ganancias el último trimestre?" en lugar de palabras clave específicas. El modelo de Procesamiento del Lenguaje Natural (NLP) convierte esta consulta en un embedding, y la base de datos vectorial encuentra los documentos cuyos embeddings son semánticamente más cercanos, proporcionando información relevante incluso si la redacción exacta no coincide. Este es un componente central de los sistemas de generación aumentada por recuperación (RAG).

Bases de datos vectoriales vs. Conceptos relacionados

Es útil diferenciar las bases de datos vectoriales de términos estrechamente relacionados:

  • Incrustaciones (Embeddings): Las incrustaciones son las representaciones vectoriales de los datos. La base de datos vectorial es el sistema especializado construido para almacenar, indexar y consultar estas incrustaciones de manera eficiente. Piensa en las incrustaciones como los libros y en la base de datos vectorial como la biblioteca inteligente que los organiza.
  • Búsqueda vectorial: La búsqueda vectorial es el proceso de encontrar los vectores más similares en un conjunto de datos. Una base de datos vectorial es la tecnología subyacente que hace que este proceso sea rápido y escalable, especialmente para la inferencia en tiempo real.

Estos componentes se gestionan como parte de un flujo de trabajo completo de MLOps, a menudo facilitado por plataformas como Ultralytics HUB para la gestión integral de modelos y conjuntos de datos.

Bases de datos vectoriales populares

Existen varias bases de datos vectoriales de código abierto y comerciales, cada una con diferentes fortalezas en cuanto a escalabilidad, implementación y características. Algunas de las más utilizadas son:

  • Pinecone: Un servicio popular de base de datos vectorial totalmente gestionado.
  • Milvus: Una base de datos vectorial de código abierto diseñada para un alto rendimiento y escalabilidad.
  • Weaviate: Una base de datos de código abierto, nativa de la IA, con capacidades de grafo.
  • Chroma DB: Una base de datos de embeddings de código abierto centrada en la simplicidad y la experiencia del desarrollador.
  • Qdrant: Una base de datos vectorial de código abierto y un motor de búsqueda de similitud escrito en Rust para el rendimiento y la seguridad.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles