Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Vektordatenbank

Entdecken Sie, wie Vektordatenbanken KI revolutionieren, indem sie effiziente Ähnlichkeitssuchen, semantische Suche und Anomalieerkennung für intelligente Systeme ermöglichen.

Eine Vektordatenbank ist eine spezielle Art von Datenbank, die entwickelt wurde, um hochdimensionale Daten, die als Vektor-Embeddings bekannt sind, zu speichern, zu verwalten und zu durchsuchen. Im Gegensatz zu traditionellen relationalen Datenbanken, die für strukturierte Daten und exakte Übereinstimmungen optimiert sind, zeichnen sich Vektordatenbanken dadurch aus, dass sie Elemente anhand ihrer Ähnlichkeit finden. Diese Fähigkeit ist grundlegend für eine breite Palette moderner KI-Anwendungen, von Empfehlungsmaschinen bis hin zur visuellen Suche, was sie zu einer kritischen Komponente in der Machine-Learning-Infrastruktur macht. Sie dienen als Langzeitgedächtnis für KI-Modelle und ermöglichen es ihnen, die komplexen Muster zu nutzen, die während des Trainings gelernt wurden.

Wie Vektor-Datenbanken funktionieren

Die Kernfunktion einer Vektordatenbank ist die effiziente Ausführung einer Vektorsuche. Der Prozess beginnt, wenn unstrukturierte Daten – wie ein Bild, ein Textblock oder ein Audio-Clip – durch ein Deep-Learning-Modell geleitet werden, um eine numerische Darstellung zu erstellen, die als Vektor-Embedding bezeichnet wird. Diese Embeddings erfassen die semantische Bedeutung der Originaldaten.

Die Vektordatenbank speichert dann diese Einbettungen und indiziert sie mithilfe spezieller Algorithmen. Wenn eine Abfrage gestellt wird (z. B. die Suche mit einem Bild), werden die Abfragedaten ebenfalls in einen Vektor umgewandelt. Die Datenbank vergleicht diesen Abfragevektor dann mit den gespeicherten Vektoren unter Verwendung von Ähnlichkeitsmetriken wie Kosinus-Ähnlichkeit oder Euklidischer Distanz, um die "nächsten" oder ähnlichsten Elemente zu finden. Um dies in großem Maßstab mit Millionen oder Milliarden von Vektoren durchzuführen, verlassen sie sich oft auf hocheffiziente Approximate Nearest Neighbor (ANN)-Algorithmen.

Anwendungsfälle in der Praxis

Vektor-Datenbanken bilden die Grundlage für viele intelligente Funktionen, mit denen Benutzer täglich interagieren.

  1. Visuelle Suche im E-Commerce: Ein Benutzer kann ein Foto eines Produkts hochladen, das ihm gefällt. Ein Computer-Vision-Modell, wie z. B. ein Ultralytics YOLO11-Modell, generiert ein Embedding für das Bild. Dieses Embedding wird verwendet, um die Vektordatenbank der E-Commerce-Website abzufragen, die Embeddings für den gesamten Produktkatalog enthält. Die Datenbank gibt die ähnlichsten Vektoren zurück, sodass die Website visuell identische oder stilistisch verwandte Produkte anzeigen kann, ein wichtiges Merkmal im Bereich KI für den Einzelhandel.
  2. Semantische Suche für Dokumente: Ein Unternehmen kann Einbettungen für alle seine internen Dokumente erstellen, z. B. Berichte und Support-Tickets. Ein Mitarbeiter kann dann mit einer natürlichsprachlichen Frage wie "Wie hoch war unser Gewinn im letzten Quartal?" anstelle von bestimmten Schlüsselwörtern suchen. Das Natural Language Processing (NLP)-Modell wandelt diese Anfrage in eine Einbettung um, und die Vektordatenbank findet die Dokumente, deren Einbettungen semantisch am nächsten liegen, und liefert relevante Informationen, selbst wenn die genaue Formulierung nicht übereinstimmt. Dies ist eine Kernkomponente von Retrieval-Augmented Generation (RAG)-Systemen.

Vektor-Datenbanken vs. verwandte Konzepte

Es ist hilfreich, Vektor-Datenbanken von eng verwandten Begriffen zu unterscheiden:

  • Embeddings: Embeddings sind die Vektordarstellungen von Daten. Die Vektordatenbank ist das spezialisierte System, das entwickelt wurde, um diese Embeddings effizient zu speichern, zu indizieren und abzufragen. Stellen Sie sich Embeddings als die Bücher und die Vektordatenbank als die intelligente Bibliothek vor, die sie organisiert.
  • Vektorsuche: Vektorsuche ist der Prozess zum Auffinden der ähnlichsten Vektoren in einem Datensatz. Eine Vektordatenbank ist die zugrunde liegende Technologie, die diesen Prozess schnell und skalierbar macht, insbesondere für Echtzeit-Inferenz.

Diese Komponenten werden als Teil eines vollständigen MLOps-Workflows verwaltet, der oft durch Plattformen wie Ultralytics HUB für das End-to-End-Management von Modellen und Datensätzen erleichtert wird.

Beliebte Vektordatenbanken

Es sind mehrere Open-Source- und kommerzielle Vektordatenbanken verfügbar, die sich hinsichtlich Skalierbarkeit, Bereitstellung und Funktionen unterscheiden. Einige der am weitesten verbreiteten sind:

  • Pinecone: Ein beliebter, vollständig verwalteter Vektordatenbankdienst.
  • Milvus: Eine Open-Source-Vektordatenbank, die für hohe Leistung und Skalierbarkeit entwickelt wurde.
  • Weaviate: Eine Open-Source-, KI-native Datenbank mit Graph-Funktionen.
  • Chroma DB: Eine Open-Source-Embedding-Datenbank, die sich auf Einfachheit und Entwicklererfahrung konzentriert.
  • Qdrant: Eine Open-Source-Vektordatenbank und Suchmaschine für Ähnlichkeitssuche, geschrieben in Rust für Leistung und Sicherheit.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert