Erfahren Sie, was Embeddings sind und wie sie KI antreiben, indem sie semantische Beziehungen in Daten für NLP, Empfehlungen und Computer Vision erfassen.
Einbettungen sind dichte, niedrig-dimensionale und kontinuierliche Vektordarstellungen von diskreten Variablen und dienen als ein grundlegendes Datenformat in modernen Künstliche Intelligenz (KI). Im Gegensatz zu spärlichen Darstellungen wie der One-Hot-Codierung, die zu massiven und ineffizienten Vektoren führen kann, erfassen Einbettungen die semantischen Beziehungen und die zugrunde liegende Bedeutung der Daten, Einbettungen die semantischen Beziehungen und die zugrunde liegende Bedeutung der Daten, indem sie hochdimensionale Eingaben - wie Wörter, Bilder oder Audiodaten - in einen kompakten numerischen Raum. In diesem gelernten Vektorraum werden Elemente, die die ähnliche Eigenschaften oder Kontexte aufweisen, in unmittelbarer Nähe zueinander angeordnet, so dass maschinelles Lernen (ML) Modelle komplexe Muster intuitiv verstehen und verarbeiten können.
Das Kernkonzept der Einbettung ist die Übersetzung von Rohdaten in eine mathematische Form, die Computer effizient verarbeiten können. effizient verarbeiten können. Dieser Prozess umfasst in der Regel eine neuronales Netz (NN) das lernt Eingaben auf Vektoren von reellen Zahlen abzubilden. Während der Modelltraining Phase passt das Netzwerk diese Vektoren so an, dass der Abstand zwischen ihnen der Ähnlichkeit der Elemente entspricht, die sie darstellen.
Zum Beispiel, in Verarbeitung natürlicher Sprache (NLP)würden die Einbettungen für die Wörter "König" und "Königin" mathematisch näher beieinander liegen als zu "Apfel", was ihre semantische Beziehung widerspiegelt. Diese Umwandlung ist eine Form von DimensionalitätsreduktionDimensionalitätsreduktion, bei der die wesentlichen Informationen erhalten bleiben, während das Rauschen entfernt wird, wodurch nachgelagerte Aufgaben wie Klassifizierung oder Clustering wesentlich effektiver.
Einbettungen werden in der Regel als Nebenprodukt des Trainings erzeugt Deep Learning (DL) Modelle auf großen Datensätzen. Frameworks wie z. B. PyTorch und TensorFlow bieten spezielle Schichten entwickelt, um diese Repräsentationen zu lernen.
Sie können Einbettungen für Bilder mit Standard Computer Vision (CV) Arbeitsabläufe erzeugen. Das folgende Python demonstriert, wie man Einbettungen aus einem Bild mit Hilfe eines vortrainierten Ultralytics YOLO11 Klassifizierungsmodell.
from ultralytics import YOLO
# Load a YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate embeddings for an image from a URL
# The embed() method specifically returns the feature vector
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")
# Output the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")
Einbettungen haben die Art und Weise, wie Systeme mit unstrukturierten Daten umgehen, revolutioniert und ermöglichen Funktionen, die zuvor unmöglich waren.
Um sich in der KI-Landschaft zurechtzufinden, ist es wichtig, den Unterschied zwischen Einbettungen und verwandten Begriffen zu verstehen.
Durch die Umwandlung abstrakter Konzepte in mathematische Vektoren überbrücken Einbettungen die Kluft zwischen menschlicher Intuition und Maschinenlogik und ermöglichen so die Mustererkennung Fähigkeiten, die in den fortschrittlichsten KI-Anwendungen von heute.