Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Matryoshka Representation Learning (MRL)

Erfahre, wie Matryoshka Representation Learning (MRL) mehrstufige Einbettungen ermöglicht. Entdecke, wie du Ultralytics YOLO26-Suche und Edge-Bereitstellung optimierst.

Matryoshka Representation Learning (MRL) ist eine Trainingsmethode in artificial intelligence (AI) und machine learning (ML), die ein neuronales Netzwerk dazu zwingt, mehrstufige embeddings innerhalb eines einzigen Ausgabevektors zu lernen. Inspiriert von russischen Matroschka-Puppen, strukturiert MRL das Embedding so, dass wichtige semantische Informationen an den Anfang gestellt werden. Das bedeutet, dass ein hochdimensionaler Vektor (zum Beispiel 1024 Dimensionen) auf kleinere, verschachtelte Teilmengen (wie 512, 256 oder 64 Dimensionen) gekürzt werden kann, ohne seine zugrunde liegende Repräsentation zu verlieren. Diese Flexibilität reduziert drastisch den Rechenaufwand, der typischerweise mit information retrieval-Aufgaben verbunden ist.

Link to this sectionSo funktioniert Matryoshka Representation Learning#

Traditionell wird ein Embedding-Modell darauf trainiert, eine spezifische loss function für eine feste Ausgabegröße zu optimieren. Wenn ein System einen kleineren Vektor benötigt, um Speicher zu sparen, muss ein komplett neues Modell trainiert werden. MRL löst dies durch die Anwendung einer verschachtelten Loss-Funktion während der Trainingsphase. Es optimiert gemeinsam die vollständige Repräsentation und deren verschachtelte Teilmengen. Organisationen wie OpenAI haben MRL für ihre modernen Embedding-APIs übernommen, was es Entwicklern ermöglicht, dynamisch Dimensionen am Ende eines Vektors zu entfernen, während akkurate cosine similarity-Werte beibehalten werden.

Link to this sectionPraxisanwendungen#

MRL bietet deutliche Vorteile bei der Abwägung von Genauigkeit gegenüber Speicherkosten und memory bandwidth.

  • Adaptive Vektorsuche für LLMs: In retrieval-augmented generation (RAG)-Pipelines verlassen sich large language models (LLMs) oft auf riesige vector databases. Unter Verwendung von MRL kann ein Unternehmen eine schnelle, grobe semantic search mithilfe der ersten 64 Dimensionen der Embeddings durchführen und anschließend die Top-Ergebnisse unter Verwendung der vollständigen 1024-dimensionalen Vektoren neu bewerten. Dieser Zwei-Stufen-Ansatz beschleunigt die vector search massiv und senkt die Speicherkosten der Datenbank.
  • Skalierbares Computer Vision am Edge: Beim Einsatz von computer vision-Systemen mit der Ultralytics Platform können Hardware-Einschränkungen stark variieren. Ein Modell, das MRL nutzt, kann visuelle Embeddings in voller Größe an einen leistungsstarken cloud deployment-Server übertragen, aber bei Betrieb auf stromsparenden edge computing-Geräten elegant auf die Übertragung gekürzter 128-dimensionaler Embeddings zurückgreifen, wodurch die latency optimiert wird, ohne das Modell neu trainieren zu müssen.

Link to this sectionUnterscheidung verwandter Konzepte#

Um MRL richtig zu nutzen, hilft es, es von älteren Techniken zur Datenkompression zu unterscheiden.

  • MRL vs. Dimensionality Reduction: Algorithmen wie PCA (Principal Component Analysis) oder t-SNE werden nach dem Training angewendet, um Daten zu komprimieren. Im Gegensatz dazu ist MRL nativ in die Architektur des neuronalen Netzwerks während des Trainings eingebettet, wodurch tiefere, nicht-lineare Beziehungen bewahrt bleiben.
  • MRL vs. Model Pruning: Beim Pruning werden Gewichte und Schichten aus dem eigentlichen neuronalen Netzwerk entfernt, um die Inferenz zu beschleunigen, etwa bei der Erstellung einer kleineren Variante eines Ultralytics YOLO-Modells. MRL ändert nicht die Modellgröße; es ändert lediglich die Größe des vom Modell erzeugten Ausgabevektors.

Link to this sectionPraktische Implementierung#

Das Kürzen eines MRL-Embeddings ist unglaublich einfach und erfordert keine komplexe semantic indexing-Logik. Da die kritischsten Merkmale in den ersten Dimensionen stark gewichtet sind, kannst du das Array einfach zuschneiden. Das folgende Beispiel demonstriert das Kürzen einer simulierten YOLO26-multimodalen Ausgabe mithilfe grundlegender PyTorch tensor operations.

import torch

# Simulate a full 1024-dimensional MRL embedding returned by a model
full_embedding = torch.rand(1, 1024)

# To deploy on memory-constrained hardware, simply slice the first 256 dimensions
# Because the model was trained with MRL, this subset remains highly accurate
truncated_embedding = full_embedding[:, :256]

print(f"Original size: {full_embedding.shape[1]}, Compressed size: {truncated_embedding.shape[1]}")

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens