Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Anleitungen

Was ist Template Matching? Ein kurzer Leitfaden

Erkunde die Bildverarbeitungstechnik namens Template Matching, wie sie funktioniert und welche Bedeutung sie in der Geschichte der Computer Vision hat.

ABAbirami Vina
5 min read
Ein Beispiel für Template Matching in der Bildverarbeitung

Bilder enthalten oft viele kleine Details, die Menschen leicht erkennen können. Für Maschinen ist diese Aufgabe jedoch nicht so einfach. Maschinen nehmen ein digitales Bild als Raster von Pixelwerten wahr, und selbst geringfügige Änderungen bei Beleuchtung, Winkel, Maßstab oder Schärfe können verwirrend sein.

Die Bildanalysefähigkeiten einer Maschine stammen im Allgemeinen aus zwei eng verwandten Bereichen der Informatik: Bildverarbeitung und Computer Vision. Obwohl sie oft zusammenarbeiten, verfolgen sie unterschiedliche Hauptziele.

Bildverarbeitung konzentriert sich auf Bilder als Rohdaten. Sie kann Bilder verbessern, versucht aber nicht, deren Inhalt zu verstehen. Hier macht Computer Vision den Unterschied. Computer Vision ist ein Zweig der Künstlichen Intelligenz (KI), der es Maschinen ermöglicht, Bilder und Videos zu verstehen.

Grundlegende Bildverarbeitung gibt es schon seit vielen Jahren, aber bahnbrechende Innovationen im Bereich Computer Vision sind viel aktueller. Ein hervorragender Weg, um die Geschichte des Fachgebiets zu verstehen, ist ein Rückblick darauf, wie wir diese Probleme früher mit älteren, traditionelleren Methoden gelöst haben.

Nimm zum Beispiel Image Matching. Es ist eine gängige Vision-Aufgabe, bei der ein System herausfinden muss, ob ein bestimmtes Objekt oder Muster in einem größeren Bild vorhanden ist.

Heutzutage lässt sich dies mithilfe von KI und Deep Learning einfach und präzise erledigen. Vor dem Aufkommen moderner neuronaler Netze in den 2010er Jahren war jedoch eine viel einfachere Technik namens Template Matching die gängige Methode.

Ein Beispiel für Template Matching

Abb. 1. Ein Beispiel für Template Matching (Quelle)

Template Matching ist ein Bildverarbeitungsverfahren, bei dem ein kleines Vorlagenbild (Template) Pixel für Pixel über ein größeres Bild geschoben wird. Dieser Faltungs-ähnliche Schiebevorgang ermöglicht es dem Algorithmus, die Position zu finden, die am besten mit diesem speziellen Muster übereinstimmt.

In diesem Artikel werden wir untersuchen, was Template Matching ist und wie moderne Verbesserungen es in realen Situationen zuverlässiger machen. Fangen wir an!

Link to this sectionWas ist Template Matching?#

Template Matching kann auch als klassische Computer-Vision-Technik bezeichnet werden, was bedeutet, dass sie direkt mit Bildpixeln (der kleinsten Einheit eines digitalen Bildes) arbeitet. Sie wird verwendet, um ein kleineres Muster innerhalb eines größeren Bildes zu finden.

Solche Methoden werden durch Geometrie, Optik und mathematische Regeln definiert, anstatt große Modelle mit riesigen Datensätzen zu trainieren. Mit anderen Worten: Ein Template-Matching-System vergleicht die Helligkeit, Farbe und andere Pixelinformationen zweier Eingaben: das Eingabebild (das größere Bild) und ein kleineres Vorlagenbild (das zu findende Muster).

Bild A und Bild B als Beispiele für Templates

Abb. 2. Bild A und Bild B sind Beispiele für Vorlagen. (Quelle)

Das Hauptziel des Template Matchings ist es, zu lokalisieren, wo das Template in der größeren Szene erscheint, und zu messen, wie eng es mit verschiedenen Bereichen des Bildes übereinstimmt. Der Template-Matching-Algorithmus erledigt dies, indem er das Template über das größere Bild schiebt und an jeder Position einen Ähnlichkeitswert berechnet.

Bereiche mit höheren Werten gelten als die beste Übereinstimmung, was bedeutet, dass sie dem Template sehr ähneln. Da diese Methode auf Pixel-für-Pixel-Vergleichen beruht, funktioniert sie am besten in kontrollierten Umgebungen, in denen sich das Erscheinungsbild von Objekten nicht ändert.

Zum Beispiel kann Template Matching bei Aufgaben zur Etikettenüberprüfung in der Qualitätskontrolle eingesetzt werden. Es kann problemlos das Vorlagenbild von Etiketten mit Bildern des fertigen Produkts abgleichen, um zu prüfen, ob die Etiketten vorhanden sind oder nicht.

Link to this sectionWie Template Matching funktioniert#

Hier ist ein schrittweiser Überblick darüber, wie Template Matching funktioniert:

  • Schritt 1 - Vorbereitung der Bilder: Der Prozess beginnt mit dem Laden des Eingabebildes und des Vorlagenbildes, gefolgt von der Umwandlung beider in ein Graustufenbild. Da Template Matching auf dem Vergleich von Pixelwerten beruht, reduziert das Entfernen von Farbinformationen das Rauschen und beschleunigt die Bildverarbeitung.

  • Schritt 2 - Verschieben des Templates über das Bild: Als Nächstes schiebt der Template-Matching-Algorithmus das Template Pixel für Pixel über das größere Bild (beginnend in der oberen linken Ecke). Jeder Schritt dieser Bewegung ist eine Iteration, bei der der Algorithmus einen Bildausschnitt aus dem Quellbild extrahiert, der der Größe des Templates entspricht.

  • Schritt 3 - Messen der Qualität der Übereinstimmung: Jeder Bildausschnitt wird mit dem Template unter Verwendung einer mathematischen Matching-Methode verglichen, um eine Korrelationsmetrik oder einen Korrelationswert für jede mögliche Position zu generieren. Gängige Ansätze sind quadrierte Differenzen (die den numerischen Abstand zwischen Pixelintensitäten messen, um die gesamte Nichtübereinstimmung zu berechnen), normalisierte Kreuzkorrelation (die Pixelwerte multipliziert, um zu bestimmen, wie gut Hell-Dunkel-Muster übereinstimmen) und der Korrelationskoeffizient (der die durchschnittliche Helligkeit subtrahiert, um sicherzustellen, dass die Übereinstimmung auch bei leichten Lichtveränderungen präzise bleibt).

  • Schritt 4 - Identifizieren der besten Übereinstimmung: Nach der Auswertung aller Positionen wählt der Algorithmus die beste Übereinstimmung aus, indem er je nach verwendeter Methode den Maximal- oder Minimalwert ermittelt. Oft wird ein Schwellenwert auf diese Ergebnisse angewendet, um sicherzustellen, dass nur Übereinstimmungen mit einer ausreichend hohen Konfidenzbewertung akzeptiert werden, wodurch schwache oder falsche Erkennungen herausgefiltert werden.

  • Schritt 5 - Hervorheben des Ergebnisses: Schließlich wird die erkannte Position zurück auf das Originalbild abgebildet. Typischerweise wird ein Begrenzungsrahmen (BBox) um den übereinstimmenden Bereich gezeichnet, der deutlich zeigt, wo das Template erscheint.

Link to this sectionPraktische Erfahrung mit Template Matching#

Obwohl bildverarbeitungsbasiertes Template Matching aufgrund der damit verbundenen Nachteile im Allgemeinen nicht in dynamischen, realen Computer-Vision-Lösungen eingesetzt wird, ist es für dich sehr einfach zu testen, da Python-Bibliotheken wie OpenCV diesen Prozess unkompliziert gestalten und zudem leicht verständliche Tutorials anbieten. Sie verfügen über eine integrierte matchTemplate-Funktion, die die komplexen mathematischen Vergleiche übernimmt.

Außerdem werden andere Funktionen unterstützt, die bei einfachen Aufgaben helfen, wie das Laden von Bildern mit der imread-Funktion und die Farbumwandlung mit der cvtColor-Funktion, um Bilder in Graustufen umzuwandeln. Die Farbumwandlung ist ein entscheidender Schritt, da die Reduzierung eines Bildes auf einen einzigen Intensitätskanal den mathematischen Vergleich innerhalb von matchTemplate wesentlich schneller und weniger anfällig für Farbrauschen macht.

Sobald du die Ähnlichkeitskarte erstellt hast, bietet OpenCV auch eine minMaxLoc-Funktion an, um die Erkennung abzuschließen. Damit lässt sich die gesamte Karte scannen, um die globalen Minimal- und Maximalwerte sowie deren exakte Koordinaten zu identifizieren. Abhängig von der verwendeten Matching-Methode ermöglicht dir minMaxLoc, die Position der besten Übereinstimmung sofort zu lokalisieren, indem die höchste Korrelation oder der niedrigste Fehlerwert in den Daten ermittelt wird.

Neben OpenCV sind Bibliotheken wie NumPy unerlässlich für den Umgang mit Bild-Arrays und die Anwendung eines Schwellenwerts auf die Ergebnisse, während Matplotlib häufig verwendet wird, um die Ähnlichkeitskarte und die endgültige Erkennung zu visualisieren. Zusammen bieten diese Tools eine vollständige Umgebung für die Erstellung und Fehlersuche einer Template-Matching-Lösung.

Link to this sectionReale Anwendungen von Template Matching#

Nachdem wir nun ein besseres Verständnis davon haben, wie Template Matching funktioniert, schauen wir uns seine Anwendung in realen Szenarien genauer an.

Link to this sectionIdentifizierung traditioneller Architekturstile#

Im Bereich kulturelles Erbe und Architekturstudien müssen Forscher Fotografien historischer Gebäude, Tempel und Monumente analysieren, um zu verstehen, wie Designmuster über Regionen hinweg variieren. Bevor fortschrittliche Computer-Vision-Modelle weit verbreitet waren, verwendeten sie Bildabgleichstechniken zur Untersuchung solcher Strukturen.

Template Matching ermöglicht es Forschern, sich auf spezifische architektonische Merkmale wie Dachumrisse, Fensteranordnungen oder Wandmotive zu konzentrieren. Durch das Schieben von Templates oder Referenzbildern über größere Bilder können sie wiederkehrende Formen identifizieren und die manuelle Bildanalyse reduzieren, die oft Stunden dauern kann.

Ein interessantes Beispiel stammt aus einer Studie zu indonesischen traditionellen Häusern. Forscher erstellten kleine Vorlagen charakteristischer Merkmale und verglichen diese mit großformatigen Fotografien. Dieser Ansatz wurde verwendet, um Bildbereiche hervorzuheben, die eng mit der Vorlage übereinstimmten, und architektonische Stile über Regionen hinweg zu klassifizieren.

Verwendung von Template Matching zur Klassifizierung traditioneller Häuser in Indonesien

Abb. 3. Verwendung von Template Matching zur Klassifizierung traditioneller Häuser in Indonesien (Quelle)

Link to this sectionObjekterkennung in industriellen Vision-Systemen#

Industrielle Umgebungen können von Vision-Systemen profitieren, die schnell Komponenten erkennen, Baugruppen verifizieren oder Defekte aufspüren können. Bevor Deep Learning in der Fertigung weit verbreitet war, experimentierten viele Teams mit Methoden des Bildabgleichs, um diese Aufgaben zu automatisieren.

Einfach ausgedrückt kann eine Komponentenvorlage verwendet werden, um Bilder von einer Produktionslinie zu scannen und Bereiche hervorzuheben, die mit der Vorlage übereinstimmen. Dies funktioniert gut, wenn Teile in konsistenten Positionen erscheinen und die Beleuchtung stabil ist.

Link to this sectionTemplate Matching zur Lungen-Tumor-Erkennung#

Auch wenn modernste Technologien im Gesundheitswesen Wirkung zeigen, bleibt die Diagnose von Gesundheitsproblemen anhand von medizinischer Bildgebung, wie CT-Scans, eine Herausforderung. Traditionell mussten Radiologen jeden Scan-Schnitt manuell überprüfen – ein Prozess, der äußerste Präzision und viel Zeit erfordert.

Bevor Deep Learning im Gesundheitswesen eingesetzt wurde, versuchten Forscher, Template Matching zu verwenden, um den Arbeitsablauf zu rationalisieren und bei der Identifizierung von Anomalien zu unterstützen. Ein gutes Beispiel für diese Technik ist die Erkennung von Lungentumoren oder Knötchen.

Bei dieser Methode erstellen Forscher Referenzvorlagen, die die typische Form und Intensität eines Tumors darstellen. Das System schiebt dann diese Vorlagen über die Scans der Patienten und misst die Ähnlichkeit an jeder Koordinate.

Erkennung von Lungentumoren mittels Template Matching

Abb. 4. Lungen-Tumor-Erkennung mittels Template Matching (Quelle)

Link to this sectionVor- und Nachteile von Template Matching#

Hier sind einige Hauptvorteile der Verwendung von Template Matching:

  • Intuitiv und unkompliziert: Template Matching ist leicht zu verstehen und zu implementieren, was es zu einem idealen Ausgangspunkt für Anfänger in der KI und Computer Vision macht.
  • Zuverlässig unter kontrollierten Bedingungen: Es funktioniert gut bei Graustufenbildern unter gleichmäßiger Beleuchtung und liefert genaue Ergebnisse, wenn Muster und Hintergründe stabil sind.
  • Einfache Integration: Mit Python-Bibliotheken wie OpenCV kann Template Matching schnell auf reale Projekte angewendet werden, ohne komplexe Einrichtung oder hohe Rechenlast.

Obwohl Template Matching viele Vorteile bietet, hat es auch Einschränkungen. Hier sind ein paar Herausforderungen, die man im Hinterkopf behalten sollte:

  • Empfindlich gegenüber Maßstab und Rotation: Variationen in der Größe oder Ausrichtung des Templates können die Genauigkeit verringern.
  • Abhängigkeit von Beleuchtung und Kontrast: Änderungen bei der Beleuchtung oder beim Kontrast zwischen dem Template und dem Bild können zu falschen Übereinstimmungen führen oder das Erkennen des Templates erschweren.
  • Begrenzte Anpassungsfähigkeit: Im Gegensatz zu KI-basierten Methoden kann Template Matching nicht aus Daten lernen oder sich im Laufe der Zeit verbessern. Es funktioniert am besten in kontrollierten oder repetitiven Umgebungen.

Link to this sectionWichtige Erkenntnisse#

Computer Vision ist ein weites Feld und umfasst verschiedene Techniken. Das Erlernen traditioneller Bildverarbeitungstechniken, wie Template Matching, ist ein hervorragender Ausgangspunkt, um zu verstehen, wie Bildanalyse funktioniert. Bahnbrechende Vision-KI-Innovationen bauen auf denselben Kernkonzepten auf und lösen ähnliche Probleme.

Möchtest du mehr über KI erfahren? Tritt unserer Community bei und schau dir unser GitHub Repository an. Erfahre, wie KI im Einzelhandel und Vision-KI in der Fertigung Veränderungen vorantreiben. Erkunde unsere Lizenzierungsoptionen, um noch heute mit Vision-KI zu entwickeln!

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens