Alles, was du über Explainable AI (XAI) wissen musst
Entdecke, wie Explainable AI (XAI) Vertrauen aufbaut, indem KI-Vorhersagen im Gesundheitswesen, in der Sicherheit, beim autonomen Fahren und mehr transparent und zuverlässig gemacht werden.

Hast du jemals eine Antwort von einem künstliche Intelligenz (KI)-Tool wie ChatGPT gesehen und dich gefragt, wie es zu diesem Schluss gekommen ist? Dann bist du dem Problem der „Black Box“ der KI begegnet. Dieser Begriff beschreibt den Mangel an Klarheit darüber, wie KI-Modelle Daten verarbeiten und analysieren. Selbst KI-Ingenieure und Wissenschaftler, die regelmäßig mit modernsten KI-Algorithmen arbeiten, empfinden es oft als herausfordernd, deren interne Abläufe vollständig zu verstehen. Tatsächlich verstehen nur 22 % der IT-Fachleute die Fähigkeiten von KI-Tools wirklich.
Die Ungewissheit darüber, wie KI-Modelle Entscheidungen treffen, kann riskant sein, insbesondere in kritischen Bereichen wie Computer Vision im Gesundheitswesen und KI im Finanzwesen. Es werden jedoch bedeutende Fortschritte erzielt, um diese Herausforderungen anzugehen und die Transparenz zu verbessern.
Insbesondere die erklärbare KI (XAI) konzentriert sich ausschließlich auf die Lösung dieses Problems. Einfach ausgedrückt handelt es sich um eine Reihe von Prozessen und Methoden, die menschlichen Anwendern helfen, die Ergebnisse oder Ausgaben komplexer Machine Learning-Algorithmen zu verstehen und ihnen zu vertrauen.
XAI kann Entwicklern helfen sicherzustellen, dass KI-Systeme wie erwartet funktionieren. Es kann KI-Unternehmen auch dabei unterstützen, regulatorische Standards zu erfüllen. In diesem Artikel erkunden wir die erklärbare KI und ihre vielfältigen Anwendungsfälle. Lass uns anfangen!
Link to this sectionDie Bedeutung von erklärbarer KI#
Erklärbarkeit ist entscheidend bei der Arbeit mit KI. Dies gilt insbesondere für das Teilgebiet der KI, Computer Vision, das in vielen Branchen wie dem Gesundheitswesen weit verbreitet ist. Bei der Verwendung von Vision-Modellen in derart sensiblen Branchen ist es wichtig, dass die Funktionsweise des Modells für jeden transparent und interpretierbar ist.
Die Interpretierbarkeit von Computer-Vision-Modellen hilft den Benutzern, besser zu verstehen, wie eine Vorhersage getroffen wurde und welche Logik dahintersteckt. Transparenz trägt dazu bei, indem sie die Funktionsweise des Modells für alle klar macht, die Grenzen des Modells deutlich aufzeigt und sicherstellt, dass Daten ethisch korrekt verwendet werden. Beispielsweise kann Computer Vision Radiologen dabei unterstützen, gesundheitliche Komplikationen in Röntgenbildern effizient zu identifizieren.

Abb. 1. Thorax-Röntgenaufnahmen, die mittels Vision-KI analysiert wurden und Klassifizierungen für gesund, krank, aktiv und latent bei Tuberkulose zeigen.
Ein Vision-System, das lediglich präzise ist, reicht jedoch nicht aus. Das System muss auch in der Lage sein, seine Entscheidungen zu erklären. Angenommen, das System könnte zeigen, welche Teile des Bildes zu seinen Schlussfolgerungen geführt haben – dann wären die Ergebnisse wesentlich klarer. Ein solches Maß an Transparenz würde medizinischem Fachpersonal helfen, ihre Befunde zu überprüfen und sicherzustellen, dass die Patientenversorgung den medizinischen Standards entspricht.
Ein weiterer Grund, warum Erklärbarkeit wesentlich ist, besteht darin, dass sie KI-Unternehmen in die Pflicht nimmt und Vertrauen bei den Nutzern aufbaut. Vertrauenswürdige KI führt dazu, dass Nutzer darauf vertrauen können, dass KI-Innovationen zuverlässig funktionieren, faire Entscheidungen treffen und verantwortungsbewusst mit Daten umgehen.
Link to this sectionWichtige Techniken der erklärbaren KI in der Computer Vision#
Nachdem wir nun besprochen haben, warum Erklärbarkeit in der Computer Vision wichtig ist, werfen wir einen Blick auf die wichtigsten XAI-Techniken, die in der Vision-KI verwendet werden.
Link to this sectionSaliency Maps#
Neuronale Netze sind Modelle, die vom menschlichen Gehirn inspiriert sind und darauf ausgelegt sind, Muster zu erkennen und Entscheidungen zu treffen, indem sie Daten durch miteinander verbundene Knotenschichten (Neuronen) verarbeiten. Sie können verwendet werden, um komplexe Probleme der Computer Vision mit hoher Genauigkeit zu lösen. Trotz dieser Genauigkeit sind sie konzeptbedingt dennoch Black Boxes.
Saliency Maps sind eine XAI-Technik, die helfen kann, nachzuvollziehen, was neuronale Netze sehen, wenn sie Bilder analysieren. Sie können auch zur Fehlerbehebung bei Modellen verwendet werden, falls diese nicht wie erwartet funktionieren.
Saliency Maps funktionieren, indem sie sich darauf konzentrieren, welche Teile eines Bildes (Pixel) die Vorhersagen eines Modells definieren. Dieser Prozess ähnelt sehr der Backpropagation, bei der das Modell von den Vorhersagen zurück zum Input verfolgt wird. Anstatt jedoch die Modellgewichte basierend auf Fehlern zu aktualisieren, betrachten wir nur, wie stark jedes Pixel für die Vorhersage „ins Gewicht fällt“. Saliency Maps sind sehr nützlich für Computer-Vision-Aufgaben wie die Bildklassifizierung.
Wenn beispielsweise ein Bildklassifizierungs-Modell vorhersagt, dass ein Bild einen Hund zeigt, können wir uns die zugehörige Saliency Map ansehen, um zu verstehen, warum das Modell denkt, es sei ein Hund. Dies hilft uns zu identifizieren, welche Pixel das Ergebnis am stärksten beeinflussen. Die Saliency Map würde alle Pixel hervorheben, die zur endgültigen Vorhersage beigetragen haben, dass es sich um einen Hund handelt.

Abb. 2. Eine Gegenüberstellung der Eingangsbilder und ihrer Saliency Maps.
Link to this sectionClass Activation Mapping (CAM)#
Class Activation Mapping ist eine weitere XAI-Technik, mit der verstanden werden soll, auf welche Teile eines Bildes sich ein neuronales Netz bei Bildklassifizierungsvorhersagen konzentriert. Es funktioniert ähnlich wie Saliency Maps, konzentriert sich jedoch auf die Identifizierung wichtiger Merkmale im Bild anstelle einzelner Pixel. Merkmale sind Muster oder Details wie Formen oder Texturen, die das Modell im Bild erkennt.
Methoden wie Gradient Weighted Class Activation Mapping (Grad-CAM) und Grad-CAM++ bauen auf derselben Idee auf, jedoch mit einigen Verbesserungen.
So funktioniert CAM:
- Bevor das neuronale Netz seine endgültige Entscheidung trifft, verwendet es einen Schritt namens Global Average Pooling (GAP), um die Informationen zu vereinfachen. GAP kombiniert alle Pixel in einem erkannten Muster zu einem einzigen Durchschnittswert und erstellt so eine Zusammenfassung für jede Feature Map (eine visuelle Darstellung erkannter Muster).
- Jeder Feature Map wird dann ein Gewicht zugewiesen, das anzeigt, wie wichtig sie für die Vorhersage einer bestimmten Klasse (wie „Vogel“ oder „Katze“) ist.
- Eine Einschränkung von CAM besteht jedoch darin, dass du das Modell möglicherweise neu trainieren musst, um diese Gewichte zu berechnen, was zeitaufwendig sein kann.
Grad-CAM verbessert dies durch die Verwendung von Gradienten, die wie Signale fungieren und zeigen, wie stark jede Feature Map die endgültige Vorhersage beeinflusst. Diese Methode macht GAP überflüssig und erleichtert es zu sehen, worauf sich das Modell konzentriert, ohne dass ein erneutes Training erforderlich ist. Grad-CAM++ geht noch einen Schritt weiter, indem es sich nur auf positive Einflüsse konzentriert, was die Ergebnisse noch klarer macht.

Abb. 3. Vergleich von CAM, Grad-CAM und Grad-CAM++.
Link to this sectionKontrafaktische Erklärungen#
Kontrafaktische Erklärungen sind ein wichtiges Element der erklärbaren KI. Eine kontrafaktische Erklärung beinhaltet die Beschreibung einer Situation oder eines Ergebnisses durch Berücksichtigung alternativer Szenarien oder Ereignisse, die nicht eingetreten sind, aber hätten eintreten können. Sie kann demonstrieren, wie Änderungen an bestimmten Eingabevariablen zu anderen Ergebnissen führen, wie etwa: „Wenn X nicht passiert wäre, wäre Y nicht eingetreten.“
Wenn es um KI und Computer Vision geht, identifiziert eine kontrafaktische Erklärung die kleinste erforderliche Änderung in einem Input (wie einem Bild oder Daten), damit ein KI-Modell ein anderes, spezifisches Ergebnis liefert. Beispielsweise könnte das Ändern der Farbe eines Objekts in einem Bild die Vorhersage eines Bildklassifizierungsmodells von „Katze“ in „Hund“ ändern.
Ein weiteres gutes Beispiel wäre das Ändern des Winkels oder der Beleuchtung in einem Gesichtserkennungssystem. Dies könnte dazu führen, dass das Modell eine andere Person identifiziert, was zeigt, wie kleine Änderungen am Input die Vorhersagen des Modells beeinflussen können.
Der einfachste Weg, diese Erklärungen zu erstellen, ist durch Ausprobieren (Trial and Error): Du kannst Teile des Inputs (wie Merkmale des Bildes oder Daten) zufällig ändern, bis das KI-Modell das gewünschte Ergebnis liefert. Andere Methoden umfassen modellunabhängige Ansätze, die Optimierungs- und Suchtechniken verwenden, um Änderungen zu finden, sowie modellspezifische Ansätze, die sich auf interne Einstellungen oder Berechnungen verlassen, um die erforderlichen Änderungen zu identifizieren.
Link to this sectionAnwendungen der erklärbaren KI in der Computer Vision#
Nachdem wir nun untersucht haben, was XAI ist und welche wichtigen Techniken es gibt, können wir durchgehen, wie es im wirklichen Leben eingesetzt wird. XAI hat vielfältige Anwendungen in vielen Bereichen. Lass uns in einige Anwendungsfälle eintauchen, die ihr Potenzial hervorheben:
- Sicherheitssysteme: XAI kann zur Verbesserung von Sicherheitssystemen eingesetzt werden, indem manipulierte Bilder in Ausweisdokumenten wie Pässen und Führerscheinen erkannt werden. Dies stellt die Echtheit von Bildern sicher, stärkt Identitätsprüfungsprozesse und verhindert betrügerische Aktivitäten in sensiblen Anwendungen.

Abb. 4. Wie XAI arbeitet, um manipulierte Bilder zu erkennen.
-
Autonomes Fahren: Das Verständnis der Fähigkeiten und Grenzen des Onboard-Vision-KI-Systems eines selbstfahrenden Autos kann ein großer Teil beim Testen des Fahrzeugs sein, bevor es auf realen Straßen eingesetzt wird. XAI kann Automobilunternehmen dabei helfen, Probleme klarer zu identifizieren und anzugehen.
-
Rechtssysteme: Vision-gestützte Dokumentenanalyse-Systeme werden zunehmend bei gerichtlichen Entscheidungsfindungen eingesetzt. XAI unterstützt faire Ergebnisse und ermöglicht es, automatisierte Urteile zu hinterfragen. Es hilft auch Rechtsexperten zu verstehen, wie ein KI-Modell zu seinen Entscheidungen gelangt.
-
Wildtierüberwachung: Kamerafallen werden oft verwendet, um Wildtiere zu beobachten und Daten über Tierarten zu sammeln. XAI kann verwendet werden, um zu erklären, wie KI diese Arten auf den Bildern klassifiziert. Auf diese Weise können Schutzbemühungen zuverlässiger und genauer sein.
Link to this sectionWichtige Erkenntnisse über erklärbare KI#
Erklärbare KI macht es einfacher zu verstehen, wie KI-Systeme funktionieren und warum sie bestimmte Entscheidungen treffen. Transparenz über KI-Modelle schafft Vertrauen und Verantwortlichkeit. Wissen ist Macht und hilft dabei, KI-Innovationen verantwortungsbewusster zu nutzen. In kritischen Bereichen wie dem Gesundheitswesen, der Sicherheit, dem autonomen Fahren und Rechtssystemen kann XAI verwendet werden, um Entwicklern und Benutzern zu helfen, KI-Vorhersagen zu verstehen, Fehler zu identifizieren sowie eine faire und ethische Verwendung sicherzustellen. Indem sie KI transparenter macht, schlägt XAI die Brücke zwischen Technologie und menschlichem Vertrauen und macht sie sicherer und zuverlässiger für reale Anwendungen.
Um mehr zu erfahren, besuche unser GitHub-Repository und engagiere dich in unserer Community. Erkunde KI-Anwendungen in selbstfahrenden Autos und der Landwirtschaft auf unseren Lösungsseiten. 🚀






