Glossar

Datenvisualisierung

Verwandeln Sie komplexe KI/ML-Daten mit leistungsstarken Visualisierungstechniken und -tools in verwertbare Erkenntnisse. Erfahren Sie mehr bei Ultralytics!

Bei der Datenvisualisierung werden komplexe Informationen und Rohdaten in einen visuellen Kontext übersetzt, z. B. in Diagramme, Grafiken und Karten. Dadurch werden die zugrundeliegenden Daten für das menschliche Gehirn leichter verständlich und helfen dabei, sinnvolle Erkenntnisse zu gewinnen. Im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) ist die Datenvisualisierung von entscheidender Bedeutung für die Erkundung von Datensätzen, das Verständnis des Modellverhaltens während des Trainings, die Bewertung der Leistung und die effektive Kommunikation der Ergebnisse. Sie wandelt potenziell überwältigende numerische Daten in intuitive visuelle Darstellungen um und hebt Muster, Trends, Anomalien und Beziehungen hervor, die in rohen Zahlen oder Textberichten möglicherweise verborgen bleiben.

Zentrale Konzepte und Techniken

Das Hauptziel der Datenvisualisierung besteht darin, Daten übersichtlich darzustellen und das Verständnis zu erleichtern. Dies wird durch verschiedene grafische Methoden erreicht, darunter:

  • Balkendiagramme: Vergleich von Mengen über verschiedene Kategorien hinweg.
  • Liniendiagramme: Zur Darstellung von Trends im Zeitverlauf oder von kontinuierlichen Intervallen.
  • Streudiagramme: Aufzeigen von Beziehungen und Korrelationen zwischen zwei numerischen Variablen.
  • Heatmaps: Anzeige von Matrixdaten, bei denen die Werte durch Farbintensität dargestellt werden, häufig verwendet für Korrelationsmatrizen oder zur Visualisierung der Aktivierung in neuronalen Netzen. Siehe den Ultralytics-Leitfaden zu Heatmaps.
  • Histogramme: Zeigen die Verteilung einer einzelnen numerischen Variable.
  • Box Plots: Zusammenfassung der Verteilung von Daten durch Quartile.

Die Wahl der richtigen Visualisierungstechnik hängt stark von der Art der Daten und der spezifischen Erkenntnis ab, die Sie vermitteln möchten. Eine wirksame Visualisierung erfordert auch eine sorgfältige Berücksichtigung von Designelementen wie Farbpaletten, Skalierung, Achsen und Beschriftungen, um eine genaue Darstellung zu gewährleisten, ohne den Betrachter in die Irre zu führen. Beliebte Python-Bibliotheken wie Matplotlib und Seaborn bieten leistungsstarke Tools zur Erstellung einer breiten Palette statischer, animierter und interaktiver Visualisierungen, die häufig in der Datenwissenschaft verwendet werden. Die Einhaltung grundlegender Prinzipien der visuellen Darstellung ist der Schlüssel für ein wirkungsvolles Data Storytelling.

Bedeutung für KI und maschinelles Lernen

Datenvisualisierung ist während des gesamten Lebenszyklus von KI/ML-Projekten unverzichtbar:

Real-World AI/ML-Anwendungen

  1. Medizinische Bildanalyse: In der KI im Gesundheitswesen hilft die Visualisierung bei der Interpretation komplexer medizinischer Scans. Ein Modell zur Objekterkennung, das auf einem Datensatz wie dem Hirntumordatensatz trainiert wurde, kann Bounding Boxes ausgeben, die mögliche Anomalien identifizieren. Durch die Visualisierung dieser Boxen, die direkt auf MRT- oder CT-Scans eingeblendet werden, können Radiologen die Ergebnisse des Modells schnell bewerten und so die Diagnose unterstützen. Darüber hinaus kann die Visualisierung von Patientenergebnissen auf der Grundlage von Bildgebungsmerkmalen helfen, Krankheitsuntertypen zu identifizieren. Die KI im Gesundheitswesen ist in hohem Maße auf solche visuellen Hilfsmittel angewiesen. Weitere Anwendungen können Sie beim National Institute of Biomedical Imaging and Bioengineering (NIBIB) erkunden.
  2. Autonome Fahrzeugentwicklung: Selbstfahrende Autosysteme verarbeiten riesige Mengen von Sensordaten. Die Visualisierung wird während der Entwicklung und Prüfung ausgiebig genutzt. Ingenieure visualisieren LiDAR-Punktwolken, Radarsignaturen und Kamerabilder in einer 3D-Simulation der Umgebung. Erkannte Objekte (Autos, Fußgänger, Radfahrer), die von Modellen wie YOLO identifiziert wurden, werden häufig mit Bounding Boxes, Verfolgungspfaden und Vertrauenswerten angezeigt, so dass die Entwickler die Genauigkeit und Sicherheit des Erkennungssystems in verschiedenen Szenarien überprüfen können. Sehen Sie sich Beispiele für KI-Lösungen in der Automobilindustrie an und erfahren Sie mehr über Branchenansätze von Unternehmen wie Mobileye.

Unterscheidung von verwandten Begriffen

  • Datenanalyse: Hierbei handelt es sich um ein breiteres Feld, das den gesamten Prozess der Prüfung, Bereinigung, Umwandlung und Modellierung von Daten umfasst, um nützliche Informationen zu entdecken und die Entscheidungsfindung zu unterstützen. Die Datenvisualisierung ist eine Komponente oder ein Werkzeug, das innerhalb der Datenanalyse verwendet wird, um Ergebnisse zu präsentieren oder Daten zu untersuchen, aber die Analyse umfasst auch statistische Modellierung, Hypothesentests und andere nichtvisuelle Methoden. Erfahren Sie mehr über die Grundlagen der Datenanalytik.
  • Bildverarbeitung: Dieser Bereich konzentriert sich auf die Bearbeitung digitaler Bilder, um sie zu verbessern oder Informationen direkt aus den Pixeldaten zu extrahieren (z. B. Filterung, Kantenerkennung, Kontrastanpassung). Während es bei der Visualisierung auch um die Darstellung von Bildern gehen kann, geht es bei der Datenvisualisierung in der KI/ML oft um die Darstellung abstrakter Daten (z. B. Modellleistungskennzahlen oder Merkmalsbeziehungen) oder um die Überlagerung von Modellinterpretationen (z. B. Erkennungen) auf Bildern, anstatt die Bilder selbst zu transformieren. Lesen Sie mehr über die Unterschiede in diesem Blogbeitrag über Computer Vision und Bildverarbeitung.
  • Explorative Datenanalyse (EDA): EDA ist der Prozess der Analyse von Datensätzen, um deren Hauptmerkmale zu verstehen, oft unter Verwendung visueller Methoden. Datenvisualisierungstechniken sind die wichtigsten Werkzeuge, die bei der EDA eingesetzt werden, um Muster aufzudecken, Anomalien zu erkennen, Hypothesen zu testen und Annahmen zu überprüfen. Der Leitfaden zur Vorverarbeitung annotierter Daten behandelt EDA-Konzepte, die für Computer-Vision-Datensätze relevant sind.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert