Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Anleitungen

Was ist Image Computing? Eine kurze Einführung

Erfahre, was Image Computing ist, wie es funktioniert und wie es im Gesundheitswesen, beim autonomen Fahren und in anderen modernen intelligenten Systemen eingesetzt wird.

ABAbirami Vina
7 min read
Maschinen interpretieren visuelle Daten durch Image Computing

Wenn du durch ein Einkaufszentrum oder eine belebte Straße gehst, zeichnen Kameras über den Eingängen und Gehwegen die Aktivitäten auf. Sie erzeugen jede Sekunde visuelle Daten, und meistens bemerken wir das nicht einmal.

Dieser ständige Datenstrom speist moderne KI-gestützte Systeme, von intelligenten Sicherheitssystemen bis hin zu selbstfahrenden Autos. Diese Innovationen werden durch Image Computing vorangetrieben, einem vielseitigen Bereich, der Informatik, Mathematik und Physik vereint.

Image Computing hilft Maschinen dabei, das zu verstehen, was sie in einem Bild sehen. Es ermöglicht Systemen zu erkennen, was in einer Szene vor sich geht, und zu entscheiden, wie sie funktionieren oder reagieren sollen, zum Beispiel ein selbstfahrendes Auto anzuhalten, wenn ein Hindernis auftaucht.

In diesem Artikel untersuchen wir, was Image Computing ist und wie es in modernsten künstlichen Intelligenz (KI) Systemen eingesetzt wird. Fangen wir an!

Link to this sectionImage Computing verstehen#

Image Computing ist der Prozess der Aufnahme, Verarbeitung und Analyse von Bildern mithilfe fortschrittlicher Algorithmen. Es behandelt Bilder als Daten, die Maschinen verstehen und mit denen sie arbeiten können.

Mit anderen Worten: Jedes Bild wird als Gitter aus Zahlen verarbeitet. Dies geschieht durch die Umwandlung von Pixeln, den kleinsten Einheiten eines Bildes, in eine Matrix aus Zeilen und Spalten. Jeder Pixel hat einen numerischen Wert, der der Maschine mitteilt, wie hell oder dunkel ein bestimmter Bereich des Bildes ist.

Die Art und Weise, wie diese Werte organisiert sind, hängt davon ab, ob es sich um ein Graustufen- oder ein Farbbild handelt. Bei Graustufenbildern liegen die Pixelwerte typischerweise zwischen 0 (schwarz) und 255 (weiß). Bei Farbbildern werden mehrere Matrizen verwendet, um verschiedene Farbkanäle darzustellen, wie Rot, Grün und Blau (RGB) oder Farbton, Sättigung und Wert (HSV).

Matrixdarstellungen digitaler Bilder

Abb. 1. Matrixdarstellungen von Bildern (Quelle)

Zusätzlich zu Pixelmatrizen enthalten Bilder oft verborgene Kontextinformationen, sogenannte Metadaten. Metadaten liefern wichtige Details wie Bildauflösung, Farbtiefe, Kamera- oder Sensoreinstellungen und den genauen Zeitpunkt der Bildaufnahme. Bilder werden in spezifischen Dateiformaten gespeichert, um sowohl visuelle Daten als auch Metadaten zu bewahren.

In der biomedizinischen Bildverarbeitung werden Bilder beispielsweise häufig im DICOM-Format (Digital Imaging and Communications in Medicine) gespeichert. DICOM kombiniert visuelle Bilddaten mit Patienteninformationen, wie Identifikationsdetails und Geräteeinstellungen, und stellt so sicher, dass die medizinische Bildanalyse genau, konsistent und sicher ist.

Link to this sectionWie Image Computing funktioniert#

Nachdem wir nun ein besseres Verständnis davon haben, was Image Computing ist, gehen wir die Schritte durch, die verwendet werden, um einen Kamera-Feed in nützliche Erkenntnisse zu verwandeln.

Obwohl der genaue Arbeitsablauf je nach Anwendung variieren kann, folgen die meisten Image-Computing-Systeme diesen Hauptphasen:

  • Bildaufnahme: Zuerst werden visuelle Daten mithilfe von Kameras und Sensoren erfasst oder aus Open-Source-Bilddatensätzen gesammelt.
  • Bildvorverarbeitung: Dann werden die aufgenommenen Bilder in der Größe angepasst, entrauscht, verbessert und in einen bestimmten Farbraum konvertiert, um die Eingaben zu standardisieren.
  • Merkmalsextraktion: Deep-Learning-Algorithmen werden verwendet, um wichtige Muster im Bild zu lernen, wie Kanten, Formen und Texturen.
  • Interpretation: Die extrahierten Merkmale werden analysiert, um Aufgaben wie Objekterkennung, Bildsegmentierung und Objektverfolgung durchzuführen.
  • Ausgabe: Schließlich generiert das System strukturierte Ausgaben, wie Klassen-Labels oder Bounding-Boxen, und präsentiert sie so, dass sie für Menschen oder andere Systeme leicht zu verstehen und für die Visualisierung nutzbar sind.

Link to this sectionImage Computing vs. Computer Vision vs. Bildverarbeitung#

Wenn du auf den Begriff Image Computing stößt, wirst du vielleicht auch Begriffe wie Bildverarbeitung und Computer Vision sehen. Obwohl diese Begriffe oft synonym verwendet werden, beschreiben sie unterschiedliche Arten, wie KI-Systeme mit visuellen Daten interagieren.

Zum Beispiel konzentriert sich Bildverarbeitung auf die Verbesserung von Bildern oder die Steigerung der Qualität von Eingabebildern mithilfe grundlegender Operationen wie Rauschentfernung, Größenanpassung und Kontrastanpassung. Währenddessen baut Computer Vision, ein Zweig der KI, auf der Bildverarbeitung auf, indem es Maschinen ermöglicht, Objekte zu erkennen, Szenen zu interpretieren und zu verstehen, was in Bildern oder Videos vor sich geht.

Image Computing kombiniert Bildverarbeitung und Computer Vision, um visuelle Daten in aussagekräftige und nutzbare Ausgaben für intelligente Systeme zu verwandeln.

Vergleich von Bildverarbeitung, Computer Vision und Bildberechnung

Abb. 2. Bildverarbeitung vs. Computer Vision vs. Image Computing. Bild vom Autor.

Link to this sectionWie Image Computing heute implementiert wird#

Schauen wir uns als Nächstes an, wie Image Computing heute implementiert wird.

In den frühen Phasen des Image Computing wurden Merkmale wie Kanten, Ecken und Texturen manuell mithilfe regelbasierter und handgefertigter Algorithmen definiert. Obwohl diese Methoden in kontrollierten Umgebungen einigermaßen gut funktionierten, hatten sie Schwierigkeiten, zu skalieren und sich an komplexe Bedingungen der realen Welt anzupassen.

Moderne Image-Computing-Systeme beheben diese Einschränkungen durch Deep-Learning-basierte Ansätze. Modelle wie Convolutional Neural Networks (CNNs) und Vision Transformer lernen automatisch relevante Merkmale aus großen Bilddatensätzen. Dies ermöglicht es ihnen, Aufgaben wie Objekterkennung, Instanzsegmentierung und Objektverfolgung mit höherer Genauigkeit und Robustheit durchzuführen.

Heute setzen Image-Computing-Workflows oft auf Echtzeit-Vision-Modelle, die für den Einsatz in modernsten KI-Systemen entwickelt wurden. Zum Beispiel ermöglichen Vision-KI-Modelle wie Ultralytics YOLO26 schnelle und effiziente Computer-Vision-Fähigkeiten wie Objekterkennung und Instanzsegmentierung sowohl auf Edge-Geräten als auch in Cloud-Umgebungen.

YOLO26 bei der Erkennung und Segmentierung von Objekten in einem Bild

Abb. 3. Ein Beispiel für die Verwendung von YOLO26 zur Erkennung und Segmentierung von Objekten in einem Bild

Link to this sectionAnwendungen von Image Computing in der realen Welt#

Image Computing wird heute in vielen realen Anwendungen eingesetzt, um visuelle Daten zu verstehen und darauf zu reagieren. Lass uns erkunden, wie Image Computing in verschiedenen Bereichen angewendet wird.

Link to this sectionMedizinisches Image Computing zur Früherkennung von Krankheiten#

Image Computing kann Ärzten und Klinikern helfen, Krankheiten früher zu erkennen und medizinische Scans effizienter zu analysieren. Diese innovativen Gesundheitssysteme können medizinische Bildgebungsdaten wie Röntgenbilder und Magnetresonanztomographie-Scans (MRT) schnell verarbeiten und liefern oft konsistentere Ergebnisse als eine manuelle Überprüfung.

Zum Beispiel können Modelle wie Ultralytics YOLO26 auf großen Mengen von Röntgenaufnahmen des Brustkorbs trainiert werden, um Muster zu lernen, die mit Infektionen und Anomalien in Verbindung stehen. Einmal trainiert, können diese Modelle helfen zu identifizieren, ob ein Scan normal aussieht oder Anzeichen von Krankheiten wie Lungenentzündung oder COVID-19 zeigt.

Link to this sectionImage Computing für autonomes Fahren#

Autonome Fahrzeuge nutzen Image Computing, um ihre Umgebung zu verstehen und Entscheidungen beim Fahren zu treffen. Die Technologie verwandelt rohes Kameramaterial in Echtzeitinformationen, die dem Fahrzeug helfen, sich sicher und reibungslos zu bewegen.

Image Computing wird häufig in Fahrerassistenzsystemen (ADAS) eingesetzt. Anstatt nur Video aufzuzeichnen, analysieren diese Module jeden Frame, um Fahrbahnmarkierungen, andere Fahrzeuge, Fußgänger und Hindernisse zu erkennen. Dies ermöglicht es dem Auto, bei geringem menschlichen Eingreifen auf wechselnde Straßenbedingungen zu reagieren.

Ein weiterer häufiger Anwendungsfall ist die Kombination von Bildern mehrerer Kameras, um eine 360-Grad-Ansicht der Umgebung des Fahrzeugs zu erstellen. Image Computing hilft dabei, Linsenverzerrungen zu korrigieren, die Bildschärfe zu verbessern und Helligkeit sowie Farbe über alle Kamera-Feeds hinweg auszugleichen. Das Ergebnis ist eine klare, nahtlose Ansicht, die es dem Fahrzeug ermöglicht, selbst bei schlechtem Wetter oder bei schlechten Lichtverhältnissen sicher zu navigieren.

Bildzusammenfügung mittels Deep Learning

Abb. 4. Bildzusammenfügung mittels Deep Learning (Quelle)

Link to this sectionVor- und Nachteile von Image Computing#

Hier sind einige der Vorteile von Image Computing:

  • Skalierbarkeit: Einmal trainiert, können Image-Computing-Systeme große Mengen visueller Daten kontinuierlich und in großem Maßstab analysieren.
  • Entscheidungsfindung: Es unterstützt zeitkritische Anwendungen wie autonomes Fahren, medizinische Screenings und industrielle Überwachung.
  • Kosteneffizienz im Laufe der Zeit: Obwohl die Ersteinrichtung teuer sein kann, kann automatisierte visuelle Analyse die langfristigen Betriebskosten senken.

Obwohl es viele Vorteile im Zusammenhang mit Image Computing gibt, gibt es auch einige Einschränkungen. Hier sind einige Faktoren, die zu berücksichtigen sind:

  • Datenqualität: Image-Computing-Methoden hängen stark von genauer Kennzeichnung und hochwertigen Datensätzen ab, deren Erstellung kostspielig und zeitaufwendig sein kann.
  • Empfindlichkeit gegenüber Bedingungen: Änderungen bei Beleuchtung, Verdeckung, Bewegungsunschärfe, Wetter oder Kamerawinkeln können die Leistung des Modells negativ beeinflussen.
  • Eingeschränkte Erklärbarkeit: Deep-Learning-basierte Bildmodelle können als Blackbox fungieren, was es schwierig macht zu erklären, wie Entscheidungen getroffen werden.

Link to this sectionWichtige Erkenntnisse#

Image Computing hat sich von grundlegender Bildverarbeitung zu einer Technologie entwickelt, die es KI-Systemen ermöglicht, die reale Welt in Echtzeit wahrzunehmen und zu verstehen. Da Deep Learning weiter voranschreitet, wird Image Computing zu einem wesentlichen Bestandteil beim Aufbau intelligenterer und praktischerer Toolkits und Anwendungen.

Tritt unserer Community bei und schau dir unser GitHub-Repository an, um mehr über KI zu lernen. Erkunde unsere Lösungsseiten, um mehr über Anwendungen von KI in der Landwirtschaft und Computer Vision in der Logistik zu erfahren. Entdecke unsere Lizenzoptionen und beginne mit dem Aufbau von Vision-KI-Modellen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens