Glossar

Generative KI

Entdecken Sie, wie generative KI originäre Inhalte wie Texte, Bilder und Audiodateien erstellt und Branchen mit innovativen Anwendungen umgestaltet.

Die generative künstliche Intelligenz (KI) stellt einen bedeutenden Zweig innerhalb des umfassenderen Bereichs der künstlichen Intelligenz (KI) dar, der sich speziell auf die Schaffung von Systemen konzentriert, die in der Lage sind, völlig neue, originelle Inhalte zu erzeugen. Diese Inhalte können verschiedene Modalitäten umfassen, darunter Text, Bilder, Audio, Code und sogar synthetische Daten. Im Gegensatz zu diskriminativen KI-Modellen, die darauf trainiert sind, auf der Grundlage von Eingabedaten zu klassifizieren oder Vorhersagen zu treffen (z. B. die Identifizierung von Objekten in einem Bild durch Objekterkennung), lernen generative Modelle die zugrunde liegenden Muster, Strukturen und Wahrscheinlichkeitsverteilungen in einem Trainingsdatensatz. Anschließend verwenden sie dieses gelernte Wissen, um neue Ergebnisse zu erzeugen, die die Merkmale der ursprünglichen Daten nachahmen. Jüngste Durchbrüche, insbesondere durch Architekturen wie Generative Pre-trained Transformers (GPT) und Diffusionsmodelle, haben die Erstellung bemerkenswert realistischer und komplexer Inhalte ermöglicht und damit die Grenzen der maschinellen Kreativität verschoben.

Wie generative KI funktioniert

Der Kerngedanke der meisten generativen Modelle besteht darin, eine Darstellung der Datenverteilung zu lernen. Sobald diese Verteilung erlernt ist, kann das Modell daraus Stichproben ziehen, um neue Datenpunkte zu erzeugen, die den Daten, auf denen es trainiert wurde, statistisch ähnlich sind. Dies erfordert komplexe neuronale Netzwerkarchitekturen (NN) und ausgefeilte Trainingstechniken. Einige bekannte Architekturen sind:

Generative KI vs. Computer Vision

Obwohl beide Teilgebiete der KI sind, verfolgen die generative KI und die Computer Vision (CV) grundlegend unterschiedliche Ziele. CV konzentriert sich darauf, Maschinen in die Lage zu versetzen, visuelle Informationen aus der Welt zu interpretieren und zu verstehen und Aufgaben wie Bildklassifizierung, Objekterkennung und Instanzsegmentierung durchzuführen. Generative KI hingegen konzentriert sich auf die Erstellung neuer visueller (oder anderer) Inhalte.

Zu den wichtigsten Unterschieden, die bei Diskussionen wie der YOLO Vision 2024 herausgestellt wurden, gehören:

  1. Größe des Modells: Generative Modelle, insbesondere LLMs und große Bildmodelle, enthalten oft Milliarden oder sogar Billionen von Parametern. CV-Modelle, die für die Echtzeitanalyse entwickelt wurden, wie z. B. Ultralytics YOLO11, sind in der Regel viel kleiner und effizienter, wobei einige Varianten nur ein paar Millionen Parameter haben(Vergleich der YOLO-Modelle).
  2. Rechnerische Ressourcen: Das Trainieren und Ausführen großer generativer Modelle erfordert eine beträchtliche Rechenleistung, oft unter Einbeziehung verteilter Cluster von Grafikprozessoren. Viele CV-Modelle, darunter auch die von Ultralytics, sind auf Effizienz optimiert und können auf Standard-Hardware oder speziellen Edge-Geräten mit Frameworks wie ONNX oder TensorRT eingesetzt werden.
  3. Ziel: CV analysiert vorhandene Daten; generative KI synthetisiert neue Daten.

Trotz dieser Unterschiede sind die beiden Bereiche zunehmend miteinander verbunden. Generative KI erweist sich als wertvoll für die Lebenslaufforschung, da sie hochwertige synthetische Daten erzeugt. Diese synthetischen Daten können reale Datensätze ergänzen und dabei helfen, robustere und genauere Lebenslaufmodelle zu trainieren, insbesondere für Szenarien, in denen reale Daten knapp oder schwer zu beschaffen sind, wie z. B. bei Simulationen des autonomen Fahrens oder der Darstellung seltener medizinischer Erkrankungen(KI im Gesundheitswesen).

Anwendungen in der realen Welt

Die generative KI verändert zahlreiche Branchen:

  • Erstellung von Inhalten: Automatische Erstellung von Artikeln, Marketingtexten und Skripten(GPT-3), Erstellung einzigartiger Bilder und Grafiken(Midjourney, DALL-E 3), Komposition von Musik und Erstellung von Videoinhalten(OpenAI Sora).
  • Synthetische Datenerzeugung: Erstellung realistischer Datensätze für das Training von ML-Modellen in Bereichen wie Robotik, Finanzen(Computer-Vision-Modelle im Finanzwesen) und Gesundheitswesen, Verbesserung der Modellleistung und Lösung von Datenschutzproblemen. So können beispielsweise synthetische medizinische Bilder erzeugt werden, um Diagnosetools zu trainieren, ohne echte Patientendaten zu verwenden.
  • Arzneimittelentdeckung und Materialwissenschaft: Entwurf neuartiger Molekülstrukturen und Vorhersage ihrer Eigenschaften, Beschleunigung von Forschung und Entwicklung, wie von Organisationen wie Google DeepMind gezeigt.
  • Personalisierung: Ermöglichung hochgradig individueller Benutzererlebnisse durch dynamische Inhaltserstellung in Chatbots, virtuellen Assistenten und Empfehlungsmaschinen.
  • Software-Entwicklung: Unterstützung von Entwicklern durch Generierung von Codeschnipseln, Vorschläge für Fehlerbehebungen und sogar die Erstellung ganzer Funktionen auf der Grundlage von Beschreibungen in natürlicher Sprache(GitHub Copilot).

Herausforderungen und ethische Erwägungen

Der rasche Fortschritt der generativen KI bringt auch Herausforderungen mit sich. Die Gewährleistung der ethischen Nutzung dieser leistungsstarken Werkzeuge ist von größter Bedeutung, insbesondere im Hinblick auf Deepfakes, Fehlinformationen, Rechte an geistigem Eigentum und inhärente Verzerrungen, die aus Trainingsdaten gelernt werden. Die Bewältigung dieser Probleme erfordert eine sorgfältige Modellentwicklung, robuste Erkennungsmethoden und klare Richtlinien, die in den Grundsätzen der KI-Ethik festgelegt sind. Darüber hinaus stellen die erforderlichen beträchtlichen Rechenressourcen ein Problem für die Umwelt und die Zugänglichkeit dar. Plattformen wie Ultralytics HUB zielen darauf ab, Arbeitsabläufe zu rationalisieren und potenziell die Einstiegshürden für bestimmte KI-Aufgaben zu senken.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert