Glossar

Natürliche Sprachverarbeitung (NLP)

Entdecken Sie Konzepte, Techniken und Anwendungen der natürlichen Sprachverarbeitung (NLP) wie Chatbots, Stimmungsanalyse und maschinelle Übersetzung.

Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist ein dynamischer Bereich der künstlichen Intelligenz (AI) und des maschinellen Lernens (ML), der es Computern ermöglichen soll, menschliche Sprache zu verstehen, zu interpretieren, zu generieren und mit ihr auf wertvolle Weise zu interagieren. Das ultimative Ziel von NLP ist es, die Kommunikationskluft zwischen Menschen und Maschinen zu überbrücken und es Software zu ermöglichen, Text- und Sprachdaten in einem Umfang und einer Geschwindigkeit zu verarbeiten und zu analysieren, die über die menschlichen Fähigkeiten hinausgehen. Dazu müssen Algorithmen und Modelle entwickelt werden, die die Komplexität, die Nuancen und den Kontext natürlicher Sprachen verarbeiten können.

Wie funktioniert NLP?

NLP-Systeme verwenden Computerlinguistik - die regelbasierte Modellierung menschlicher Sprache - zusammen mit statistischen und Deep-Learning-Modellen zur Verarbeitung von Sprachdaten. Der Prozess beginnt in der Regel mit der Datenvorverarbeitung, bei der der Rohtext durch einen Prozess namens Tokenisierung in kleinere, handhabbare Einheiten zerlegt wird.

Nach der Tokenisierung nutzen moderne NLP-Pipelines fortschrittliche neuronale Netzarchitekturen wie rekurrente neuronale Netze (RNNs) und in jüngerer Zeit die äußerst einflussreiche Transformer-Architektur. Diese Modelle, die die Grundlage für die heutigen Large Language Models (LLMs) bilden, analysieren die kontextuellen Beziehungen zwischen Wörtern. Dadurch sind sie in der Lage, komplexe Aufgaben wie die Erkennung von Absichten, die Übersetzung von Sprachen und sogar die Erstellung von Originalinhalten zu übernehmen. Führende Einrichtungen wie die Stanford NLP Group und Organisationen wie die Association for Computational Linguistics (ACL) stehen bei dieser Forschung an vorderster Front.

Anwendungen in der realen Welt

NLP ermöglicht eine breite Palette von Anwendungen, die viele von uns täglich nutzen. Zwei prominente Beispiele sind:

  1. Maschinelle Übersetzung: Tools wie Google Translate verwenden hochentwickelte NLP-Modelle, um Text und Sprache automatisch von einer Sprache in eine andere zu übersetzen. Diese Systeme analysieren die Satzstruktur und Bedeutung in der Ausgangssprache und generieren dann eine grammatikalisch korrekte und kontextuell angemessene Übersetzung in der Zielsprache. Diese Modelle werden anhand umfangreicher Datensätze mit Paralleltexten aus Quellen wie den Protokollen der Vereinten Nationen trainiert.

  2. Stimmungsanalyse: Unternehmen nutzen NLP zur Analyse von Kundenfeedback aus sozialen Medien, Produktbewertungen und Umfragen. Indem sie den emotionalen Ton des Textes als positiv, negativ oder neutral klassifizieren, können Unternehmen Einblicke in die öffentliche Meinung, die Kundenzufriedenheit und die Markenwahrnehmung gewinnen, was datengesteuerte Entscheidungen ermöglicht.

Weitere gängige Anwendungen sind intelligente virtuelle Assistenten wie Siri und Alexa, Spam-E-Mail-Filter, Tools zur Textzusammenfassung und Chatbots für den Kundendienst.

NLP vs. Verwandte Konzepte

NLP ist zwar verwandt, unterscheidet sich aber von einigen ähnlichen Begriffen:

  • Natürliches Sprachverstehen (NLU): NLU ist ein Teilbereich des NLP, der sich speziell auf den Aspekt des Verstehens konzentriert, d. h. auf das Extrahieren von Bedeutung, Absicht und Kontext aus der Sprache. NLP ist breiter angelegt und umfasst auch Aufgaben wie Texterstellung und Sprachsynthese.
  • Textgenerierung: Dies ist eine spezifische Fähigkeit oder Aufgabe innerhalb des NLP, die sich auf die Produktion von menschenähnlichem Text konzentriert. Sie ist zwar ein zentraler Bestandteil vieler NLP-Anwendungen (wie Chatbots oder Übersetzungen), deckt aber nicht die Verständnis- oder Analyseaspekte von NLP ab.
  • Computer Vision (CV): CV befasst sich mit der Interpretation und dem Verständnis von Informationen aus visuellen Eingaben wie Bildern und Videos und konzentriert sich auf Aufgaben wie Objekterkennung oder Bildsegmentierung. NLP hingegen konzentriert sich auf Sprachdaten. Die beiden Bereiche überschneiden sich jedoch zunehmend in multimodalen Modellen, die sowohl Text als auch Bilder verarbeiten und Anwendungen wie die automatische Bilduntertitelung ermöglichen. Sie können mehr über die Verbindung von NLP und CV lesen. Ultralytics ist auf CV spezialisiert und bietet Modelle wie Ultralytics YOLO11 für Aufgaben, die hohe Genauigkeit und Geschwindigkeit erfordern.

Werkzeuge und Plattformen

Die Entwicklung und Bereitstellung von NLP-Anwendungen erfordert häufig den Einsatz von Spezialbibliotheken und -plattformen:

  • Bibliotheken: Open-Source-Bibliotheken wie spaCy und NLTK bieten Werkzeuge für gängige NLP-Aufgaben wie Tokenisierung, Parsing und Entity-Erkennung.
  • Plattformen: Hugging Face bietet ein umfangreiches Repository an vortrainierten Modellen (insbesondere Transformers), Datensätzen und Tools, die die Entwicklung erheblich beschleunigen. Für die Verwaltung des gesamten Lebenszyklus von ML-Modellen, einschließlich solcher, die in NLP- oder kombinierten CV-NLP-Pipelines verwendet werden, bieten Plattformen wie Ultralytics HUB robuste MLOps-Funktionen, die Training, Bereitstellung und Überwachung rationalisieren. In der Ultralytics-Dokumentation finden Sie weitere Ressourcen zur Modellentwicklung und -bereitstellung.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert