Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Named Entity Recognition (NER) (Erkennung benannter Entitäten)

Entdecken Sie die Erkennung benannter Entitäten (NER) in NLP. Erfahren Sie, wie Sie classify wie Namen und Daten identifizieren und classify können, um mit KI und Ultralytics Erkenntnisse zu gewinnen.

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist eine zentrale Teilaufgabe der natürlichen Sprachverarbeitung (Natural Language Processing, NLP) , bei der wichtige Informationen in unstrukturierten Texten identifiziert und klassifiziert werden. In einem typischen Arbeitsablauf scannt ein NER-Modell ein Dokument, um „Entitäten” zu finden – bestimmte Wörter oder Ausdrücke, die Objekte aus der realen Welt repräsentieren – und ordnet sie vordefinierten Kategorien zu, wie Namen von Personen, Organisationen, Orten, Daten oder medizinischen Codes. Dieser Prozess ist unerlässlich, um rohe, unstrukturierte Daten wie E-Mails, Kundenbewertungen und Nachrichtenartikel in strukturierte Formate umzuwandeln, die Maschinen verarbeiten und analysieren können. Durch die Beantwortung der Fragen „Wer, was und wo” in einem Text ermöglicht NER Künstlichen Intelligenz (KI) -Systemen, automatisch aussagekräftige Erkenntnisse aus riesigen Informationsmengen zu gewinnen.

Wie NER funktioniert

Moderne NER-Systeme nutzen fortschrittliche statistische Modelle und Deep-Learning-Techniken (DL), um den Kontext eines Wortes zu verstehen. Der Prozess beginnt mit der Tokenisierung, bei der ein Satz in einzelne Einheiten, sogenannte Token, zerlegt wird. Ausgefeilte Architekturen wie der Transformer analysieren dann die Beziehungen zwischen diesen Token, um ihre Bedeutung anhand ihrer Verwendung zu bestimmen.

Das Wort „Apple“ kann beispielsweise je nach Satz auf eine Frucht oder ein Technologieunternehmen verweisen. Durch Mechanismen wie Selbstaufmerksamkeit erkennt ein NER-Modell, dass „Apple hat ein neues Telefon herausgebracht“ sich auf eine Organisation bezieht, während „Ich habe einen Apfel gegessen“ sich auf ein generisches Objekt bezieht. Die Leistung dieser Modelle hängt stark von hochwertigen Trainingsdaten und präzisen Datenannotationen ab. In multimodalen Anwendungen wird NER oft mit optischer Zeichenerkennung (OCR) kombiniert, um Text aus Bildern zu extrahieren, bevor er verarbeitet wird.

Anwendungsfälle in der Praxis

NER ist eine grundlegende Technologie für viele intelligente Automatisierungstools, die in verschiedenen Branchen eingesetzt werden.

  • KI im Gesundheitswesen: Medizinische Einrichtungen nutzen NER, um elektronische Gesundheitsakten nach wichtigen Daten zu durchsuchen. Durch die Extraktion von Entitäten wie Symptomen, Medikamentennamen und Dosierungen aus klinischen Notizen können Forscher die Arzneimittelentwicklung beschleunigen und die Patientenversorgung verbessern.
  • Intelligenter Kundensupport: Unternehmen setzen Chatbots ein, die mit NER ausgestattet sind, um Kundenbeschwerden automatisch zu classify ifizieren. Wenn ein Benutzer die Nachricht „Der Bildschirm meines Laptops ist kaputt“ sendet, identifiziert das System „Laptop“ als Produkt und „Bildschirm ist kaputt“ als Defekt und leitet das Ticket sofort an den technischen Support weiter.
  • Inhaltsempfehlung: Streaming-Dienste und Nachrichtenaggregatoren verwenden NER, um Inhalte mit relevanten Entitäten (z. B. Schauspielern, Genres, Orten) zu versehen. Empfehlungssysteme verwenden diese Tags dann , um neue Filme oder Artikel vorzuschlagen, die den Interessen eines Benutzers entsprechen.
  • Finanzanalyse: Investmentfirmen nutzen NER, um täglich Tausende von Finanzberichten und Nachrichtenartikeln zu scannen. Durch die Extraktion von Firmennamen und Geldwerten können sie vorausschauende Modelle erstellen, um Markttrends zu prognostizieren .

Unterscheidung von NER und verwandten Konzepten

Es ist hilfreich, NER von anderen Interpretationsaufgaben zu unterscheiden, um seine spezifische Rolle in einer KI-Pipeline zu verstehen.

  • Objekterkennung: Während NER Entitäten in Texten identifiziert, identifiziert die Objekterkennung Entitäten in Bildern. Beispielsweise erkennt ein visuelles Modell wie YOLO26 Autos und Fußgänger in Video-Feeds, während NER „Ford” und „Fahrer” in schriftlichen Berichten erkennt. Beide Aufgaben zielen darauf ab, interessante classify innerhalb ihrer jeweiligen Datenmodalitäten zu lokalisieren und classify .
  • Sentimentanalyse: Diese Aufgabe bestimmt den emotionalen Ton (positiv, negativ oder neutral) eines Textes. NER extrahiert, worüber gesprochen wird (z. B. „Das iPhone 16”), während die Sentimentanalyse bestimmt, wie der Benutzer darüber denkt (z. B. „ist erstaunlich”).
  • Natural Language Understanding (NLU): NLU ist ein weiter gefasster Oberbegriff für maschinelles Leseverständnis. NER ist eine spezifische Komponente von NLU, die oft zusammen mit der Intent-Klassifizierung eingesetzt wird, um die Bedeutung der Eingabe eines Benutzers vollständig zu erfassen.
  • Keyword-Extraktion: Im Gegensatz zu NER, das Wörter in semantische Kategorien (z. B. Person, Datum) einteilt, identifiziert die Keyword-Extraktion lediglich die häufigsten oder relevantesten Begriffe in einem Dokument, ohne deren Entitätstyp zu verstehen.

Kombination von NER mit Computer Vision

Die Konvergenz von Text und Bild ist ein wachsender Trend im multimodalen Lernen. Modelle wie YOLO schließen diese Lücke, indem sie Textprompts zur Objekterkennung verwenden. In diesem Arbeitsablauf fungiert der Text-Encoder ähnlich wie ein NER-System, indem er die semantische Bedeutung der vom Benutzer angegebenen Klassennamen (Entitäten) interpretiert, um entsprechende visuelle Objekte zu finden.

Das folgende Python zeigt, wie man die ultralytics Bibliothek zur detect anhand von benutzerdefinierten Textbeschreibungen, die Entitäten der natürlichen Sprache effektiv mit visuellen Daten verknüpft.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Tools und Implementierung

Entwickler haben Zugang zu einem robusten Ökosystem von Tools für die Implementierung von NER. Beliebte Open-Source-Bibliotheken wie spaCy und NLTK bieten vorab trainierte Pipelines für den sofortigen Einsatz. Für Anwendungen im Unternehmensmaßstab bieten Cloud-Dienste wie Google Natural Language verwaltete APIs, die sich je nach Bedarf skalieren lassen.

Die Verwaltung des Lebenszyklus dieser KI-Modelle – sei es für Text oder Bildverarbeitung – erfordert einen effizienten Betrieb. Ultralytics vereinfacht diese MLOps-Prozesse und bietet eine einheitliche Umgebung für die Verwaltung von Datensätzen, das Training von Modellen und die Bereitstellung von Lösungen. Dadurch wird sichergestellt, dass KI-Projekte skalierbar und produktionsreif bleiben, was die kontinuierliche Verbesserung von Modellen wie YOLO26 für Spitzenleistungen unterstützt.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten