Entdecken Sie, wie überwachtes Lernen KI mit gelabelten Daten unterstützt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Stimmungsanalyse ermöglicht.
Überwachtes Lernen ist eine grundlegende Kategorie des maschinellen Lernens (ML), bei der Algorithmen aus einem Datensatz lernen, der Eingabe-Ausgabe-Paare enthält, die als markierte Daten bezeichnet werden. Im Wesentlichen ist der Algorithmus "überwacht", weil er lernt, indem er seine Vorhersagen zu den Eingabedaten mit den bekannten korrekten Ausgaben (Labels) vergleicht, die in den Trainingsdaten enthalten sind. Ziel ist es, dass der Algorithmus eine Zuordnungsfunktion lernt, die die Ausgabe für neue, unbekannte Eingaben genau vorhersagen kann. Dieser Ansatz ist für viele moderne Anwendungen der Künstlichen Intelligenz (KI) von zentraler Bedeutung, da er es Systemen ermöglicht, Vorhersagen oder Entscheidungen auf der Grundlage historischer Beispiele zu treffen, die in Benchmark-Datensätzen oder benutzerdefinierten Datensätzen gefunden wurden.
Der Prozess beginnt mit einem sorgfältig vorbereiteten Datensatz, bei dem jeder Datenpunkt aus Eingangsmerkmalen und einer entsprechenden korrekten Ausgangsbezeichnung besteht. Dies erfordert oft einen erheblichen Aufwand bei der Datenerfassung und -beschriftung. Bei einer Bildklassifizierungsaufgabe wären die Eingaben beispielsweise Bilder (die vielleicht mit Techniken aus Bibliotheken wie OpenCV vorverarbeitet wurden), und die Beschriftungen wären die Kategorien, zu denen sie gehören (z. B. "Katze", "Hund"). Der Algorithmus macht iterativ Vorhersagen für die Trainingsdaten und passt seine internen Parameter (oder Modellgewichte) mithilfe eines Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD) oder Adam an, um die Differenz zwischen seinen Vorhersagen und den tatsächlichen Bezeichnungen zu minimieren. Diese Differenz wird durch eine Verlustfunktion gemessen. Dieses Training wird fortgesetzt, oft über mehrere Epochen hinweg, bis das Modell ein zufriedenstellendes Maß an Genauigkeit oder andere relevante Leistungskennzahlen auf separaten Validierungsdaten erreicht, wodurch sichergestellt wird, dass es sich gut auf neue Daten verallgemeinern lässt und eine Überanpassung vermieden wird.
Überwachtes Lernen ist unglaublich vielseitig und ermöglicht eine Vielzahl von Anwendungen, bei denen historische Daten zukünftige Ereignisse vorhersagen oder neue Informationen klassifizieren können. Durch seine Fähigkeit, direkt von markierten Beispielen zu lernen, eignet es sich für Aufgaben, die eine hohe Präzision erfordern. Viele Computer-Vision-Aufgaben (CV) beruhen in hohem Maße auf überwachtem Lernen, einschließlich solcher, die von hochmodernen Modellen wie Ultralytics YOLO durchgeführt werden.
Hier sind zwei konkrete Beispiele:
Weitere gängige Anwendungen sind die Objekterkennung in Bildern und Videos (für autonome Fahrzeuge und Sicherheitssysteme), die Filterung von Spam-E-Mails, die Vorhersage von Immobilienpreisen (eine Regressionsaufgabe ) und die Gesichtserkennung. Sie wird auch in der KI für eine intelligentere Bestandsverwaltung im Einzelhandel und in KI-Lösungen für die Landwirtschaft eingesetzt.
Mehrere Konzepte sind für das Verständnis und die effektive Anwendung des überwachten Lernens von zentraler Bedeutung:
Das überwachte Lernen unterscheidet sich von anderen primären Paradigmen des maschinellen Lernens:
Zusammenfassend lässt sich sagen, dass das überwachte Lernen eine leistungsstarke und weit verbreitete Technik ist, die markierte Daten nutzt, um Modelle für Vorhersageaufgaben zu trainieren. Es bildet das Rückgrat vieler erfolgreicher KI-Anwendungen, einschließlich derer, die von Ultralytics entwickelt und unterstützt werden, und ist eine entscheidende Fähigkeit für jeden, der im Bereich Datenwissenschaft oder KI arbeitet.