Q:
Warum ist Datenanmerkung in einigen maschinellen Lernprojekten wichtig?
EIN:Datenanmerkungen sind beim maschinellen Lernen wichtig, da sie in vielen Fällen die Arbeit des maschinellen Lernprogramms erheblich erleichtern.
Dies hat mit dem Unterschied zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen zu tun. Beim überwachten maschinellen Lernen sind die Trainingsdaten bereits gekennzeichnet, damit die Maschine die gewünschten Ergebnisse besser verstehen kann. Wenn der Zweck des Programms beispielsweise darin besteht, Katzen in Bildern zu identifizieren, verfügt das System bereits über eine große Anzahl von Fotos, die als Katze gekennzeichnet sind oder nicht. Anhand dieser Beispiele werden dann neue Daten gegenübergestellt, um die Ergebnisse zu erzielen.
Kostenloser Download: Maschinelles Lernen und warum es wichtig ist |
Bei unbeaufsichtigtem maschinellem Lernen gibt es keine Labels. Daher muss das System Attribute und andere Techniken verwenden, um die Katzen zu identifizieren. Ingenieure können das Programm auf das Erkennen von visuellen Merkmalen von Katzen wie Schnurrhaaren oder Schwänzen trainieren, aber der Prozess ist kaum so einfach wie beim überwachten maschinellen Lernen, bei dem diese Etiketten eine sehr wichtige Rolle spielen.
Bei der Datenanmerkung werden Etiketten an den Trainingsdatensätzen angebracht. Diese können auf viele verschiedene Arten angewendet werden - oben haben wir über binäre Datenanmerkungen gesprochen - Katzen oder nicht Katzen - aber auch andere Arten von Datenanmerkungen sind wichtig. Beispielsweise kann im medizinischen Bereich die Datenanmerkung das Markieren bestimmter biologischer Bilder mit Markierungen umfassen, die Pathologie- oder Krankheitsmarkierungen für andere medizinische Eigenschaften identifizieren.
Datenanmerkungen erfordern viel Arbeit - und werden häufig von Teams durchgeführt -, sind jedoch ein wesentlicher Bestandteil der Funktionsweise vieler maschineller Lernprojekte. Es bietet diese anfängliche Einrichtung, um einem Programm beizubringen, was es lernen muss und wie verschiedene Eingaben zu unterscheiden sind, um genaue Ausgaben zu erzielen.
