Q:
Warum ist es für Datenwissenschaftler wichtig, Transparenz anzustreben?
EIN:Transparenz ist in datenwissenschaftlichen Projekten und Programmen für maschinelles Lernen von wesentlicher Bedeutung, teilweise aufgrund der Komplexität und Komplexität, die sie antreibt - weil diese Programme eher „lernen“ (probabilistische Ergebnisse erzeugen) als vorgegebene lineare Programmieranweisungen befolgen, und weil infolgedessen Es kann schwer zu verstehen sein, wie die Technologie zu Schlussfolgerungen gelangt. Das "Black-Box" -Problem von Algorithmen für maschinelles Lernen, die für menschliche Entscheidungsträger nicht vollständig erklärbar sind, ist auf diesem Gebiet ein großes Problem.
Vor diesem Hintergrund wird die Fähigkeit, erklärbares maschinelles Lernen oder „erklärbare KI“ zu beherrschen, wahrscheinlich ein Hauptaugenmerk bei der Suche nach Talenten für einen Datenwissenschaftler sein. Bereits jetzt finanziert DARPA, die Institution, die uns das Internet gebracht hat, eine Multimillionen-Dollar-Studie über erklärbare KI, um die Fähigkeiten und Ressourcen zu fördern, die erforderlich sind, um Technologien für maschinelles Lernen und künstliche Intelligenz zu schaffen, die für den Menschen transparent sind.
Eine Möglichkeit, darüber nachzudenken, besteht darin, dass es häufig eine „Alphabetisierungsphase“ der Talententwicklung und eine „Hyperliterationsphase“ gibt. Für einen Datenwissenschaftler wäre die traditionelle Alphabetisierungsphase das Wissen darüber, wie maschinelle Lernprogramme zusammengestellt und aufgebaut werden Algorithmen mit Sprachen wie Python; wie man neuronale Netze aufbaut und mit ihnen arbeitet. Die Hyperliteracy-Phase wäre die Fähigkeit, erklärbare KI zu beherrschen, Transparenz bei der Verwendung von Algorithmen für maschinelles Lernen zu schaffen und Transparenz zu bewahren, wenn diese Programme auf ihre Ziele und die Ziele ihrer Bearbeiter hinarbeiten.
Eine andere Möglichkeit, die Bedeutung von Transparenz in der Datenwissenschaft zu erklären, besteht darin, dass die verwendeten Datensätze immer komplexer werden und daher potenziell das Leben der Menschen beeinträchtigen. Ein weiterer wichtiger Treiber für erklärbares maschinelles Lernen und Datenwissenschaft ist die Europäische Datenschutz-Grundverordnung, die kürzlich eingeführt wurde, um die unethische Verwendung personenbezogener Daten einzudämmen. Anhand der DSGVO als Testfall können Experten sehen, wie die Notwendigkeit, datenwissenschaftliche Projekte zu erläutern, Datenschutz- und Sicherheitsbedenken sowie die Geschäftsethik berücksichtigt.