Das Zusammenführen von Datenquellen in Hadoop ist ein komplexes Geschäft. Einige der Gründe hierfür sind:
- Benutzerdefinierte, quellenspezifische Skripts, die Datenquellen kombinieren, sind problematisch.
- Die Verwendung von Datenintegrations- oder Data-Science-Tools führt zu viel Unsicherheit.
- Das Hinzufügen von Daten aus externen Quellen ist nahezu unmöglich.
Heute werde ich diskutieren, wie Hadoop Analytics durch quellenunabhängige Technologien verbessert wird, mit denen interne und externe Datenquellen auf einfache Weise kombiniert werden können. Neben der Beschreibung der Funktionsweise quellenunabhängiger Methoden werde ich auch erläutern, warum Hadoop-Analysen integrierte Intelligenz- und Wissenstransferfunktionen, ein Verständnis für Beziehungen und Dateneigenschaften sowie eine skalierbare und leistungsstarke Architektur erfordern.
Webinar: Bedeutungsmatrizen: Verbinden der Punkte in Hadoop - Melden Sie sich hier an |