Inhaltsverzeichnis:
Definition - Was bedeutet Data Sandbox?
Eine Datensandbox im Kontext von Big Data ist eine skalierbare und entwicklungsfähige Plattform, mit der die umfangreichen Informationssätze eines Unternehmens durch Interaktion und Zusammenarbeit untersucht werden können. Es ermöglicht einem Unternehmen, seinen tatsächlichen Investitionswert in Big Data zu realisieren.
Eine Datensandbox wird hauptsächlich von Data-Science-Teams untersucht, die Sandbox-Plattformen aus eigenständigen, analytischen Datamarts oder logischen Partitionen in Enterprise Data Warehouses beziehen. Daten-Sandbox-Plattformen stellen die für Datenwissenschaftler erforderliche Rechenleistung zur Verfügung, um typischerweise komplexe analytische Arbeitslasten zu bewältigen.
Techopedia erklärt Data Sandbox
Eine Datensandbox umfasst massive parallele Zentraleinheiten, High-End-Speicher, Speicher mit hoher Kapazität und E / A-Kapazität und trennt normalerweise Datenexperiment- und Produktionsdatenbankumgebungen in Data Warehouses.
Die IBM Netezza 1000 ist ein Beispiel für eine Datensandbox-Plattform, bei der es sich um einen eigenständigen analytischen Datamart handelt. Ein Beispiel für eine logische Partition in einem Enterprise Data Warehouse, das auch als Daten-Sandbox-Plattform dient, ist das IBM Smart Analytics-System. Ein Hadoop-Cluster wie IBM InfoSphere BigInsights Enterprise Edition ist ebenfalls in dieser Kategorie enthalten.