Inhaltsverzeichnis:
Definition - Was bedeutet Big Data?
Big Data bezieht sich auf einen Prozess, der verwendet wird, wenn traditionelle Data Mining- und Verarbeitungstechniken die Einsichten und die Bedeutung der zugrunde liegenden Daten nicht aufdecken können. Daten, die unstrukturiert oder zeitkritisch oder einfach sehr groß sind, können von relationalen Datenbank-Engines nicht verarbeitet werden. Für diese Art von Daten ist ein anderer Verarbeitungsansatz erforderlich, der als Big Data bezeichnet wird und bei dem auf sofort verfügbarer Hardware massive Parallelität angewendet wird.
Techopedia erklärt Big Data
Big Data spiegelt ganz einfach die sich ändernde Welt wider, in der wir leben. Je mehr sich Dinge ändern, desto mehr werden die Änderungen erfasst und als Daten aufgezeichnet. Nehmen Sie das Wetter als Beispiel. Für einen Wettervorhersager ist die Menge an Daten, die weltweit über die örtlichen Gegebenheiten gesammelt werden, erheblich. Logischerweise würde es Sinn machen, dass lokale Umgebungen regionale und regionale Auswirkungen globale Auswirkungen bestimmen, aber es könnte auch umgekehrt sein. Auf die eine oder andere Weise spiegeln diese Wetterdaten die Merkmale von Big Data wider, bei denen für eine große Datenmenge eine Echtzeitverarbeitung erforderlich ist und bei denen die große Anzahl von Eingaben maschinell generiert werden kann, persönliche Beobachtungen oder äußere Kräfte wie Sonnenflecken.
Die Verarbeitung solcher Informationen zeigt, warum Big Data so wichtig geworden ist:
- Die meisten jetzt gesammelten Daten sind unstrukturiert und erfordern eine andere Speicherung und Verarbeitung als in herkömmlichen relationalen Datenbanken.
- Die verfügbare Rechenleistung ist rasant, was bedeutet, dass es mehr Möglichkeiten gibt, Big Data zu verarbeiten.
- Das Internet hat Daten demokratisiert, das Datenangebot stetig erweitert und gleichzeitig immer mehr Rohdaten erzeugt.
Daten in ihrer Rohform haben keinen Wert. Daten müssen verarbeitet werden, um wertvoll zu sein. Hierin liegt jedoch das inhärente Problem von Big Data. Lohnt sich die Verarbeitung von Daten aus dem nativen Objektformat zu einer nutzbaren Erkenntnis für die hohen Kapitalkosten? Oder gibt es einfach zu viele Daten mit unbekannten Werten, um das Spiel mit Big-Data-Tools zu rechtfertigen? Die meisten von uns würden zustimmen, dass die Vorhersage des Wetters einen Wert hat. Die Frage ist, ob dieser Wert die Kosten für die Zusammenstellung aller Echtzeitdaten zu einem Wetterbericht, auf den man zählen kann, aufwiegen könnte.
