Q:
Wie können vorhandene Data-Warehouse-Umgebungen am besten skaliert werden, um die Anforderungen der Big-Data-Analyse zu erfüllen?
EIN:Einzelne Data Warehouse-Projekte müssen von Fall zu Fall bewertet werden. Im Allgemeinen gibt es beim Versuch, ein vorhandenes Data-Warehouse-Design zu erweitern, um die Big-Data-Analyse besser zu handhaben, einen zentralen Prozess, um herauszufinden, was zu tun ist. IT-Experten können dies als "Scaling up" oder "Scaling out" bezeichnen.
Webinar: Big Iron, Meet Big Data: Freigabe von Mainframe-Daten mit Hadoop & Spark Hier registrieren |
Bei der Skalierung geht es im Allgemeinen darum, eine ausreichende Verarbeitungsleistung, ausreichend Arbeitsspeicher und leistungsfähigere Serveraktivitäten für die Verarbeitung aller größeren Datenmengen zu erhalten, die das Unternehmen verarbeiten wird. Im Gegensatz dazu kann das Skalieren das Sammeln von Clustern von Serverhardware und deren Vernetzung zur Korrelation von Big Data bedeuten.
Einige IT-Experten haben vorgeschlagen, dass die häufigere Methode bei Apache Hadoop und anderen gängigen Big-Data-Tools und -Plattformen darin besteht, Hardware zu skalieren und zu gruppieren, um die gewünschten Effekte zu erzielen. Andere weisen jedoch darauf hin, dass mit der heutigen Technologie ein Data-Warehouse mithilfe einer Beschaffungsstrategie skaliert werden kann, mit der einem Server Ressourcen hinzugefügt werden, beispielsweise indem eine höhere Anzahl von Prozessorkernen zusammen mit einer größeren Menge an RAM abgerufen wird.
Unabhängig davon, ob sie vergrößert oder verkleinert werden, benötigen Data Warehouses zusätzliche physische Hardware-Ressourcen, um die größeren Daten-Workloads bewältigen zu können. Sie benötigen auch zusätzliche Personalverwaltung, was mehr Schulung für interne Teams bedeutet. In das Projekt muss viel Planung einfließen, um festzustellen, welche Art von Stress und Druck die größeren Daten-Workloads auf ein vorhandenes Altsystem ausüben, um es für ein neues Big-Data-Ökosystem auszurüsten. Ein großes Problem sind Speicherengpässe, die ein Upgrade der Speicherzentren erfordern, und andere Arten von Leistungsengpässen, die ein aufkeimendes System behindern können, wenn sie nicht behoben werden.