Inhaltsverzeichnis:
- Definition - Was bedeutet Post-Processing-Deduplizierung (PPD)?
- Techopedia erklärt die Post-Processing-Deduplizierung (PPD)
Definition - Was bedeutet Post-Processing-Deduplizierung (PPD)?
Post-Process-Deduplication (PPD) bezeichnet ein System, bei dem Software-Prozesse redundante Daten aus einem Datensatz herausfiltern, nachdem sie an einen Datenspeicherort übertragen wurden. Dies kann auch als asynchrone Deduplizierung bezeichnet werden und wird häufig verwendet, wenn Manager es für ineffizient oder nicht durchführbar halten, redundante Daten vor oder während der Übertragung zu entfernen.
Techopedia erklärt die Post-Processing-Deduplizierung (PPD)
Die Nach-Prozess-Deduplizierung steht im Gegensatz zu einer Praxis, die als Inline-Deduplizierung bezeichnet wird, bei der die redundanten Daten entfernt werden, während die Daten zur Speicherung übertragen werden. Einer der Gründe, warum sich Administratoren für einen Post-Process-Deduplizierungsansatz entscheiden, liegt darin, dass die Inline-Deduplizierung den Übertragungsprozess verlangsamen und die einfache und effiziente Archivierung von Daten erschweren kann.
Während Manager oder Administratoren die Verwendung einer Nachverarbeitungs-Deduplizierungsmethode möglicherweise einfacher finden, weist diese Art der Datenoptimierung Nachteile auf. Zum einen muss das Datenspeicherziel über genügend Speicherplatz für den größeren ungefilterten Datensatz verfügen. Vorausgesetzt, Datenmanager verfügen über ausreichend Speicherplatz und das Parsen von Daten im Speicher stellt keine technischen Schwierigkeiten dar. Die Nachverarbeitungs-Deduplizierungsmethode ist häufig eine wünschenswerte Methode, um einen Datensatz für die zukünftige Verwendung zu bereinigen, nachdem er bereits sorgfältig verstaut wurde "Kühlhaus."
