In der Vergangenheit war es bei digitalen Daten sinnvoll, Daten zwischen Transaktionsdaten, den in Geschäftsanwendungen erfassten, in Datenbanktabellen gespeicherten und von BI-Tools präsentierten Daten und allen anderen Daten zu trennen: E-Mails, Webseiten, Bilder, Videos und so weiter. Heutzutage neigen wir dazu, solche "anderen Daten" als unstrukturierte Daten zu bezeichnen.
Trotzdem war es analysierbar und Software zur Ableitung von Wert aus solchen Daten hat die Kluft überschritten. Vor allem dieses analytische Erfordernis führte zum ursprünglichen Konzept eines Datensees, eines Datenspeichers für beide Arten von Daten und zusätzlich für Daten, die aus mehreren Quellen außerhalb des Unternehmens stammen, von denen einige unvermeidlich unstrukturiert waren.
In diesem Artikel untersuchen wir, wie das durch den Data Lake geschaffene neue Ökosystem nicht mehr nur aus den Transaktionen (oder Ereignissen) des Geschäfts besteht. Dazu gehören auch Daten aus anderen Quellen, mit denen das Unternehmen Analysen durchführt und die Benutzer über wichtige Informationen informiert, auf denen Entscheidungen beruhen können. Das Aufzeichnungssystem wird wie immer die goldene Kopie der Unternehmensdaten und der Prüfpfad der IT-Aktivitäten des Unternehmens sein.