Seit der Einführung des Big-Data-Konzepts durchlief es mehrere Evolutionsphasen. Hadoop wurde 2005 mit einigen anfänglichen Funktionen wie der MapReduce-Verarbeitungsengine eingeführt, mit der umfangreiche Datenverarbeitungs-Workloads in Clustern verteilt werden konnten. Hadoop selbst hat viele Veränderungen erfahren und fortschrittliche Frameworks und Methoden entwickelt.
YARN ist eine Kernkomponente von Hadoop 2.0. Grundsätzlich werden die Ressourcen in einer Clusterumgebung verwaltet. Der YARN-Broker interagiert (im Auftrag der Anwendungen) mit den Rechenressourcen und weist jeder Anwendung Ressourcen zu, die auf unterschiedlichen Filterkriterien basieren.
Wir werden uns die wichtigsten Vorteile von YARN gegenüber Hadoop 1.0 ansehen.