Zuhause Trends Was ist Apache Nutch? - Definition aus techopedia

Was ist Apache Nutch? - Definition aus techopedia

Inhaltsverzeichnis:

Anonim

Definition - Was bedeutet Apache Nutch?

Apache Nutch ist ein Webcrawler-Softwareprodukt, mit dem Daten aus dem Web aggregiert werden können. Es wird in Verbindung mit anderen Apache-Tools wie Hadoop für die Datenanalyse verwendet.

Techopedia erklärt Apache Nutch

Apache Nutch ist ein Open-Source-Produkt, das von der Apache Software Foundation lizenziert wird. Diese Entwickler-Community verfügt über Lizenzen für eine Reihe von Apache-Softwaretools, mit denen Daten sortiert und analysiert werden können. Eine der zentralen Technologien ist Apache Hadoop, ein in der Geschäftswelt sehr beliebtes Big-Data-Analysetool.

Neben Tools wie Apache Hadoop und Funktionen zum Speichern, Analysieren und mehr besteht die Aufgabe von Nutch darin, mithilfe von Web-Crawler-Algorithmen Daten aus dem Web zu sammeln und zu speichern.

Benutzer können einfache Befehle in Apache Nutch verwenden, um Informationen unter URLs zu sammeln. Benutzer verwenden Apache Nutch normalerweise zusammen mit einem anderen Open-Source-Tool, einem Framework namens Apache Solr, das als Repository für die mit Apache Nutch gesammelten Daten fungieren kann.

Was ist Apache Nutch? - Definition aus techopedia