Zuhause Bloggen Was ist Content Scraping? - Definition aus techopedia

Was ist Content Scraping? - Definition aus techopedia

Inhaltsverzeichnis:

Anonim

Definition - Was bedeutet Content Scraping?

Content Scraping ist eine illegale Methode, um Originalinhalte von einer legitimen Website zu stehlen und die gestohlenen Inhalte ohne Wissen oder Erlaubnis des Inhabers des Inhalts auf einer anderen Website zu veröffentlichen. Content-Scraper versuchen häufig, gestohlenen Content als ihren eigenen Content auszugeben, und geben keine Zuweisung an die Eigentümer des Contents.


Das Scraping von Inhalten kann durch manuelles Kopieren und Einfügen oder mithilfe komplexerer Techniken erfolgen, z. B. mithilfe von spezieller Software, HTTP-Programmierung oder HTML- oder DOM-Parsern.


Ein Großteil des Inhalts, der dem Scraping zum Opfer fällt, ist urheberrechtlich geschütztes Material. eine erneute Veröffentlichung ohne Erlaubnis des Urhebers ist strafbar. Scraper-Sites werden jedoch auf der ganzen Welt gehostet, und Scraper, die zum Entfernen von urheberrechtlich geschütztem Inhalt aufgefordert werden, wechseln möglicherweise einfach die Domains oder verschwinden.

Techopedia erklärt Content Scraping

Content Scraper sind in der Lage, den Datenverkehr auf ihre Websites zu lenken, indem sie qualitativ hochwertige Inhalte mit hoher Keyword-Dichte von anderen Websites entfernen. Blogger sind besonders anfällig dafür, wahrscheinlich, weil einzelne Blogger keinen legalen Angriff auf Schaber starten. Scraper werden ermutigt, diese Praxis fortzusetzen, da Suchmaschinen noch keinen effektiven Weg gefunden haben, um eindeutige Inhalte aus den Scrap-Inhalten herauszufiltern, so dass Scraper weiterhin davon profitieren können.


Website-Administratoren können sich durch einfache Maßnahmen, z. B. das Hinzufügen von Links zu ihrer eigenen Website innerhalb des Inhalts, vor dem Schaben schützen. Auf diese Weise können sie zumindest einige Zugriffe auf den Inhalt von Scrap-Inhalten erhalten. Anspruchsvollere Methoden für das Scraping durch Bots sind:

  • Kommerzielle Anti-Bot-Anwendungen
  • Fang Bots mit einem Honeypot und blockiere deren IP-Adressen
  • Bots mit JavaScript-Code blockieren
Was ist Content Scraping? - Definition aus techopedia