Zuhause Trends Was ist besser, eine Plattform oder ein selbst erstellter Algorithmus für maschinelles Lernen auf aws?

Was ist besser, eine Plattform oder ein selbst erstellter Algorithmus für maschinelles Lernen auf aws?

Anonim

Q:

Was ist besser, eine Plattform oder ein selbst erstellter Algorithmus für maschinelles Lernen in AWS?

EIN:

Heutzutage integrieren viele Unternehmen Lösungen für maschinelles Lernen in ihre Analysetools, um das Markenmanagement zu verbessern, das Kundenerlebnis zu verbessern und die betriebliche Effizienz zu steigern. Modelle für maschinelles Lernen sind die Kernkomponente von Lösungen für maschinelles Lernen. Modelle werden mit mathematischen Algorithmen und großen Datenmengen trainiert, um zuverlässige Vorhersagen zu treffen. Zwei gängige Beispiele für Vorhersagen sind: (1) Feststellen, ob eine Reihe von Finanztransaktionen auf Betrug hindeutet, oder (2) Bewerten der Verbraucherstimmung in Bezug auf ein Produkt auf der Grundlage der über soziale Medien gesammelten Informationen.

Amazon SageMaker ist ein vollständig verwalteter Dienst, mit dem Entwickler und Datenwissenschaftler Modelle für maschinelles Lernen erstellen, trainieren und bereitstellen können. In SageMaker können Sie vorkonfigurierte Algorithmen verwenden oder den eigenen Weg gehen, um eine individuellere Lösung zu finden. Beide Entscheidungen sind gültig und dienen gleichermaßen als Grundlage für eine erfolgreiche Lösung für maschinelles Lernen.

(Anmerkung der Redaktion: Hier können Sie andere Alternativen zu SageMaker sehen.)

Zu den Standardalgorithmen von SageMaker gehören beliebte, hochoptimierte Beispiele für die Klassifizierung von Bildern, die Verarbeitung natürlicher Sprachen usw. Die vollständige Liste finden Sie hier .

  • Out-of-the-Box-Vorteile: Diese Algorithmen wurden voroptimiert (und werden ständig verbessert). Sie können schnell einsatzbereit und einsatzbereit sein. Außerdem ist die automatische Hyperparameter-Optimierung von AWS verfügbar.
  • Out-of-the-Box-Überlegungen: Die oben genannten kontinuierlichen Verbesserungen führen möglicherweise nicht zu so vorhersehbaren Ergebnissen, als hätten Sie die vollständige Kontrolle über die Implementierung Ihrer Algorithmen.

Wenn diese Algorithmen für Ihr Projekt nicht geeignet sind, haben Sie drei weitere Möglichkeiten: (1) die Apache Spark Library von Amazon, (2) benutzerdefinierten Python-Code (der TensorFLow oder Apache MXNet verwendet) oder (3) "Bringen Sie Ihre eigenen mit" Sie sind im Wesentlichen nicht eingeschränkt, müssen jedoch ein Docker-Image erstellen, um Ihr Modell zu trainieren und zu bedienen (Sie können dies anhand der Anweisungen hier tun).

Der Bring-Your-Own-Ansatz bietet Ihnen völlige Freiheit. Dies kann sich für Datenwissenschaftler als attraktiv erweisen, die bereits eine Bibliothek mit benutzerdefiniertem und / oder proprietärem Algorithmuscode erstellt haben, der möglicherweise nicht im aktuellen Standardsatz enthalten ist.

  • Bring-Your-Own-Vorteile: Ermöglicht die vollständige Kontrolle über die gesamte Data-Science-Pipeline sowie die Verwendung von proprietärem IP.
  • Überlegungen zum Mitnehmen : Dockerisierung ist erforderlich, um das resultierende Modell zu trainieren und zu bedienen. Es liegt in Ihrer Verantwortung, algorithmische Verbesserungen vorzunehmen.

Unabhängig von der Wahl Ihres Algorithmus ist SageMaker on AWS ein erwägenswerter Ansatz, da der Benutzerfreundlichkeit aus datenwissenschaftlicher Sicht große Bedeutung beigemessen wurde. Wenn Sie jemals versucht haben, ein maschinelles Lernprojekt von Ihrer lokalen Umgebung auf ein gehostetes zu migrieren, werden Sie angenehm überrascht sein, wie nahtlos SageMaker dies macht. Und wenn Sie von vorne anfangen, sind Sie Ihrem Ziel bereits einige Schritte näher, vorausgesetzt, Sie haben bereits viel zur Hand.

Was ist besser, eine Plattform oder ein selbst erstellter Algorithmus für maschinelles Lernen auf aws?