Mit Algorithmen Wahlen vorhersagen: Ein Gespräch mit Drew Linzer

2025

Drew wird auf dem Big Data Innovation Summit am 30. und 31. Januar in Las Vegas präsentieren: http://analytics.theiegroup.com/bigdata-lasvegas, zusammen mit Rednern von Obama für Amerika, Best Buy, LinkedIn, der New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs und viele mehr.

Registrierungslink: http://bit.ly/Zs3wms

Dieses Interview wurde von George Hill geführt und im Big Data Innovation Magazine veröffentlicht.

Welche Art von Reaktion gab es auf Ihre Vorhersagen?

Der größte Teil der Reaktion konzentrierte sich auf den Unterschied in der Genauigkeit zwischen denjenigen von uns, die die öffentlichen Meinungsumfragen studiert haben, und die "Bauchgefühl" -Vorhersagen populärer Experten und Kommentatoren. Am Wahltag haben Datenanalysten wie ich, Nate Silver (New York Times FiveThirtyEight-Blog), Simon Jackman (Stanford University und Huffington Post) und Sam Wang (Princeton Election Consortium) Obamas Wiederwahlchancen auf über 90% geschätzt und richtig vorausgesehen 332 Wahlstimmen für Obama als wahrscheinlichstes Ergebnis. In der Zwischenzeit sagten Experten wie Karl Rove, George Will und Steve Forbes, dass Romney gewinnen würde - und in einigen Fällen auch leicht. Dies hat dazu geführt, dass von einem "Sieg für die Quants" die Rede ist, von dem ich hoffe, dass er sich bei zukünftigen Wahlen durchsetzen wird.

Wie bewerten Sie den in Ihren Vorhersagen verwendeten Algorithmus?

Mein Prognosemodell schätzte die Ergebnisse der Staatsstimmen und die endgültige Wahl, beginnend im Juni, an jedem Tag des Wahlkampfs. Ich wollte, dass die Einschätzung dieser Prognosen so fair und objektiv wie möglich ist - und dass ich keinen Spielraum habe, wenn sie falsch sind. Etwa einen Monat vor der Wahl habe ich auf meiner Website eine Reihe von acht Bewertungskriterien veröffentlicht, die ich verwenden würde, sobald die Ergebnisse bekannt wären. Wie sich herausstellte, funktionierte das Modell perfekt. Im Laufe des Sommers prognostizierte er, dass Obama alle seine Bundesstaaten 2008 ohne Indiana und North Carolina gewinnen würde, und ließ sich von dieser Prognose kaum ab, selbst nachdem die Unterstützung für Obama im September nach oben geklettert war, und tauchte dann nach der ersten Präsidentschaftsdebatte auf.

Die Datenmenge, die während dieser Kampagne sowohl von unabhängigen Analysten als auch von Kampagnenteams verwendet wurde, war enorm. Welche Auswirkungen hat dies auf die Datennutzung im Jahr 2016?

Die Kampagne 2012 hat bewiesen, dass mehrere, unterschiedliche Quellen quantitativer Informationen verwaltet, vertrauenswürdig sind und erfolgreich für verschiedene Zwecke eingesetzt werden können. Wir Außenstehenden konnten das Wahlergebnis weit im Voraus vorhersagen. Innerhalb der Kampagnen wurden enorme Fortschritte bei der Ausrichtung auf Wähler, der Verfolgung von Meinungen, dem Sammeln von Spenden und der Wahlbeteiligung erzielt. Nachdem wir nun wissen, dass diese Methoden funktionieren können, gibt es meines Erachtens kein Zurück mehr. Ich erwarte, dass Reporter und Wahlkampfkommentatoren die Umfrageaggregation 2016 viel ernster nehmen. Und obwohl Obama und die Demokraten derzeit einen Vorteil in der Wahlkampftechnologie zu haben scheinen, wäre ich überrascht, wenn die Republikaner nicht schnell aufholen würden.

Glauben Sie, dass der Erfolg dieser datengetriebenen Kampagne dazu geführt hat, dass Kampagnenmanager jetzt sowohl Analyst als auch Stratege sein müssen?

Die Kampagnenmanager müssen nicht unbedingt selbst Analysten sein, sollten jedoch ein besseres Verständnis dafür haben, wie Daten und Technologien zu ihrem Vorteil genutzt werden können. Kampagnen verwendeten immer Umfrageforschung, um Strategien zu formulieren und die Stimmungslage der Wähler zu messen. Aber jetzt gibt es eine Reihe anderer leistungsstarker Tools: Websites für soziale Netzwerke, Wählerdatenbanken, mobile Smartphones und E-Mail-Marketing, um nur einige zu nennen. Und das zusätzlich zu den jüngsten Fortschritten bei den Umfragemethoden und der statistischen Meinungsmodellierung. In der amerikanischen Wahlkampfpolitik ist gerade viel Neues im Gange.

Sie haben es geschafft, die Wahlergebnisse 6 Monate im Voraus vorherzusagen. Was ist Ihrer Meinung nach der realistische maximale Zeitrahmen, um ein Ergebnis mithilfe Ihrer Analysetechniken genau vorherzusagen?

Ungefähr vier oder fünf Monate sind ungefähr so weit zurück, wie die Wissenschaft uns jetzt gehen lässt; und das schiebt es sogar ein bisschen. Zuvor waren die Umfragen zu wenig aussagekräftig: Zu viele Personen sind entweder unentschlossen oder widmen der Kampagne noch keine Aufmerksamkeit. Die historischen wirtschaftlichen und politischen Faktoren, die erwiesenermaßen mit den Wahlergebnissen korrelieren, verlieren ebenfalls ihre Vorhersagekraft, sobald wir den Bereich von etwa 4 bis 5 Monaten überschreiten. Glücklicherweise bleibt den Kampagnen noch viel Zeit, Strategien zu entwerfen und Entscheidungen über die Verteilung ihrer Ressourcen zu treffen.

Mit Algorithmen Wahlen vorhersagen: Ein Gespräch mit Drew Linzer

Neue Generatoren arbeiten mit modernen Algorithmen an der ASCII-Kunst

Wie können Unternehmen zufällige Waldmodelle für Vorhersagen verwenden?

Embedded Analytics im Gespräch mit qlik

Die Wahl des Herausgebers

Was ist DNS-Hijacking? - Definition aus techopedia

Was ist Semantic Web? - Definition aus techopedia

Was ist Domain-Hijacking? - Definition aus techopedia

Was ist Homepage-Hijacking? - Definition aus techopedia

Die Wahl des Herausgebers

Was ist ein Campus Area Network (CAN)? - Definition aus techopedia

Was ist eine Subnetzmaske mit variabler Länge (vlsm)? - Definition aus techopedia

Was ist Computertechnik? - Definition aus techopedia

Was ist ein Silo? - Definition aus techopedia

Die Wahl des Herausgebers

Was ist Website-Architektur? - Definition aus techopedia

Was ist tischgesteuertes Design? - Definition aus techopedia

Was ist Jitter (voip)? - Definition aus techopedia

Was ist Internet-Routing? - Definition aus techopedia

Die Wahl des Herausgebers

Was ist eine Laufzeitumgebung (RTE)? - Definition aus techopedia

Was ist ein Screenshot? - Definition aus techopedia

Was ist Scrollen? - Definition aus techopedia

Was ist Quellcode? - Definition aus techopedia

Die Wahl des Herausgebers

Was ist das Bandbreitenzuweisungsprotokoll (BAP)? - Definition aus techopedia

Was ist unabhängige Überprüfung und Validierung (iv & v)? - Definition aus techopedia

Was ist das Neighbor Discovery Protocol (ndp)? - Definition aus techopedia

Was ist das Secure Neighbor Discovery Protokoll (Sendeprotokoll)? - Definition aus techopedia

Beliebte Kategorien