Simon Munzert, Lukas Stötzer, Thomas Gschwend, Marcel Neunhoeffer, Sebastian Sternberg, Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell für Bundestagswahlen in:

PVS Politische Vierteljahresschrift, page 418 - 441

PVS, Volume 58 (2017), Issue 3, ISSN: 0032-3470, ISSN online: 0032-3470, https://doi.org/10.5771/0032-3470-2017-3-418

Browse Volumes and Issues: PVS Politische Vierteljahresschrift

Bibliographic information
PDF download Citation download Share
418 PVS, 58. Jg., 3/2017, S. 418-441, DOI: 10.5771/0032-3470-2017-3-418 Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell für Bundestagswahlen Simon Munzert, Lukas Stötzer, Thomas Gschwend, Marcel Neunhoeffer und Sebastian Sternberg Zweitstimme.org. A structural-dynamic forecasting model for German federal elections Abstract: We present results of an ex-ante forecast of party-specific vote shares at the German Federal Election 2017. To that end, we combine data from published trial heat polls with structural information. The model takes care of the multi-party nature of the setting and allows making statements about the probability of certain events, such as the plurality of votes for a party or the majority for coalition options in parliament. The forecasts of our model are continuously being updated on the platform zweitstimme.org. The value of our approach goes beyond the realms of academia: We equip journalists, political pundits, and ordinary citizens with information that can help make sense of the parties’ latent support and ultimately make voting decisions better informed. Keywords: Bundestag election, forecast, polls, Bayesian modeling, probability Schlagworte: Bundestagswahl, Vorhersage, Umfragen, Bayesianische Modellierung, Wahrscheinlichkeit 1. Einleitung1 Wer wird stärkste Partei im nächsten Bundestag und stellt möglicherweise den nächsten Kanzler? Erreicht eine Ampelkoalition oder eine Koalition aus SPD, B’90/Die Grünen und der Linken eine rechnerische Mehrheit? Schafft es die FDP wieder in den Bundestag? In der medialen Berichterstattung zur Bundestagswahl 2017 nehmen Fragen wie diese einen wichtigen Platz ein. Dabei dienen insbesondere nahezu täglich veröffentlichte Befragungen als Evidenz. Allerdings stellen sie weder eine besonders zuverlässige Grundlage dar, um den Monate in der Zukunft liegenden Wahlausgang vorherzusagen, noch, um die Unsicherheit einzuordnen, die mit der Beantwortung der eben genannten Fragen einhergeht. In diesem Beitrag präsentieren wir einen neuen Ansatz, um sowohl Zweitstimmenergebnisse verschiedener Parteien als auch entsprechende Koalitionsoptionen für die kommende Bundestagswahl 2017 vorherzusagen. Dabei stehen drei Ziele im Vordergrund: (1) Frühzeitige und möglichst präzise Vorhersage des Bundes- 1 Für hilfreiche Kommentare danken wir Marc Debus, Helmut Norpoth, Kai-Uwe Schnapp und Steffen Zittlau sowie zwei anonymen Gutachtern. Den Editoren danken wir für die schnelle Bearbeitung unserer Einreichung, die eine Veröffentlichung der Vorhersage noch vor der Wahl möglich machte. Darüber hinaus bedanken wir uns herzlich für die Überlassung von Daten, insbesondere hinsichtlich der Sonntagsfrage bei Jochen Groß, Marcel Noack, Gertrud Petrig (Institut für Demoskopie Allensbach) sowie Rainer Schnell, und bei Christel Selzer für ihre redaktionelle Arbeit am Manuskript. 58. Jahrgang Heft 3 / 2017 FORUM Munzert et al. 419 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell tagswahlergebnisses und daraus ableitbarer Koalitions-Konstellationen, (2) Aktualisierung der Vorhersage auf Basis neu veröffentlichter Umfragen bis zur Bundestagswahl und (3) Berechnung und Kommunikation realistischer Unsicherheit sowie ableitbarer Wahrscheinlichkeiten für bestimmte Ereignisse, die mit den ver- öffentlichten Vorhersagen verbunden sind. Bisherige Methoden zur Vorhersage von Bundestagswahlen basierten entweder auf strukturellen Modellen, die auf empirischen Regelmäßigkeiten bei bisherigen Bundestagswahlen beruhen, etwa dem robusten Zusammenhang zwischen Kanzlerpopularität und dem Stimmanteil der Koalitionsparteien – (Gschwend u. Norpoth 2000, 2001, 2017; Kayser u. Leininger 2016; Leininger u. Kayser 2017) oder auf Aggregationsmodellen, die Informationen aus veröffentlichten Umfragen kombinieren (Walther 2015; Selb u. Munzert 2016). Während rein umfragebasierte Modelle Informationen bis kurz vor dem Wahltag inkorporieren können, sind sie fehleranfällig für umfragespezifische Verzerrungen. Strukturelle Modelle erweisen sich dagegen trotz ihrer Datensparsamkeit als erstaunlich treffsicher (Gelman u. King 1993; Gschwend u. Norpoth 2005; Norpoth u. Gschwend 2003). Allerdings sind rein strukturelle Modelle meist nicht flexibel genug, um auf kurzfristige Neujustierungen im Parteiensystem oder der politischen Stimmung reagieren zu können und sind deswegen in Hinblick auf die vorhergesagten Grö- ßen nicht immer zielführend. So lassen viele der für die Bundestagswahlen vorgestellten Modelle lediglich Vorhersagen für den Anteil der Koalitionsparteien zu. Kern unserer Strategie ist deshalb die Entwicklung eines kombinierten Modells, das die Stärken von strukturellen Modellen und Aggregationsmodellen in sich vereint. Dafür entwickeln wir ein strukturelles Modell, benutzen jedoch auch ver- öffentlichte Werte der sogenannten „Sonntagsfrage“ im Zeitverlauf, um die Zweitstimmenanteile von Parteien und mögliche Koalitionen vorherzusagen. Diese Kombination von strukturellen Modellen und Aggregationsmodellen von Umfragedaten zur Wahlvorhersage – wohlgemerkt ohne eigene Umfragen in Auftrag zu geben – ist für die Bundesrepublik ein Novum. Eine ähnliche Strategie wurde auf nationaler Ebene bisher nur zur Vorhersage des kombinierten Stimmenanteils der Regierungskoalition angewendet (Küntzler 2017).2 Während alle Informationen, die in den strukturellen Teil unseres Modells eingehen, bereits für die Prognose verfügbar sind, wird unser Modell immer dann aktualisierte Vorhersagen für den Wahlausgang der kommenden Bundestagswahl liefern, wenn neue Umfrageergebnisse zur „Sonntagsfrage“ veröffentlicht werden. Für die kommende Bundestagswahl am 24. September 2017 liefert unser Modell basierend auf Daten, die Stand 31. Mai 2017 verfügbar sind, folgende Vorhersage (mit 90  %-Kredibilitätsintervallen in Klammern): CDU/CSU 36,0 Prozent [28,3 %; 44,4 %], SPD 26,4 Prozent [19,5 %; 34,7 %], FDP 7,6 Prozent [4,9 %; 11,4 %], B’90/Die Grünen 7,2 Prozent [5,0 %; 10,5 %], Die Linke 8,1 Prozent [5,8 %; 12,2 %], und AfD 8,2 Prozent [5,6 %; 11,9 %]. 2 Für einen Kombinationsansatz zur Vorhersage von Wahlergebnissen auf Wahlkreisebene außerdem Munzert (2016). 420 PVS, 58. Jg., 3/2017 Forum 2. Ein neuer Vorhersageansatz Das hier vorgeschlagene Modell ist ein Hybrid aus einer strukturellen Komponente, das historische Zusammenhänge zwischen Fundamentalvariablen und Wahlanteilen einzelner Parteien auswertet, und einer dynamischen Komponente, die neue Information aus Umfragen vom Start der ersten Prognose bis zum Tag vor der Bundestagswahl in aktualisierte Vorhersagen einrechnet. In diesem Abschnitt stellen wir zunächst die Modellkomponente vor, die Vorhersagen auf Basis historischer Informationen generiert. 2.1 Das strukturelle Modell Das strukturelle Modell erfüllt drei wesentliche Funktionen: Erstens erlaubt es uns eine frühzeitige Vorhersage des Wahlausgangs, weil die in das Modell eingehenden Prädiktoren bereits 200 Tage vor der Wahl feststehen. Dadurch kann zweitens die historische Vorhersage als Anker für das dynamische, umfragebasierte Modell genutzt werden, wie wir es im nächsten Abschnitt noch ausführlicher erläutern. Drittens erlaubt es die Auswertung historischer Beziehungen zwischen Wahlergebnissen und Strukturvariablen – das Modell lernt also aus den vergangenen 18 Bundestagswahlen seit 1949. Das ist insbesondere auch für eine realistische Einschätzung der Unsicherheit relevant, die mit den veröffentlichten Vorhersagen einhergeht, da die Schätzunsicherheit bei der geringen Zahl der Fälle doch beträchtlich ist. Wir beginnen mit der Modellierung des Wahlanteils ypt einer Partei p zum Zeitpunkt der Wahl t. Die Anzahl der modellierten Anteile der Parteien p = 1,2, …, P variiert über Wahlen hinweg. Während beispielsweise bis zur Wahl 1979 lediglich die Anteile von CDU/CSU, SPD, FDP und Anderen (kombinierter Anteil der übrigen Parteien) modelliert werden, kommen ab 1980 der Anteil für B’90/Die Grünen, ab 1990 der Anteil für PDS/Die Linke und ab 2013 der AfD-Wähleranteil hinzu. Ziel ist es schließlich, von den Wahlen w = 1,2, …, W – 1 auf den Ausgang der kommenden Wahl W zu extrapolieren. Wir nehmen für ypw eine Normalverteilung mit Mittelwert μpw und Varianz σ2 an, ~ , (1) wobei μpw als eine lineare Funktion von Kovariaten modelliert wird: . (2) Es besteht kein Konsens darüber, welche Variablenkombination in einem strukturellen Modell verwendet werden sollte, um die Stimmenanteile von Parteien bei Bundestagswahlen vorherzusagen. Die Vielfalt der Modelle und Prognosen allein schon in diesem Forum gibt bereits Aufschluss über die Unsicherheit, wie diese konkret modelliert werden sollten. Lauderdale u. Linzer (2015) bezeichnen letzteres als Spezifikationsunsicherheit. Eng damit verbunden ist das Bias-Varianz- Dilemma (Hastie et al. 2009), das, übertragen auf diese Anwendung, die Herausforderung beschreibt, Variablen zu identifizieren, die vergangene Wahlausgänge 421 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell gut vorhersagen, sich jedoch auch für zukünftige Wahlen als prädiktiv erweisen. Wir begegnen diesem Problem mit folgender Strategie: Zunächst erstellen wir einen Datensatz mit einer Vielzahl plausibler Prädiktoren3. Auf Basis dieses Variablensamples generieren wir alle möglichen Kombinationen von 1 bis K Prädiktoren (Gesamtzahl möglicher Kombinationen: 1023), berechnen auf Basis vergangener Wahlergebnisse lineare Modelle zur Erklärung parteispezifischer Wahlanteile und messen für jedes dieser Modelle die Varianzaufklärung. Dabei zeigen sich zwei Dinge: Erstens nimmt der relative Gewinn in der Varianzaufklärung für Modelle mit mehr als drei Prädiktoren deutlich ab. Gleichzeitig zeigen sich drei Variablen als konsistent robust, d. h. finden sich häufig im jeweils vorhersagestärksten Modell für eine festgelegte Zahl an Prädiktoren wieder. Diese robusten Faktoren sind (1) der Wahlanteil bei der zurückliegenden Bundestagswahl (für erstmals antretende Parteien mit 0 definiert), (2) der Mittelwert der in den Sonntagsfragen 230–200 Tage vor der Wahl veröffentlichten, parteispezifischen Anteile, und (3) ein Indikator für die Kanzlerpartei. Wir beschränken uns deshalb auf diese drei Va riablen. Gleichzeitig lassen sich diese auch theoretisch sinnvoll motivieren und bieten so die Gelegenheit, etablierte Theorien zum Wahlverhalten über den Vorhersageansatz implizit zu testen.4 Wahlen finden nicht in einem politischen Vakuum statt. Wähler entwickeln langfristige Bindungen zu Parteien (Campbell et al. 1960). Die Verteilung der Parteibindungen in der Wählerschaft erlaubt es bereits Erwartungen zu bilden, welchen Stimmenanteil eine Partei unter „normalen Umständen“ erhalten sollte (Converse 1966; Falter u. Rattinger 1983). Wir operationalisieren den Wählerrückhalt, auf den Parteien unter normalen Umständen bauen können, als den errungenen Stimmenanteil einer Partei bei der letzten Bundestagswahl. Dieser Wert ist im Normalfall bereits vier Jahre vor einer Bundestagswahl verfügbar und dient deshalb als längerfristig wirksamer Prädiktor.5 Panel (a) in Abbildung 1 zeigt den 3 Dazu gehören Wahlanteil bei der zurückliegenden Wahl, mittlerer Wahlanteil bei den letzten drei zurückliegenden Wahlen, mittlere Zustimmung in Befragungen 230 – 200 Tage vor der Wahl, Abschneiden bei Landtagswahlen in der zurückliegenden Legislaturperiode, Indikatoren für den Status der Partei (Kanzlerpartei, große Partei [SPD oder CDU/CSU], Regierungspartei, im Parlament vertretene Partei), Arbeitslosigkeit ein Jahr vor der Wahl und Veränderung der Arbeitslosigkeit ein Jahr vor der Wahl. 4 Eine Alternative zu dieser „Ad-Hoc-Lösung“ zur Variablenauswahl wäre, wie von Lauderdale u. Linzer (2015) vorgeschlagen, die Implementation einer Regularisierung. Hierbei verhält man sich zunächst agnostisch gegenüber den auszuwählenden Variablen und nimmt stattdessen alle gleichzeitig ins Modell auf, lässt aber gleichzeitig deren Koeffizienten bei eingeschränkter Vorhersagekraft gegen Null schrumpfen, um Overfitting zu vermeiden. Wir haben uns aus zwei Gründen gegen dieses Vorgehen und für einen Kompromiss aus subjektiver und datengetriebener Variablenauswahl entschieden: Zum einen ist auch der Regularisierungsansatz inhärent subjektiv, da das Universum der möglichen Prädiktoren vorgegeben werden muss. Zum zweiten dynamisieren wir die Effekte der Koeffizienten über Zeit (siehe Diskussion im Folgenden). Unsere experimentellen Berechnungen haben gezeigt, dass dieses Vorgehen zusammen mit einem Regularisierungsansatz zu extrem instabilen Koeffizientenschätzungen führt. 5 In bekannten strukturellen Modellen haben sich ähnliche Prädiktoren etabliert. Leininger und Kayser (2017) nehmen ebenfalls den Wahlanteil bei der zurückliegenden Bundestagswahl als Prädiktor. Das Kanzlermodell (Gschwend u. Norpoth 2000, 2001) beinhaltet beispielsweise eine Normalwahlkomponente, die über den mittleren Wahlanteil bei den letzten drei zurückliegenden Wahlen operationalisiert wird. In unserem Sample zeigte eine solche, längerfristige Spezifikation eine geringfügig schlechtere Performanz. 422 PVS, 58. Jg., 3/2017 Forum historischen Zusammenhang zwischen Parteianteilen bei aufeinanderfolgenden Wahlen. Der Prädiktor hilft insbesondere technisch zwischen traditionell kleinen und großen Parteien zu diskriminieren, doch auch innerhalb der Cluster kleiner bzw. großer Parteien besteht ein stark positiver Zusammenhang. Gleichzeitig wird deutlich, dass diese Variable nicht ausreicht, um starke Stimmengewinne bzw. -verluste zu erklären, wie sie beispielsweise die Union 2013, die FDP 2013 und die SPD 2009 erlebt bzw. erlitten haben. Abbildung 1: Bivariate Zusammenhänge zwischen Prädiktoren im strukturellen Modell und Zweitstimmenanteil der Parteien, 1953 – auf Wahlergebnisse der SPD und Union beschränkt (a) (b) (c) Anmerkungen: Die gestrichelten Linien berichten die vorhergesagten Werte einer linearen Regression. Quelle: eigene Darstellung. 423 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Der zweite Faktor, die Umfragewerte 230–200 Tage vor der Wahl, bildet in erster Linie kurzfristige Einflussfaktoren ab, die sich auf den Stimmenanteil der Parteien auswirken. Zum einen besteht die jeweilige Wählerschaft einer Partei nicht nur aus Stammwählern, die relativ immun gegenüber bestimmten Themen oder dem speziellen Personal sind, mit denen die Parteien in den Wahlkampf ziehen. Da Parteibindungen üblicherweise stabiler als Wahlentscheidungen sind, müssen selbst Stammwähler immer wieder motiviert werden zur Wahl zu gehen. Zum anderen gibt es auch Wähler, die a priori weniger festgelegt sind, sogenannte Wechselwähler (Schoen 2014), deren jeweilige Wahlentscheidung für eine Partei unter anderem abhängig ist von den speziellen Themensetzungen und dem Spitzenpersonal der Parteien, die diese Themen verkörpern. Zur Operationalisierung dieser kurzfristigen Neigungen verwenden wir den Stand der einzelnen Parteien in der Sonntagsfrage aus veröffentlichten Umfragen (Groß 2010; Schnell u. Novack 2014; Selb u. Munzert 2016). Wir operationalisieren die politische Stimmung unmittelbar vor der heißen Wahlkampfphase als Durchschnitt aller verfügbarer Umfragewerte einer Partei 230–200 Tage vor einer jeden Wahl.6 In Panel (b) in Abbildung 1 zeigt sich erneut und wenig überraschend ein starker Zusammenhang zwischen den aggregierten Wahlabsichten 230–200 Tage vor der Wahl und dem tatsächlichen Stimmenanteil bei der darauffolgenden Wahl. Die Varianz der tatsächlichen Anteile um den vorhergesagten Wert ist jedoch, wie dies statistisch auch zu erwarten ist, für die größeren Parteien größer. Unser dritter Erklärungsfaktor ist institutionell vermittelt. Für die Bewertung der Regierungsarbeit ist auch entscheidend, wer die Regierungskoalition führt (Gschwend u. Norpoth 2000, 2001). Die kanzlerstellende Partei ist also nicht nur eine Partei unter vielen. Kanzlerstellende Parteien bekommen nicht nur Stimmen von Anhängern dieser Partei, sondern darüber hinaus auch Stimmen von Wählern, die diese Partei wählen, um dadurch Einfluss auf die Regierungsbildung und -arbeit auszuüben (Cox 1997). Darüber hinaus wird unterstellt, dass die Kanzlerpartei über diese exponierte Rolle in der Regierung einen Aufmerksamkeitsbonus erhält, der sich ebenfalls in überdurchschnittlicher Unterstützung niederschlagen kann. Dieser besonderen institutionellen Stellung der kanzlerstellenden Parteien tragen wir Rechnung, indem wir einen zusätzlichen Parameter schätzen, der nur den Stimmenanteil dieser Partei beeinflusst.7 Panel (c) in Abbildung 1 weist einen deutlich höheren mittleren Stimmenanteil für Kanzlerparteien gegenüber der an- 6 Selb u. Munzert (2016) finden empirisch, dass die Ergebnisse von Sonntagsfragen, die zwischen acht und zehn Monaten vor einer Bundestagswahl gestellt wurden, zu geringeren Vorhersagefehlern führen, als die Ergebnisse von Umfragen, die zeitlich näher an der Wahl liegen. Wir lehnen uns in der Variablenkonstruktion an diese empirische Regularität an, wählen jedoch ein etwas nach vorne verschobenes und kürzeres Zeitfenster. Im Fall der Bundestagswahl 1969 wird dieses Fenster um drei Tage erweitert, da ansonsten keine Umfrage erfassbar gewesen wäre. 7 Implementiert wird dies über eine Dummy-Variable, die den Wert 1 für die amtierende kanzlerstellende Partei annimmt. Direkt vor der Wahl 1983 stellte formal die CDU/CSU mit Helmut Kohl den Kanzler. Allerdings interpretieren wir, ebenso wie in Gschwend und Norpoths Kanzlermodell, diese Wahl als Abrechnung mit der von Helmut Schmidt bis zum Herbst 1982 geführten sozialliberalen Koalition. Folglich kodieren wir für die Wahl 1983, abweichend von unserer Regel, die SPD als kanzlerstellende Partei. 424 PVS, 58. Jg., 3/2017 Forum deren großen Nichtkanzlerpartei auf (die kleineren Parteien wurden aus Gründen der Übersichtlichkeit weggelassen). Da der betrachtete Zeitraum fast 70 Jahre umfasst, stellt sich die Frage, ob die Annahme eines zeitstabilen datengenerierenden Prozesses gerechtfertigt ist. Das System der kollektiven politischen Repräsentation hat sich über die Jahre verändert (Zittel u. Gschwend 2007). Zum einen befördern Prozesse des sozialen Wandels Veränderungen in der traditionellen Wählerbasis von Parteien. Die einzelnen Parteien können sich nicht mehr auf eine bestimmte Wählerklientel verlassen. Zum anderen nimmt die Gruppe der Parteianhänger immer weiter ab (Arzheimer 2006). Der Veränderungsdruck deutet in die Richtung einer stärkeren Personalisierung von Repräsentation. Folglich sollten für die Erklärung des Erfolges von Parteien bei Bundestagswahlen langfristige Faktoren zunehmend weniger wichtig werden, kurzfristige Faktoren dagegen wichtiger. Um dieser Entwicklung Rechnung zu tragen, erlauben wir den β-Koeffizienten aus Gleichung (2) in einem bayesianischen dynamisch-linearen Modell gemäß eines random walk-Prozesses über die Wahlen zu variieren: ~ , (3) wobei . (4) Die Effekte der Prädiktoren können also so über Bundestagswahlen variieren, dass der durchschnittliche Einfluss des kten Prädiktors eine Funktion des Einflusses bei der vergangenen Wahl, und eines linearen Trends (erfasst durch den Drift-Parameter ) ist.8 Abbildung 2 berichtet die geschätzten β-Koeffizienten für die vergangenen 17 Wahlen und die kommende Wahl. Wie erwartet, nimmt die Bedeutung des Stimmenanteils bei der letzten Bundestagswahl ab, das Gewicht der Umfragen, die im Vorfeld der jeweiligen Bundestagskampagne veröffentlicht wurden, dagegen zu. Die Koeffizienten entwickeln sich nahezu spiegelbildlich zueinander. Substanziell beobachtet man also, dass die Ergebnisse der vergangenen Wahl immer weniger Vorhersagekraft für die Ergebnisse der kommenden Wahl haben, die Vorhersagekraft der Umfragen hingegen zugenommen hat. Der Effekt für die Kanzlerpartei schwankt über Zeit zwischen 0 und 15 Prozentpunkten, weist allerdings keinen klaren Trend auf. Für die Bundestagswahl 2017 extrapolieren wir den beobachteten Trend: Die Gewichte für die Vorhersage ergeben sich aus den geschätzten Koeffizienten für 2013 und den variablenspezifischen Drift-Parametern, weshalb ein weiter sinkendes Gewicht des Anteils der vergangenen Wahl und ein stärkeres Gewicht der Umfragen zum Einsatz kommen. 8 Eine weniger technisch anspruchsvolle Umsetzung eines Trends über Wahlen hinweg wäre es, die entsprechenden Faktoren mit einer Wahl-Trend-Variable zu interagieren. Das würde allerdings eine starke Annahme über die funktionale Form dieses Veränderungsprozesses implizieren. 425 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Abbildung 2: Koeffizientenschätzungen des strukturellen Modells, 1953–2017 Anmerkungen: Koeffizientenschätzungen des strukturellen Modells, 1953-2017 (vgl. Gleichung [3]). Quelle: eigene Darstellung. Der Versuch, die Anteile aller Parteien gemeinsam über eine Schätzgleichung vorherzusagen bzw. einen einheitlichen datengenerierenden Prozess über alle relevanten Parteien und Wahljahre zu beschreiben, mag zunächst kontraintuitiv erscheinen. Bei vergangenen Wahlen eingesetzte strukturelle Modelle beschränk- 426 PVS, 58. Jg., 3/2017 Forum ten sich entweder auf die Vorhersage des kombinierten Stimmenanteils der Regierungsparteien (Gschwend u. Norpoth 2000, 2001, 2017; Kayser u. Leininger 2016; Küntzler 2017), oder modellierten die jeweiligen Anteile in separaten Regressionsgleichungen, die dann simultan geschätzt wurden (Jérôme et al. 2013). Tatsächlich birgt unser Vorgehen sowohl Vor- als auch Nachteile. Auf der einen Seite können sinnvollerweise lediglich Prädiktoren verwandt werden, die für alle Parteien und Wahlzeitpunkte definierbar sind, nicht aber solche, die wahl-, aber nicht parteienspezifisch messbar sind.9 Außerdem werden im Modell keine mechanischen Vorkehrungen gegen wahlspezifisch unlogische Vorhersagen getroffen (z. B. wenn sich die vorhergesagten Wahlanteile nicht zu exakt 100 % summieren). Aus diesem Grund korrigieren wir die resultierenden Vorhersagen ex post, indem die einzelnen vorhergesagten Wahlanteile anhand deren Summe normalisiert werden. Aus unserer Sicht überwiegen jedoch die Vorteile unseres Ansatzes: Er ermöglicht Vorhersagen für die Anteile aller relevanten Parteien, die zur Wahl antreten – auch für solche mit eingeschränkter Historie, wie zum Beispiel die AfD im Rahmen der diesjährigen Bundestagswahl. Das wiederum erlaubt, die eigentlichen Fragen von Interesse – siehe Einleitung – präziser zu beantworten. Gleichzeitig erhöht das Modell die Anzahl der Freiheitsgrade, da mehrere Anteile pro Wahl in die Schätzung eingehen. Durch die Dynamisierung der Koeffizientenschätzung können wir schließlich die unrealistische Annahme lockern, dass sich die grundsätzliche Statik der strukturellen Zusammenhänge über die vergangenen Jahrzehnte nicht verändert. Nichtsdestotrotz ist die Vorhersage des strukturellen Modells, wie wir weiter unten zeigen werden, mit erheblicher Unsicherheit behaftet. Im folgenden Abschnitt legen wir dar, wie über den Verlauf der Kampagne veröffentlichte Umfragen effizient ausgewertet werden können, um sowohl die Erwartungen über die jeweiligen Zweitstimmenanteile zu aktualisieren als auch – in Maßen – präzisere Vorhersagen zu generieren. 2.2 Das Umfrage-Modell Die Vorhersagen des strukturellen Modells werden in einem nächsten Schritt durch ein umfragebasiertes Modell dynamisiert. Dazu erweitern wir das von Linzer diskutierte bayesianisch rückwärtsgerichtete random walk-Modell (Linzer 2013). Linzers Modell ist ein Hybrid aus „pooling the polls“-Modellen (Jackman 2005; Pickup u. Johnston 2007; Walther 2015) und strukturellen Vorhersagen. Die Vorhersagen des strukturellen Modells werden dabei als prior-Information für den Wahltag festgesetzt. Ein rückwärtsgerichteter random walk glättet dann, vom Wahltag ausgehend, die Informationen, die aus neu veröffentlichten Umfragen gewonnen werden. Dieses Vorgehen führt zu einer „Mischung“ beider Vor- 9 Geht man beispielsweise davon aus, dass Wirtschaftswachstum Wahlverhalten entscheidend beeinflusst, müsste ein entsprechender Indikator je nach Erwartung mit parteispezifischen Indikatoren (z. B. Regierungspartei) interagiert werden, da es sich bei der Modellierung aller Wahlanteile um ein Nullsummenspiel handelt: Parteiinvariante Indikatoren müssen für einige Parteien positive, für andere aber negative Effekte ausweisen können. 427 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell hersagequellen. Liegt der Wahlzeitpunkt noch weit in der Zukunft, ist die allein auf Umfragen basierende Vorhersage sehr unsicher, da diese über Zeit sehr volatil sind. Dementsprechend wird zunächst der Vorhersage des strukturellen Modells mehr Gewicht beigemessen. Rückt der Wahltag näher, steigt das Vertrauen des Modells in die umfragebasierte Vorhersage, da diese präziser wird. Dieses Vorgehen trägt der Beobachtung Rechnung, dass Sonntagsfragen, die mehrere Monate vor der Wahl durchgeführt werden, keine gute prädiktive Performanz aufweisen (Jennings u. Wlezien 2016).10 Unser Modell stellt die erste Anwendung dieses rückwärtsgerichteten random walk-Modells in einem Mehrparteienkontext dar. Dazu müssen einige Anpassungen vorgenommen werden, die wir im Folgenden beschreiben. Die Zeitreihe der Wahl ist definiert durch T Tage zwischen der letzten und der neuen Wahl. t ∈ (1, …, T) ist dabei die Notation für jeden einzelnen Tag, T der Wahltag. Umfrage ytc des Instituts c ∈ (1, …, C) zum Zeitpunkt t ist ein (1 × P) Vektor, der die Anzahl der Wahlzusagen für jede der modellierten Parteien p ∈ (1, …, P) abzählt. Jede Umfrage hat eine Stichprobengröße Nct. Die beobachteten Umfrageergebnisse für jede Partei werden dann als Funktion eines latenten Unterstützungsvektors und eines institutsspezifischen Verzerrungsvektors modelliert. Der Verzerrungsvektor berücksichtigt, dass Institute bei der ausgewiesenen Unterstützung für bestimmte Parteien systematisch danebenliegen können (Jackman 2005).11 Die Umfragewerte folgen daher einer Multinomialverteilung mit Erwartungswert : ytc ~ Multinomial( ). (5) Die Vorhersage wird durch die Modellierung von αt dynamisiert. Um der Tatsache, dass sich die geschätzten Parteianteile zu Eins aufaddieren müssen (also die Summe der Einträge des Vektors αt + δc für die Multinomialverteilung Eins ergeben muss), Genüge zu tragen, nutzen wir eine zur Analyse von kompositionalen Daten gebräuchliche log-ratio-Transformation (Aitchison 1982) der αt-Parameter und Einschränkungen über den Verzerrungsvektor.12 Dafür wird die letzte Partei als Referenzpartei αtP verwendet und die Werte für die anderen Parteien folgendermaßen transformiert: . Diese transformierten Werte werden dann in einen rückwärtsgerichteten random walk integriert: ~ . (6) 10 Dies spiegelt sich nicht zuletzt auch darin wider, dass der Einfluss der Umfragekomponente in unserem strukturellen Modell durch die beiden anderen Prädiktoren stark diskontiert wird. 11 Auf diese Instituts- oder „House“-Effekte gehen wir im Folgenden nicht weiter ein, da sie die Vorhersagen kaum beeinflussen. In den Online-Materialien weisen wir die entsprechenden Effekte nach Institut, Wahljahr und Partei getrennt auf. 12 Hierfür wird der Verzerrungsvektor sowohl für Parteien als auch Institute um Null zentriert. Diese Restriktion ist notwendig, um die latente Parteiunterstützung zu identifizieren. 428 PVS, 58. Jg., 3/2017 Forum In dieser Modellierung zeigt die Varianz-Kovarianz-Matrix an, wie stark die für einen Tag identifizierten Unterstützungswerte vom darauffolgenden Tag abhängen. In unserer Spezifikation nutzen wir eine unabhängige Varianzstruktur, sodass S nur von Null verschiedene Elemente ( )auf der Diagonalen besitzt, wobei 1 ≤ k ≤ P – 1.13 Die Eleganz dieser rückwärtsgerichteten Formulierung von klassischen „pooling-the-polls“-Modellen besteht darin, dass die Vorhersagen als prior-Information für den Wahltag genutzt werden können. Während bayesianische Modelle mit vorwärtsgerichteter random walk-Implementation prior-Information für den Starttag der Wahlkampagne (bzw. der dynamischen Modellschätzung) benötigen, bedarf es in unserer rückwärtsgerichteten Formulierung priors für den Wahltag. Hier kommen die zuvor präsentierten strukturellen Vorhersagen ins Spiel. Sie beinhalten Erwartungen über das Ergebnis auf Basis historischer Wahlen, die ohne die komplette Zeitreihe der Umfragen auskommen. Dazu werden die Verteilungen der strukturellen Vorhersagen als prior für den Wahltag genutzt. Auch in diesem Fall sollte gewährleistet sein, dass die vorhergesagten Parteianteile zwischen Null und Eins liegen sollten. Dafür arbeiten wir mit einer Beta- Verteilung und übertragen Erwartungswert und Standardabweichung der Vorhersage in die shape-Parameter ap und bp der Beta-Verteilung: 14 ~ . (7) Um diese Vorhersagen auf die log-transformierte Skala des random walk anzupassen, werden sie ebenfalls transformiert. Die aus diesem Modell resultierende Vorhersage ist dann der latente Zuspruch am Wahltag, αT. Bei ersten Evaluationen des Modells anhand vergangener Wahlen (siehe folgender Abschnitt) stellte sich heraus, dass das Umfragemodell zwar die prädiktive Performanz im Vergleich zu den strukturellen Vorhersagen nochmals deutlich verbessert, die geschätzte Unsicherheit der resultierenden Vorhersagen jedoch zu gering ist. Die mit den Vorhersagen einhergehenden Kredibilitätsintervalle waren also deutlich zu schmal, d. h. beinhalteten den wahren Wert seltener, als dies statistisch zu erwarten wäre. In anderen Worten: Das Modell ist sich „sicherer“, als es auf Basis zurückliegender Vorhersagen sein sollte. Dies liegt daran, dass Umfragen wenige Tage vor der Wahl zwar häufig präzise Vorhersagen liefern, bisweilen jedoch stark danebenliegen.15 Der empirische Vorhersagefehler ist also im Mittel deutlich größer, als die Unsicherheit über die geschätzte latente Unterstützung suggerieren würde. Dies spiegelt letztlich den Unterschied zwischen latenter, aber 13 Die Schätzung von Kovarianzen wäre an dieser Stelle prinzipiell auch möglich. Die Vorhersagen werden dadurch allerdings kaum beeinflusst, weshalb wir im Folgenden die sparsamere Spezifikation verwenden. 14 Um sowohl den Erwartungswert für Partei p ( ) als auch die Standardabweichung ( ) der Vorhersage in der Beta-Verteilung beizubehalten, folgen wir Jackman (2009, S. 55) und nutzen folgende Gleichungen zur Übertragung der Werte: und . 15 So schätzten die letzten Umfragen vor der Wahl 2005 die CDU bei über 40 Prozent ein – das tatsächliche Ergebnis lag dann mit etwa 35 Prozent deutlich darunter. 429 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell eben auf Basis von Surveydaten geschätzter Parteienunterstützung einerseits und tatsächlichem Wahlverhalten andererseits wider. Es gibt viele mögliche Ursachen diese Diskrepanzen (beispielsweise unterschiedliche Surveyteilnahmebereitschaften von Anhängern verschiedener Parteien, kurzfristige Änderungen der Wahlabsichten nach der letzten Umfrage; vgl. dazu auch das „Total-Survey-Error“- Framework (Groves et al. 2010; Schnell u. Novack 2014). Um möglichen systematischen Verzerrungen von Umfragen Rechnung zu tragen, nutzen wir deshalb einen ähnlichen Ansatz wie Hanretty et al. (2016) und korrigieren die umfragebasierte Vorhersage um die Fehlervarianz der Vorhersagen vergangener Wahlen. Dies wird praktisch implementiert durch einen zusätzlichen „Sprung“ von der geschätzten latenten Unterstützung am Wahltag zu den finalen Ergebnissen. Die Varianz des Sprungs berechnet sich auf Basis von Umfragen für alle Wahlen seit 1953 (der ersten Wahl mit veröffentlichten Umfragedaten), die in den letzten zwei Tagen vor der Wahl veröffentlicht worden sind. Nach dieser Korrektur ist unsere Vorhersage der latente Zuspruch am Wahltag plus einem „Sprung“, der die Vorhersageintervalle vergrößert. Um die Beschränkung des latenten Raums zu berücksichtigen, wird die Varianz des Sprungs auf die log-ratio-transformierten latenten Werte (αT) angewendet und dann rücktransformiert. Die historische Varianz der Fehler der log-ratio-transformierten Werte der „Sonntagsfrage“ seit 1953 beträgt 0,18. Diesen Wert nutzen wir als Varianz des „Sprungs“. Die Vorhersage für jede Partei ist dann ƒp = αTp + sp, mit sp ~ N(0,0,0.18). Durch die Rücktransformation – damit alle vorhergesagten ƒp sich wieder auf Eins aufsummieren – ergeben sich schließlich unsere Vorhersagen ƒp. 3. Daten, Schätzung und Evaluation anhand vergangener Wahlen Abbildung 3: Out-of-sample-Vorhersagen des strukturellen Modells von Parteianteilen bei Bundestagswahlen, 1953–2013 Quelle: eigene Darstellung 430 PVS, 58. Jg., 3/2017 Forum Zur Kalibrierung des strukturellen Modells verwenden wir Daten für alle bisherigen 18 Bundestagswahlen seit 1949. Die Ergebnisse der ersten Bundestagswahl gehen als Indikator für längerfristige Parteienbindung in das Modell ein, werden allerdings nicht selbst geschätzt. Zur Identifikation der Wahlabsicht 230–200 Tage vor der Wahl greifen wir auf Umfragedaten zurück, die von Groß (2010) gesammelt und von Schnell und Noack (2014) erweitert und zur Verfügung gestellt wurden, und füllen Lücken in den Zeitreihen durch weitere Daten auf, die uns vom Institut für Demoskopie Allensbach bereitgestellt wurden. Für Umfragen, die nach 2009 veröffentlicht wurden, verwenden wir Daten der Plattform wahlrecht.de. Umfragen von Instituten, die nur unregelmäßig Ergebnisse veröffentlichen, schließen wir aus und beschränken uns auf Veröffentlichungen vom Institut für Demoskopie Allensbach, von der Forschungsgruppe Wahlen sowie von forsa, Emnid, GMS, Infratest dimap und INSA. Die Umfragen verwenden wir dann auch zur Schätzung des Umfrage-Modells für die Wahlen 2002–2017, und zwar alle, die im letzten Jahr vor der Wahl erhoben wurden. Abbildung 4: Dynamische Vorhersagen des SPD-Stimmenanteils, Bundestagswahl 2013 Anmerkungen: Einzelne Symbole markieren Ergebnisse veröffentlichter Umfragen nach Institut. Die durchgezogene Kurve zeigt den Median der latenten Parteiunterstützung aus der posteriori-Verteilung des Modells, die Schattierungen die 90 %- und 95 %-Kredibilitätsintervalle. Das finale Resultat ist mit einer horizontalen durchgezogenen Linie (bei 25,7 %) und die Vorhersage basierend auf dem historischen Modell durch eine gestrichelte Linie (bei 23,8 %) gekennzeichnet. Quelle: eigene Darstellung. Zur Schätzung der Modellparameter und Generierung der vorhergesagten Anteilswerte sowohl im strukturellen als auch im Umfragemodell simulieren wir deren posterior-Verteilung mittels des in JAGS implementierten Markov-Chain- 431 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Monte-Carlo-Algorithmus (Plummer 2016; R Core Development Team 2013).16 Die Schätzung des Umfragemodells basiert auf fünf MCMC-Ketten mit je 200.000 Iterationen nach einer Burn-in-Periode von 150.000 Iterationen, wobei nur jede 100ste Iteration gespeichert wird. Die Konvergenz des verwendeten Gibbs-Samplers überprüfen wir anhand der Gelman-Rubin-Statistik und auf Basis visueller Evidenz (Gelman u. Rubin 1992; Brooks u. Gelman 1998).17 Abbildung 3 veranschaulicht den Zusammenhang zwischen den vorhergesagten und realisierten Wahlanteilen von Parteien bei vergangenen Bundestagswahlen. Die Anteile wurden hierfür „out-of-sample“ vorhergesagt, d. h. bei der jeweiligen Schätzung als unbekannt angenommen. Im Mittel über alle Parteien liegt der RMSE (root mean squared error; Wurzel der mittleren quadratischen Abweichung) bei 3,0 Prozent; vereinfacht gesprochen verfehlt also das strukturelle Modell den tatsächlichen Wahlanteil im Durchschnitt um etwa 3 Prozentpunkte.18 Im rechten Schaubild von Abbildung 3 wird deutlich, dass einige Beobachtungen vom Modell besonders verfehlt werden. Hier sind nicht die absoluten Wahlanteile, sondern deren Änderungen zwischen aufeinanderfolgenden Wahlen abgetragen. Insbesondere bei der Vorhersage der Anteile der großen Parteien liegt das Modell bisweilen deutlich daneben – im Fall des Erfolgs der Union 2013 (tatsächlich +7,7%) sagte das Modell beispielsweise lediglich einen Zugewinn von 1,9 Prozent voraus.19 Ein Blick in die Befragungsdaten für die vom Modell schlecht vorhergesagten Fälle zeigt häufig – wie auch im Falle der Grünen 2013 – einen späten Aufwärts- oder Abwärtstrend, was vom strukturellen Modell nur schlecht aufgefangen werden kann. Um diese Information zu nutzen, werden die strukturellen Vorhersagen mit dem Umfragemodell dynamisiert. Am Beispiel der Umfragewerte der SPD vor der Bundestagswahl 2013 stellen wir kurz die Funktionsweise der Dynamisierung durch das rückwärtsgerichtete random walk-Modell vor. Abbildung 4 zeigt hierbei die Entwicklung der Modellschätzung über Zeit. Dazu wird das Modell separat für verschiedene Datengrundlagen geschätzt. Zwei zentrale Charakteristiken des Modells sollen anhand dieses Beispiels illustriert werden. Zuerst fällt auf, dass die Unsicherheit über den Zuspruch am Wahltag über Zeit deutlich abnimmt. Während das 95 %-Kredibilitätsintervall 148 Tage vor der Wahl von etwas unter 22 Prozent bis etwa 29 Prozent reicht, ist es 8 Tage vor der Wahl deutlich schmaler und umfasst nur noch den Bereich von etwas unter 26 Prozent bis etwa 28 Prozent. Im Fall der SPD 2013 ist das finale Resultat auch in allen Intervallen enthalten. Zweitens zeigt sich, dass anfänglich die strukturellen Vorhersagen noch einen Einfluss auf die Entwicklung der Zustimmung haben, während am Ende der Kampagne das Mo- 16 Daten, Modell-Code und R-Skripte zur Replikation unserer Ergebnisse stellen wir in einem GitHub- Archiv frei online unter folgender Adresse zur Verfügung: https://github.com/zweitstimme/btw-2017. 17 Für Modelle, die nicht für die finale Vorhersage verwendet werden, arbeiten wir mit zwei MCMC-Ketten. 18 Der MAE (mean absolute error; mittlere absolute Abweichung), der Ausreißer im Vergleich zum RMSE weniger bestraft, beträgt 2,2 Prozent. 19 Besonders auffällig sind zudem die Ausreißer für die Union und andere Parteien bei der Wahl 1953. Hierbei spielen möglicherweise die Konsolidierung des Parteiensystems und dabei ein besonders starker Stimmengewinn für die Union eine Rolle. 432 PVS, 58. Jg., 3/2017 Forum dell eher dem Umfrage-Trend vertraut. Für die oberen Abbildungen (148 und 64 Tage vor der Wahl) tendiert die Entwicklung der Unterstützung leicht der durch die gestrichelte Linie markierten strukturellen Vorhersagen zu. Im Kontrast dazu ist diese Tendenz zwischen dem achten und letzten Tag vor der Wahl eher gering. Das liegt daran, dass anfänglich die Vorhersage aus dem strukturellen Modell noch relativ viel Information über den finalen Ausgang bereitstellt, während mit zunehmender Präzision der Umfrage dieser mehr Gewicht zugemessen wird. Dieser Effekt ist für kleine Parteien noch stärker, da dort eine präzisere Vorhersage aus dem strukturellen Modell möglich ist. Weitere Beispiele für die Wahlen 2002– 2013 finden sich im Online-Archiv zu diesem Artikel. Die dynamische Komponente verbessert die Vorhersagekraft unseres Modells für die letzten vier Wahlen erheblich. Tabelle 1 dokumentiert den RMSE für das strukturelle Modell im Vergleich zum Umfragemodell zu unterschiedlichen Zeitpunkten der Kampagne. Der durchschnittliche Fehler des strukturellen Modells für die Wahlen 2002–2013 liegt mit 2,54 relativ niedrig. Das Umfragemodell bietet ähnliche Werte für 148 bis 36 Tage vor der Wahl, verbessert sich dann aber nochmals deutlich in den letzten acht Tagen auf durchschnittlich 1,83. Einen Tag vor der Wahl liegt der RMSE bereits wieder bei 1,98 Prozentpunkten. Mit Ausnahme der Wahl 2005, bei der die Umfragen den Wahlanteil der CDU deutlich überschätzten, zeigt sich für die einzelnen Wahlen dasselbe Muster: Bis 36 Tage vor der Wahl ist die Vorhersagefähigkeit ähnlich gut für das Umfragemodell und das strukturelle Modell, nimmt dann aber für das Umfragemodell erheblich zu. Das ist besonders auffällig für die Wahl 2013, in der das strukturelle Modell stark danebenlag (RMSE 3,47), dieses aber durch die Dynamisierung mittels des Umfragemodells mit einem RMSE von 1,69 und 1,33 einen bzw. acht Tage vor der Wahl aufgefangen werden konnte. Für Vorhersagen ist allerdings nicht nur die erwartete durchschnittliche Abweichung relevant, sondern auch die korrekte Einschätzung der Unsicherheit. Unsere korrigierten 95 %-Kredibilitätsintervalle der Vorhersage aus dem Umfragemodell zeigen mit 94 % eine sehr passende Deckung des richtigen Ergebnisses für die letzten vier Wahlen auf – d. h. sie enthalten den wahren Wert nahezu exakt so häufig, wie zu erwarten wäre.20 Wie das Umfragemodell die Vorhersagen über Zeit verbessert, stellen wir in Abbildung 5 noch einmal exemplarisch für die Bundestagswahl 2013 dar. Zwei Vorteile des Modells werden dabei besonders deutlich: Zum einen verbessert sich die Vorhersage über Zeit. Das Zentrum der Intervalle liegt für die meisten Parteien und Zeitpunkte zwischen den wahren Werten und den strukturellen Vorhersagen, was eine Reduzierung des Vorhersagefehlers mit näher rückendem Wahltag widerspiegelt. Beispielsweise bewegt sich die Vorhersage für die Grünen bis 36 Tage vor der Wahl etwa auf dem Niveau der strukturellen Vorhersage, nimmt dann jedoch die abstürzenden Umfragewerte auf und nähert sich dem tatsächlichen Ergebnis. Zweitens zeigt sich, dass vor allem für kleine Parteien die Vorhersagen über Zeit deutlich an Präzision gewinnen. 20 Die Deckung für die verschiedenen Abschnitte sind einen Tag vor der Wahl 95 Prozent, acht Tage vor der Wahl 100 Prozent, 36 Tage vor der Wahl 95 Prozent, 64 Tage vor der Wahl 95 Prozent, 92 Tage vor der Wahl 95 Prozent, 120 vor der Wahl 90 Prozent und 148 Tage 90 Prozent. 433 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Abbildung 5: Entwicklung der Modellvorhersage für die Bundestagswahl 2013, 148 Tage bis einen Tag vor der Wahl Anmerkungen: Die Punkte geben die Median-Vorhersage an, die dicken bzw. dünnen Balken das 90 % bzw. 95 %-Kredibilitätsintervall. Das finale Resultat ist mit einer horizontalen durchgezogenen Linie und die Vorhersage basierend auf dem strukturellen Modell durch eine gestrichelte Linie gekennzeichnet. Quelle: eigene Darstellung. Tabelle 1: Entwicklung des RMSE der out-of-sample-Vorhersagen nach Datengrundlage und Wahl. Strukturelles Modell vs. Umfragemodell, gestaffelt nach Zeitpunkt vor der Wahl Modell RMSE 2002-13 2002 2005 2009 2013 Strukturell 2,54 1,87 2,32 1,91 3,47 Umfrage, 1 Tag vor Wahl 1,98 1,23 3,24 1,38 1,33 Umfrage, 8 Tage vor Wahl 1,83 1,08 2,86 1,06 1,69 Umfrage, 36 Tage vor Wahl 2,27 1,96 2,80 1,64 2,65 Umfrage, 64 Tage vor Wahl 2,22 1,56 2,81 1,48 2,67 Umfrage, 92 Tage vor Wahl 2,54 2,06 2,92 1,78 3,14 Umfrage, 120 Tage vor Wahl 2,80 2,60 3,27 2,18 3,02 Umfrage, 148 Tage vor Wahl 2,59 2,18 3,03 1,88 3,05 Quelle: eigene Darstellung. Während beispielsweise im Falle der FDP 148 Tage vor der Wahl sowohl ein Wahlerfolg mit über 10 Prozent der Stimmen als auch ein Ausscheiden aus dem Bundestag möglich erscheint, tendiert das Modell 36 Tage vor Wahl zu einem knappen Ergebnis. Interessant ist hierbei, dass der Erwartungswert relativ konstant bleibt und sich nur die Präzision der Vorhersage verändert. Ähnliche Muster erwarten wir auch für die Vorhersagen der Bundestagswahl 2017. 434 PVS, 58. Jg., 3/2017 Forum 4. Vorhersage der Bundestagswahl 2017 In einem letzten Schritt nutzen wir das Modell, um den Ausgang der Bundestagswahl 2017 vorherzusagen. Dazu verwenden wir an dieser Stelle lediglich Daten, die bis zum 31. Mai 2017, kurz vor der Online-Veröffentlichung dieses Artikels und 116 Tage bzw. knapp vier Monate vor der Wahl zur Verfügung standen. Zur Erzeugung der Wahlabsichtsvariable des strukturellen Modells werden 18 Befragungen verwendet, die zwischen dem 6. Februar 2017 und 8. März 2017 veröffentlicht wurden (und damit in den Zeitraum nach der Verkündung der Kanzlerkandidatur von Martin Schulz fallen). Bei der Vorhersage von Parteianteilen beschränken wir uns auf die Parteien, die laut den Umfragen eine realistische Chance auf den Einzug in den nächsten Bundestag haben (und dabei auch separat ausgewiesen werden): CDU/CSU (ein gemeinsamer vorhergesagter Wahlanteil), SPD, Die Linke, B’90/Die Grünen, FDP und AfD. Abbildung 6: Dynamische Vorhersagen der Stimmenanteile für die Bundestagswahl 2017 Anmerkungen: Einzelne Symbole markieren Ergebnisse veröffentlichter Umfragen nach Institut. Die durchgezogene Kurve zeigt den Median der latenten Parteiunterstützung aus der posteriori-Verteilung des Modells, die Schattierungen die 90 %- und 95 %-Kredibilitätsintervalle. Die Vorhersage basierend auf dem strukturellen Modell ist durch eine gestrichelte Linie gekennzeichnet. Quelle: eigene Darstellung. Das strukturelle Modell liefert folgende Vorhersage, die als prior-Information für das Umfrage-Modell genutzt wird: CDU/CSU 35,0 Prozent (SD = 4,4), SPD 27,5 Prozent (3,0), Die Linke 8,4 Prozent (2,2), B’90/Die Grünen 7,9 Prozent (2,1), FDP 6,4 Prozent (2,2), AfD 9,1 Prozent (2,3). Abbildung 6 zeigt die Entwicklung der Vorhersage auf Basis der neu verfügbaren Umfragedaten. Um die Dynamik des Umfragemodells besser sichtbar zu machen, deckt die Abbildung den Zeitraum eines ganzen Jahres vor der Wahl ab. Gut sichtbar ist der Schulz-Effekt, ein extremer positiver Schock in der SPD-Zeitreihe, der sich in negativen Schocks der anderen 435 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Zeitreihen widerspiegelt. Mittlerweile hat sich dieser Effekt jedoch wieder deutlich zurückgebildet – die CDU/CSU liegt in der aktuell geschätzten latenten Zustimmung sogar höher als vor der Ernennung Schulz’ zum Kanzlerkandidaten. Gleichzeitig zeigen die Abbildungen, dass die Vorhersage des strukturellen Modells noch einen substanziellen Einfluss auf die Wahltagsvorhersage ausübt: die Unterstützungskurven schrumpfen noch deutlich in Richtung der strukturellen Vorhersage, sodass wir aktuell ein schwächeres Abschneiden sowohl der CDU/CSU als auch der FDP erwarten würden, als die aktuelle latente Parteienunterstützung erwarten ließe. Grundsätzlich sollte das Gewicht des strukturellen Modells über den Verlauf der Kampagne ab- und das des Umfragemodells weiter zunehmen. Zum Zeitpunkt dieser Vorhersage hält sich der Nutzen der Kombination des strukturellen Modells mit der dynamischen Komponente noch in Grenzen – gemäß den Ergebnissen aus Tabelle 1 würden wir nicht erwarten, dass dieser Schritt zu einer starken Verbesserung der Vorhersagegüte beiträgt. Wir präsentieren hier dennoch die Ergebnisse des kombinierten Modells, um sowohl das Prozedere zu illustrieren als auch die starken Schwankungen in der latenten Parteiunterstützung zu verdeutlichen. Damit verbunden ist auch die große Unsicherheit, die das Modell der Vorhersage zu diesem Zeitpunkt noch beimisst. Die Kredibilitätsintervalle weiten sich zwischen dem Zeitpunkt der Vorhersage und dem Wahltag noch stark aus. Für diesen Zeitraum liegen noch keine Daten vor, dementsprechend groß ist auch die kombinierte Unsicherheit aus dem strukturellen Modell und der Variabilität der Befragungen. Abbildung 7: Vorhersagen der Stimmenanteile für die Bundestagswahl 2017 Anmerkungen: 90 %-(95 %-)Kredibilitätsintervalle durch dicke (dünne) Balken angezeigt. Quelle: eigene Darstellung. Die aktuellen vorhergesagten Stimmenanteile 158 Tage vor der Wahl sind schließlich nochmals detailliert in Abbildung 7 abgetragen. Demnach käme die CDU/ CSU auf 36,0 Prozent [28,3 %; 44,4 %], die SPD auf 26,4 Prozent [19,5 %; 34,7 %], die AfD auf 8,2 Prozent [5,6 %; 11,9 %], Die Linke auf 8,1 Prozent 436 PVS, 58. Jg., 3/2017 Forum [5,8 %; 12,2 %], die FDP auf 7,6 Prozent [4,9 %; 11,4 %], und B’90/Die Grünen auf 7,2 Prozent [5,0 %; 10,5 %] (90 %-Kredibilitätsintervalle in Klammern).21 Dabei wird deutlich, dass die mit den aktuellen Vorhersagen verbundene Unsicherheit noch beträchtlich ist.22 Tabelle 2: Vorhergesagte Wahrscheinlichkeiten auf Basis der simulierten Stimmenanteile für Ereignisse im Zuge der Bundestagswahl 2017 Ereignis Wahrscheinlichkeit (in %) Größte Partei CDU/CSU 87 SPD 13 Koalitionsmehrheit CDU/CSU + SPD 100 CDU/CSU + FDP 25 CDU/CSU + B’90/Die Grünen 22 CDU/CSU + B’90/Die Grünen + FDP 72 SPD + B’90/Die Grünen 0 SPD + B’90/Die Grünen + Linke 15 SPD + B’90/Die Grünen + FDP 11 Scheitern an 5%-Hürde FDP 6 AfD 2 B’90/Die Grünen 6 Zugewinn an Stimmenanteilen im Vergleich zu 2013 CDU/CSU (>41.5%) 14 SPD (>25.7%) 56 Die Linke (>8,6%) 38 B’90/Die Grünen (>8,4%) 24 FDP (>4.8%) 95 AfD (>4.7%) 99 Weitere Ereignisse Sechs Fraktionen im Bundestag 86 AfD drittstärkste Fraktion 33 Quelle: eigene Darstellung. Ein wichtiger Vorteil der bayesianischen Modellierung und Implementation mittels MCMC-Simulationen ist, dass sich sehr einfach Wahrscheinlichkeiten für alle mit den vorhergesagten Größen direkt verbundene Ereignisse berechnen lassen. Hierzu werden die Ergebnisse der Simulationen herangezogen und aus der relativen Häufigkeit des Eintretens bestimmter Ereignisse deren Wahrscheinlichkeit abgeleitet. Einige dieser Wahrscheinlichkeiten sind in Tabelle 2 aufgelistet. Basierend auf diesen Berechnungen beträgt die Wahrscheinlichkeit für die CDU/CSU, als 21 Die hier berichteten Zahlen beschreiben die Median-, nicht die Mittelwert-Vorhersagen aus den posterior-Verteilungen. Deshalb weicht die Summe der Werte geringfügig von 100 Prozent ab. 22 Die in Abbildung 7 präsentierten Unsicherheitsintervalle sind zudem breiter als die in Abbildung 6 für den Wahltag präsentierten Intervalle. Dies liegt daran, dass letztere die Schock-Anpassung (zur Korrektur möglicher Umfrageverzerrungen) noch nicht berücksichtigt. 437 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell stärkste Fraktion aus der Bundestagswahl hervorzugehen, 87 Prozent, für die SPD lediglich 13 Prozent. Ein Blick auf unterschiedliche Koalitionsoptionen zeigt, dass neben der Großen Koalition aktuell eine Jamaika-Koalition erhebliche Chancen auf eine rechnerische Mehrheit im Parlament hätte, aber auch eine Schwarz-Gelbe Koalition mit 25 Prozent nicht unmöglich scheint. 23 Gleichzeitig besteht mit Blick auf die kleinen Parteien aktuell für keine ein nennenswertes Risiko, an der 5 %-Hürde zu scheitern. Gleichzeitig gibt das Modell der FDP, der AfD und der SPD aktuell die höchsten Chancen, im Vergleich zur letzten Wahl Stimmenanteile hinzuzugewinnen und somit als nominelle Gewinner aus der Wahl hervorzugehen. Schließlich sehen 6/7 unserer Simulationen sechs Fraktionen im Bundestag und ein Drittel die AfD als drittstärkste Fraktion. 5. Vorläufige Diskussion Eine abschließende Beurteilung unseres Vorhersagemodells steht zu diesem Zeitpunkt noch aus. Am Abend des 24. September 2017 wird sich herausstellen, ob das Modell – idealerweise besser noch als die unmittelbar vor dem Wahltag veröffentlichten Umfragen – in der Lage war, den Ausgang der Bundestagswahl zu antizipieren. Es ist durchaus möglich, dass das Modell an diesem Test scheitert. Weder verfügen wir über Insiderwissen noch über eine „magische“ Formel, die den Wahlausgang in allen Fällen zuverlässig vorhersagt. Aus wissenschaftlicher Sicht sollte die Präzision einer Vorhersage nicht das alleinige Kriterium zur Beurteilung der Qualität eines Vorhersagemodells darstellen (Lewis-Beck 2005). Die Vorhersage von Wahlergebnissen ist ein Geschäft mit extrem seltenen Ereignissen; es ist somit nicht immer einfach zu beurteilen, ob Erfolg oder Misserfolg eher der Modellspezifikation oder dem Zufall zuzuschreiben sind. Gleichzeitig sind einige Vorzüge des Modells gegenüber bisherigen Methoden zur Bundestagwahlvorhersage bereits jetzt ersichtlich: Es erlaubt sowohl eine frühzeitige Vorhersage (200 Tage vor der Wahl) durch die historische Komponente als auch eine Aktualisierung der Erwartungen auf Basis neuer Umfragen, kombiniert also die Vorteile struktureller Modelle mit denen von Umfragedaten. Darüber hinaus werden Vorhersagen für alle relevanten antretenden Parteien generiert und nicht nur für den Koalitionsanteil. Durch das bayesianische Setup ist zudem eine intuitive Ableitung von Wahrscheinlichkeiten jedes beliebigen, auf den prognostizierten Parteianteilen basierenden Ereignisses möglich. Zwar sagt das Modell nichts über den Verlauf und die Erfolgswahrscheinlichkeit von Koalitionsverhandlungen aus (Bräuninger u. Debus 2008, 2012; Debus 2011). Letztlich ist aber die Frage, welche Koalitionen zumindest rechnerisch möglich sein werden, um eine Mehrheit der Sitze im neuen Bundestag zu erhalten, von zentraler Bedeutung für die persönliche Wahlentscheidung und die letztliche Bewertung des Wahlausgangs. Insofern können die Pro- 23 Diese Wahrscheinlichkeiten beziehen sich natürlich lediglich auf die rechnerischen Mehrheiten der Sitze. Dabei wird zwar berücksichtigt, ob ein potenzieller Koalitionspartner die 5 %-Hürde überschreitet, jedoch keinerlei strategische Überlegungen zur tatsächlichen Wahrscheinlichkeit der Realisierung einer solchen Koalition durch die beteiligten Parteien angestellt. 438 PVS, 58. Jg., 3/2017 Forum gnosen und daraus abgeleiteten Wahrscheinlichkeiten einen Beitrag dazu leisten, dass Wählerinnen und Wähler bei der Inanspruchnahme eines ihrer wichtigsten Bürgerrechte möglichst gut informiert sind. Um als hilfreicher Wegweiser für Wählerinnen und Wähler, aber auch für Parteien, Kandidaten und Journalisten zu dienen, ist jedoch auch wichtig, dass sowohl ermittelt als auch kommuniziert wird, mit wie viel Unsicherheit die veröffentlichten Vorhersagen verbunden sind. In den letzten Jahren sind (vor allem umfragebasierte) Prognosemodelle zunehmend in die Kritik geraten, da sie den Ausgang einiger bedeutsamer Wahlen (britische Unterhauswahl 2015; Brexit-Referendum 2016; Trump-Wahl 2016) nicht korrekt vorhersagen konnten. Auf der einen Seite ist nicht davon auszugehen, dass dies mittelfristig das Aus für zuverlässige Wahlvorhersagen bedeutet – im Gegenteil gibt es Hinweise darauf, dass im internationalen Vergleich Umfragedaten nach wie vor ein robuster Prädiktor für Wahlausgänge darstellen (Kennedy et al. 2017). Auf der anderen Seite sind jedoch Vertreter der Wahlvorhersagezunft in der Pflicht, Prognosen mit realistischen Unsicherheiten zu publizieren und diese Unsicherheit auch für die nichtwissenschaftliche Öffentlichkeit verständlich zu machen. Dazu gehört eine Offenlegung der Datengrundlage, Transparenz bei der Modellbildung und Hilfestellung bei der Interpretation der Ergebnisse mit Blick auf die eigentlich interessierenden Größen. Wir versuchen, diesen Kriterien mit unserem Modell gerecht zu werden. Zum einen haben wir technische Vorkehrungen getroffen, um zu zuversichtliche Prognosen zu vermeiden und eine realistischere Quantifizierung von Unsicherheit zu erlangen. Zum anderen stellen wir die Ergebnisse unserer Vorhersage einer breiteren Öffentlichkeit auf dem Internetportal zweitstimme.org zur Verfügung. Das Portal soll auch dazu dienen, Aktualisierungen der Vorhersage im Verlauf der Kampagne zu kommunizieren und interessierten Wahlbeobachtern Werkzeuge an die Hand zu geben, um die mit den Ergebnissen verbundenen geschätzten Wahrscheinlichkeiten für bestimmte Ereignisse intuitiv nachzuvollziehen. Damit hoffen wir im Kontext der Wahlberichterstattung zur kommenden Bundestagswahl einen politikwissenschaftlich fundierten, für die Allgemeinheit nützlichen Beitrag zu leisten. Literatur Aitchison, John. 1982. The Statistical Analysis of Compositional Data. Journal of the Royal Statistical Society Series B 44(2): 139–177. DOI: 10.1007/978-94-009-4109-0. Arzheimer, Kai. 2006. ‘Dead men walking?’ Party identification in Germany, 1977–2002. Electoral Studies 25(4): 791–807. DOI: 10.1016/j.electstud.2006.01.004. Bräuninger, Thomas, und Marc Debus. 2012. Parteienwettbewerb in den deutschen Bundesländern. Wiesbaden: VS Verlag für Sozialwissenschaften. Bräuninger, Thomas, und Marc Debus. 2008. Der Einfluss von Koalitionsaussagen, programmatischen Standpunkten und der Bundespolitik auf die Regierungsbildung in den deutschen Ländern. Politische Vierteljahresschrift 49(2): 309–38. DOI: 10.1007/ s11615-008-0101-6. Brooks, Stephen P., und Andrew Gelman. 1998. General Methods for Monitoring Convergence of Iterative Simulations. Journal of Computational and Graphical Statistics 7(4): 434–455. DOI: 10.2307/1390675. 439 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Campbell, Angus, Philip E. Converse, Warren E. Miller, und Donald E. Stokes. 1960. The American Voter. New York, NY: Wiley. Converse, Philip E. 1966. The Concept of Normal Vote. In Elections and the Political Order, Hrsg. Angus Campbell, Philip E. Converse, Warren E. Miller, und Donald E. Stokes, 9–39. New York, NY: Wiley. Cox, Gary W. 1997. Making Votes Count: Strategic Coordination in the World’s Electoral Systems. New York, NY: Cambridge University Press. Debus, Marc. 2011. Parteienwettbewerb, Regierungsbildung und Ergebnisse der Koalitionsverhandlungen nach der Bundestagswahl 2009. In Die Parteien nach der Bundestagswahl 2009, Hrsg. Oskar Niedermayer, 281–306. Wiesbaden: Verlag für Sozialwissenschaften. Falter, Jürgen W., und Hans Rattinger. 1983. Parteien, Kandidaten und politische Streitfragen bei der Bundestagswahl 1980: Möglichkeiten und Grenzen der Normal-Vote-Analyse. In Wahlen und politisches System. Analysen aus Anlass der Bundestagswahl 1980, Hrsg. Max Kaase, und Hans-Dieter Klingemann, 320–421. Opladen: Westdeutscher Verlag. Gelman, Andrew, und Gary King. 1993. Why Are American Presidential Election Campaign Polls So Variable When Votes Are So Predictable? British Journal of Political Science 23(4): 409–451. DOI: 10.1017/S0007123400006682. Gelman, Andrew, und Donald B. Rubin. 1992. Inference From Iterative Simulation Using Multiple Sequences. Statistical Science 7: 457–511. Groß, Jochen. 2010. Die Prognose von Wahlergebnissen. Wiesbaden: VS Verlag für Sozialwissenschaften. Groves, Robert M., Floyed J. Fowler, Jr., Mick P. Couper, James M. Lepkowski, Eleanor Singer, und Roger Tourangeau. 2010. Survey Methodology, 2nd Edition. New York, NY: Wiley. Gschwend, Thomas, und Helmut Norpoth. 2000. Soll und Haben: Die deutsche Wählerschaft rechnet mit den Parteien ab. In 50 Jahre Empirische Wahlforschung in Deutschland. Entwicklung, Befunde, Perspektiven, Daten, Hrsg. Markus Klein, Wolfgang Jagodzinski, Ekkehard Mochmann, und Dieter Ohr, 389–409. Wiesbaden: Westdeutscher Verlag. Gschwend, Thomas, und Helmut Norpoth. 2001. Wenn am nächsten Sonntag... Ein Prognosemodell für Bundestagswahlen. In Wahlen und Wähler: Analysen aus Anlass der Bundestagswahl 1998, Hrsg. Hans-Dieter Klingemann, und Max Kaase, 473–499. Wiesbaden: Westdeutscher Verlag. Gschwend, Thomas, und Helmut Norpoth. 2005. Prognosemodell auf dem Prüfstand: Die Bundestagswahl 2005. Politische Vierteljahresschrift 46(4): 682–688. DOI: 10.1007/ s11615-005-0308-8. Gschwend, Thomas, und Helmut Norpoth. 2017. Machtwechsel in Sicht? Die Vorhersage des Kanzlermodells für die Bundestagswahl 2017. Politische Vierteljahresschrift 58(3): 392–406. Hanretty, Chris, Ben Lauderdale, und Nick Vivyan. 2016. Combining national and constituency polling for forecasting. Electoral Studies 41: 23–43. DOI: 10.1016/j.electstud. 2015.11.019. Hastie, Trevor, Robert Tibshirani, und Jerome Friedman. 2009. The Elements of Statistical Learning. New York, NY: Springer. Jackman, Simon. 2005. Pooling the polls over an election campaign. Australian Journal of Political Science 40(4): 499–517. DOI: 10.1080/10361140500302472. Jackman, Simon. 2009. Bayesian Analysis for the Social Sciences. Chichester: Wiley. 440 PVS, 58. Jg., 3/2017 Forum Jennings, Will, und Christopher Wlezien. 2016. The Timeline of Elections: A Comparative Perspective. American Journal of Political Science 60(1): 219–233. DOI: 10.1111/ ajps.12189. Jérôme, Bruno, Véronique Jérôme-Speziari, und Michael S. Lewis-Beck. 2013. A Political- Economy Forecast for the 2013 German Elections: Who to Rule with Angela Merkel? Political Science & Politics 46(3): 479–80. DOI: 10.1017/S1049096513000814. Kayser, Mark Andreas, und Arndt Leininger. 2016. A Predictive Test of Voters’ Economic Benchmarking: The 2013 German Bundestag Election. German Politics 25(1): 106– 130. DOI: 10.1080/09644008.2015.1129531. Kennedy, Ryan, Stefan Wojcik, und David Lazer. 2017. Improving election prediction internationally. Science 355(6324): 515–520. DOI: 10.1126/science.aal2887. Küntzler, Theresa. 2017. Using Data Combination of Fundamental Variable-Based Forecasts and Poll-Based Forecasts to Predict the 2013 German Election. German Politics. Im Erscheinen. DOI: 10.1080/09644008.2017.1280781. Lauderdale, Benjamin E., und Drew Linzer. 2015. Under-performing, over-performing, or just performing? The limitations of fundamentals-based presidential election forecasting. International Journal of Forecasting 31(3): 965–979. DOI: 10.1016/j.ijforecast. 2015.03.002. Leininger, Arndt, und Mark A. Kayser. 2017. Eine länderbasierte Prognose zur Bundestagswahl 2017. Politische Vierteljahresschrift 58(3): 407–417. Lewis-Beck, Michael, Helmut Norpoth, William Jacoby, und Herbert Weisberg. 2008. The American Voter Revisited. Ann Arbor, MI: University of Michigan Press. Linzer, Drew A. 2013. Dynamic Bayesian Forecasting of Presidential Elections in the States. Journal of the American Statistical Association 108(501): 124–134. DOI: 10.1080/01621459.2012.737735. Munzert, Simon 2017. Forecasting elections at the constituency level: A correction-combination procedure. International Journal of Forecasting 33(2): 467–481. DOI: 10.1016/ j.ijforecast.2016.12.001. Norpoth, Helmut, und Thomas Gschwend. 2003. Against all Odds? The Red-Green Victory. German Politics and Society 21(1): 15–34. DOI: 10.3167/104503003782353619. Pickup, Mark, und Richard Johnston. 2007. Campaign trial heats as electoral information: Evidence from the 2004 and 2006 Canadian federal elections. Electoral Studies 26(2): 460–476. DOI: 10.1016/j.electstud.2007.03.001. Plummer, Martyn. 2016. JAGS – Just Another Gibbs Sampler. http://mcmc-jags.sourceforge.net/. Zugegriffen: 24.04.2017. R Development Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. http://www.r-project.org. Zugegriffen: 24.04.2017. Schnell, Rainer, und Marcel Noack. 2014. The Accuracy of Pre-Election Polling of German General Elections. Methods, Data, Analyses 8(1): 5–24. DOI: 10.12758/mda.2014.001. Schoen, Harald. 2014. Wechselwahl. In Handbuch Wahlforschung, Hrsg. Jürgen W. Falter, und Harald Schoen, 489–522. Wiesbaden: Springer. Selb, Peter, und Simon Munzert. 2016. Forecasting the 2013 German Bundestag Election Using Many Polls and Historical Election Results. German Politics 25(1): 73–83. DOI: 10.1080/09644008.2015.1121454. 441 Munzert et al. | Zweitstimme.org. Ein strukturell-dynamisches Vorhersagemodell Walther, Daniel. 2015. Picking the winner(s): Forecasting elections in multiparty systems. Electoral Studies 40: 1–13. DOI: 10.1016/j.electstud.2015.06.003. Zittel, Thomas, und Thomas Gschwend. 2007. Der Bundestagswahlkampf von 2005 und Kollektive Repräsentation: Ein kurzer Auftakt zum langen Abschied? In Die Bundestagswahl 2005. Analysen des Wahlkampfes und der Wahlergebnisse, Hrsg. Frank Brettschneider, Oskar Niedermayer, und Bernhard Weßels, 119–144. Wiesbaden: VS Verlag für Sozialwissenschaften. Autorenangaben Dr. Simon Munzert Institut für Sozialwissenschaften Humboldt Universität zu Berlin Unter den Linden 6 10099 Berlin E-Mail: simon.munzert@hu-berlin.de Dr. Lukas Stötzer Institut für Politikwissenschaft Universität Zürich Affolternstraße 56 8050 Zürich E-Mail: lukas.stoetzer@uzh.ch Prof. Thomas Gschwend, Ph.D. Professor für Politikwissenschaft, quantitative sozialwissenschaftliche Methoden Universität Mannheim 68131 Mannheim E-Mail: gschwend@uni-mannheim.de Marcel Neunhoeffer, M.A. Fakultät für Sozialwissenschaften Universität Mannheim 68131 Mannheim E-Mail: mneunhoe@uni-mannheim.de Sebastian Sternberg, M.A. Fakultät für Sozialwissenschaften Universität Mannheim 68131 Mannheim E-Mail: ssternbe@uni-mannheim.de

Abstract

We present results of an ex-ante forecast of party-specific vote shares at the German Federal Election 2017. To that end, we combine data from published trial heat polls with structural information. The model takes care of the multi-party nature of the setting and allows making statements about the probability of certain events, such as the plurality of votes for a party or the majority for coalition options in parliament. The forecasts of our model are continuously being updated on the platform zweitstimme.org. The value of our approach goes beyond the realms of academia: We equip journalists, political pundits, and ordinary citizens with information that can help make sense of the parties’ latent support and ultimately make voting decisions better informed.

Zusammenfassung

Wir berichten die Ergebnisse einer ex-ante-Vorhersage der Zweitstimmenergebnisse für die Bundestagswahl 2017. Dazu kombinieren wir Daten veröffentlichter Umfragen mit strukturellen Informationen. Das Modell trägt den Eigenheiten von Vielparteiensystemen Rechnung und erlaubt es, Aussagen über die Wahrscheinlichkeit bestimmter Wahlergebnisse zu treffen, z. B. der Mehrheit der Sitzanteile für eine Partei oder der rechnerischen Mehrheit für verschiedene Koalitionsoptionen. Die Vorhersagen des Modells werden auf der Plattform zweitstimme.org veröffentlicht und aktualisiert. Unser Ansatz hat dabei nicht nur akademischen Wert: Wir geben Journalisten, Experten und Bürgern Informationen an die Hand, die helfen können, tatsächliche Parteiunterstützung einzuschätzen und letztlich besser informierte Wahlentscheidungen zu treffen.

References
Aitchison, John. 1982. The Statistical Analysis of Compositional Data. Journal of the Royal Statistical Society Series B 44(2): 139–177. DOI: 10.1007/978-94-009-4109-0. https://doi.org/10.1007/978-94-009-4109-0
Arzheimer, Kai. 2006. ‘Dead men walking?’ Party identification in Germany, 1977–2002. https://doi.org/10.1016/j.electstud.2006.01.004
Electoral Studies 25(4): 791–807. DOI: 10.1016/j.electstud.2006.01.004. https://doi.org/10.1016/j.electstud.2006.01.004
Bräuninger, Thomas, und Marc Debus. 2012. Parteienwettbewerb in den deutschen Bundesländern. Wiesbaden: VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-93226-2_2
Bräuninger, Thomas, und Marc Debus. 2008. Der Einfluss von Koalitionsaussagen, programmatischen Standpunkten und der Bundespolitik auf die Regierungsbildung in den deutschen Ländern. Politische Vierteljahresschrift 49(2): 309–38. DOI: 10.1007/ s11615-008-0101-6. https://doi.org/10.1007/s11615-008-0101-6
Brooks, Stephen P., und Andrew Gelman. 1998. General Methods for Monitoring Convergence of Iterative Simulations. Journal of Computational and Graphical Statistics 7(4): 434–455. DOI: 10.2307/1390675. https://doi.org/10.2307/1390675
Campbell, Angus, Philip E. Converse, Warren E. Miller, und Donald E. Stokes. 1960. The American Voter. New York, NY: Wiley.
Converse, Philip E. 1966. The Concept of Normal Vote. In Elections and the Political Order, Hrsg. Angus Campbell, Philip E. Converse, Warren E. Miller, und Donald E. Stokes, 9–39. New York, NY: Wiley.
Cox, Gary W. 1997. Making Votes Count: Strategic Coordination in the World’s Electoral Systems. New York, NY: Cambridge University Press. https://doi.org/10.1017/CBO9781139174954.005
Debus, Marc. 2011. Parteienwettbewerb, Regierungsbildung und Ergebnisse der Koalitionsverhandlungen nach der Bundestagswahl 2009. In Die Parteien nach der Bundestagswahl 2009, Hrsg. Oskar Niedermayer, 281–306. Wiesbaden: Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-93223-1_13
Falter, Jürgen W., und Hans Rattinger. 1983. Parteien, Kandidaten und politische Streitfragen bei der Bundestagswahl 1980: Möglichkeiten und Grenzen der Normal-Vote-Analyse. In Wahlen und politisches System. Analysen aus Anlass der Bundestagswahl 1980, Hrsg. Max Kaase, und Hans-Dieter Klingemann, 320–421. Opladen: Westdeutscher Verlag. https://doi.org/10.1007/978-3-322-86405-5_12
Gelman, Andrew, und Gary King. 1993. Why Are American Presidential Election Campaign Polls So Variable When Votes Are So Predictable? British Journal of Political Science 23(4): 409–451. DOI: 10.1017/S0007123400006682. https://doi.org/10.1017/S0007123400006682
Gelman, Andrew, und Donald B. Rubin. 1992. Inference From Iterative Simulation Using Multiple Sequences. Statistical Science 7: 457–511. https://doi.org/10.1214/ss/1177011136
Groß, Jochen. 2010. Die Prognose von Wahlergebnissen. Wiesbaden: VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-92313-0_2
Groves, Robert M., Floyed J. Fowler, Jr., Mick P. Couper, James M. Lepkowski, Eleanor Singer, und Roger Tourangeau. 2010. Survey Methodology, 2nd Edition. New York, NY: Wiley.
Gschwend, Thomas, und Helmut Norpoth. 2000. Soll und Haben: Die deutsche Wählerschaft rechnet mit den Parteien ab. In 50 Jahre Empirische Wahlforschung in Deutschland. Entwicklung, Befunde, Perspektiven, Daten, Hrsg. Markus Klein, Wolfgang Jagodzinski, Ekkehard Mochmann, und Dieter Ohr, 389–409. Wiesbaden: Westdeutscher Verlag. https://doi.org/10.1007/978-3-322-90180-4_16
Gschwend, Thomas, und Helmut Norpoth. 2001. Wenn am nächsten Sonntag... Ein Prognosemodell für Bundestagswahlen. In Wahlen und Wähler: Analysen aus Anlass der Bundestagswahl 1998, Hrsg. Hans-Dieter Klingemann, und Max Kaase, 473–499. Wiesbaden: Westdeutscher Verlag. https://doi.org/10.1007/978-3-322-95630-9_14
Gschwend, Thomas, und Helmut Norpoth. 2005. Prognosemodell auf dem Prüfstand: Die Bundestagswahl 2005. Politische Vierteljahresschrift 46(4): 682–688. DOI: 10.1007/ s11615-005-0308-8. https://doi.org/10.1007/s11615-005-0308-8
Gschwend, Thomas, und Helmut Norpoth. 2017. Machtwechsel in Sicht? Die Vorhersage des Kanzlermodells für die Bundestagswahl 2017. Politische Vierteljahresschrift 58(3): 392–406. https://doi.org/10.5771/0032-3470-2017-3-392
Hanretty, Chris, Ben Lauderdale, und Nick Vivyan. 2016. Combining national and constituency polling for forecasting. Electoral Studies 41: 23–43. DOI: 10.1016/j.electstud. 2015.11.019.
Hastie, Trevor, Robert Tibshirani, und Jerome Friedman. 2009. The Elements of Statistical Learning. New York, NY: Springer. https://doi.org/10.1007/978-0-387-84858-7_16
Jackman, Simon. 2005. Pooling the polls over an election campaign. Australian Journal of Political Science 40(4): 499–517. DOI: 10.1080/10361140500302472. https://doi.org/10.1080/10361140500302472
Jackman, Simon. 2009. Bayesian Analysis for the Social Sciences. Chichester: Wiley. https://doi.org/10.1002/9780470686621
Jennings, Will, und Christopher Wlezien. 2016. The Timeline of Elections: A Comparative Perspective. American Journal of Political Science 60(1): 219–233. DOI: 10.1111/ ajps.12189. https://doi.org/10.1111/ajps.12189
Jérôme, Bruno, Véronique Jérôme-Speziari, und Michael S. Lewis-Beck. 2013. A Political-Economy Forecast for the 2013 German Elections: Who to Rule with Angela Merkel? Political Science & Politics 46(3): 479–80. DOI: 10.1017/S1049096513000814. https://doi.org/10.1017/S1049096513000814
Kayser, Mark Andreas, und Arndt Leininger. 2016. A Predictive Test of Voters’ Economic Benchmarking: The 2013 German Bundestag Election. German Politics 25(1): 106– 130. DOI: 10.1080/09644008.2015.1129531. https://doi.org/10.1080/09644008.2015.1129531
Kennedy, Ryan, Stefan Wojcik, und David Lazer. 2017. Improving election prediction internationally. Science 355(6324): 515–520. DOI: 10.1126/science.aal2887. https://doi.org/10.1126/science.aal2887
Küntzler, Theresa. 2017. Using Data Combination of Fundamental Variable-Based Forecasts and Poll-Based Forecasts to Predict the 2013 German Election. German Politics. Im Erscheinen. DOI: 10.1080/09644008.2017.1280781. https://doi.org/10.1080/09644008.2017.1280781
Lauderdale, Benjamin E., und Drew Linzer. 2015. Under-performing, over-performing, or just performing? The limitations of fundamentals-based presidential election forecasting. International Journal of Forecasting 31(3): 965–979. DOI: 10.1016/j.ijforecast. 2015.03.002.
Leininger, Arndt, und Mark A. Kayser. 2017. Eine länderbasierte Prognose zur Bundestagswahl 2017. Politische Vierteljahresschrift 58(3): 407–417. https://doi.org/10.5771/0032-3470-2017-3-407
Lewis-Beck, Michael, Helmut Norpoth, William Jacoby, und Herbert Weisberg. 2008. The American Voter Revisited. Ann Arbor, MI: University of Michigan Press. https://doi.org/10.3998/mpub.92266
Linzer, Drew A. 2013. Dynamic Bayesian Forecasting of Presidential Elections in the States. Journal of the American Statistical Association 108(501): 124–134. DOI: 10.1080/01621459.2012.737735. https://doi.org/10.1080/01621459.2012.737735
Munzert, Simon 2017. Forecasting elections at the constituency level: A correction-combination procedure. International Journal of Forecasting 33(2): 467–481. DOI: 10.1016/ j.ijforecast.2016.12.001. https://doi.org/10.1016/j.ijforecast.2016.12.001
Norpoth, Helmut, und Thomas Gschwend. 2003. Against all Odds? The Red-Green Victory. German Politics and Society 21(1): 15–34. DOI: 10.3167/104503003782353619. Pickup, Mark, und Richard Johnston. 2007. Campaign trial heats as electoral information: Evidence from the 2004 and 2006 Canadian federal elections. Electoral Studies 26(2): https://doi.org/10.3167/104503003782353619
460–476. DOI: 10.1016/j.electstud.2007.03.001. https://doi.org/10.1016/j.electstud.2007.03.001
Plummer, Martyn. 2016. JAGS – Just Another Gibbs Sampler. http://mcmc-jags.source-forge.net/. Zugegriffen: 24.04.2017.
R Development Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. http://www.r-project.org. Zugegriffen: 24.04.2017.
Schnell, Rainer, und Marcel Noack. 2014. The Accuracy of Pre-Election Polling of German General Elections. Methods, Data, Analyses 8(1): 5–24. DOI: 10.12758/mda.2014.001. Schoen, Harald. 2014. Wechselwahl. In Handbuch Wahlforschung, Hrsg. Jürgen W. Falter,
und Harald Schoen, 489–522. Wiesbaden: Springer.
Selb, Peter, und Simon Munzert. 2016. Forecasting the 2013 German Bundestag Election Using Many Polls and Historical Election Results. German Politics 25(1): 73–83. DOI: 10.1080/09644008.2015.1121454. https://doi.org/10.1080/09644008.2015.1121454
Walther, Daniel. 2015. Picking the winner(s): Forecasting elections in multiparty systems. https://doi.org/10.1016/j.electstud.2015.06.003
Electoral Studies 40: 1–13. DOI: 10.1016/j.electstud.2015.06.003. https://doi.org/10.1016/j.electstud.2015.06.003
Zittel, Thomas, und Thomas Gschwend. 2007. Der Bundestagswahlkampf von 2005 und Kollektive Repräsentation: Ein kurzer Auftakt zum langen Abschied? In Die Bundestagswahl 2005. Analysen des Wahlkampfes und der Wahlergebnisse, Hrsg. Frank Brettschneider, Oskar Niedermayer, und Bernhard Weßels, 119–144. Wiesbaden: VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-90536-5_6

Abstract

Current Research Findings and Controversial Discussions from all areas and sub-areas of Political Science: Politische Vierteljahresschrift (PVS) has been published since 1960 by the executive and advisory board of the German Association for Political Science (DVPW). The journal provides space for recent research findings from all sub-areas of political science. It therefore contains papers on political theory and the history of ideas; on comparative governance and politics; the domains of policy analysis, international relations and foreign policy; on political sociology; and papers in the areas of empirical social research and methodology.

The PVS contains four categories of articles: The critical papers form the core category of the journal. In this section, are published theory-based and methodically reflected articles from all sub-areas of political science.

Within the forum section, contemporary scientific controversies are debated.

The commentaries contain scientifically well-grounded statements with reference to current issues of political developments or to the field of political science.

The review essays provide a broad overview of the international state of the art of political science, as well as current developments and relevant published literature regarding a particular research-field.

The PVS-Literatur publishes reviews of single publications from all sub-fields of the discipline of political sciences, as well as accumulative reviews presenting more than one new publication within an area of political sciences.

Every paper published in the PVS (within the categories critical papers and forum) is run through a double-blind expertise process prior to publication. Generally, two external referees examine the anonymous manuscripts. The referee reports are also made anonymous before being handed back to the authors. Additionally, the authors can be provided with references from the editorial board.

The editors rely on the collaboration of the colleagues in the scientific discipline as their referees and reviewers. Anyone interested in being a referee or reviewer is welcomed to complete and submit the PVS-reviewer-form or referee-form to the editor. Next to your name and address please indicate your field of investigative interest as well. This information will be added to the editorial database.

Website: www.pvs.nomos.de

Zusammenfassung

Aktuelle Forschungsergebnisse und kontroverse Diskussionen aus allen Teilbereichen der Politikwissenschaft: Die Zeitschrift bietet Raum für neueste Forschungsergebnisse aus allen Teildisziplinen der Politikwissenschaft. Sie beinhaltet somit Beiträge aus der Politischen Theorie und Ideengeschichte, aus dem Bereich Analyse und Vergleich politischer Systeme, aus der Policy-Analyse, aus dem Bereich der Internationalen Beziehungen und der Außenpolitik, aus der empirischen Sozialforschung und Methodenlehre sowie aus der Politischen Soziologie.

Die PVS umfasst vier Kategorien von Beiträgen: Die Abhandlungen stellen den Kern der Zeitschrift dar. In dieser Rubrik werden theoriegeleitete, methodisch reflektierte Forschungsbeiträge aus allen Bereichen der Politikwissenschaft veröffentlicht. Im Forum sollen wissenschaftliche Kontroversen angestoßen oder ausgetragen werden. Die Kommentare beinhalten wissenschaftlich fundierte Stellungnahmen zu Problemen der politischen Entwicklung oder des Faches „Politikwissenschaft“. Mit den Literaturberichten wird ein breiter Überblick über den internationalen Forschungsstand, über aktuelle Entwicklungen und die hierzu erschienene Literatur in einem bestimmten Forschungsfeld gegeben.

Homepage: www.pvs.nomos.de