Wahlumfrage und Prognosemodelle

Eigentlich schon seit der Bundestagswahl aber nach dem „Listen-Fuck-up“* der AfD am vergangenen Freitag, bei dem etwa zwei Drittel der AfD-Landesliste vom Landeswahlausschuss wegen schwerwiegender Formfehler kassiert wurden, erfreuen sich Diskussionen über taktisches Wählen größerer Beliebtheit. Ich bin der Meinung, dass in einigen Wählen taktisches Wählen sinnvoll sein kann, aber viele Anleitungen etwas zu kurz greifen und teilweise auch von parteipolitischen Präferenzen geprägt sind, werde ich nicht die nächste Anleitung verfassen. Mir geht es mehr um die Frage, was Umfragen und Modelle (wie wahlkreisprognose.de) können und nicht können.

Da offensichtlich nicht alle Wahlberechtigen bei einer Umfrage befragt werden, werden statistische Methoden zu Hilfe genommen, um einer kleineren Stichprobe auf die Wahlabsicht aller Wahlberechtigten zu schließen. Das Verfahren ist mit einer gewissen Unsicherheit behaftet (ich habe gehört, dass die Unsicherheit in der Regel bei ±3 Prozentpunkten liegt), aber im Rahmen dieser Unsicherheit relativ genau. Wie der freie Journalist Tobias Wilke dargelegt hat, sind durch diese Unsicherheiten mit einer Wahrscheinlichkeit von 95% eine ganze Menge mehr Koalitionsoptionen möglich, als anhand der Mittelwerte, die in der Zeitung oder auf Social-Media-Sharepics landen, zunächst für möglich erscheint.

Bei der Auswahl der Stichprobe gibt es unter Umständen auch Probleme: Vor einigen Jahren habe ich Diskussionen mitbekommen, dass in vielen Wählen die Stichprobe anhand der Festnetztelefonanschlüsse gewählt wurde. Wer keinen Festanschluss hat, kann nie Teil der Stichprobe werden. Es gab in diesem Zusammenhang die These, dass gerade studentische Milieus in den Stichproben so keine Berücksichtigung finden. Nach der Wahl Trumps ging die Aussage herum, dass es gezielte Absprachen in Foren gab, im Falle einer Umfrage anzugeben, dass man plane für Hillary Clinton zu stimmen. Was aber ohne eventuelles Gemunkel ein Problem ist, ist dass Personen in Umfragen dazu tendieren sozial erwünschte Antworten zu geben und bspw. Nicht angeben, dass sie vorhaben eine faschistische Partei zu wählen. Den Umfrageinstituten ist das natürlich bewusst und sie versuchen das auszugleichen, was aber unter Umständen auch über das Ziel hinausschießen kann.

Halten wir fest, Wahlumfragen sind häufig innerhalb des Unsicherheitsintervalls relativ genau. Aber wenn die Unsicherheiten völlig außer acht gelassen werden, kann der Blick auf politische Möglichkeiten verstellt werden.

Wenn anhand von Umfragen dann bestimmte Wahlkreisergebnisse prognostiziert werden, geht es dann weg von Umfragen hin zu Modellen, konkret geht es natürlich um wahlkreisprognose.de. Den Ansatz Umfrageergebnisse auf Bundes- und Landesebene auf Wahlkreisebene herunterzubrechen und mit weiteren Daten, wie Zuzügen und Wegzügen zu kombinieren, halte ich persönlich für sehr spannend. Ähnliche Versuche gab es auch schon zuvor parteiintern, nur wurden da keine konkreten Zahlen öffentlich diskutiert. Die Umfragen für Bundes- und Landesebene haben natürlich die bereits erwähnten Unsicherheiten. Diese Unsicherheiten beeinflussen die Voraussage. Dadurch, dass sich Wahlkreiszuschnitte ändern, Landtags- und Bundestagswahlkreise nicht überschneiden, bestimmte Modellannahmen zu Wählerbindung und Mobilisierung fehlerbehaftet sind und so weiter, ist das Ergebnis von Wahlkreisprognose.de fehlerbehaftet. Dazu kommen besondere lokale Faktoren, die bspw. im Fall vom Leipziger Südwahlkreis, der mit hoher Wahrscheinlichkeit an Juliane Nagel von der Linken gehen wird und nicht knapp an die Grünen.** Das illustriert auch den Punkt, dass der Vergleich zwischen Direktkandierenden und Parteilisten den Faktor der Persönlichkeit völlig ausklammert. An sich wäre das trotzdem vergleichsweise unproblematisch, wenn der Fehler beziffert werden würde oder zumindest die konkreten Annahmen offengelegt werden würden. (Als theoretischer Physiker bin ich vertraglich verpflichtet an dieser Stelle den, George Box zugeschriebenen, Aphorismus zu zitieren: „All models are wrong, but some are useful.“ – „Alle Modelle sind falsch, aber einige sind nützlich.“) Mit solchen Informationen könnten Entscheidungen zur taktischen Wahl tatsächlich informierter getroffen werden. Leider veröffentlicht wahlkreisprognose.de nur ein White Paper, das kurz die verwendeten Daten skizziert und selektiv vergangene Erfolge auflistet. Diese Liste liest sich zwar äußerst beeindruckend, aber sagt tatsächlich nichts über die Zuverlässigkeit des Modells aus. Sind zukünftige Prognosen genau so gut? Keine Ahnung. Wie groß war der größte Unterschied zwischen Prognose und Wahlergebnis? Keine Ahnung. Und ohne eine Angabe der Unsicherheit und des Modellfehlers ist es auch nicht möglich die Qualität einzuschätzen. Als vorläufige Faustregel würde ich alle angezeigten Vorsprünge zwischen 0 und 12%, als offenes Rennen ansehen, da mein Bauchgefühl mir sagt, dass der Fehler wahrscheinlich so bei 10 Prozentpunkten liegen könnte, und viel wichtiger: Nur auf Basis von wahlkreisprognose.de bitte keine Entscheidung zum taktischen Wählen treffen!

(Und falls Journalist_innen diesen Text lesen: Ich fände ja Umfragen auf Wahlkreisniveau sehr spannend.)

*Diesen Ausdruck habe ich ohne jegliche Scham von Maren, die den Sachsennaht-Podcast mitherausbringt, geborgt.
**Ich bin sogar so sicher, dass ich ein Bier oder ein anderes Getränk nach Wahl verwetten würde. Wetteinsätze bitte an eine meiner privaten Mailadressen oder per Telefon.

PS: Ich hoffe, ich bekomme jetzt keine Ärger von @durchgezaehlt, weil ich hier Anfängerfehler beim Beschreiben gemacht habe.