Grafik mit den Teilen des Programmcodes: Automatisierte Wahlberichte – was wir gelernt haben.
Fünf Dinge, die wir gelernt haben: Hintergrundinformationen als Alleinstellungsmerkmal, Barrierefreiheit und größtmögliche Zugänglichkeit, Transparenz, Veröffentlichung und Dokumentation, das Verhältnis von Automatisierung und Journalismus. Bildrechte: MITTELDEUTSCHER RUNDFUNK

Landtagswahl in Sachsen-Anhalt 2021 Automatisierte Wahlberichte: Warum wir den Code veröffentlichen

16. Juli 2021, 08:28 Uhr

Zur Landtagswahl in Sachsen-Anhalt im Juni 2021 hat MDR SACHSEN-ANHALT erstmals auf automatisierte Berichterstattung gesetzt. Warum? Um einen detaillierten Überblick zur Landtagswahl im Juni 2021 zu geben. Was wir dabei gelernt haben – für unsere eigene Arbeit und für andere, die ähnliches vorhaben: Hintergrundinformationen als Alleinstellungsmerkmal, Barrierefreiheit und größtmögliche Zugänglichkeit, Transparenz und Dokumentation sowie das Verhältnis von Automatisierung und Journalismus.

Es ist schon lang gute datenjournalistische Praxis, Wahlergebnisse übersichtlich in Grafiken, Karten und in Analyseberichten darzustellen. Es ist üblich, darzulegen, wer in welchem Wahlkreis antritt und welche Politikerin oder welcher Politiker letztlich gewonnen hat. Aber wer kennt schon wirklich jede Direktkandidatin, jeden Direktkandidaten und weiß, welche politischen Hintergründe in den jeweiligen Wahlkreisen eine Rolle spielen? Wie wird in einer konkreten Gemeinde im Vergleich zum Landesergebnis gewählt und welche Partei hat bei vorangegangenen Wahlen üblicherweise gewonnen?

Um diese Fragen zu beantworten, hat MDR SACHSEN-ANHALT zur Landtagswahl 2021 auf automatisierte Berichterstattung gesetzt. Neben einer ausführlichen Wahlberichterstattung mit Analysen, Reportagen und Interviews sind insgesamt 259 Berichte teils automatisiert über den Wahlabend hinweg entstanden. Dadurch konnten wir die Abstimmung und Auszählung in den Gemeinden und Wahlkreisen bis hin zum offiziellen Endergebnis begleiten.

Was das konkret heißt und wie wir dabei vorgegangen sind, haben wir hier in diesem Text aufgeschrieben.

Was wir daraus gelernt haben, was für andere Medien wichtig werden könnte und wo wir den Code veröffentlichen, dokumentieren wir im Folgenden.

#1 Vorteil für regionale und lokale Medien: Hintergrundinformation aus den Regionen

Kein Journalist, keine Journalistin kann an einem Wahlabend detailliert die Auszählungen und Zwischenstände von Gemeinden und Wahlkreisen im Blick behalten, darüber in 259 Artikeln berichten und die Artikel bei neuen Auszählungsständen immer aktuell halten. Mit automatisierten Berichten ist das aber möglich – vor allem, wenn die Artikel mit redaktionell erarbeiteten Textpassagen und Hintergrundinformationen über Politikerinnen und Politiker oder zu den Wahlkreisen ergänzt werden. So bleibt Zeit für andere wichtige Aufgaben: Gespräche mit den Zuschauerinnen und Zuschauern und Leserinnen und Lesern zu führen, sich auf Reportagen zu konzentrieren und Analysen des Wahltages anzufertigen.

Die Erfahrung zeigt: Die Detailberichte werden angenommen und immer wieder abgerufen – ein Angebot, das wir unseren Leserinnen und Lesern gemacht haben und das ohne Hilfe durch Automatisierung so nicht möglich gewesen wäre.

Auch aus redaktioneller Sicht sind die Erkenntnisse und Recherchen zu Wahlkreisen, Gemeinden und Politikerinnen und Politikern sowohl am Wahlabend als auch im Nachhinein sehr gut nutzbar. Kolleginnen und Kollegen können auf die Informationen – beispielsweise wie der Wahlkreis traditionell wählt oder welche Hintergründe einzelne Politikerinnen und Politiker haben – schon während der Wahlnacht zugreifen und in ihre eigene Berichterstattung einbauen. Und in der Nachberichterstattung steht der Redaktion eine große Zahl an Texten zur Verfügung, die immer wieder verlinkt werden kann.

Zu den automatisierten Artikeln

Grafik zur Landtagswahl 2021, Gemeindeergebnisse
Mindestens 83 Abgeordnete ziehen nach der Wahl am 6. Juni 2021 in den achten Landtag in Sachsen-Anhalt ein. Bildrechte: MDR

Die automatisierte Bereitstellung von statistischen Daten, zum Beispiel Wahldaten zur Bundestagswahl nicht nur als Grafik, sondern auch in Textform, wird immer mehr zum Standard werden. Vor allem große Medienhäuser, in denen durch ihre eingeübte datenjournalistische Arbeit Programmiererinnen und Programmierer und Journalisten eng zusammenarbeiten, werden auf diese Methode zurückgreifen.

Wo bleibt dann aber das Handlungsfeld für regionale und lokale Medienhäuser? Nach unserer Erfahrung vor allem in der Kombination von redaktionell erarbeiteten Hintergründen zu Wahlkreisen, Gemeinden, Politikerinnen und Politikern einerseits und der automatischen Darstellung der Wahlergebnisse andererseits. Hier liegt die Stärke und das Wissen der regionalen Medienhäuser mit ihren Lokalredaktionen und Regionalstudios.

#2 Barrierefreiheit

Wie oben schon erwähnt, sind Automatisierungen schon lange Bestandteil in der datenjournalistischen Berichterstattung der Medienhäuser. Deutlich wird das an den vielfältigen interaktiven Grafiken zu Wahlen. Was für die Darstellung auf Smartphones, an Computerbildschirmen und im TV wunderbar ist, kann zum Beispiel für blinde Menschen ein Problem werden, die sich die Informationen beispielsweise über Screenreader erschließen.

Statische Grafiken sind oft nicht gut genug mit Alternativtexten versehen. Und in der interaktiven Form, oft im Hintergrund über Javascript realisiert, ist es schwierig, die Informationen überhaupt zugänglich zu machen.

Aus diesem Grund ist es wichtig, dass man das, was man in Form von Daten und Visualisierungen erzählen kann, auch in Textform anbietet.

#3 Transparenz

Der wichtigste Punkt bei automatisierten journalistischen Produkten ist: transparent zu machen, wie man vorgegangen ist und dass der jeweilige Bericht in Teilen automatisiert erzeugt wurde. Warum?

Zum einen können andere Arten von Fehlern auftreten, als wenn Journalistinnen und Journalisten den Text schreiben. Beispielsweise könnten Ergebnisdaten vertauscht sein, Sätze nicht in der richtigen grammatikalischen Form stehen, Abweichungen zu den Daten in den eingebetteten Grafiken auftreten oder automatisch gezogene Schlüsse und Bewertungen nicht korrekt sein.

Aus diesem Grund haben wir uns entschieden, den Hinweis zur Automatisierung ganz an den Anfang des Textes zu stellen und dort auch gleich die Möglichkeit gegeben, dass uns Leserinnen und Leser per Mail kontaktieren können.

Wo Sie Fehler melden können

Wir haben die Datensätze und Textstrukturen vorab ausführlich mit Beispieldaten getestet. Trotzdem kann es auf Grund der Komplexität möglich sein, dass sich Fehler einschleichen. Wenn Sie einen Fehler entdeckt haben, dann freuen wir uns, wenn Sie uns einen Hinweis per Mail an data@mdr.de senden.

Zum anderen ist es wichtig, für jeden nachvollziehbar und offen die Vorgehensweise zu erklären – auch damit andere Redaktionen, Medienhäuser und interessierte Journalistinnen und Journalisten daraus lernen und wir selbst unsere Algorithmen und Programmierung verbessern können.

#4 Veröffentlichung und Dokumentation

Screenshot des Skriptes für die automatisierte Wahlberichterstattung
Codezeilen in einem Skript für die automatisierte Wahlberichterstattung in Sachsen-Anhalt Bildrechte: MDR/ida

Deswegen veröffentlichen und dokumentieren wir unsere Vorgehensweise und den Code in einer abstrahierten Form auf einer dafür geeigneten Plattform – in unserem Fall ist das github. Das heißt, wir veröffentlichen zwar nicht den kompletten Code des Wahlprojektes – die jeweiligen Anpassungen an Serverstrukturen und Content-Management-Systeme sind beispielsweise zu individuell –, geben aber einen ausreichend tiefen Einblick in den Maschinenraum der Automatisierung, damit wir und andere daraus lernen können.

Wie und warum andere ARD-Rundfunkhäuser ihre Projekte als Open Source dokumentieren, haben zum Beispiel die Kolleginnen und Kollegen des BR hier beschrieben.

Dabei ist zu beachten, dass der Code, um automatisierte Texte zu erstellen, nur ein Teil der Arbeit ist. Weitere Punkte sind wichtig, um eine reibungslose automatisierte Wahlberichterstattung zu garantieren.

Korrekte und zuverlässige Daten bilden die Grundlage für jede Wahlberichterstattung. Um die von der Wahlleitung veröffentlichten Daten zu nutzen, müssen diese Daten außerem in ein geeignetes Format gebracht werden.

Wenn sich bei der Datenquelle Felder und Zuordnungen ändern, kann im schlimmsten Fall die Programmierung der automatisierten Berichterstattung zwar korrekt sein, das Ergebnis im Artikel jedoch vollkommen unverständlich werden.

Für die Veröffentlichung ist unbedingt der Import des generierten Textes in das jeweilige Content-Management-System zu beachten. Hier können die Anpassungen viel Zeit in Anspruch nehmen.

Außerdem ist Text nur ein Teil der Berichterstattung. Grafiken, Videos und Bilder machen Artikel ansprechender und die Informationen für viele Leser und Leserinnen zugänglicher. Auch hier lohnt es sich, viel Zeit zu investieren, um die geeignete Form zu finden.

#5 Automatisierung ersetzt nicht Journalismus

Die vorangegangenen Punkte zeigen, dass eine journalistische Automatisierung von Prozessen Journalistinnen und Journalisten und ihre Aufgaben nicht ersetzen. Sie hilft eher dort, wo man bisher nicht berichten konnte, weil Arbeitszeit und –kraft begrenzt sind, und unterstützt bei sich ständig wiederholenden, redundanten Aufgaben.

Die Anforderung an Journalistinnen und Journalisten ändern sich aber, denn neben der gründlichen Recherche muss bei automatisierten Berichten auch in Möglichkeiten gedacht werden. Das heißt, die Einschätzung und Beurteilung von Ereignissen muss vorausgedacht und werden und dann in die Programmierung einfließen. Hier liegt die große Herausforderung und gleichzeitig auch eine der Hauptfehlerquellen.

Um diese Fehler zu vermeiden, ist es wichtig, dass sich Journalistinnen und Journalisten zumindest in Grundzügen mit den Grundlagen von Programmierungen auseinandersetzen.

Und das Wichtigste: Testen, testen, testen!

Alle Komponenten im Prozess müssen überprüft werden. Das gilt nicht nur für die inhaltliche Korrektheit der Texte, sondern auch für mögliche Änderungen der Daten, für die Einbindung von Grafiken und den Import in das Content-Management-System.

Für eine tiefer gehende Beschäftigung mit den Bedingungen und Herausforderungen von Automatisierung im Journalismus ist beispielsweise der Kurs "News Algorithms: The Impact of Automation and AI on Journalism" des Knight Centers for Journalism in the Americas mit Nicholas Diakopoulos, Professor für Communication Studies and Computer Science, ein guter Einstieg. Die Seminarunterlagen sind hier veröffentlicht worden.

Mit diesen Erfahrungen und der Dokumentation unserer Arbeit ist die Hoffnung verbunden, dass andere Journalistinnen und Journalisten daraus lernen können und eigene Ansatzpunkte für ihre Arbeit finden – und gegebenenfalls einen ersten Einblick in die Voraussetzungen für automatisierten Journalismus finden.

Hintergründe und Aktuelles zur Landtagswahl – unser multimediales Update

In unserem Update zur Landtagswahl in Sachsen-Anhalt geben unsere Redakteure einen Überblick über die wichtigsten politischen Entwicklungen und ordnen sie ein.

#LTWLSA – das multimediale Update zur Landtagswahl – immer freitags per Mail in Ihrem Postfach. Hier können Sie das Update abonnieren.

Martin Paul im Funkhaus von MDR SACHSEN-ANHALT
Bildrechte: MDR/Luca Deutschländer

Über Martin Paul Martin Paul ist Teil des Teams von MDR SACHSEN-ANHALT und begeistert von den Möglichkeiten und Ausdrucksformen des digitalen Journalismus – Daten und Code, Visualisierung und Video, Longread und Ticker, Social-Media und Dialog. Was ihn umtreibt? Besonders die Frage, wie man das Netz frei und offen gestalten und Teilhabe garantieren kann.

Online-Journalismus hat er im Studiengang Multimedia & Autorschaft an der Universität in Halle und bei der Mitteldeutschen Zeitung gelernt. An der Universität in Leipzig hat er Kultur- und Vergleichende Literaturwissenschaft studiert.

Natalie Widmann – Data Science, Natural Language Processing and Machine Learning practitioner
Bildrechte: Natalie Widmann

Über Natalie Widmann Natalie ist Data Scientist bei ida, der Innovations- und Digitalagentur von MDR und ZDF und fasziniert von der Schnittstelle zwischen Gesellschaft und neuen Technologien.

Sie verarbeitet, analysiert und verknüpft Daten, so dass daraus wirkliche Erkenntnisse und manchmal auch maschinelle Lernanwendungen entstehen. Mit einem Fokus auf das sogenannte Natural Language Processing macht Natalie Texte semantisch durchsuchbar oder generiert diese automatisch.

MDR/Martin Paul, Natalie Widmann

Dieses Thema im Programm: MDR SACHSEN-ANHALT – Das Radio wie wir | 06. Juni 2021 | 18:00 Uhr

404 Not Found

Not Found

The requested URL /api/v1/talk/includes/html/0f4ae3cb-b7d9-4474-bb32-2b7867bcbbd5 was not found on this server.

Mehr zur Landtagswahl in Sachsen-Anhalt