Covid-19 Benfords Law: Deutsche Covid-Statistiken sind konsistent – schwedische nicht
Hauptinhalt
01. Juli 2024, 11:05 Uhr
Wissenschaftler haben die Corona-Daten aus 182 Ländern analysiert. Demnach liefern nur 27 Länder konsistente, also widerspruchsfreie Statistiken, darunter Deutschland, Israel und Großbritannien. Andere erfüllen die Anforderungen nur teilweise.
Finanzgeschäfte, Wahlen oder Epidemien haben eines gemeinsam: Sammelt man jeweils alle zu einem Thema gehörende Datensätze zusammen, dann sind die einzelnen Datenpunkte nie ganz zufällig verteilt. Etwa wie bei der Gaußschen Normalverteilung aus dem Mathematikunterricht gibt es bei sehr großen Datenmengen Verteilungsmuster. Eines davon ist das sogenannte Benfordsche Gesetz, das unter anderem aussagt, dass in sozial- oder wirtschaftswissenschaftlichen Datensätzen die Anfangsziffern 1 und 2 häufiger vorkommen als eine 9. Eine 1 ist demnach etwa 6,6 Mal so häufig, wie eine 9.
Corona-Daten aus Deutschland bestehen statistische Überprüfung
Daher lässt sich "Benfords Law", wie die Regel ursprünglich heißt, auch die offiziell herausgegebenen Corona-Daten von nationalen Gesundheitsbehörden anwenden. Je eher sie Benfords Law entsprechen, als desto zuverlässiger können sie angesehen werden. Je mehr sie abweichen, desto größer die Wahrscheinlichkeit, dass sie unvollständig oder manipuliert sind.
Noah Farhadi von der Privathochschule IU (Internationale Hochschule in Berlin) und Hooshang Lahooti von der Universität Sydney haben für ihre Studie Daten zu Infektions- und Sterbezahlen sowie zu Covid-Tests und Impfungen für 182 Länder gesammelt und mit Hilfe von Benfords Law sowie weiteren statistischen Prüfverfahren analysiert. Ergebnis: 27 Länder, darunter Deutschland, Australien, Spanien, Israel und das Vereinigte Königreich veröffentlichen Statistiken, die den erwarteten Verteilungen entsprechen. Bei 123 Ländern, darunter die USA, China und Frankreich, werden die Anforderungen an die Datenqualität nur teilweise erfüllt. 26 Länder, darunter Weißrussland, Bangladesch aber auch Schweden und die Niederlande, weisen laut der statistischen Analyse jedoch deutliche Abweichungen von der natürlichen Verteilung auf.
Kapazitätsengpässe erzeugen Abweichungen in der Statistik
Die Gründe dafür können unterschiedlich sein. Zum einen können extrem rasch wachsende oder schrumpfende Fallzahlen zu Abweichungen führen. Auch Kapazitätsengpässe, etwa bei den Corona-Tests, können die Statistik künstlich beeinflussen. Ein wichtiger Faktor dafür, dass man das Benfordsche Gesetz erfolgreich anwenden kann, ist, dass es keine künstlich geschaffenen Ober- und Untergrenzen gibt.
"Stehen einem Land beispielsweise eine maximale Zahl von PCR-Tests zur Verfügung, vielleicht 300 am Tag, und sind diese dann voll ausgelastet, dann wird die Zahl bestätigter Neuinfektionen bei einer Ausbruchswelle vielleicht viele Tage hintereinander bei 300 liegen. In der statistischen Analyse nach dem Benfordschen Gesetz fällt das dann als Anomalie auf", sagt Noah Farhadi. Zugleich zeige eine solche Untersuchung, dass die tatsächlichen Fallzahlen sehr viel höher ausfallen könnten.
Gute Daten sind keine reine Geldfrage
Auch manipulierte Daten fallen auf, das zeigt das Beispiel Iran. "Da konnten wir bereits im vergangenen Jahr feststellen, dass sie nicht konsistent sind", sagt Farhadi. Den offiziellen Statistiken zufolge hatte das Land die erste Covid-Welle 2020 mit nur wenigen Infektionen überstanden. Aber schon die statistische Analyse zeige, dass an den Daten etwas nicht stimmen konnte. Reporter der BBC deckten dann Anfang August auf: Das Land hatte seinen Corona-Fälle systematisch zu niedrig angegeben.
Für Europa zeigt die Studie, dass einige Länder nur bedingt den Anforderungen von Benfords Law genügen, etwa Schweden oder die Niederlande. Länder mit geringeren Ausgaben für Gesundheitssysteme können dagegen "zuverlässige beziehungsweise konsistente Daten über den Verlauf der Epidemie veröffentlichen", stellt Farhadi fest und nennt als Beispiel Afghanistan, das sich zwar im Bürgerkrieg befindet, aber offenbar ein gutes Berichtssystem im Gesundheitswesen hat. "Nach Angaben von Macrotrends wurden in Afghanistan im Jahre 2018 nur 50 US-Dollar pro Kopf an Gesundheitsausgaben getätigt. Im gleichen Zeitraum betrugen die Ausgaben in den Niederlanden 5.307 US-Dollar pro Kopf, also fast hundert Mal so viel", sagt Fahrhadi. Am Geld allein kann es also nicht liegen.
(ens)
Zur Studie
- Farhadi, Lahooti: Are COVID-19 Data Reliable? A Quantitative Analysis of Pandemic Data from 182 Countries, MDPI
Not Found
The requested URL /api/v1/talk/includes/html/7792214a-67a0-44ca-8457-9a1c0213f001 was not found on this server.