Bundesinstitut für Bevölkerungsforschung

Interview zu Artikel in „Intereconomics“ • 02.07.2020Fallstricke bei der Interpretation von COVID-19-Daten

Bei der Interpretation des Corona-Geschehens spielt neben der Qualität und Vollständigkeit des vorhandenen Datenmaterials auch die gewählte Analysemethodik eine wichtige Rolle. Ein Artikel untersucht Fehler, die bei der Arbeit mit den Daten gemacht werden können. Sowohl Politiker als auch Experten sind bei der Bekämpfung des Coronavirus vor allem auf verlässliche Daten angewiesen. Denn nicht zuletzt bestimmen die Zahlen in weiten Teilen die Strategie der Entscheidungsträger. Doch die Datensituation offenbart Fallstricke für die Interpretation, wie Dr. Andreas Backhaus in einem Beitrag für das Journal „Intereconomics“ zeigt.

Datendiagramm und Corona-Virus Quelle: monsitj via Getty Images

Die Probleme beginnen bereits bei der Wahl der Maßzahlen, mit denen die Sterblichkeit des SARS-CoV-2 gemessen wird. Dazu wird im Ländervergleich der Infektionszahlen die Interpretation der Daten durch unterschiedliche Erfassungs- und Klassifizierungssysteme von COVID-19-Fällen erschwert. Im Interview erläutert Dr. Andreas Backhaus zentrale Befunde seiner Analyse und zeigt auf, was beachtet werden muss.

Herr Dr. Backhaus, in welche Fallen kann man tappen, wenn man das Pandemiegeschehen korrekt interpretieren möchte?

Mit der Verbreitung von Daten im Zuge der Pandemie sind einige Fallen entstanden, die sich negativ auf die Interpretation der Daten und die daraus erfolgenden Maßnahmen auswirken können. Das fängt an bei der Verwendung verschiedener epidemiologischer Maßzahlen. So werden in der öffentlichen Debatte beispielsweise die Fallsterblichkeitsrate oder auf englisch Case Fatality Rate, abgekürzt CFR, die Infektionssterblichkeitsrate und die Sterblichkeitsziffer genannt. Diese drei Maßzahlen unterscheiden sich voneinander und liefern unterschiedliche Werte, was zur Verwirrung beiträgt.

Ein weiterer Punkt betrifft die Basis der Vergleichbarkeit von Daten zwischen den Ländern. So ergibt ein Vergleich der CFR zwischen Italien und Südkorea, dass in Italien dieser Wert zu jedem Zeitpunkt der Pandemie jenen von Südkorea überstieg. Daher könnte man annehmen, dass das Virus in Italien tödlichere Folgen hat als in Südkorea. Diese Interpretation übersieht aber, dass zuerst die Vergleichbarkeit der Fallsterblichkeitsraten in unterschiedlichen Ländern sichergestellt sein muss. Erst wenn die bestätigten Fälle, die in die Kalkulation einfließen, hinreichend ähnlich sind, zum Beispiel mit Blick auf ihr Alter, ist eine Vergleichbarkeit gegeben. Bei diesen beiden Ländern zeigt sich eine Nichtvergleichbarkeit aufgrund der unterschiedlichen Altersstruktur der bestätigten Fälle: So hat Italien mit einem stark erhöhten Anteil älterer Menschen unter den bestätigten Infektionen auch mehr Todesfälle zu beklagen als Südkorea mit einem vergleichsweise hohen Anteil junger Menschen unter den bestätigten Fällen.

Welche Rolle spielen Lücken bei den Daten?

Lückenhaft übertragene Daten erhöhen die Gefahr für Fehlinterpretationen des Pandemiegeschehens. Wie sehr Datenlücken zu Verzerrungen beitragen können, belegen die Updates und Revisionen des Datenmaterials. Daher sollte man immer im Hinterkopf behalten, dass neue Daten oftmals unvollständig und häufig noch Gegenstand substanzieller Überarbeitungen sind. Sie sind daher nicht zur sofortigen Nutzung als Grundlage für eine politische Evaluation geeignet.

Wie kann man die Fehlinterpretationen von Daten vermeiden?

Die gezeigten Beispiele machen deutlich, dass die verwendeten Ansätze und Maßnahmen verstanden, sauber definiert und angemessen kenntlich gemacht werden müssen. Werden die gleichen statistischen Maßzahlen zum Beispiel im Ländervergleich verwendet, muss sichergestellt sein, dass die zugrundeliegenden Daten auch hinreichend vergleichbar sind. Gibt es Zweifel über die Genauigkeit der Daten im spezifischen Corona-Kontext, sollten zusätzlich andere unabhängig gesammelte Daten als Unterstützung bei der Validierung herangezogen werden. Vorsicht sollte angesagt sein, wenn Datenveröffentlichungen bereits als final interpretiert werden. Es besteht immer eine große Wahrscheinlichkeit, dass sie häufig noch aktualisiert werden. Darüber hinaus sollte bei der Interpretation der Daten und Statistiken mit beachtet werden, inwieweit Selektionseffekte die Zusammenstellung des zugrundeliegenden Samples beeinflusst haben.

Schließlich sollte man sich beim Wirkungsvergleich der politischen Maßnahmen zur Pandemiebekämpfung immer die Frage stellen, warum eine bestimmte Maßnahme in einem spezifischen Kontext ergriffen worden ist. Ein harter Lockdown zum Beispiel wurde oft dort ergriffen, wo die Situation schon zu diesem Zeitpunkt katastrophal war, während Staaten mit anfänglich milderen Verläufen auch oft nur zu milderen Maßnahmen griffen. Hier würde man also im Ergebnis fälschlicherweise zwei Maßnahmen miteinander vergleichen, die auf völlig verschiedene Situationen angewendet worden sind.

Backhaus, Andreas (2020): Common Pitfalls in the Interpretation of COVID-Data and Statistics. In: Intereconomics 55, 162–166 (2020). https://doi.org/10.1007/s10272-020-0893-1

Hinweis zur Verwendung von Cookies

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen zum Datenschutz erhalten Sie über den folgenden Link: Datenschutz

OK