Statistische Analyse von Krankheitsausbreitung

PI: Dr. Sebastian Meyer
Team: Sophie Reichert (M.Sc.)

Im Rahmen der Überwachung von (meldepflichtigen) Infektionskrankheiten wie z.B. verursacht durch Influenza-, Corona-, Rota- oder Noroviren, werden altersabhängige und räumliche Inzidenzen erfasst, in Deutschland durch das Robert Koch-Institut. Gesundheitsbehörden und Epidemiologen sehen sich mit Fragen zur Wirksamkeit von Impfstoffen konfrontiert, ob es besonders anfällige Untergruppen in der Bevölkerung gibt, ob einige Serotypen infektiöser sind als andere und wie schnell und weit sich die Krankheit ausbreitet. Die Modellierung von Epidemien auf Basis von Surveillance-Daten ist von zentraler Bedeutung für unser Verständnis der Ausbreitung von Infektionskrankheiten, z.B. in Bezug auf Umweltfaktoren oder saisonale Effekte und Reproduktionszahlen. Statistische Ansätze befassen sich mit der Unsicherheit sowohl der interessierenden Parameter als auch von Vorhersagen der Inzidenz. Mit dem Ziel eines regressionsähnlichen Analysewerkzeugs wurden sogenannte endemisch-epidemische Modelle entwickelt und im R-Paket „surveillance“ implementiert: ein multivariates Zeitreihenmodell für Zähldaten („HHH“) und ein räumlich-zeitliches Punktprozessmodell für Daten auf Individualebene („twinstim“). Beide Ansätze erwiesen sich bereits in mehreren epidemiologischen Analysen (vor allem auch seitens anderer Forschergruppen) als nützlich, inklusive zu COVID-19.

Diese Methoden wurden zuletzt außerhalb von „surveillance“ flexibilisiert, u.a. für mehrdimensionale Zeitreihen mit übermäßig vielen Nullen und zur Schätzung eines seriellen Intervalls. Im Rahmen eines DFG-Projekts aus dem Bereich „Research Software – Quality Assured and Re-usable“ werden die Implementierungen des Grundmodells und der methodischen Weiterentwicklungen derzeit gebündelt und an aktuelle Standards quelloffener Forschungssoftware angepasst, um eine breite Anwendung und Weiterentwicklung im Rahmen epidemiologischer Datenanalysen zu ermöglichen.