Statistische Lernverfahren und medizinische Datenanalyse

PI: PD Dr. Werner Adler

Bei der statistischen Auswertung klinischer Studien in Zusammenarbeit mit dem Universitätsklinikum Erlangen treten neben den üblichen Fragestellungen, die mit herkömmlichen Testverfahren und multiparametrischen Modellen gelöst werden können, oft Untersuchungen mit sehr kleinen Stichprobengrößen und / oder komplexer Datenstruktur auf, bei denen sich neben komplexen statistischen Modellen auch nicht-parametrische Analyseverfahren anbieten, die keine statistischen Verteilungsannahmen treffen. Unter den letzteren spielt vor allem das Bootstrapverfahren eine wichtige Rolle, das neben der Schätzung von Konfidenzintervallen oder der Bestimmung der statistischen Signifikanz bei der Untersuchung des Gruppenunterschieds verschiedener statistischer Maße zum Beispiel auch zur Generierung von Ensembles von Klassifikations- und Regressionsbäumen verwendet werden kann, da eine flexible Anpassung an die vorliegende Datenstruktur möglich ist. Gemischte lineare Modelle erlauben durch geschickte Manipulation der Kovarianzmatrix die Bestimmung der Korrelation bei Daten mit entsprechender Datenstruktur, wie etwa dem Vorliegen von Wiederholungsmessungen. Eine weitere wichtige Rolle, um beispielsweise Datensätze effizient auswerten zu können, bei denen von Glaukompatienten teilweise beide Augen vorliegen, spielen GEE-Modelle, die die Datenstruktur nicht so sehr in der Modellierung der Größe von Parametern, sondern eher in der Bestimmung ihrer Unsicherheit berücksichtigen.