Medienspiegel

Fallstricke der Statistik

Veröffentlicht
Eingeweidelesen auf hohem Niveau
von Eduard Kaeser    4.6.2016
„Im Zeitalter von Big Data ist es leicht, statistisch signifikante Korrelationen zwischen Daten zu finden. Das Data-Mining birgt aber die Gefahr, die Kernaufgabe der Wissenschaft aus den Augen zu verlieren.“

„Im alten Rom gab es den Haruspex, den Eingeweideleser. Er weissagte aus den Innereien von Opfertieren künftiges Geschehen. Vor allem in der Leber sah er die Welt im Kleinen, den Mikrokosmos als Spiegel des Makrokosmos. Man könnte, in einer etwas gewagten Analogie, den Haruspex als antiken Datenanalysten sehen, der aus der «evidence» von Form, Farbe, Konsistenz, Anomalie, Textur der Leber zum Beispiel auf schlechtes Wetter schliesst; modern ausgedrückt: eine Korrelation zwischen Leberdaten und meteorologischem Ereignis herstellt.

Unsinnige Forschungsresultate

Das ähnelt, so meldet sich der Zyniker, doch erstaunlich dem, was Forscher im Zeitalter von Big Data tun, in Medizin, Psychologie, Soziologie, Ökonomie. Der Epidemiologe John Ioannidis ist kein Zyniker, hat aber 2005 eine Arbeit veröffentlicht mit dem Titel «Warum die meisten Forschungsresultate falsch sind». Er bezog sich auf das biomedizinische Feld, das Problem, das er anspricht, ist allerdings von allgemeiner Bedeutung. Im «Economist» wurde im Januar dieses Jahres eine Metastudie über ökonomische Artikel in drei Top-Journalen vorgestellt, die zum Resultat kam, dass bei 20 bis 30 Prozent der Artikel mit signifikanten Resultaten geschummelt worden sei. Und im Online-Forum «Edge» ärgerte sich etwa zur selben Zeit der Kognitionspsychologe Richard Nisbett über die sogenannte multiple Regression in der Statistik, eine Methode, die oft Resultate zwischen Unsinn und Schaden liefere. Also eigentlich wissenschaftliches Eingeweidelesen sei.“ (…)

http://www.nzz.ch/wissenschaft/physik/fallstricke-der-statistik-eingeweidelesen-auf-hohem-niveau-ld.86504