Korrelation ungleich Kausalität oder die Geschichte von Störchen und Babies

Aus gegebenem Anlass ein nettes Beispiel aus dem Bereich der Statistik. Statistiker messen liebend gerne sog. Korrelationen. Das heißt sie versuchen statistische Zusammenhänge zwischen zwei Gruppen festzustellen. Daraus soll empirisch der Wirklichkeit ein Stück weit auf die Spur gekommen werden, sozusagen empirisch gemessen werden „was die Welt in ihrem Innersten zusammenhält“.

Das ganze Problem an der Sache ist: Es gibt bei komplexeren Themen immer Einflussvariablen, die ich in meinem Hypothesentest nicht berücksichtigt habe. Die Wirklichkeit ist wesentlich komplexer als meine theoretische Testumgebung. Ein großes Problem besteht außerdem darin, dass die Statistik keine Kausalitäten messen kann, nur Korrelationen. Und aus Korrelationen kann ich nicht automatisch eine Kausalität ableiten. Ich entdecke somit vielleicht sogar einen signifikanten Zusammenhang, meine Schlussfolgerung für die Wirklichkeit kann aber trotzdem total daneben liegen.

Als klassisches Beispiel dient der Zusammenhang „Anzahl Störche und Anzahl Babies“.

Statistiker konnten in der Tat feststellen, dass eine Korrelation zwischen der Zahl neugeborener Babies und der Anzahl an Störchen besteht. Die BILD könnte nun lauthals verkünden: Wissenschaftler konnten empirisch beweisen: Störche bringen Babies zur Welt.

Allerdings war der Versuchsaufbau mit nur zwei Variablen vielleicht auch einfach nur ein wenig zu simpel.
Bei genauerem Hinschauen stellte man eine dritte Einflussgröße fest: Die geografische Lage.

Und hieraus ließ sich nun herleiten, die Anzahl der Störche UND die Zahl neugeborener Babies stieg gemeinsam in ländlichen Gebieten und war beides Mal niedriger in städtischen Gebieten. Der kausale Einflussfaktor war also nicht der Storch, sondern die Geografie.

Die Kausalität war nicht:

Storch => Babies

sondern:

Ländliches Gebiet => Storch UND Ländliches Gebiet => Babies

Mit diesem Wissen im Hintergrund, lest die BILD und alle anderen Zeitungen ab sofort ein wenig vorsichtiger. Statistische Werte kommen in unzähligen Artikeln vor und werden oft viel zu unreflektiert übernommen. Dabei sind die Schlussfolgerungen häufig gar nicht so eindeutig wie es manch ein statistisch ungebildeter Journalist gern hätte.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

Bloggen auf WordPress.com.

Nach oben ↑

%d Bloggern gefällt das: