Zurück zum Glossar

Begriffserklärung: Scheinkorrelation

Was eine Scheinkorrelation ist: ein statistischer Zusammenhang ohne echte Ursache-Wirkung-Beziehung, oft erzeugt durch eine dritte, versteckte Größe.

Eine Scheinkorrelation (engl. spurious correlation) liegt vor, wenn zwei Variablen einen statistischen Zusammenhang aufweisen, obwohl keine echte Ursache-Wirkung-Beziehung besteht. Der beobachtete Zusammenhang entsteht zufällig oder weil beide Variablen von einer dritten, nicht berücksichtigten Größe beeinflusst werden.

Beispiel: Zusammenhang zwischen Autos und Piraten

Es ist Fakt, es gibt weltweit eine:

  • zunehmende Zahl an Autos
  • und eine sinkende Zahl an Piraten.

Historische Daten zeigen:

  • Die Zahl der Piraten ist in den letzten 150 Jahren stark gesunken.
  • Die Zahl der Autos ist im gleichen Zeitraum stark gestiegen.

Daraus ergibt sich statistisch also eine negative Korrelation:
Je mehr Autos es gibt, desto weniger Piraten existieren!

Warum ist das eine Scheinkorrelation?

Der Zusammenhang ist eine Scheinkorrelation, weil:

  • es keinen kausalen Zusammenhang zwischen Autos und Piraten gibt,
  • Autos nicht dazu geführt haben, dass Piraten verschwinden,
  • Piraten keinen Einfluss auf die Anzahl der Autos haben.

Beide Entwicklungen verlaufen lediglich zufällig gleichzeitig.

Merksatz

Eine Scheinkorrelation zeigt einen statistischen Zusammenhang, aber keine echte Ursache-Wirkung-Beziehung.

Oder

Korrelation bedeutet nicht zwangsläufig Kausalität

Korrelation impliziert keine Kausalität