Varianzanalyse

Aus Familienwortschatz
Zur Navigation springen Zur Suche springen
Die druckbare Version wird nicht mehr unterstützt und kann Darstellungsfehler aufweisen. Bitte aktualisiere deine Browser-Lesezeichen und verwende stattdessen die Standard-Druckfunktion des Browsers.

Die Varianzanalyse (kurz: Anova (von "analysis of varianz")) ist eine Methode der Statistik, bei der mehr als 2 Gruppen auf Unterschiedlichkeit getestet werden.

  • Problem: Beim multiplen Testen soll insgesamt eine Sicherheit von 95% erreicht werden (vgl. Dr.Sorglos als Bergsteiger)


Prinzip

Bonferoni

Bonferoni-Methode beruht darauf, bei jedem Einzeltest die Wahrscheinlichkeit so hoch zu wählen, dass man insgesamt wieder 95% erreicht

  • Beispiel:
ich teste dreimal mit 0,95 ----> 0,953 = 85,7%. Ich habe also insgesamt eine Wahrscheinlichkeit von (nur noch) 85,7%. Um nun eine Gesamtwahrscheinlichkeit von 95% zu erhalten, müsssen die Wahrscheinlichkeiten der einzelnen Tests entsprechend erhöht werden, dass insgesamt 95% herauskommen (bei drei Gruppen --> dritte Wurzel aus 95 = ungefähr 0,98 pro Test)
Achtung: je mehr sich der Alpha-Fehler verringert, desto mehr vergrößert man den Beta-Fehler. Um beide gleich groß zu halten benötigt man (riesen) große Stichproben

Anova

Anova ist eine Art von F-Test (F-Test: unterscheiden sich die Streuungen ?)


Prinzip von Anova: Wie streuen die Werte ?

  1. In jeder Gruppe (Population) streuen die Werte
  2. Zusätzlich gibt es eine gewisse Streuung zwischen den Gruppen
  • Anova untersucht: Wie verhält sich die Streuung zwischen den Gruppen zur Streuung innerhalb der Gruppen ? (wenn Streuung zwischen den Gruppen größer ist als die Streuung innerhalb der Gruppen, wir es sich um einen Unterschied handeln)


Anova ist ein 2 Stufentest

  1. Alternativ- und Nullhypothese (ist ein Unterschied da oder nicht (dann bin ich schon fertig))
  2. Wenn es einen Unterschied gibt: Wer unterscheidet sich denn (a von b? b von c? c von a und b?)

Datei:Varianzanalyse h0richtig1.jpg

In dieser Abbildung liegen die Gruppen dicht bei einander. Man würde in diesem Fall H0 beibehalten.


Varianzanalyse h0falsch0.jpg Datei:Varianzanalyse h0falsch1.jpg

In diesen Abbildungen gibt es mindestens in einer Gruppe einen Unterschied. In der linken Abbildung sind alle Gruppen unterschiedlich. In der rechten Abbildung unterscheidet sich die gelbe Gruppe deutlich von der blauen und grünen. In beiden Fällen wird H0 verworfen.


Beispiel

Als Beispiel nehmen wir folgende 3 Gruppen:

Messwerte

Gruppe 1 Gruppe 2 Gruppe 3
1 4 6
2 5 8
3 3 5
2 4 5
x = 2 x = 4 x = 6


Insgesamt haben wir die Werte 1, 2, 3, 2, 4, 5, 3, 4, 6, 8, 5, 5

Das arithmetische Mittel xGesamt ist in diesem Fall 4.


Streuung innerhalb der Gruppen

Summe der quadrierten Abweichungen für alle Gruppen bestimmen:

Messwert Abstand von x quadrierte Abstände

Gruppe 1
1 1 - 2 = -1 1
2 2 - 2 = 0 0
3 3 - 2 = 1 1
2 2 - 2 = 0 0
x = 2 Summe = 0 Summe = 2

Gruppe 2
4 4 - 4 = 0 0
5 5 - 4 = 1 1
3 3 - 4 = -1 1
4 4 - 4 = 0 0
x = 4 Summe = 0 Summe = 2

Gruppe 3
6 6 - 6 = 0 0
8 8 - 6 = 2 4
5 5 - 6 = -1 1
5 5 - 6 = -1 1
x = 6 Summe = 0 Summe = 6

Die Summen der quadrierten Abweichungen der drei Gruppen werden nun aufaddiert.

2 + 2 + 6 = 10

Die Summe der quadratischen Abweichungen innerhalb der Gruppen beträgt in unserem Beispiel also: 10


Streuung zwischen den Gruppen

Als nächstet wird ermittelt, wie weit die Mittelwerte der Gruppen vom Gesamtmittelwert abweichen.

Gruppe Abweichung von xGesamt quadrierte Abweichung Anzahl in Gruppe (n)
Gruppe 1 2 - 4 = -2 4 4
Gruppe 2 4 - 4 = 0 0 4
Gruppe 3 6 - 4 = 2 4 4

Jetzt wird für jede Gruppe die quadrierte Abweichung mit der Grupppenanzahl (n) multipliziert.

Gruppe 1 => 4 x 4 = 16
Gruppe 2 => 0 x 4 = 0
Gruppe 3=> 4 x 4 = 16


Die Summe der quadrierten Abweichungen zwischen den drei Gruppen lautet in unserem Fall

16 + 0 + 16 = 32

Signifikanztest

Summe der quadrierten Abweichungen Freiheitsgrade
( n-1 )
Bezugsmaß
(Varianz)
F p
zwischen 32 2 16 14,41 < 0,01
innerhalb 10 9 1,11
gesamt 42 11

Anmerkung: es wurden innerhalb der Gruppen 9 Freiheitsgrade gewählt, weil in jeder Gruppe n-1 abgezogen werden muss. Da hier jede Gruppe 4 Messwerte hat -> 3 + 3 + 3 = 9


Für p < 0,05 gilt: Signifikanz

Das bedeutet in unserem Fall: mindestens eine Gruppe ist unterschiedlich!

siehe auch