Die Statistik ist die Zusammenfassung bestimmter Methoden, um Massenerscheinungen zu quantifizieren und interpretieren.

Unterteilung

Die Statistik wird in die folgenden drei Teilbereiche eingeteilt:

die deskriptive Statistik (auch beschreibende Statistik oder empirische Statistik)
mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen. Bei einigen Institutionen, z. B. bei der amtlichen Statistik, ist die Erstellung solcher Statistiken die Hauptaufgabe. Siehe dazu unter Statistischem Bundesamt
die mathematische Statistik (auch schließende Statistik, Inferenzstatistik oder induktive Statistik)
In der mathematischen Statistik leitet man aus den Daten einer Stichprobe Eigenschaften einer Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.
die explorative Statistik (hypothesen-generierende Statistik, Data Mining)
Methodisch eine Zwischenform der beiden vorgenannten Teilbereiche, bekommt als Anwendungsform jedoch zunehmend eine eigenständige Bedeutung. Mittels deskriptiver Verfahren und induktiver Test-Methoden werden mögliche Zusammenhänge (oder Unterschiede) zwischen Daten in vorhandenen Datenbeständen systematisch gesucht und zugleich in ihrer Stärke und Ergebnissicherheit zu bewerten versucht. Die so gefundenen Ergebnisse können als Hypothesen verstanden werden, die erst dann als statistisch abgesichert betrachtet werden können, nachdem sie von darauf aufbauenden, induktiven Testverfahren mit entsprechenden (prospektiven) Versuchsplanungen bestätigt wurden.

Wie können nicht-Statistiker statistische Methoden beurteilen

Anhand der folgenden Punkte können statistische Methoden einer Studie beurteilt werden:

  1. Werden die Daten zuerst nach Auffälligkeiten untersucht und dann gezielt daraufhin überprüft ? (Hypothesenüberprüfend oder Hypothesengeneriernd (siehe: multiples testen -> bei 100 Test erzielt man (bei Alpha=5%) per Zufall 5 signifikante Ergebnisse)
  2. Wird nach Unterschieden in den Ausgangsgruppen gesucht und wie wird mit eventuellen Unterschieden umgegangen ? (z.B. erste Gruppe besteht nur aus 20jährigen, Gruppe 2 nur aus 80jährigen)
  3. werden die Testvorraussetzungen überprüft (z.B. ob eine Normalverteilung vorliegt)
  4. wird nach Ausreißern gesucht und wie wird mit ihnen umgegangen? (graphische Darstellung, Vorraussetzung)
  5. Wie wird mit Studienabbrechern (drop out) umgegangen? (Intent to treat versus peer protocol)
  6. wird Korrelation mit Kausalität verwechselt ? (Anzahl der Störche hat Einfluss auf die Geburtenrate)
  7. werden Konfidenzgrenzen genannt ? (wie wahrscheinlich befindet sich der wahre Wert innerhalb der gewählten Grenzen)
  8. wird das Signifikanzniveau (alpha) genannt?
  9. wird ein "einseitiger" oder "zweiseitiger" Test durchgeführt? Wie wir ein einseitiger Test begründet? (zweiseitig: es wird die gegenteilige Ausprägung mitgetestet: z.B. bei einem Schlafmittel sollte neben der Schlafdauer auch "Wachheit" mitgetestet werden.)
  10. wie viele statistische Tests wurden durchgeführt ? (Unterschied hypothesen-testend hypothesen-generierend; wieviele Untergruppen werden analysiert? Achtung, gilt auch für Untersuchungen nach Zusammenhängen (Korrelationen))
  11. wie wird in einer Verlaufsstudie der Endzeitpunkt festeglegt?
  12. wird die Fallzahl begründet? Wenn nicht im Vorfeld durchgeführt, wird bei einem nicht signifikanten Ergebnis die Power angegeben?

Software

Für statistische Zwecke stehen diverse Softwares zur Verfügung:

  • SPSS (kostenpflichtig)
  • R (kostenfrei)


Siehe auch

Literatur

  • Bortz, Jürgen: "Statistik für Human- und Sozialwissenschaftler", Springer Verlag, (5. Auflage 2005) ISBN 3540650881
  • Lorenz, Rolf J.: "Grundbegriffe der Biometrie", Gustav Fischer Verlag, (4. Auflage 1996) ISBN 3827407672

Weblinks


Wikipedia-Logo.png vgl. Wikipedia: "Statistik"


en:statistic