Inhalt |
---|
Chi-Quadrat-Anpassungstest |
Tabelle der Verteilungsfunktion der standardisierten Normalverteilung |
Tabelle der Signifikanzschranken der Chi-Quadrat-Verteilung |
Eine rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe aus einer normalverteilten Grundgesamtheit stammt, ist der Chi-Quadrat-Test, entwickelt von K. pearson. Dieses statistische Prüfverfahren vergleicht die beobachtete empirische Verteilung der Stichprobe, gegeben durch die absoluten oder relativen Häufigkeiten oder auch durch die relativen Summenhäufigkeiten einer in Klassen eingeteilten Meßreihe, mit einer angenommenen theoretischen Verteilung der dazugehörigen Grundgesamtheit. Dazu stellt man über das unbekannte Wahrscheinlichkeitsgesetz F(x) der Grundgesamtheit eine Hypothese auf und prüft diese an Hand einer geeigneten Testgröße, die die Abweichung zwischen empirischer und theoretischer Verteilung zum Ausdruck bringt, auf Ablehnung oder Annahme. Da die statistische Hypothese die gesamte unbekannte Verteilungsfunktion F(x) und nicht nur einzelne ihrer Parameter betrifft, spricht man von einem nichtparametrischen (oder verteilungsfreien) Prüfverfahren und im vorliegenden Fall auch von einem Anpassungstest (STORM).
Wenn der Mittelwert und die Varianz der Grundgesamtheit nicht gegeben sind, müssen sie aus der Stichprobe geschätzt werden.
fi = Beobachtete Häufigkeit
xi = Klassenmitte
Die aufgestellten Hypothesen lauten:
H0: Die Stichprobe stammt aus einer normalverteilten
Population
HA: Die Stichprobe stammt nicht aus einer
normalverteilten Population
Mit Hilfe der Schätzwerte und
kann man die erwarteten Häufigkeiten nach dem in
der folgenden Tabelle angegebenen Schema berechnen.
(Mittelwert = 70,16; Standardabweichung = 3,1281; n = 75)
Klassen- |
Klassen- |
Beobachtete Häufigkeit |
|
|
Erwartete Häufigkeit |
|
<62,5 |
0 |
-2,45 |
0,00714 |
0,00740 |
0,5355 |
|
62,5...<63,5 |
63 |
1 |
-2,13 |
0,01659 |
0,00945 |
0,7088 |
63,5...<64,5 |
64 |
2 |
-1,81 |
0,03515 |
0,01856 |
1,3920 |
64,5...<65,5 |
65 |
4 |
-1,49 |
0,06811 |
0,03296 |
2,4720 |
65,5...<66,5 |
66 |
3 |
-1,17 |
0,12100 |
0,05289 |
3,9668 |
66,5...<67,5 |
67 |
6 |
-0,85 |
0,19766 |
0,07666 |
5,7495 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
oi = obere Klassengrenze der i-ten Klasse
zi = Standardisierung der normalverteilten oberen
Klassengrenze der i-ten Klasse
=
Wahrscheinlichkeit der standardisierten Normalverteilung (wird
aus Tabelle der Verteilungsfunktion der standardisierten
Normalverteilung entnommen)
Pi = Wahrscheinlichkeit für die i-te Klasse
= Erwartete Häufigkeit der i-ten Klasse
Pi ist die Wahrscheinlichkeit dafür, daß die
betrachtete Zufallsgröße x der Grundgesamtheit in die i-te
Klasse fällt, d.h. x zwischen der unteren und oberen
Klassengrenze der i-ten Klasse liegt unter der Voraussetzung, daß
die Hypothese H0 zutrifft, x also normalverteilt ist.
Damit die Testgröße näherungsweise eine Chi-Quadrat-Verteilung
besitzt, dürfen die erwarteten Häufigkeiten nicht zu klein sein. Als Faustregel soll die
Beziehung
für alle Klassen gelten, d.h., keine der
erwarteten Häufigkeiten darf kleiner als 5 sein. Ist für einige
Klassen die Forderung
verletzt, so müssen
benachbarte Klassen zusammengefaßt werden (STORM).
In unserem Beispiel müßten die ersten 5 Klassen zusammengefaßt
werden.
Klassen- |
Beobachtete Häufigkeit |
Erwartete Häufigkeit |
|
<66,5 |
10 |
9,0751 |
0,0943 |
66,5...<67,5 |
6 |
5,7495 |
0,0109 |
... |
... |
... |
... |
... |
... |
... |
... |
Nach der Wahl der Irrtumswahrscheinlichkeit (Beispiel
) entnimmt man der
Tabelle der Chi-Quadrat-Verteilung die Schranke
.
Die Freiheitsgrade (FG oder ) ergibt sich aus der
Anzahl Klassen k - 1 - r, wobei r die Anzahl der geschätzten
Parameter ist (Beispiel: Mittelwert und Varianz geschätzt, damit
r = 2).
Gilt für die berechnete Testgröße die Ungleichung
, so wird H0
abgelehnt, für
erfolgt keine Ablehnung, d.h., die
Abweichung zwischen erwarteter und beobachteter Häufigkeit ist
nicht signifikant, und es besteht kein Widerspruch zu der Annahme,
daß die Stichprobe aus der durch H0 festgelegten
Grundgesamtheit stammt.
Letzte Änderung: 20.09.1999
Kontakt: Wolfgang Stümer