ru
Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 5)
29.03.2009 (niedziela)
WSKAŹNIKI ZRÓŻNICOWANIA (ROZPROSZENIA, DYSPERSJI)
DLA DANYCH ILOŚCIOWYCH
ROZSTĘP
Wstępną, orientacyjną, pozycyjną miarą zróżnicowania jest rozstęp, czyli odległość między wynikiem minimalnym a maksymalnym.
rozstęp = 150 – 195 cm
wartość rozstępu = 45 cm
Podstawową klasyczną miarą zróżnicowania danych ilościowych jest wariancja, czyli przeciętny kwadrat odchyleń od średniej.
WARIANCJA
Wariancję wyznacza się z następującego wzoru:
4
1) dla danych indywidualnych
2) dla danych punktowych
3) dla danych klasowych
uwaga!
Podane wzory to tzw. wariancja dla próby (wariancja estymatorem nieobciążonym)
Stosuje się również wariancję dla populacji z estymatorem
Dla populacji:
Wariancja – przyjmuje wartość minimalną = 0 gdy nie ma żadnego zróżnicowania, natomiast jej wartość maksymalna jest nieokreślona.
Wyniku wariancji nie interpretujemy, używamy go porównawczo (większa wariancja większe zróżnicowanie)
ODCHYLENIE STANDARDOWE
Bardzo wygodnym wskaźnikiem rozproszenia danych ilościowych jest odchylenie standardowe.
Jest to miara absolutna tzn. jej miano jest zgodne z mianem średniej.
S – informuje, jakie jest przeciętne odchylenie wyników w próbie od średniej.
wyniki zgodne z normą
(-1SD,+1SD)
obszar przeciętnej
zmienności
85-115 - norma dla populacji
1 prawo Czebyszewa
- W 1 SD mieści się 2/3 – ok. 68% populacji
2 prawo Czebyszewa
- W 2 SD mieści się ok. 95% populacji
3 prawo Czebyszewa
- W 3SD mieści się ok. 99,7 % populacji
! Prawie cała populacja mieści się w 3 odchyleniach standardowych.
(Odchylenie standardowe nie ma wartości 0)
WSPÓŁCZYNNIK ZMIENNOŚĆI
Dla oceny wielkości zróżnicowanie danych w próbie stosuje się pomocniczy współczynnik zmienności – v
Zasada interpretacji v:
v
zróżnicowanie
0
0,01-10%
11-33,3 %
33,4- 68 %
69-90 %
91-100 %
pow.100 %
brak
nikłe
słabe
umiarkowane
silne
bardzo silne
ekstremalnie silne
v informuje ile procent ze średniej stanowi wielkość odchylenia standardowego, czyli jak duże jest zróżnicowanie w stosunku do średniej.
1. Przykład dla danych indywidualnych
cecha mierzona: liczba zapisanych stron na wykładzie.
l.p
xi
xi -
(x-)2
1
2
3
5
6
-2,2
-0,2
+0,8
+1,8
4,84
0,04
0,64
3,24
N=5
21
8,80
przeciętnie zapisano 4,2 str.
- dąży do zera
Interpretacja:
Długość notatek poszczególnych osób odchyla się przeciętnie o 1,48 kartki w górę lub w dół od średniej.
Pozwala nam to wyznaczyć obszar przeciętnej zmienności.
xtyp – obszar wyników najbardziej zbliżonych do średniej.
- S < xtyp < + S
4,20 - 1,48 4,20 + 1,48
2,72 < xtyp < 5,68
v informuje, że zróżnicowanie długości notatek mierzona odchyleniem standardowym
stanowi 35,2% ze średniej , a więc badana grupa 5 osób jest umiarkowanie zróżnicowana ze
względu na długość notatek.
2.Przykład dla danych punktowych
cecha mierzona: liczba posiadanych płaszczy wiosennych.
10
12
7
14
N=30
29
20,967
Przeciętnie na 1 osobę przypada 0,97 płaszcza.
Przeciętne odchylenie od wynosi 0,85 płaszcza.
0,97 – 0,85 0,97 + 0,85
0,12 < xtyp < 1,82
...
chomik-lukasz2