Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 6)
24.05.2009
MIARY KONCNTRACJI
Miary koncentracji w podstawowym znaczeniu dotyczą stopnia skupienia wartości cechy
wokół średniej.
Wskaźnik:
m4 – 4 moment centralny
S4 – odchylenie standardowe do 4 potęgi
4 moment centralny dla danych indywidualnych:
( i )
( p )
( k )
Im wyższa jest wartość K tym większa koncentracja wokół średniej, czyli krzywa jest
bardziej wysmukła.
Przyjmuje się, że jeżeli K=3 to zbiorowość ma rozkład normalny.
Dla ułatwienia interpretacji stosuje się, więc współczynnik koncentracji:
K’ = 0 - rozkład jest normalny
K’ > 0 - rozkład bardziej wysmukły
K’ < 0 - rozkład bardziej spłaszczony
Wskaźniki :
Absolutne
Względne
BADANIE ZALEŻNOŚCI CECH ILOŚCIOWYCH
Współczynnik korelacji liniowej r - Persona
Sy – odchylenie standardowe cechy y
Dla danych indywidualnych wygodniej jest korzystać ze wzoru:
r przyjmuje wartości ściśle od
r informuje o kierunku i sile zależności cech.
r = +1
zależność dodatnia
obie cechy zmieniają się w tą samą stronę,
jeśli jedna maleje to druga rośnie.
r = -1
zależność ujemna
jak jedna cecha rośnie to druga spada
np. Im szybciej jedzie tym krótszy czas przejazdu.
r=0
r nadaje się tylko do mierzenia zależności liniowych i w przybliżeniu liniowych.
r = +0,8 r = -0,4
Nie można stosować r do zależności typowo krzywoliniowych.
r zależy od liczebności próby.
INTERPRETACJA SIŁY ZALEŻNOŚCI
r
siła zależności
0
0,01 – 0,2
0,21 – 0,4
0,41 – 0,6
0,61 – 0,8
0,81 – 0,99
1
brak
bardzo słaba
słaba
umiarkowana
dość silna
bardzo silna
pełna
np.
= -0,89 - zależność bardzo silna ujemna
!!! Przy porównywaniu siły zależności nie liczymy (-)
czyli np. :
- 0,89 > 0,19
Aby można było policzyć r musza być spełnione 3 warunki:
1. Obie cechy powinny być ilościowe (wyrażone na skali stosunkowej lub przedziałowej) ciągłe lub w przybliżeniu ciągłe.
2. Zależność musi być uzasadniona logicznie
3. Obie cechy musza być zależne linowo, bądź w przybliżeniu liniowo z całkowitym wykluczeniem zależności ewidentnie krzywoliniowej, dlatego każdorazowo przed przystąpieniem do liczenia r robi się najpierw wykres korelacyjny, z którego ustala się czy zależność w ogóle istnieje.
zad.
W 5 os. grupie zaliczających sprawdzian ustalono dla każdej osoby czas wykonania w minutach: 30, 18, 25, 12, 5 oraz liczbę popełnionych błędów: 1, 2, 6, 7, 9. Ustal siłę i kierunek zależności tych cech.
1) W praktyczny sposób (dla małych danych), aby ustalić czy cecha jest wystarczająco ciągła do liczenia r wyznaczamy rozstęp.
rozstęp
N-2
30 – 5
9 – 1
> lub = jeżeli jest większe lub równe jest wystarczająco ciągłe
5-2
2) Warunek drugi, sprawdzamy czy zależność ma sens….
3) Sprawdzamy…
Na podstawie wykresu stwierdzamy, że:
- zależność istnieje
- jest ujemna
- jest w przybliżeniu liniowa
Liczenie r:
Lp.
2
3
4
5
30
18
25
12
6
7
9
-6
-13
144
49
36
169
-4
-3
16
-48
-12
-52
N=5
90
chomik-lukasz2