Statystyka 24.05.2009.doc

(135 KB) Pobierz
Kiniuś™

Kiniuś

Statystyka

Dr Elżbieta Grabowska

(notatki z wykładu 6)

24.05.2009

 

 

MIARY KONCNTRACJI

 

Miary koncentracji w podstawowym znaczeniu dotyczą stopnia skupienia wartości cechy

wokół średniej.

 

Wskaźnik:

                               m4 – 4 moment centralny

                                          S4 – odchylenie standardowe do 4 potęgi

 

 

4 moment centralny dla danych indywidualnych:

 

( i  )  

( p )  

( k )  

 

 

Im wyższa jest wartość K tym większa koncentracja wokół średniej, czyli krzywa jest

bardziej wysmukła.

 

Przyjmuje się, że jeżeli  K=3 to zbiorowość ma rozkład normalny.

 

Dla ułatwienia interpretacji stosuje się, więc współczynnik koncentracji:

 

K’ = 0  - rozkład jest normalny

K’ > 0  - rozkład bardziej wysmukły

K’ < 0  - rozkład bardziej spłaszczony

 

Wskaźniki :

Absolutne

Względne

 

 

 

 

 

 

 

 

Kiniuś

 

BADANIE ZALEŻNOŚCI CECH ILOŚCIOWYCH

 

 

Współczynnik korelacji liniowej r - Persona

 

Sy – odchylenie standardowe cechy y

 

( i )

( p )

( k )

 

Dla danych indywidualnych wygodniej jest korzystać ze wzoru:

 

 

r przyjmuje wartości ściśle od

r informuje o kierunku i sile zależności cech.

 



r = +1

zależność dodatnia

obie cechy zmieniają się w tą samą stronę,

jeśli jedna maleje to druga rośnie.

 

 

 



r = -1

zależność ujemna

jak jedna cecha rośnie to druga spada

np. Im szybciej jedzie tym krótszy czas przejazdu.

 



             

Kiniuś

r=0 

 

 

 

 

 

r nadaje się tylko do mierzenia zależności liniowych i w  przybliżeniu liniowych.

 



r = +0,8

              r = -0,4

 

                           

 

 

 

Nie można stosować r do zależności typowo krzywoliniowych.

r zależy od liczebności próby.

 

INTERPRETACJA SIŁY ZALEŻNOŚCI

r

siła zależności

0

0,01 – 0,2

0,21 – 0,4

0,41 – 0,6

0,61 – 0,8

0,81 – 0,99

1

brak

bardzo słaba

słaba

umiarkowana

dość silna

bardzo silna

pełna

np.

              = -0,89  -  zależność bardzo silna ujemna

 

              !!! Przy porównywaniu siły zależności nie liczymy (-)

              czyli np. :

              - 0,89 > 0,19

 

 

 

Aby można było policzyć  r musza być spełnione 3 warunki:

1.   Obie cechy powinny być ilościowe (wyrażone na skali stosunkowej lub przedziałowej) ciągłe lub w przybliżeniu ciągłe.

2.   Zależność musi być uzasadniona logicznie

3.   Obie cechy musza być zależne linowo, bądź w przybliżeniu liniowo z całkowitym wykluczeniem zależności ewidentnie krzywoliniowej, dlatego każdorazowo przed przystąpieniem do liczenia r robi się najpierw  wykres korelacyjny, z którego ustala się czy zależność w ogóle istnieje.

              Kiniuś

zad.

W 5 os. grupie zaliczających sprawdzian ustalono dla każdej osoby czas wykonania w minutach: 30, 18, 25, 12, 5 oraz liczbę popełnionych błędów: 1, 2, 6, 7, 9. Ustal siłę i kierunek zależności tych cech.

 

1)  W praktyczny sposób (dla małych danych), aby ustalić czy cecha jest wystarczająco ciągła do liczenia r wyznaczamy rozstęp.

rozstęp

 

N-2

30 5

 

  9 – 1

> lub =    jeżeli jest większe lub równe jest wystarczająco ciągłe

5-2

 

5-2

 

2)  Warunek drugi, sprawdzamy czy zależność ma sens….

3)  Sprawdzamy



 

 

Na podstawie wykresu stwierdzamy, że:

- zależność istnieje

- jest ujemna

- jest w przybliżeniu liniowa

 

 

 

 

 

 

Liczenie r:

 

Lp.

1

2

3

4

5

30

18

25

12

5

1

2

6

7

9

12

0

7

-6

-13

144

0

49

36

169

-4

-3

1

2

4

16

9

1

4

16

-48

0

7

-12

-52

N=5

90

25

0

...
Zgłoś jeśli naruszono regulamin