Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 3)
15.03.2009
ZALEŻNOŚĆ CECH JAKOŚCIOWYCH
Wszelkie analizy zależności rozpoczynamy od tabelaryzacji danych.
Najprostsza tabela krzyżowa dla 2 cech jakościowych dychotomicznych (dzieli się tylko na 2 kategorii np. płeć k i m)
kat.
1
2
n 1,1
n 2,1
n 1,2
n 2,2
kobiety
mężczyźni
suma
Są
6
18
24
Nie ma
12
8
20
26
44
np.Uzdolnienia techniczne w zależności od płci:
N = 44 os
Dychotomizowanie kategorii - podział kategorii na pół np.
Zgadzam się ++
Raczej się zgadzam +
Raczej się nie zgadzam -
Nie zgadzam się --
- zaznaczamy odpowiedzi w tabeli każdej osoby z osobna
- jak wszystkie kostki są skarbowane zliczamy
( karbowanie, co 4)
Prawidłowa tabela:
- suma wierszy zgadza się z sumą kolumn i z N (ilością elementów próby)
- w zasadzie minimalna liczebność kostki to 5 os. lub 5 obiektów.
Na podstawie tabeli liczymy podstawową miarę zależności dla danych jakościowych:
Chi kwadrat
Wzór uproszczony na odpowiedni dla tabeli czteropolowej:
a
b
c
d
Zad.1
Ponieważ nie ma określonej wartości maksymalnej, nie nadaje się do interpretacji to musimy przeliczyć go na 1 dowolnie wybrany wskaźnik sił związku.
Wskaźnik Yule’a
Wskaźnik T Czuprowa
w - l. wierszy
k – l. kolumn
Wskaźnik V Cramera
(mniejsza z dwóch wartości do
wyboru w lub dwóch)
Współczynnik siły związku rp
Dla tabeli 4polowej zawsze = V = T
nie nadaje się do tabel bardziej rozbudowanych wtedy liczymy V lub T.
Wskaźniki te przybierają podobne wartości, lecz nie identyczne.
rp nadająca się dla tabel 4polowych lub bardziej rozbudowanych, ale tylko wtedy gdy 1 cecha jest dychotomiczna.
rp > V T Wskaźniki siły związku przyjmują wartości od 0 do 1, czyli pokazują siłę zależności czyli siłę związku cech.
V, T
rp
zależność
0
0,01-0,20
0,21-0,40
0,41-0,60
0,61-0,80
0,81-0,99
brak
nikła
słaba
przeciętna
dość silna
bardzo silna
pełna
(dane z zad.1)
= V = T = 0,35 – zależność słaba
rp = 0,47 – zależność umiarkowana zbliżona do przeciętnej.
[ Jeżeli niespełnione są warunki do liczenia ‘chi kwadrat’, liczymy N...
chomik-lukasz2