2011-01-15 21;49;58.PDF

(10046 KB) Pobierz
657565741 UNPDF
190
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
191
ceniu hipotezy zerowej H 0 ). Do obliczenia wartości p należy w tym
przypadku użyć jednoargumentowej funkcji @NORMSDIST(X) (ryć. 6.22).
Jako argument X trzeba podać bezwzględną wartość statystyki Uf (czyli
@ABS(B7)) i aby otrzymać wartość p, funkcję tę musimy odjąć od jedności.
Po zatwierdzeniu wprowadzonej funkcji zostaje obliczone prawdopo-
dobieństwo p równe 0,021.
cechy wynikowej na tych samych obiektach, ale za pomocą dwóch różnych
metod.
Chcąc ocenić wpływ zastosowanej operacji czy zabiegu, nie wykorzystu-
jemy testu dla dwóch średnich, lecz dla par obserwacji. W teście tym
zweryfikujemy zatem średnią różnicę dwóch serii pomiarowych, a nie
różnicę ich wartości średnich.
W związku z tym, dla każdego elementu pobranego do próby obliczamy
różnicę obydwu pomiarów, przy czym zaleca się obliczać różnicę „po"
minus „przed". Jeżeli wynik pomiaru „przed" oznaczymy x t , a pomiaru
„po"y ; ., to ich różnica z i —y i - x t będzie dodatnia, gdy zaobserwujemy wzrost
S V R:E9 / vS|^^tSSSQFlMSQiST(®ABŚpĄ)
•"• .: •-.! • ~ A '•>:''!
1 j
.•: 2 •:-!
:?lS^|g;BiS^S3H»SK;:;«S:f-C ,. ^Srf-Zf
Dobowe wydalanie potasu [nmol/d]
| Grupa kontrolna |
42,41
337,82
38
[
Grupa chorych
|
Ryć. 6.22. Wynik testu u dla
dwóch wartości średnich
z dużej próby
51^4
581,29
57
badanej cechy, a ujemna, jeśli odnotujemy jej spadek.
W teście dla par obserwacji hipoteza zerowa zakłada, że średnia
różnica wynosi zero (H 0 : ź —0), co odpowiada założeniu, iż wpływ zasto-
sowanej operacji nie ma żadnego znaczenia dla wartości badanej cechy
wynikowej. Postać hipotezy alternatywnej może wskazywać na istotną
zmianę (H,: z ^0), istotny wzrost (H,: z >0) lub istotny spadek (H, .-ź <0)
wartości analizowanej cechy. Pierwsza z tych postaci prowadzi do wniosko-
wania z dwustronnym, druga z prawostronnym, a trzecia z lewostronnym
obszarem krytycznym.
Na podstawie n różnic wyników pomiarów należy obliczyć średnią
różnicę ź oraz estymator odchylenia standardowego różnic Ś 2 , a następnie
wartość statystyki:
•-' 5 -i
n
: ' ; e •;]
Testu
ill_j
u
-2,021
0,025
'• 8 i
alfa/2
|
0,0216
-.» i
p
1
Odpowiedź: Ponieważ p<La, mamy więc podstawy do odrzu-
cenia hipotezy zerowej H 0 i przyjęcia hipotezy alternatywnej H,,
stwierdzającej, że badana populacja kobiet chorych na łuszczycę
zwykłą charakteryzuje się różnym (wyższym) średnim wydala-
niem potasu z moczeni niż grupa kobiet zdrowych.
6.1.5. Test dla par obserwacji
Często zdarza się, że przedmiotem rozważań są wyniki dwu prób
będących realizacjami pomiarów nie tyle w dwóch populacjach, co wyko-
nanych dwukrotnie na obiektach jednej populacji, ale w pewnym odstępie
czasu, w którym obiekty te poddane zostały wpływowi jakiegoś czynnika
zewnętrznego. Chodzi o to, że pierwszy pomiar nastąpił „przed" jakąś
operacją, a drugi „po" niej. Tak więc próba losowa składa się z n elemen-
tów, z których każdy był dwukrotnie obiektem pomiaru, a co za tym idzie
każdy z tych obiektów charakteryzuje para liczb. Niekoniecznie musi ona
stanowić wyniki pomiarów wykonanych „przed" i „po" jakiejś operacji czy
zabiegu. Może bowiem być uzyskana poprzez dwukrotny pomiar tej samej
t=r-/rl
(6.10)
która ma przy założeniu prawdziwości hipotezy H g rozkład t Studenta o n-1
stopniach swobody.
Nietrudno dostrzec, że test dla par obserwacji jest w zasadzie zgodny
z testem dla wartości średniej w populacji (przy malej próbie), przy czym
estymatory wartości średniej i odchylenia standardowego dotyczą różnic
wyników dwóch pomiarów, średnia hipotetyczna zaś została pominięta,
ponieważ jest zerem. W tej sytuacji sposób wnioskowania przebiega iden-
tycznie jak w przypadku testu t dla wartości średniej w populacji (pkt
6.1.1).
657565741.002.png
192
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
193
Przykład 6.13
Sprawdzić, czy zastosowanie „cudownej" kuracji odchudzającej Arzez
9 losowo wybranych ochotników przyczynia się do istotnego zmniejszenia
ich masy ciała. Przyjąć poziom istotności ct=0,05.
Odpowiedź: Ponieważ p <a, zatem wartość statystki t znalazła
się w obszarze krytycznym (lewostronnym), są więc podstawy do
odrzucenia hipotezy zerowej, zakładającej, że kuracja odchudza-
jąca nie wpływa na zmniejszenie masy ciała. Tak więc zastoso-
wanie jej wpłynęło w istotny sposób na obniżenie masy ciała 9 lo-
sowo wybranych ochotników.
Rozwiązanie
Dane źródłowe o masie ciała [kg] przed i po kuracji od 9 ochudzających
się osób wprowadzono do bloku komórek A2..B10. Dane te oraz przebieg
rozwiązania zilustrowano na rycinie 6.23. Hipotezę zerową zamieszczono
w komórce A12, natomiast alternatywną w komórce A13, przy czym
w hipotezach tych użyto w miejsce symbolu średniej różnicy jedynie litery
z, bowiem uzyskanie zapisu z jest w Excelu 97 niemożliwe. Różnice masy
ciała obliczono w komórkach C2:C10, przy czym tylko w komórce C2
zrealizowano odejmowanie, stosując w zapisie formuły adresy względne.
Przykład 6.14
Sprawdzić, czy zastosowanie krótkotrwałego leczenia 13 chorych z nad-
czynnościa tarczycy spowodowało podwyższenie czasu wyrzutu lewej
komory serca (LVET). Przyjąć poziom istotności alfa=0,05.
Rozwiązanie
Dane źródłowe czasu wyrzutu lewej komory serca (LVET) dla populacji
13 chorych z nadczynnością tarczycy przed leczeniem i po krótkotrwałym
leczeniu wprowadzono do bloku komórek B3..B15 (ryć. 6.24).
C3
"v] . •. ;:=[=(B3-A3)
' , B .•;J-\". ^cml^;i
Po kuracji
:
"" ' ' "
j
1 :
7 i
Xl
4 :
T":
'6 •
/ i
"p j
9 \
1U;
11 i
12 i
_13j
J4j
15j
16;
17<
3; .-| .-•;£,:
.A!': «;F.:Ky-;:: ;-:G_j •
•' A - '•••
Różnica
92
101
88
76
104
87
89
80
91
85
ssp
83
76
98
79
83
82
87
-7
*|=(B2-A2) J
j=(B10-A10) |
*^*
> |=ŚRED^4IA(C2:C10) |
Ryć. 6.24. Dane źródłowe,
obliczenie różnic, średniej
różnicy i odchylenia
standardowego
H„: z-0
Hi: z<0
Średnia
Odch. std.
,|=ODCH.STANOARDOWE(C2:C10) |
. -r|=lLE.UCZ8(C2:C10)|
>.|=C1 2*P1ERW1ASTEK(C1 4 'C13 |
n
t
a
4,015
0,05
0,00193'"'"'
i
P!
J»j=R02KŁAD.T(-C15:C14-1;1) |
Ryć. 6.23. Dane źródłowe oraz rozwiązanie testu dla par obserwacji
Kolejne różnice uzyskano za pomocą powielenia komórki C2 do ko-
mórek C3:C10. W ramkach informacyjnych uwidoczniono zarówno for-
muły, za pomocą których obliczono wspomniane różnice twardości, jak
i formuły niezbędne do zrealizowania zasadniczych obliczeń właściwych dla
testu t dla par obserwacji.
Hipoteza H 0 , zbudowana dla tego zadania, przyjmuje równą zero śred-
nią różnicę pomiędzy wartościami LVET po leczeniu do wartości przed
leczeniem (H 0 : 2=0), natomiast hipoteza alternatywna H, zakłada, że róż-
nica ta jest większa od zera (H 0 : z>0), co wyznacza jednostronny obszar
krytyczny.
657565741.003.png
194
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
W komórce D3 obliczamy różnicę pomiędzy wartością LVET po leczeniu
(C3) i wartością LVET przed leczeniem (B3) dla pierwszego pacjenta (ryć.
6.24). Formułę tę kopiujemy dla pozostałych pacjentów (czyli do komórek
od B4 do B15).
W komórkach B16, B17 i B18 obliczamy: średnią wartość LVET przed
leczeniem, nieobciążony estymator odchylenia standardowego oraz liczeb-
ność populacji wpisując odpowiednio: do komórki B16 - @AVG(B3..B15)),
do B17 - @STDS(B3..B15)), a do B18 - @COUNT(B3..B15). Następnie
zawartość tego bloku komórek kopiujemy dla danych LVET, uzyskanych po
leczeniu (do bloku C16..C18), oraz dla obliczonych różnic (do bloku
D16..D18). W ten sposób otrzymaliśmy dane wejściowe do przeprowadze-
nia testu t dla par obserwacji.
Do komórki D20 wprowadzamy formułę obliczającą statystykę t (ryć.
6.25), do komórki D21 założoną wartość alfa, natomiast do komórki D22
trzyargumentową funkcję @TDIST(X,DegFreedom,Tails), obliczająca
wartość prawdopodobieństwa p w postaci @TDIST(D20;C18-1;1), gdyż
argument X to wartość statystyki t (czyli D20), mająca argument
DegFreedom, czyli liczbę stopni swobody n-1 (czyli C18-1), natomiast Tails
przybiera wartość l (mamy obszar jednostronny).
6.1.6. Test jednorodności wielu wariancji - test Bartletta
Test ten jest uogólnieniem testu F dla dwóch wariancji w przypadku,
w którym z punktu widzenia rozproszenia badanej cechy wynikowej
rozważaniom poddaje się k populacji (k>_3). Zakłada się przy tym, że cecha
wynikowa ma w tych populacjach rozkłady normalne N(m t er i) (i=l, 2, . . . ,
k). Z badanych populacji pobiera się próby losowe o liczebnościach n,., co
prowadzi, po wykonaniu pomiarów cechy wynikowej, do uzyskania war-
tości x.j (i=l, 2, . . , k,j=l, 2, . . , n,.). Wykorzystując te wyniki, weryfikuje
się hipotezę zerową o jednakowych wariancjach (jednakowym rozproszeniu
badanej cechy) we wszystkich populacjach, czyli Hj rjp of= 03=. . . =a k .
Hipotezę alternatywną H, formułuje się następująco: nie wszystkie
wariancje są jednakowe.
Test Bartletta, zwany tak od nazwiska jego autora, wymaga obliczenia
kolejno nieobciążonych estymatorów wariancji we wszystkich populacjach:
(6.11)
a następnie łącznego oszacowania wariancji:
(6.12)
1
T:D20
-',,'v^(Dt6-©SÓRT(D1B)}/D17
:
: r - "'
oraz „poprawki" c:
i
13
[
284 1
295 1
11]
7,31
7,26
13
Ryć. 6.25. Wynik testu t dla
par obseracji
c=l
IB !
17 i
18 .3
35Si
30 j
_ 2|; J
średnia
265,54
272.65
0^14.— J
gdzie n jest liczebnością całkowitą:
(6.13)
odch. stand.
11,31
11,72
n
13
13
Test i dla par obserwacje
t[
alfa
P
3.62S|
0,05
0,0017
;=i
Następnie oblicza się wartość statystyki x 2 zgodnie ze wzorem:
X 2 = i((n-k)lns 2 -| (n,-l)lnS 2 )
n=Zn,-
(6.14)
Po zatwierdzeniu wprowadzonej funkcji zostaje obliczone prawdo-
podobieństwo p równe 0,0017.
Odpowiedź: Ponieważ p<.0t, stwierdzono więc podstawy do
odrzucenia hipotezy zerowej i przyjęcia hipotezy alternatywnej,
mówiącej o podwyższeniu średniej wartości czasu wyrzutu lewej
komory serca (LVET) u chorych z nadczynnością tarczycy po
krótkotrwałym leczeniu w stosunku do stanu przed leczeniem.
(6-15 )
która ma przy założeniu prawdziwości hipotezy H 0 rozkład asymptotyczny
X 2 o k-1 stopniach swobody. Obszar krytyczny w tym teście buduje się
wyłącznie jako prawostronny, w związku z tym ustalenie wartości p prze-
biega identycznie jak w teście dla wariancji populacji generalnej (pkt 6.1.2),
wykorzystującym również rozkład x 2 -
657565741.004.png
196
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
Test Bartletta przede wszystkim poprzedza test jednorodności wielu
średnich, w którym zakłada się jednorodność wariancji w badanych
populacjach. Jedynie wynik testu Bartletta, wskazujący na brak podątaw
do odrzucenia hipotezy zerowej pozwala, na zastosowanie testu jednorod-
Estymujemy zatem wariancję
mierząca zmienność między populacjami:
gdzie:
(6.16)
ności wielu średnich.
Biorąc pod uwagę przytoczone tu spostrzeżenie, zrezygnujemy z
rozwiązania zadania przykładowego przechodząc do omówienia testu
analizy wariancji dla wielu średnich.
(6-17)
są estymatorami wartości średnich w poszczególnych populacjach,
6.1.7. Test jednorodności wielu średnich (klasyfikacja pojedyncza)
(6.18)
Rozważamy k populacji charakteryzujących się rozkładem normalnym
badanej cechy N(m ; , o,-) (i=l, 2, . . . , k), przy czym zakładamy równość
wszystkich wariancji, czyli a\=a\ =o 3 =. . . = <j^. Ten warunek stosowal-
ności testu możemy zweryfikować omówionym w punkcie 6.1.6 testem
jednorodności wielu wariancji.
Z populacji tych losujemy niezależnie próby o liczebnościach n t
elementów, na których przeprowadzamy pomiary cechy wynikowej,
otrzymując wartości x tj (i = l, 2, . ., k,j=l, 2, . . , n t ), przy czym K^m^e ..,
gdzie E- jest wartością tzw. składnika losowego - zmiennej losowej o roz-
kładzie normalnym N(0,c). Na podstawie wyników pomiarów x { . wery-
fikujemy hipotezę zerową H„: m,=m 2 =7n 3 = . . .=m k w stosunku do hipo-
tezy alternatywnej H,, która brzmi: nie wszystkie średnie są równe.
Jeżeli warunek o równości wszystkich wariancji jest spełniony, a hi-
poteza zerowa prawdziwa, mamy w zasadzie do czynienia z jedną populacja
o tej samej wartości średniej i wariancji. Oznacza to, że analiza od-
dzielnych populacji ze względu na tę samą cechę jest nieuzasadniona. Jeśli
natomiast hipoteza zerowa okazuje się fałszywa, to wprawdzie rozrzut
wyników pomiarów w każdej populacji jest taki sam, ale obserwuje się
(istotną) zmienność między tymi populacjami.
Istota testu polega na rozdzieleniu sumy kwadratów wariancji ogólnej
na dwa składniki, będące miara zmienności między badanymi populacjami
oraz wewnątrz nich.
- i9 >
Nietrudno zauważyć, że łączne oszacowanie wariancji w teście
Bartletta (6.12) jest jednocześnie estymatorem wariancji składnika losowe-
go (6.19). Wykonując zatem jako pierwszy test jednorodności wielu wa-
riancji, ograniczamy się w teście jednorodności wielu średnich do oblicze-
nia jedynie estymatora wariancji, będącego miarą zmienności między popu-
lacjami (6.16).
W dalszej kolejności obliczamy wartość statystyki F:
F= -
(6.20)
która przy założeniu prawdziwości hipotezy zerowej ma rozkład F Sne-
decora o liczbach stopni swobody k-1 i n-k. Wykorzystując tablice tego
rozkładu, wyznacza się wartość p i porównuje z przyjętą z góry wartością
poziomu istotności a. Jeżeli zajdzie relacja p>CL, wówczas stwierdzamy
brak podstaw do odrzucenia hipotezy zerowej, natomiast w przypadku, gdy
p < a, hipotezę zerową należy odrzucić i przyjąć hipotezę alternatywną
o niejednorodnych wartościach średnich.
jest estymatorem średniej ogólnej, przy czym n jest liczebnością całkowitą
(6.14) oraz wariancję w obrębie tych populacji (zmienność tzw. składnika
losowego):
657565741.005.png
198
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych
Warto podkreślić, że w teście jednorodności wielu średnich zawsze
dzieli się estymator sj przez estymator ś^, bez względu na to, czy wartość
statystyki F przekroczy l czy też nie. Jeżeli zatem zdarzy się, że l|< śjj,
(F<1), to nie ma potrzeby ustalania wartości p. Można od razu pÓMjąć
decyzję o braku podstaw do odrzucenia hipotezy H 0 .
Przebieg obliczeń w teście Bartletta przedstawiono
na rycinie 6.26b.
W Wariancja ^WARIANCJĄ^Ą;3)
Przykład 6.15
Dokonano pomiarów stężenia frakcji HDL-cholesterolu [mg%] dla
trzech grup pacjentów. Wykorzystując wyniki pomiarów, przedstawione na
rycinie 6.26, sprawdzić, czy badane grupy pacjentów (A, B i C) różnią się z
punktu widzenia stężenia badanej frakcji cholesterolu. Przyjąć poziom
istotności a=0,05.
_ . v ..-.~. u ,^ro.UIŁ)y(U21-
_
c
1,oar^*-plł(SUMA(A19:C19)-1/(D2l-D22)y(3'(D22-1))
X 2
1.488^-* .
_27
Rozwiązanie
Na podstawie wyników pomiarów stężenia frakcji HDL-cholestero- lu
(ryć. 6.26a) podejmiemy próbę zweryfikowania hipotezy zerowej o jedna-
kowych średnich wartościach stężenia HDL-cholesterolu we wszystkich
trzech grupach pacjentów. Tak więc hipoteza zerowa ma postać H„:
m,=m.,=m 3 , natomiast hipoteza alternatywna H t zakłada, że badane grupy
pacjentów różnią się pod względem średniego stężenia HDL-cholesterolu.
Jako pierwszy wykonamy test
[jednorodności wielu (trzech) wa-
riancji, w którym postawimy hipotezę
Ryć. 6.26b. Przebieg obliczeń w teście Bartletta
- C12 " ^,j~, -^- a j 55
::•:••-.• A- •••.•-.--:', ' B .. • ;
Stężnie HDL-choleslerolu
Grupa A
[mq%l
Grupa C
W komórce A16 obliczyliśmy wartość nieobciążonego estymatora
wariancji, w komórce A17 liczebność próby, w komórce A18 liczebność
pomniejszona o l, a odwrotność tej różnicy w komórce A19. Wreszcie w ko-
mórce A20 obliczyliśmy logarytm naturalny z estymatora wariancji.
Wszystkie wykonane tu obliczenia dotyczą Grupy A (pierwsza populacja).
Postać odpowiednich formui widoczna jest w ramkach tekstowych, umie-
szczonych po prawej stronie ryciny. Podano jedynie postać formuł znaj-
dujących się w kolumnie A, bowiem dla dwóch pozostałych grup pacjentów
obliczenie wymienionych wyżej wielkości uzyskaliśmy poprzez powielenie
komórek A16:A20 odpowiednio do komórek B16.-B20 i C16:C20. Przy-
pomnijmy, że zabieg powielenia polegał tu na zaznaczeniu bloku komórek
A16:A20, a następnie kliknięciu przycisku ;%: (Kopiuj), po czym po zazna-
czeniu komórek B16:C16 wystarczyło nacisnąć klawisz [Enter].
Uzyskane w opisany sposób wartości są niezbędne do obliczenia
estymatora wariancji składnika losowego, poprawki c i ostatecznie wartości
statystyki % 2 , przy czym brakującą liczebność całkowitą n oraz liczbę
populacji k wyznaczyliśmy odpowiednio w komórkach D21 i D22.
Grupa B
0 .j = (^(warunek stosowal-
52 ności testu jednorodności wielu śred-
5 53 nich) wobec hipotezy alternatywnej
^ H,, zakładającej, że wariancje te nie
55 są jednakowe. Dopiero wtedy, gdy
^ stwierdzimy brak podstaw do odrzu-
55! cenią H 0 (w teście Bartletta), będzie-
my mogli zweryfikować hipotezę
° jednorodności trzech średnich.
H
56
53
54
52
54
53
53
55
55
53
54
55
4
5
8
9
10
11
1?
13
61
54
58
51
60
51
58
52
57
51
58
50
60
51
59
50
51 C
53
Ryć. 6.26a. Wyniki pomiarów stężenia
frakcji HDL-cholesterolu
a *r MT -i •
n
657565741.001.png
Zgłoś jeśli naruszono regulamin