2011-01-15 21;49;58.PDF

190

Weryfikacja hipotez statystycznych

191

ceniu hipotezy zerowej H 0 ). Do obliczenia wartości p należy w tym

przypadku użyć jednoargumentowej funkcji @NORMSDIST(X) (ryć. 6.22).

Jako argument X trzeba podać bezwzględną wartość statystyki Uf (czyli

@ABS(B7)) i aby otrzymać wartość p, funkcję tę musimy odjąć od jedności.

Po zatwierdzeniu wprowadzonej funkcji zostaje obliczone prawdopo-

dobieństwo p równe 0,021.

cechy wynikowej na tych samych obiektach, ale za pomocą dwóch różnych

metod.

Chcąc ocenić wpływ zastosowanej operacji czy zabiegu, nie wykorzystu-

jemy testu dla dwóch średnich, lecz dla par obserwacji. W teście tym

zweryfikujemy zatem średnią różnicę dwóch serii pomiarowych, a nie

różnicę ich wartości średnich.

W związku z tym, dla każdego elementu pobranego do próby obliczamy

różnicę obydwu pomiarów, przy czym zaleca się obliczać różnicę „po"

minus „przed". Jeżeli wynik pomiaru „przed" oznaczymy x t , a pomiaru

„po"y ; ., to ich różnica z i —y i - x t będzie dodatnia, gdy zaobserwujemy wzrost

S V R:E9 / vS|^^tSSSQFlMSQiST(®ABŚpĄ)

•"• .: •-.! • ~ A '•>:''!

1 j

.•: 2 •:-!

:?lS^|g;BiS^S3H»SK;:;«S:f-C ,. ^Srf-Zf

Dobowe wydalanie potasu [nmol/d]

| Grupa kontrolna |

42,41

337,82

[

Grupa chorych

Ryć. 6.22. Wynik testu u dla

dwóch wartości średnich

z dużej próby

51^4

581,29

badanej cechy, a ujemna, jeśli odnotujemy jej spadek.

W teście dla par obserwacji hipoteza zerowa zakłada, że średnia

różnica wynosi zero (H 0 : ź —0), co odpowiada założeniu, iż wpływ zasto-

sowanej operacji nie ma żadnego znaczenia dla wartości badanej cechy

wynikowej. Postać hipotezy alternatywnej może wskazywać na istotną

zmianę (H,: z ^0), istotny wzrost (H,: z >0) lub istotny spadek (H, .-ź <0)

wartości analizowanej cechy. Pierwsza z tych postaci prowadzi do wniosko-

wania z dwustronnym, druga z prawostronnym, a trzecia z lewostronnym

obszarem krytycznym.

Na podstawie n różnic wyników pomiarów należy obliczyć średnią

różnicę ź oraz estymator odchylenia standardowego różnic Ś 2 , a następnie

wartość statystyki:

•-' 5 -i

: ' ; e •;]

Testu

ill_j

-2,021

0,025

'• 8 i

alfa/2

0,0216

-.» i

Odpowiedź: Ponieważ p<La, mamy więc podstawy do odrzu-

cenia hipotezy zerowej H 0 i przyjęcia hipotezy alternatywnej H,,

stwierdzającej, że badana populacja kobiet chorych na łuszczycę

zwykłą charakteryzuje się różnym (wyższym) średnim wydala-

niem potasu z moczeni niż grupa kobiet zdrowych.

6.1.5. Test dla par obserwacji

Często zdarza się, że przedmiotem rozważań są wyniki dwu prób

będących realizacjami pomiarów nie tyle w dwóch populacjach, co wyko-

nanych dwukrotnie na obiektach jednej populacji, ale w pewnym odstępie

czasu, w którym obiekty te poddane zostały wpływowi jakiegoś czynnika

zewnętrznego. Chodzi o to, że pierwszy pomiar nastąpił „przed" jakąś

operacją, a drugi „po" niej. Tak więc próba losowa składa się z n elemen-

tów, z których każdy był dwukrotnie obiektem pomiaru, a co za tym idzie

każdy z tych obiektów charakteryzuje para liczb. Niekoniecznie musi ona

stanowić wyniki pomiarów wykonanych „przed" i „po" jakiejś operacji czy

zabiegu. Może bowiem być uzyskana poprzez dwukrotny pomiar tej samej

t=r-/rl

(6.10)

która ma przy założeniu prawdziwości hipotezy H g rozkład t Studenta o n-1

stopniach swobody.

Nietrudno dostrzec, że test dla par obserwacji jest w zasadzie zgodny

z testem dla wartości średniej w populacji (przy malej próbie), przy czym

estymatory wartości średniej i odchylenia standardowego dotyczą różnic

wyników dwóch pomiarów, średnia hipotetyczna zaś została pominięta,

ponieważ jest zerem. W tej sytuacji sposób wnioskowania przebiega iden-

tycznie jak w przypadku testu t dla wartości średniej w populacji (pkt

6.1.1).

192

Weryfikacja hipotez statystycznych

193

Przykład 6.13

Sprawdzić, czy zastosowanie „cudownej" kuracji odchudzającej Arzez

9 losowo wybranych ochotników przyczynia się do istotnego zmniejszenia

ich masy ciała. Przyjąć poziom istotności ct=0,05.

Odpowiedź: Ponieważ p <a, zatem wartość statystki t znalazła

się w obszarze krytycznym (lewostronnym), są więc podstawy do

odrzucenia hipotezy zerowej, zakładającej, że kuracja odchudza-

jąca nie wpływa na zmniejszenie masy ciała. Tak więc zastoso-

wanie jej wpłynęło w istotny sposób na obniżenie masy ciała 9 lo-

sowo wybranych ochotników.

Rozwiązanie

Dane źródłowe o masie ciała [kg] przed i po kuracji od 9 ochudzających

się osób wprowadzono do bloku komórek A2..B10. Dane te oraz przebieg

rozwiązania zilustrowano na rycinie 6.23. Hipotezę zerową zamieszczono

w komórce A12, natomiast alternatywną w komórce A13, przy czym

w hipotezach tych użyto w miejsce symbolu średniej różnicy jedynie litery

z, bowiem uzyskanie zapisu z jest w Excelu 97 niemożliwe. Różnice masy

ciała obliczono w komórkach C2:C10, przy czym tylko w komórce C2

zrealizowano odejmowanie, stosując w zapisie formuły adresy względne.

Przykład 6.14

Sprawdzić, czy zastosowanie krótkotrwałego leczenia 13 chorych z nad-

czynnościa tarczycy spowodowało podwyższenie czasu wyrzutu lewej

komory serca (LVET). Przyjąć poziom istotności alfa=0,05.

Rozwiązanie

Dane źródłowe czasu wyrzutu lewej komory serca (LVET) dla populacji

13 chorych z nadczynnością tarczycy przed leczeniem i po krótkotrwałym

leczeniu wprowadzono do bloku komórek B3..B15 (ryć. 6.24).

"v] . •. ;:=[=(B3-A3)

' , B .•;J-\". ^cml^;i

Po kuracji

"" ' ' "

1 :

7 i

4 :

T":

'6 •

/ i

"p j

9 \

1U;

11 i

12 i

_13j

J4j

15j

16;

17<

3; .-| .-•;£,:

.A!': «;F.:Ky-;:: ;-:G_j •

•' A - '•••

Różnica

101

104

ssp

-7

*|=(B2-A2) J

j=(B10-A10) |

*^*

> |=ŚRED^4IA(C2:C10) |

Ryć. 6.24. Dane źródłowe,

obliczenie różnic, średniej

różnicy i odchylenia

standardowego

H„: z-0

Hi: z<0

Średnia

Odch. std.

,|=ODCH.STANOARDOWE(C2:C10) |

. -r|=lLE.UCZ8(C2:C10)|

>.|=C1 2*P1ERW1ASTEK(C1 4 'C13 |

4,015

0,05

0,00193'"'"'

J»j=R02KŁAD.T(-C15:C14-1;1) |

Ryć. 6.23. Dane źródłowe oraz rozwiązanie testu dla par obserwacji

Kolejne różnice uzyskano za pomocą powielenia komórki C2 do ko-

mórek C3:C10. W ramkach informacyjnych uwidoczniono zarówno for-

muły, za pomocą których obliczono wspomniane różnice twardości, jak

i formuły niezbędne do zrealizowania zasadniczych obliczeń właściwych dla

testu t dla par obserwacji.

Hipoteza H 0 , zbudowana dla tego zadania, przyjmuje równą zero śred-

nią różnicę pomiędzy wartościami LVET po leczeniu do wartości przed

leczeniem (H 0 : 2=0), natomiast hipoteza alternatywna H, zakłada, że róż-

nica ta jest większa od zera (H 0 : z>0), co wyznacza jednostronny obszar

krytyczny.

194

Weryfikacja hipotez statystycznych

W komórce D3 obliczamy różnicę pomiędzy wartością LVET po leczeniu

(C3) i wartością LVET przed leczeniem (B3) dla pierwszego pacjenta (ryć.

6.24). Formułę tę kopiujemy dla pozostałych pacjentów (czyli do komórek

od B4 do B15).

W komórkach B16, B17 i B18 obliczamy: średnią wartość LVET przed

leczeniem, nieobciążony estymator odchylenia standardowego oraz liczeb-

ność populacji wpisując odpowiednio: do komórki B16 - @AVG(B3..B15)),

do B17 - @STDS(B3..B15)), a do B18 - @COUNT(B3..B15). Następnie

zawartość tego bloku komórek kopiujemy dla danych LVET, uzyskanych po

leczeniu (do bloku C16..C18), oraz dla obliczonych różnic (do bloku

D16..D18). W ten sposób otrzymaliśmy dane wejściowe do przeprowadze-

nia testu t dla par obserwacji.

Do komórki D20 wprowadzamy formułę obliczającą statystykę t (ryć.

6.25), do komórki D21 założoną wartość alfa, natomiast do komórki D22

trzyargumentową funkcję @TDIST(X,DegFreedom,Tails), obliczająca

wartość prawdopodobieństwa p w postaci @TDIST(D20;C18-1;1), gdyż

argument X to wartość statystyki t (czyli D20), mająca argument

DegFreedom, czyli liczbę stopni swobody n-1 (czyli C18-1), natomiast Tails

przybiera wartość l (mamy obszar jednostronny).

6.1.6. Test jednorodności wielu wariancji - test Bartletta

Test ten jest uogólnieniem testu F dla dwóch wariancji w przypadku,

w którym z punktu widzenia rozproszenia badanej cechy wynikowej

rozważaniom poddaje się k populacji (k>_3). Zakłada się przy tym, że cecha

wynikowa ma w tych populacjach rozkłady normalne N(m t er i) (i=l, 2, . . . ,

k). Z badanych populacji pobiera się próby losowe o liczebnościach n,., co

prowadzi, po wykonaniu pomiarów cechy wynikowej, do uzyskania war-

tości x.j (i=l, 2, . . , k,j=l, 2, . . , n,.). Wykorzystując te wyniki, weryfikuje

się hipotezę zerową o jednakowych wariancjach (jednakowym rozproszeniu

badanej cechy) we wszystkich populacjach, czyli Hj rjp of= 03=. . . =a k .

Hipotezę alternatywną H, formułuje się następująco: nie wszystkie

wariancje są jednakowe.

Test Bartletta, zwany tak od nazwiska jego autora, wymaga obliczenia

kolejno nieobciążonych estymatorów wariancji we wszystkich populacjach:

(6.11)

a następnie łącznego oszacowania wariancji:

(6.12)

T:D20

-',,'v^(Dt6-©SÓRT(D1B)}/D17

: r - "'

oraz „poprawki" c:

[

284 1

295 1

11]

7,31

7,26

Ryć. 6.25. Wynik testu t dla

par obseracji

c=l

IB !

17 i

18 .3

35Si

30 j

_ 2|; J

średnia

265,54

272.65

0^14.— J

gdzie n jest liczebnością całkowitą:

(6.13)

odch. stand.

11,31

11,72

Test i dla par obserwacje

alfa

3.62S|

0,05

0,0017

;=i

Następnie oblicza się wartość statystyki x 2 zgodnie ze wzorem:

X 2 = i((n-k)lns 2 -| (n,-l)lnS 2 )

n=Zn,-

(6.14)

Po zatwierdzeniu wprowadzonej funkcji zostaje obliczone prawdo-

podobieństwo p równe 0,0017.

Odpowiedź: Ponieważ p<.0t, stwierdzono więc podstawy do

odrzucenia hipotezy zerowej i przyjęcia hipotezy alternatywnej,

mówiącej o podwyższeniu średniej wartości czasu wyrzutu lewej

komory serca (LVET) u chorych z nadczynnością tarczycy po

krótkotrwałym leczeniu w stosunku do stanu przed leczeniem.

(6-15 )

która ma przy założeniu prawdziwości hipotezy H 0 rozkład asymptotyczny

X 2 o k-1 stopniach swobody. Obszar krytyczny w tym teście buduje się

wyłącznie jako prawostronny, w związku z tym ustalenie wartości p prze-

biega identycznie jak w teście dla wariancji populacji generalnej (pkt 6.1.2),

wykorzystującym również rozkład x 2 -

•

196

Weryfikacja hipotez statystycznych

Test Bartletta przede wszystkim poprzedza test jednorodności wielu

średnich, w którym zakłada się jednorodność wariancji w badanych

populacjach. Jedynie wynik testu Bartletta, wskazujący na brak podątaw

do odrzucenia hipotezy zerowej pozwala, na zastosowanie testu jednorod-

Estymujemy zatem wariancję

mierząca zmienność między populacjami:

gdzie:

(6.16)

ności wielu średnich.

Biorąc pod uwagę przytoczone tu spostrzeżenie, zrezygnujemy z

rozwiązania zadania przykładowego przechodząc do omówienia testu

analizy wariancji dla wielu średnich.

(6-17)

są estymatorami wartości średnich w poszczególnych populacjach,

6.1.7. Test jednorodności wielu średnich (klasyfikacja pojedyncza)

(6.18)

Rozważamy k populacji charakteryzujących się rozkładem normalnym

badanej cechy N(m ; , o,-) (i=l, 2, . . . , k), przy czym zakładamy równość

wszystkich wariancji, czyli a\=a\ =o 3 =. . . = <j^. Ten warunek stosowal-

ności testu możemy zweryfikować omówionym w punkcie 6.1.6 testem

jednorodności wielu wariancji.

Z populacji tych losujemy niezależnie próby o liczebnościach n t

elementów, na których przeprowadzamy pomiary cechy wynikowej,

otrzymując wartości x tj (i = l, 2, . ., k,j=l, 2, . . , n t ), przy czym K^m^e ..,

gdzie E- jest wartością tzw. składnika losowego - zmiennej losowej o roz-

kładzie normalnym N(0,c). Na podstawie wyników pomiarów x { . wery-

fikujemy hipotezę zerową H„: m,=m 2 =7n 3 = . . .=m k w stosunku do hipo-

tezy alternatywnej H,, która brzmi: nie wszystkie średnie są równe.

Jeżeli warunek o równości wszystkich wariancji jest spełniony, a hi-

poteza zerowa prawdziwa, mamy w zasadzie do czynienia z jedną populacja

o tej samej wartości średniej i wariancji. Oznacza to, że analiza od-

dzielnych populacji ze względu na tę samą cechę jest nieuzasadniona. Jeśli

natomiast hipoteza zerowa okazuje się fałszywa, to wprawdzie rozrzut

wyników pomiarów w każdej populacji jest taki sam, ale obserwuje się

(istotną) zmienność między tymi populacjami.

Istota testu polega na rozdzieleniu sumy kwadratów wariancji ogólnej

na dwa składniki, będące miara zmienności między badanymi populacjami

oraz wewnątrz nich.

- i9 >

Nietrudno zauważyć, że łączne oszacowanie wariancji w teście

Bartletta (6.12) jest jednocześnie estymatorem wariancji składnika losowe-

go (6.19). Wykonując zatem jako pierwszy test jednorodności wielu wa-

riancji, ograniczamy się w teście jednorodności wielu średnich do oblicze-

nia jedynie estymatora wariancji, będącego miarą zmienności między popu-

lacjami (6.16).

W dalszej kolejności obliczamy wartość statystyki F:

F= -

(6.20)

która przy założeniu prawdziwości hipotezy zerowej ma rozkład F Sne-

decora o liczbach stopni swobody k-1 i n-k. Wykorzystując tablice tego

rozkładu, wyznacza się wartość p i porównuje z przyjętą z góry wartością

poziomu istotności a. Jeżeli zajdzie relacja p>CL, wówczas stwierdzamy

brak podstaw do odrzucenia hipotezy zerowej, natomiast w przypadku, gdy

p < a, hipotezę zerową należy odrzucić i przyjąć hipotezę alternatywną

o niejednorodnych wartościach średnich.

jest estymatorem średniej ogólnej, przy czym n jest liczebnością całkowitą

(6.14) oraz wariancję w obrębie tych populacji (zmienność tzw. składnika

losowego):

198

Weryfikacja hipotez statystycznych

Warto podkreślić, że w teście jednorodności wielu średnich zawsze

dzieli się estymator sj przez estymator ś^, bez względu na to, czy wartość

statystyki F przekroczy l czy też nie. Jeżeli zatem zdarzy się, że l|< śjj,

(F<1), to nie ma potrzeby ustalania wartości p. Można od razu pÓMjąć

decyzję o braku podstaw do odrzucenia hipotezy H 0 .

Przebieg obliczeń w teście Bartletta przedstawiono

na rycinie 6.26b.

W Wariancja ^WARIANCJĄ^Ą;3)

Przykład 6.15

Dokonano pomiarów stężenia frakcji HDL-cholesterolu [mg%] dla

trzech grup pacjentów. Wykorzystując wyniki pomiarów, przedstawione na

rycinie 6.26, sprawdzić, czy badane grupy pacjentów (A, B i C) różnią się z

punktu widzenia stężenia badanej frakcji cholesterolu. Przyjąć poziom

istotności a=0,05.

_ . v ..-.~. u ,^ro.UIŁ)y(U21-

1,oar^*-plł(SUMA(A19:C19)-1/(D2l-D22)y(3'(D22-1))

X 2

1.488^-* .

_27

Rozwiązanie

Na podstawie wyników pomiarów stężenia frakcji HDL-cholestero- lu

(ryć. 6.26a) podejmiemy próbę zweryfikowania hipotezy zerowej o jedna-

kowych średnich wartościach stężenia HDL-cholesterolu we wszystkich

trzech grupach pacjentów. Tak więc hipoteza zerowa ma postać H„:

m,=m.,=m 3 , natomiast hipoteza alternatywna H t zakłada, że badane grupy

pacjentów różnią się pod względem średniego stężenia HDL-cholesterolu.

Jako pierwszy wykonamy test

[jednorodności wielu (trzech) wa-

riancji, w którym postawimy hipotezę

Ryć. 6.26b. Przebieg obliczeń w teście Bartletta

- C12 " ^,j~, -^- a j 55

::•:••-.• A- •••.•-.--:', ' B .. • ;

Stężnie HDL-choleslerolu

Grupa A

[mq%l

Grupa C

W komórce A16 obliczyliśmy wartość nieobciążonego estymatora

wariancji, w komórce A17 liczebność próby, w komórce A18 liczebność

pomniejszona o l, a odwrotność tej różnicy w komórce A19. Wreszcie w ko-

mórce A20 obliczyliśmy logarytm naturalny z estymatora wariancji.

Wszystkie wykonane tu obliczenia dotyczą Grupy A (pierwsza populacja).

Postać odpowiednich formui widoczna jest w ramkach tekstowych, umie-

szczonych po prawej stronie ryciny. Podano jedynie postać formuł znaj-

dujących się w kolumnie A, bowiem dla dwóch pozostałych grup pacjentów

obliczenie wymienionych wyżej wielkości uzyskaliśmy poprzez powielenie

komórek A16:A20 odpowiednio do komórek B16.-B20 i C16:C20. Przy-

pomnijmy, że zabieg powielenia polegał tu na zaznaczeniu bloku komórek

A16:A20, a następnie kliknięciu przycisku ;%: (Kopiuj), po czym po zazna-

czeniu komórek B16:C16 wystarczyło nacisnąć klawisz [Enter].

Uzyskane w opisany sposób wartości są niezbędne do obliczenia

estymatora wariancji składnika losowego, poprawki c i ostatecznie wartości

statystyki % 2 , przy czym brakującą liczebność całkowitą n oraz liczbę

populacji k wyznaczyliśmy odpowiednio w komórkach D21 i D22.

Grupa B

0 .j = (^(warunek stosowal-

52 ności testu jednorodności wielu śred-

5 53 nich) wobec hipotezy alternatywnej

^ H,, zakładającej, że wariancje te nie

55 są jednakowe. Dopiero wtedy, gdy

^ stwierdzimy brak podstaw do odrzu-

55! cenią H 0 (w teście Bartletta), będzie-

my mogli zweryfikować hipotezę

° jednorodności trzech średnich.

51 C

Ryć. 6.26a. Wyniki pomiarów stężenia

frakcji HDL-cholesterolu

a *r MT -i •

•

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: