statystyka wszystko.docx

(356 KB) Pobierz

Do czego służy test statystyczny?

weryfikacji hipotezy, wnioskowanie o H0 na podstawie danych, które prowadzi do 1 z 2 wniosków: H0 odrzucamy odpowiednie wnioski i H0 nie odrzucamy i uznajemy je za prawdziwe.

Co to jest moc testu?

Prawdopodobieństwo odrzucenia hipotezy stat. w sytuacji, gdy jest ona fałszywa, czyli prawdopod. nie popełnienia błędu 2 rodzaju (1-B)=P

Od czego zależy moc testu?

Od liczebności próby im > tym moc >. H0=uoX-N(u,b2) im u jest dalsze tym test jest mocniejszy. Wariancji jej wartości.

Analiza wariancji.

Porównanie wartości oczekiwanej wielu populacji, gdzie obserwowane są cechy o rozkładzie normalnym, a dokładnie do weryfikacji hipotezy H0=u1=u2=...uk

ui dla i=1,...,k – oznacza wartość oczekiwaną w itej populacji np. porównanie przeciętnych plonów pszenicy pewnych odmian. Dzięki weryfikacji tej hipotezy możemy uzyskać odp. na pytanie istnienia związku między cechą jakościową, który posłuży do podziału na populacje a badaną cechę ilościową. Stosuje się w doświadczalnictwie, badanie różnych czynników na określoną cechę.

Analiza regresji.

Służy 1 do sprawdzenia, czy istnieje zależność między dwiema cechami ilościowymi jak i 2 do podania opisu ilościowego zależności, np. badając zależność między dawką nawozu a efektywnością nawożenia łąk. X – dawka N deterministyczna Y – efektywność E(Y/X=x)=Bo+B1x oszacowanie B1 i Bo opis ilościowy zależności; Weryfikacja Ho:B1=0 – stwierdzenie zależności. Czyli analiza regresji opisuje zależność średniej wartości zmiennej Y od wartości zmiennej niezależnej X.

Analiza korelacji.

Badanie istnienia związku między (wł. jego siły) prostoliniowego pomiaru dwiema zmiennymi losowymi o normalnych rozkładach prawdopodobieństwa np. zależność między wzrostem i ciężarem człowieka, zawartością białka i tłuszczu w mleku. Zmienne losowe ciągłe. Analiza korelacji pozwala wykazać bądź nie istnienie związku między X i Y.

Estymacja parametru rozkładu prawdopodobieństwa.

Szacowanie na podstawie próby nieznanych wartości parametru rozkładu prawdopodobieństwa, np. X-wzrost X-N (u,b2) estymator u na podstawie próby jest X=u – estymator nieobciążony

Własności dobrego estymatora.

- nieobciążony – wart. oczekiwana estymatora = wart. parametru szacowanego, estymator jest też zmienną losową

- zgodność – z im większej próby wyznaczymy estymator tym będzie bardziej zgodny z rzeczywistym u.

- efektywność – losowy błąd estymatora najmniejsza wariancja najefektywniejszy estymator

Przedział ufności.

Wyznaczony na podstawie próby zakres liczbowy pokrywający z góry zadanym prawdopodobieństwem (znanym poziomem istotności) szacowaną nieznaną wartość parametru *dystrybuanta określa P(X<x)F(x) Formalnie jest to całka z funkcji gęstości par. X na podstawie (-nieskończoności, x).

1. Rozkład empiryczny cechy.

Podstawą do jakichkolwiek analiz statystycznych badanej cechy jest określenie tzw. empirycznego rozkładu cechy. Polega ono na uporządkowanym, uszeregowanym rosnąco wartościom, przyjmowanym przez tę cechę odpowiednio zdefiniowanych częstości ich występowania.

2. Podać definicję i opisać właściwości funkcji rozkładu zmiennej losowej oraz dystrybuanty.

Funkcje rozkładu zmiennej losowej: przyporządkowuje wartościom tej zmiennej losowej wartości prawdopodobieństw z jakimi one występują, suma tych prawd. równa się 1. Własności D=R;f=<0;1> jest ograniczona. Zmienna losowa X jest typu skokowego jeśli może przyjmować skończoną lub nieskończoną, ale przeliczoną liczbę wartości. Zmienna losowa X jest typu ciągłego jeśli możliwe wartości należą do przedziału ze zbioru liczb rzeczywistych.

F. dystrybuanty: przyporządkowuje wartościom zmiennej losowej wartości prawdopodobieństwa tego ze wartości zmiennej losowej. Przyjmuje wartość nie większą od wartości argumentu, własność jest ograniczona 0<=F(x)

3. Co to jest standaryzowany układ normalny i jak przeprowadza się proces standaryzacji?

Jest to rozkład normalny, który uległ przekształceniu a po którym ma parametr E(U)=o; DZ(U)=1. Jego dystrybuanta jest stablicowana. Standaryzacja jest to przekształcenie, którego celem może być prowadzenie różnych rozkładów zmiennej o różnym przeciętnym poziomie i stopniu zróżnicowania dla porównywalności. Standaryzację przeprowadza się w następujący sposób: od wartości zmiennej odejmuje się jej wartość oczekiwaną i otrzymaną różnicę dzieli się przez odchylenie standardowe.

4. Jakie testy są używane do weryfikacji hipotezy Ho=u1=u2 i jakie są kryteria wyboru?

- test T-studenta, jeżeli populacja ma rozkład normalny o nieznanych parametrach;

- test U, jeżeli populacja generalna ma dowolny rozkład o nie znanych parametrach (duża próba) lub gdy populacja generalna ma rozkład normalny o nieznanym u, ale znanym d (mała próba).

5. Co to jest hipoteza? Omów rodzaje weryfikowanych hipotez.

Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej. Do weryfikacji hipotez służą testy istotności. Postać tych testów a w szczególności statystyk będących sprawdzianami Ho zależy od tego, jakiego parametru dotyczy hipoteza oraz jakimi informacjami o populacji generalnej dysponujemy.

6. Jakie czynniki i w jaki sposób wpływają na długość przedziału ufności dla wartości oczekiwanej?

Zależy od poziomu istotności a, odchylenia standardowego d i liczebności próby N. Od a i d zależy wprost proporcjonalnie, czyli wraz ze wzrostem parametru rośnie długość przedziału ufności, od N zależy odwrotnie proporcjonalnie ze wzrostem liczebności maleje długość przedziału. Dt=2uaS/pierwiastek z N

7. Omówić dowolnie wybrany rozkład zmiennej losowej skokowej, przedstawić na wykresie.

f(x), F(x)

Zmienna losowa przyjmuje dwie wartości 1, 2 każda z wartości przyjmuje z prawdopodobieństwem ½.

8. Od czego zależy wartość i położenie obszaru krytycznego?

Wielkość od wielkości wartości krytycznej (Ua), a odchylenie od wielkości poziomu istotności a, im większe a tym mniejszy obszar krytyczny. Położenie od stosowanego testu zgodności, np. przy rozkładzie normalnym jest dwustronny, a przy rozkładzie c prawostronny. Położenie zależy też od rodzaju weryfikowanej hipotezy – lewostronnej, prawostronnej i obustronnej.

9. Wypisz hipotezy, które można weryfikować testem T-studenta. Jakie założenia należy przyjąć o populacjach generalnych?

Ho:u=u0 – populacja ma rozkład normalny o nieznanych parametrach, mała próba

Ho:u1=u2 – mała próba, wariancje jednakowe

10. Podać cechy dobrego estymatora.

- nieobciążony – przy wielokrotnym losowaniu próby średnie z wartości przyjmowanych przez estymator nieobciążony równa jest wartości szacowanego parametru;

- efektywny – najefektywniejszy jest ten, który ma najmniejszą wariancję;

- dostateczny (wystarczający) jeżeli do jego konstrukcji użyto wszystkie elementy próby;

- zgodny – jeśli wraz ze wzrostem wartości próby wartość estymatora jest bliższa wartości estymowanego parametru. Jeżeli dla każdego e>0 lim P{<qa z daszkiem - q>≤e}=1 to q jest estymatorem zgodnym. Jeżeli rozpatrujemy próby (n->rośnie) Es zgodny – jego wartość pokrywa się z wartością nieznaną.

11. Jaka jest interpretacja współczynnika korelacji i regresji jakie wartości mogą przyjmować te parametry?

Współczynnik korelacji określa siłę zależności między zmiennymi. Współczynnik regresji mówi o ile wzrośnie zmiana zależności, jeżeli zmienna niezależna zmieni się o 1.

xyÎ(-1,1)

12. Jeżeli rozkład ma częstość empiryczną sukcesu w dużych próbach, jakie są parametry tego rozkładu?

Ma rozkład normalny o parametrach: m – wartość oczekiwana i s - odchylenie standardowe.

13. Omówić definicję prawdopodobieństwa.

- klasyczna – prawdopodobieństwo zdarzenia A jest to stosunek zdarzeń sprzyjających temu zdarzeniu, do ilości wszystkich zdarzeń elementarnych.

- aksjomatyczna – niech W będzie daną przestrzenią zdarzeń elementarnych. Jeżeli każdemu zdarzeniu A przestrzeni W zostanie przyporządkowana dokładnie jedna liczba P(A) spełniająca warunki P(A)≥0; P(W)=1 dla każdej pary wyłączających się zdarzeń A,B P(AB)=P(A)+P(B) to mówimy, że na zdarzeniach przestrzeni W zostało określone prawdopodobieństwo zdarzenia A, warunki nazywamy aksjomatami

- statystyczna – jeżeli przy wielorakiej realizacji doświadczeń w wyniku których może wystąpić zdarzenie A, częstość tego zdarzenia wyraża wyraźnie prawidłowość, oscyluje wokół pewnej nieznanej liczby, jeżeli wahania częstotliwości przejawiają tendencję malejącą w miarę wzrostu liczby doświadczeń, to liczba P nazywa się prawdopodobieństwem zdarzenia A.

14. Cechy rozkładu normalnego.

Symetryczny względem prostej x=u; osiąga jedno maximum w punkcie, ma dwa punkty przecięcia dla x=u - s i u + s; EX=u=Ho. Dowód na jego symetryczność jest określony do zera dla x do +∞ i -∞. Przekształcenie standaryzacja prowadzi do powstania innego rozkładu normalnego.

15. O czym informują kwantyle i mediany w próbie?

Kwantyle dzielą uporządkowaną rosnąco zbiorowość na 4 części liczące po 25% obserwacji środkowej. Dla zmiennej losowej ciągłej mediana dzieli pole pod wykresem na dwie równe części.

16. Co to jest obszar krytyczny, od czego zależy jego wielkość i położenie pod krzywą rozkładu statystyki testowej?

Jest to taki obszar przestrzeni próby, że jeśli wynik prób znajduje się w tym obszarze to sprawdzoną hipotezę zerową odrzucamy, jeśli natomiast wynik próby znajduje się poza tym obszarem to hipotezę Ho przyjmujemy (nie odrzucamy).

17. Podaj interpretację parametru współzmienności zmiennej losowej dwuwymiarowej.

Współczynnik determinacji exy mówi nam w jakiej części wartości jednej zmiennej jest zdeterminowana wartość drugiej zmiennej.

Współczynnik regresji bxy mówi o ile wzrośnie zmiana zależności jeżeli zmienna niezależna zmieni się o 1.

 

 

18. Co można powiedzieć o zmiennej w próbie jeśli wszystkie miary przyjmują tę samą wartość?

Jeżeli wszystkie miary przyjmują tę samą wartość to znaczy, że brak jest zróżnicowania w próbie, czyli wszystkie wartości cechy są jednakowe.

19. Dlaczego w testach istotności nie przyjmujemy Ho?

W testach istotności uwzględnia się tylko prawdopodobieństwo a popełnienia błędu 1 rodzaju. Pomija się przyjęcie hipotezy fałszywej(błędu II rodzaju b) nie mówi się o przyjęciu tej hipotezy, ale o tym, że wyniki danej próby nie dają podstaw do jej odrzucenia. Jeżeli wynik znajduje się na obszarze krytycznym odrzuca się Ho, a prawdziwa jest H1, bo w pewnych testach możliwe jest określenie prawdopodobieństwa b popełnienia błędu II rodzaju. Można zatem w pewnych przypadkach, po określeniu obszaru krytycznego dla wartości a wyznaczyć prawdopodobieństwo takiego błędu.

20. Rozkład normalny.

Określony jest przez swoje parametry: m i s; funkcja jest zbieżna do 0 dla -∞; +∞; podlega prawu trzech sigm; symetryczny względem prostej przechodzącej przez m; funkcja rozkładu posiada jedno maximum lokalne m0, które pokrywa się z wartością oczekiwaną (EX); każdy rozkład normalny X:N(m,s) można sprowadzić do postaci tzw. standaryzowanego rozkładu normalnego, którego funkcja gęstości i dystrybuanta została stablicowana (m=0 s=1)ÞN(0,1); wykresem funkcji gęstości rozkładu normalnego jest krzywa Grensa symetryczna względem prostej o równaniu x=m z dwoma punktami przegięcia m-s i m+s

21. Podać interpretację parametrów współzależności zmiennej losowej.

1. Kowariancja cos(xy) – moment centralny II rzędu jest równa zeru, jeśli zmienne x, y niezależne – wartość liczbowa jest nieistotna

CXY=EXY-EX-EY

jeśli jest różna od zera, jest zależność; kiedy jej wartość jest dodatnia to jedna zmienna wpływa na drugą pozytywnie (jeśli I rośnie to II też); kiedy jest ujemna: jedna wpływa na drugą i jej wzrost powoduje malenie II i na odwrót.

2. Współczynnik korelacji dxy: przyjmuje wartość z przedziału <-1,1>; jest ujemna kiedy korelacja dxy=cov(x,y)/DXDY; określa natężenie zależności między dwiema zmiennymi lub jej brak; im bliżej –1 lub 1, tym większe natężenie zależności; kiedy równe O, to brak zależności.

22. Jak zmienia się długość przedziału ufności dla prawdopodobieństwa sukcesu, gdy liczebność próby wzrośnie o...?

Kiedy n(liczebność próby) rośnie, to długość przedziału maleje o tyle samo.

24. W pewnej próbie d=0,5 a stosunki korelacji są równe 0,7 i 0,8 (e=x,y) jak można zinterpretować ich wartość?

d=0,5 – zależności pozytywne i słabe; exy=0,7 i exy=0,8 zmienna X i Y wpływają na siebie nieznacznie (słabo).

weryfikalne – zerowe

nie weryfikalne - alternatywne

25. Zmienna losowa

Funkcja, która przyporządkowuje wartości liczbowe zdarzeniom elementarnym, Xi:Pi; X-wartości zmiennej losowej, i-kolejność, P-prawdopodobieństwo wystąpienia. Funkcja rozkładu prawdopodobieństw – przypisanie p polejnym zmiennym losowym -  rozkład zmiennej losowej.

26. Zmienna losowa skokowa

cechy jakościowe, zbiór przeliczalny (skończony lub nie)

27. Zmienna losowa ciągła

cechy ilościowe, zbiór liczb rzeczywistych

28. Wartość oczekiwana

mówi czego możemy się spodziewać po danym rozkładzie; moment zwykły I-rzędu m1=EX, m1=åx1p1. Odchylenie standardowe – rzeczywiste odchylenia od wartości oczekiwanej.

29. Rozkład Bernoulliego

Zmienna losowa ma rozkład dwumianowy, jeśli przyjmuje wartości k=0,1,2...n z prawdopodobieństwem określonym wzorem. Parametrem tego rozkładu jest n-liczba doświadczeń, p-prawdopodobieństwo sukcesu. Rezultatem doświadczenia może być A-sukces lub A’ porażka. Doświadczenie to powtarzamy wielokrotnie (n) tak, że prawdopodobieństwo sukcesu pozostaje w pojedynczych próbach stałe i równe p. Liczba zaobserwowanych sukcesów to k=0,1,2,...,n EX-np. D2X-np.(1-p)

30. Ho o niezależności

dotyczy dwóch cech w jednej próbie, kiedy między zmiennymi jest brak zależności.

31. Ho o zgodności

zmienna ma rozkład zgodny z określonym rozkładem teoretycznym. Wtedy Ho: x – rozkład normalny, Bernouliego, Possona. Zmienna ma jednakowy rozkład w dwóch populacjach. Wtedy Ho; Xa ma rozkład jak X. Do weryfikacji używa się testu tylko c2 I- rozkład empiryczny, II-rozkład teoretyczny (zakładamy, że Ho jest prawdziwe). Test c2 o niezależności.

Test c2 o zgodności. Próba z jednej populacji musi być dwuwymiarowa. Przy odrzuceniu hipotezy – dwie zmienne mogą być zależne istotne lub wysokoistotne.

 

 

 

32. Do czego służą testy statystyczne?

Służą do weryfikacji hipotez, czyli do wnioskowania o postawionej hipotezie statystycznej (Ho) na podstawie danych, które prowadzą do jednego z dwóch wniosków:

1. wniosek Ho kwestionujemy, czyli odrzucamy

2. Ho nie odrzucamy a tym samym uznajemy za prawdziwe.

33. Jakie dwa rodzaje  błędów grożą przy weryfikacji hipotezy?

1. jeśli Ho odrzucamy, jesteśmy narażeni na błąd 1-go rodzaju polegający na odrzuceniu hipotezy prawdziwej wyrażony przez a poziom istotności

2. jeśli Ho nie odrzucamy, narażeni jesteśmy na błąd II-go rodzaju, który polega na nie odrzuceniu hipotezy fałszywej

Doświadczenie losowe to  proces, który możemy powtarzać wielokrotnie w jednakowych lub zbliżonych warunkach, którego przebiegu i ostatecznego rezultatu nie można w jednoznaczny sposób przewidzieć.

Przykłady

(1)              rzut monetą

(2)              rzut koską do gry

(3)              rozdanie kart

(4)              losowanie toto-lotka

(5)              strzelanie do celu

 

Przestrzeń zdarzeń elementarnych (przestrzeń wyników) jest to zbiór wszystkich możliwych, niepodzielnych, wykluczających się wyników pewnego doświadczenia losowego. Oznaczamy ją przez W. Elementy tego zbioru to zdarzenia elementarne. Oznaczamy je przez w, ewentualnie ze wskaźnikami (numerami) przez wi .

Przykłady

(1)              Przestrzenią zdarzeń elementarnych rzutu kostką do gry jest zbiór W={1,2,3,4,5,6} gdzie cyfra 1 oznacza wypadnięcie górnej ścianki z jednym oczkiem, cyfra 2 wypadnięcie górnej ścianki z dwoma oczkami, itd. To samo doświadczenie możemy też zapisać jako W={ w1, w2, w3, w4, w5, w6}  gdzie wi, oznacza wypadnięcie górnej ścianki z liczbą  oczek równą i. Liczebność zbioru W to ilość elementów w zbiorze czyli n (W)=6.

(2)              Partia towaru składa się ze sztuk dobrych i złych. Wybieramy losowo jedną sztukę. Zdarzenia elementarne definiujemy następująco :

d  —wybraliśmy sztukę dobrą              w  —wybraliśmy sztukę wadliwą

Zbiorem zdarzeń elementarnych jest zbiór: W={d,w}jego liczebność wynosi 2. Zdarzenie elementarne d zachodzi wtedy i tylko wtedy gdy wylosujemy sztukę dobrą, zdarzenie elementarne w zachodzi wtedy i tylko wtedy gdy wylosujemy sztukę wadliwą.

(3)              Strzelamy dwukrotnie do celu. Interesuje nas w którym strzale cel został trafiony. Zdarzenia elementarne definiujemy następująco:

(t, t)—trafienie w pierwszym i drugim strzale

(t, c)—trafienie w pierwszym i chybienie w drugim strzale

(c, t)—chybienie w pierwszym i trafienie w drugim strzale

(c, c)—chybienie w pierwszym i drugim strzale

Zbiorem zdarzeń elementarnych jest zbiór  W={(t, t), (c, t), (t, c), (c, c)}jego liczebność wynosi 4.

(9)                Strzelec trafia do celu tyle razy aż trafi. Przyjmujemy zbiór zdarzeń elementarnych

W={ w1, w2, w3, ...., wn},

gdzie wn, dla n=1,2,3,... oznacza że cel zostanie trafiony w strzale o numerze n oraz w strzałach o numerach 1,2,...,n-1 nie został trafiony.

(10)              Dokonujemy pomiaru pewnej wielkości fizycznej. Przyjmujemy, że każda liczba rzeczywista może być wynikiem tego pomiaru, zatem W jest zbiorem R wszystkich liczb rzeczywistych czyli W=R.

Wobec powyższych przykładów zauważamy że zbiór zdarzeń elementarnych może być:

(a)...

Zgłoś jeśli naruszono regulamin