Statystyka - opracowane pytania 4
1. Rozkład empiryczny cechy.
Podstawą do jakichkolwiek analiz statystycznych badanej cechy jest określenie tzw. empirycznego rozkładu cechy. Polega ono na uporządkowanym, uszeregowanym rosnąco wartościom, przyjmowanym przez tę cechę odpowiednio zdefiniowanych częstości ich występowania.
2. Podać definicję i opisać właściwości funkcji rozkładu zmiennej losowej oraz dystrybuanty.
Funkcje rozkładu zmiennej losowej: przyporządkowuje wartościom tej zmiennej losowej wartości prawdopodobieństw, z jakimi one występują, suma tych prawd. równa się 1. Własności D=R; f=<0;1> jest ograniczona. Zmienna losowa X jest typu skokowego, jeśli może przyjmować skończoną lub nieskończoną, ale przeliczoną liczbę wartości. Zmienna losowa X jest typu ciągłego, jeśli możliwe wartości należą do przedziału ze zbioru liczb rzeczywistych.
F. dystrybuanty: przyporządkowuje wartościom zmiennej losowej wartości prawdopodobieństwa tego ze wartości zmiennej losowej. Przyjmuje wartość nie większą od wartości argumentu, własność jest ograniczona 0<=F(x)
3. Co to jest standaryzowany układ normalny i jak przeprowadza się proces standaryzacji?
Jest to rozkład normalny, który uległ przekształceniu a po którym ma parametr E(U)=o; DZ(U)=1. Jego dystrybuanta jest stablicowana. Standaryzacja jest to przekształcenie, którego celem może być prowadzenie różnych rozkładów zmiennej o różnym przeciętnym poziomie i stopniu zróżnicowania dla porównywalności. Standaryzację przeprowadza się w następujący sposób: od wartości zmiennej odejmuje się jej wartość oczekiwaną i otrzymaną różnicę dzieli się przez odchylenie standardowe.
- test T-studenta, jeżeli populacja ma rozkład normalny o nieznanych parametrach;
- test U, jeżeli populacja generalna ma dowolny rozkład o nie znanych parametrach (duża próba) lub gdy populacja generalna ma rozkład normalny o nieznanym u, ale znanym d (mała próba).
5. Co to jest hipoteza? Omów rodzaje weryfikowanych hipotez.
Przez hipotezę statystyczną rozumie się dowolne przypuszczenie, co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej. Do weryfikacji hipotez służą testy istotności. Postać tych testów a w szczególności statystyk będących sprawdzianami Ho zależy od tego, jakiego parametru dotyczy hipoteza oraz jakimi informacjami o populacji generalnej dysponujemy.
6. Jakie czynniki i w jaki sposób wpływają na długość przedziału ufności dla wartości oczekiwanej?
Zależy od poziomu istotności a, odchylenia standardowego d i liczebności próby N. Od a i d zależy wprost proporcjonalnie, czyli wraz ze wzrostem parametru rośnie długość przedziału ufności, od N zależy odwrotnie proporcjonalnie ze wzrostem liczebności maleje długość przedziału. Dt=2µaS/√N
7. Omówić dowolnie wybrany rozkład zmiennej losowej skokowej, przedstawić na wykresie.
f(x), F(x)
Zmienna losowa przyjmuje dwie wartości 1, 2 każda z wartości przyjmuje z prawdopodobieństwem ½.
8. Od czego zależy wartość i położenie obszaru krytycznego?
Wielkość od wielkości wartości krytycznej (Ua), a odchylenie od wielkości poziomu istotności a, im większe a tym mniejszy obszar krytyczny. Położenie od stosowanego testu zgodności, np. przy rozkładzie normalnym jest dwustronny, a przy rozkładzie c prawostronny. Położenie zależy też od rodzaju weryfikowanej hipotezy – lewostronnej, prawostronnej i obustronnej.
9. Wypisz hipotezy, które można weryfikować testem T-studenta. Jakie założenia należy przyjąć o populacjach generalnych?
Ho: µ = µ0 – populacja ma rozkład normalny o nieznanych parametrach, mała próba
Ho: µ1 = µ2 – mała próba, wariancje jednakowe
10. Podać cechy dobrego estymatora.
§ Nieobciążony – przy wielokrotnym losowaniu próby średnie z wartości przyjmowanych przez estymator nieobciążony równa jest wartości szacowanego parametru;
§ Efektywny – najefektywniejszy jest ten, który ma najmniejszą wariancję;
§ Dostateczny (wystarczający) - jeżeli do jego konstrukcji użyto wszystkie elementy próby;
§ Zgodny – jeśli wraz ze wzrostem wartości próby wartość estymatora jest bliższa wartości estymowanego parametru. Jeżeli dla każdego e > 0 lim P{<qa z daszkiem - q>≤e}=1 to q jest estymatorem zgodnym. Jeżeli rozpatrujemy próby (n > rośnie) Es zgodny – jego wartość pokrywa się z wartością nieznaną.
11. Jaka jest interpretacja współczynnika korelacji i regresji jakie wartości mogą przyjmować te parametry?
Współczynnik korelacji określa siłę zależności między zmiennymi. Współczynnik regresji mówi o ile wzrośnie zmiana zależności, jeżeli zmienna niezależna zmieni się o 1.
xyÎ(-1,1)
12. Jeżeli rozkład ma częstość empiryczną sukcesu w dużych próbach, jakie są parametry tego rozkładu?
Ma rozkład normalny o parametrach: m – wartość oczekiwana i s - odchylenie standardowe.
13. Omówić definicję prawdopodobieństwa.
§ klasyczna – prawdopodobieństwo zdarzenia A jest to stosunek zdarzeń sprzyjających temu zdarzeniu, do ilości wszystkich zdarzeń elementarnych.
§ aksjomatyczna – niech W będzie daną przestrzenią zdarzeń elementarnych. Jeżeli każdemu zdarzeniu A przestrzeni W zostanie przyporządkowana dokładnie jedna liczba P(A) spełniająca warunki P(A)≥0; P(W)=1 dla każdej pary wyłączających się zdarzeń A,B P(AB)=P(A)+P(B) to mówimy, że na zdarzeniach przestrzeni W zostało określone prawdopodobieństwo zdarzenia A, warunki nazywamy aksjomatami
§ statystyczna – jeżeli przy wielorakiej realizacji doświadczeń w wyniku których może wystąpić zdarzenie A, częstość tego zdarzenia wyraża wyraźnie prawidłowość, oscyluje wokół pewnej nieznanej liczby, jeżeli wahania częstotliwości przejawiają tendencję malejącą w miarę wzrostu liczby doświadczeń, to liczba P nazywa się prawdopodobieństwem zdarzenia A.
14. Cechy rozkładu normalnego.
Symetryczny względem prostej x=µ; osiąga jedno maximum w punkcie, ma dwa punkty przecięcia dla x=µ - s i µ + s; EX=µ=H0. Dowód na jego symetryczność jest określony do zera dla x do +∞ i -∞. Przekształcenie standaryzacja prowadzi do powstania innego rozkładu normalnego.
15. O czym informują kwantyle i mediany w próbie?
Kwantyle dzielą uporządkowaną rosnąco zbiorowość na 4 części liczące po 25% obserwacji środkowej. Dla zmiennej losowej ciągłej mediana dzieli pole pod wykresem na dwie równe części.
16. Co to jest obszar krytyczny, od czego zależy jego wielkość i położenie pod krzywą rozkładu statystyki testowej?
Jest to taki obszar przestrzeni próby, że jeśli wynik prób znajduje się w tym obszarze to sprawdzoną hipotezę zerową odrzucamy, jeśli natomiast wynik próby znajduje się poza tym obszarem to hipotezę H0 przyjmujemy (nie odrzucamy).
17. Podaj interpretację parametru współzmienności zmiennej losowej, dwuwymiarowej.
Współczynnik determinacji exy mówi nam, w jakiej części wartości jednej zmiennej jest zdeterminowana wartość drugiej zmiennej.
Współczynnik regresji bxy mówi o ile wzrośnie zmiana zależności, jeżeli zmienna niezależna zmieni się o 1.
18. Co można powiedzieć o zmiennej w próbie, jeśli wszystkie miary przyjmują tę samą wartość?
Jeżeli wszystkie miary przyjmują tę samą wartość to znaczy, że brak jest zróżnicowania w próbie, czyli wszystkie wartości cechy są jednakowe.
19. Dlaczego w testach istotności nie przyjmujemy H0?
W testach istotności uwzględnia się tylko prawdopodobieństwo a popełnienia błędu 1 rodzaju. Pomija się przyjęcie hipotezy fałszywej(błędu II rodzaju b) nie mówi się o przyjęciu tej hipotezy, ale o tym, że wyniki danej próby nie dają podstaw do jej odrzucenia. Jeżeli wynik znajduje się na obszarze krytycznym odrzuca się H0, a prawdziwa jest H1, bo w pewnych testach możliwe jest określenie prawdopodobieństwa b popełnienia błędu II rodzaju. Można, zatem w pewnych przypadkach, po określeniu obszaru krytycznego dla wartości a wyznaczyć prawdopodobieństwo takiego błędu.
20. Rozkład normalny.
Określony jest przez swoje parametry: m i s; funkcja jest zbieżna do 0 dla -∞; +∞; podlega prawu trzech sigm; symetryczny względem prostej przechodzącej przez m; funkcja rozkładu posiada jedno maximum lokalne m0, które pokrywa się z wartością oczekiwaną (EX); każdy rozkład normalny X : N (m,s) można sprowadzić do postaci tzw. standaryzowanego rozkładu normalnego, którego funkcja gęstości i dystrybuanta została stablicowana (m=0 s=1)Þ N(0,1); wykresem funkcji gęstości rozkładu normalnego jest krzywa Grensa symetryczna względem prostej o równaniu x=m z dwoma punktami przegięcia m-s i m+s
21. Podać interpretację parametrów współzależności zmiennej losowej.
1. Kowariancja cos(xy) – moment centralny II rzędu jest równa zeru, jeśli zmienne x, y niezależne – wartość liczbowa jest nieistotna
CXY = EXY - EX - EY
Jeśli jest różna od zera, jest zależność; kiedy jej wartość jest dodatnia to jedna zmienna wpływa na drugą pozytywnie, (jeśli I rośnie to II też); kiedy jest ujemna: jedna wpływa na drugą i jej wzrost powoduje malenie II i na odwrót.
2. Współczynnik korelacji dxy: przyjmuje wartość z przedziału <-1,1>; jest ujemna, kiedy korelacja dxy=cos(x,y)/DXDY; określa natężenie zależności między dwiema zmiennymi lub jej brak; im bliżej –1 lub 1, tym większe natężenie zależności; kiedy równe 0, to brak zależności.
22. Jak zmienia się długość przedziału ufności dla prawdopodobieństwa sukcesu, gdy liczebność próby wzrośnie o...?
Kiedy n (liczebność próby) rośnie, to długość przedziału maleje o tyle samo.
23. Jaki rozkład ma średnia arytmetyczna próby? Czy jej rozkład zależy od rozkładu cechy w populacji?
24. W pewnej próbie d=0,5 a stosunki korelacji są równe 0,7 i 0,8 (e=x,y) jak można zinterpretować ich wartość?
d=0,5 – zależności pozytywne i słabe; exy=0,7 i exy=0,8 zmienna X i Y wpływają na siebie nieznacznie (słabo).
weryfikalne – zerowe
nie weryfikalne - alternatywne
25. Zmienna losowa
Funkcja, która przyporządkowuje wartości liczbowe zdarzeniom elementarnym, Xi:Pi; X-wartości zmiennej losowej, i-kolejność, P-prawdopodobieństwo wystąpienia. Funkcja rozkładu prawdopodobieństw – przypisanie p kolejnym zmiennym losowym - rozkład zmiennej losowej.
...
Agata5932