Podstawy Statystyki z przykładami
Statystyka może być rozumiana dwojako, w sensie potocznym uważa się za nią niektóre zestawienia liczbowe charakteryzujące np. umieralność niemowląt, wydobycie kopalin, wypadki przy pracy, spożycie dobra na jednostkę itp. Tak pojmowana statystyka nie jest dyscypliną naukową. Przez statystykę bowiem rozumiemy naukę, która zajmuje się badaniem prawidłowości zachodzących w procesach masowych.
Procesy masowe rządzą się prawami wielkich liczb (na 1000 dzieci rodzi się 517 chłopców i 483 dziewczynki), nie mówimy o nich gdy mamy do czynienia z jednym i tylko jednym przypadkiem (w jednej rodzinie urodziły się cztery dziewczynki)
Prawidłowości statystyczne są wynikiem występowania tzw. przyczyn głównych, prawidłowości są odkształcane (zakłócane) poprzez występowanie przyczyn ubocznych, im większa jest liczba obserwacji tym mniejsze jest oddziaływanie przyczyn ubocznych, a gdy liczba obserwacji dąży do nieskończoności oddziaływanie przyczyn ubocznych wzajemnie się znosi (spada do zera).
Zadania statystyczne
Podstawowym zadaniem statystycznym jest dostarczanie wiarygodnych informacji w celu zarządzania wszystkimi dziedzinami życia.
Podział statystyki (wg różnych kryteriów)
Statystyka matematyczna
Zajmuje się weryfikacją hipotez statystycznych oraz estymacją (szacowaniem) punktową lub przedziałową parametrów.
Statystyka opisowa
Główne działy statystyki opisowej
Kompleksowa analiza struktury zbiorowości,
Analiza korelacji i regresji,
Analiza dynamiki zjawisk (badanie szeregów czasowych, tendencji rozwojowej).
Podstawowe pojęcia
ZNAKI UMOWNE
-
Zjawisko nie występuje
0,0
Zjawisko występuje w ilościach mniejszych niż da się to wyrazić w przyjętej jednostce miary
.
Brak danych lub brak danych wiarygodnych
X
Wypełnienie rubryki nie dotyczy, nie ma sensy
Zbiorowość statystyczna – nie definiujemy – stanowi odpowiednik zbioru w matematyce, podajemy jednak przykłady zbiorowości np. zbiorowość osób, przedmiotów, zjawisk (przyrodniczych, ekonomicznych, społecznych). Zbiorowość zwana inaczej populacją albo zbiorowością generalną składa się z jednostek statystycznych (odpowiedniki elementów w zbiorze). Każda jednostka zbiorowości ma pewne właściwości. Te właściwości nazywamy cechami statystycznymi – to one podlegają badaniu.
Ogólny podział cech statystycznych
Stałe,
Wspólne wszystkim jednostkom statystycznym i z uwagi na to nie są przedmiotem badania a tylko odpowiedniego grupowania zbiorowości na pewne podzbiorowości.
Zmienne,
Rozróżniają jednostki pomiędzy sobą. Dzielą się na:
cechy mierzalne inaczej ilościowe (takie, których wartość da się przedstawić za pomocą liczby).Wśród mierzalnych wyróżnia się cechy:
ciągłe, ich wartości przedstawia się w postaci dowolnej liczby rzeczywistej np. wiek, waga, wydajność pracy, cena, kurs, temperatura,
skokowe, ich wartość da się przedstawić wyłącznie za pomocą zera lub liczb naturalnych (np. liczba dzieci w rodzinie 0, 1, 2, 3...)
quasi ciągłe
cechy niemierzalne (jakościowe) to takie cechy, których wartości nie da się zmierzyć a jedynie opisać w sposób słowny (płeć, wykształcenie, kolor włosów).
Kompleksowa analiza struktury zbiorowości
W skład kompleksowej analizy struktury zbiorowości wchodzą:
Średnia (klasyczna i pozycyjna),
Miary rozproszenia (dyspersji),
Miary skośności (asymetrii),
Miary spłaszczenia (koncentracji).
Ad.1 Średnie klasyczne
Średnia arytmetyczna (średnia x - )
dla szeregów prostych gdy dane nie są uporządkowane wyraża się wzorem
Dodać wszystkie wartości danych (x) i podzielić przez ich liczbę
xi – wartość badanej cechy i-tej jednostki statystycznej,
N – liczba badanych jednostek statystycznych.
PRZYKŁAD :
Średni wzrost mężczyzn (10 elementów)
x1 = 168 x2 = 178 x3 = 171 x4 = 185 x5 =180
x6 = 171 x7 = 179 x8 =183 x9 =180 x10 =175
168+178+171+185+180+171+179+183+180+175 = 1770
1770 ¸10 = 177
= 177 cm
dla szeregu rozdzielczego – jeżeli w wyniku odpowiedniego grupowania danych nieuporządkowanych w szereg rozdzielczy w postaci:
W kolumnie (x) podano przedziały zarobków.
W kolumnie (ni) podano ilość osób które spełniają warunki kolumny (x).
W kolumnie (x`i) obliczono środek przedziału klasowego
Np. (700+800) ¸ 2 = 750
W kolumnie (ni×x`i) podano iloczyn dwóch wcześniejszych kolumn.
UWAGA: wartości graniczne przypisujemy do wyższej klasy (np. wartość 800 przypisujemy do drugiej klasy)
x
ni
x`i
ni ×x`i
700-800
11
750
8250
800-900
18
850
15300
900-1000
26
950
24700
1000-1800
36
1400
50400
1800-2400
32
2100
67200
2400-3000
16
2700
43200
suma
N=139
209050
209.050 ¸ 139 = 1504
ni – liczebność i-tego przedziału klasowego (suma ni równa się N)
x`i – środek i-tego przedziału klasowego
średnia geometryczna
stosujemy dla liczb względnych (procenty, promile np. roczne wykonanie planu).
gdzie xi >0 (PI oznacza iloczyn)
średnia harmoniczna
jest odwrotnością średniej arytmetycznej – stosujemy gdy dane są podane jako odwrotność np. zużycie paliwa na jednostkę, wydajność na godzinę.
gdzie xi ¹0
Ad. 1 Średnie pozycyjne
Wynikają z pozycji w szeregu, wyznacza się na podstawie tzw. wzorów interpolacyjnych.
Dominanta (wartość typowa , modalna, dominująca) – to taka wartość badanej cechy, której odpowiada największa liczebność
Sposób wyznaczania dominanty dla szeregu prostego
uporządkować szereg rosnąco (czasami malejąco),
podsumować jednostki, które maja tę samą wartość.
Dominantą będzie wartość występująca najczęściej.
Sposób wyznaczania dominanty dla szeregu rozdzielczego
...
michal.stalowa