Statystyka [25 stron]
Statystyka – nauka o metodach ilościowych, badania zjawisk masowych. Zajmuje się badaniem procesów, jakie zachodzą w zbiorowościach statystycznych.
Zjawisko masowe – występują w przyrodzie, społeczeństwie, badane dla większej liczby przypadków, wykazują pewną prawidłowość.
Badanie statystyczne – ogół prac mających na celu:
Poznanie struktury badanej zbiorowości ze względu na określone cechy
Ocenę współzależności zjawisk
Poznanie dynamiki zmian zjawiska w czasie i przyczyn wywołujących zmienność tego zjawiska.
Populacja statystyczna (zbiorowość statystyczna) – zbiór osób, przedmiotów, zjawisk podobnych do siebie, ale nie identycznych, poddanych badaniom statystycznym. Każdy element populacji statystycznej to jednostka statystyczna.
Jednostka statystyczna – element zbiorowości statystycznej, posiada ona cechy wspólne lub przynajmniej jedną cechę wspólną z innymi jednostkami oraz różnice w stosunku do innych jednostek.
Przy określaniu populacji statystycznej określamy:
kogo, co badamy
jaki obszar obejmuje badanie
jakiego okresu dotyczy badanie
np. badamy stan zdrowia dzieci rozpoczynających naukę w 2000 roku na terenie województwa łódzkiego. W tym badaniu zbiorowością statystyczną są dzieci rozpoczynające naukę w 2000 roku. Jednostką jest każde z tych dzieci.
Badanie statystyczne ma dwojaki charakter:
całkowite (pełne, wyczerpujące) – to takie, w którym bezpośredniej obserwacji podlegają wszystkie jednostki statystyczne. Badania te przeprowadza się dla zbiorowości mało licznych, ponieważ są małe koszty. Przy tym badaniu otrzymujemy opis statystyczny.
częściowe – bezpośredniej obserwacji podlega pewien podzbiór zbiorowości statystycznej nazywany próbą i wyniki uogólniamy na całą zbiorowość. By to uogólnienie miało sens, próba musi być liczna i reprezentatywna (struktura musi być zbliżona do danej zbiorowości). Przy tym badaniu opis dotyczy próby. W częściowym odniesieniu do całej zbiorowości mamy do czynienia z wnioskowaniem statystycznym.
Cechy statystyczne - własności jednostek statystycznych podlegające badaniom. Jednocześnie cecha statystyczna jest kryterium podziału całej zbiorowości statystycznej, czyli wszystkich jednostek na mniejsze części.
Podział cech statystycznych:
mierzalne – ilościowe – wartości otrzymujemy w wyniku pomiaru lub policzenia, i które w naturalny sposób wyrażają się liczbami i występują w określony w określonych jednostkach. Dzielą się na:
skokowe (dyskretne) przyjmują wartości nie zależące od pomiaru np. liczba osób w rodzinie, dni w roku na odpoczynek
ciągłe przyjmują wartości z poziomych przedziałów. Wartości te często zależą od dokładności pomiaru (czas wykonania pewnego detalu np. długość włókna przędzy przy badaniu jej jakości)
niemierzalne – jakościowe – warianty opisujemy słowami np. zawód, wykształcenie. Dzielimy je na:
dwudzielne – istnieją dwa warianty np. płeć, tak-nie
wielodzielne – wiele wariantów np. zawód
Etapy badania statystycznego:
Projektowanie – sprecyzować cel badania, określić zbiorowość statystyczną i oszacować jej liczebność, określić charakter badania (pełne, częściowe), uściślić badane cechy, podać źródła pozyskiwania danych, przygotować formularze ankiet
Zbieranie danych statystycznych – źródła danych statystycznych są pierwotne (bezpośrednio od jednostek, obserwacje, ankieta) lub wtórne (opracowania firm, instytucji, ośrodków badań statystycznych). Dane zgromadzone są tzw. Surowe
Opracowanie danych – tabele, wykresy. Materiał należy pogrupować, usystematyzować. Grupowanie ma charakter typologiczny (gdy łączymy w grupy jednostki, które mają taki sam wariant cechy) lub wariacyjny (porządkujemy dane ze względu na wartości cechy dla tych jednostek) Pogrupowane dane zapisujemy w szeregach statystycznych
Analiza wyników – podanie informacji
Charakterystyki liczbowe struktury zbiorowości
Parametry statystyczne – są to liczby, które w systematyczny sposób opisują strukturę zbiorowości ze względu na badaną cechę mierzalną.
Parametry statystyczne dzielą się na następujące grupy:
Miary położenia
Miary zmienności
Miary asymetrii
Miary koncentracji
Miary położenia mogą być:
Klasyczne
Średnia arytmetyczna
Średnia harmoniczna
Średnia geometryczna
Inne średnie
Pozycyjne
Dominanta (moda, wartość modalna)
Kwantyle:
Kwartyle
Kwartyl dolny
Mediana
Kwartyl górny
Kwintyle
Decyle
Centyle
Miary klasyczne:
Średnia arytmetyczna określana jest wzorami:
Dla szeregu szczegółowego
Dla szeregu rozdzielczego
Dla szeregu z przedziałem klasowym liczebność grupy
Przykład:
Badano liczbę czasopism ilustrowanych zakupionych w ciągu tygodnia przez mieszkańców pewnego bloku dane zawarto w tabeli:
Lp
Liczba czasopism x1
Liczba mieszkańców n1
X1n1
Nis
1
0
7
2
13
20
3
18
36
38
4
21
45
5
50
Ni=50
Xini=90
nis – liczebność skumulowana (dodajemy wszystkie cyfry z kolumny ni)
Szereg punktowy
Średnio mieszkańcy tego bloku kupowali 1,8 czasopisma
Dominanta = 2 (w kolumnie xini największą liczbą jest 36 czyli liczba czasopism wynosi 2)
Mediana -
Badano oszczędności mieszkańców pewnego osiedla i otrzymane wyniki przedstawiono w tabeli:
Oszczędności w tys zł
Liczba osób ni
X1
xini
nis
0-2
8
2-4
17
51
...
mcz2