Statystyka – obejmuje metody zbierania, prezentacji i analizy danych dotyczących zjawisk masowych.
Zadaniem statystyki jest – badanie prawidłowości zachodzących w zjawiskach masowych na podstawie badań.
BADANIA STATYSTYCZNE –
- planowanie badania
-obserwacja statystyczna
-opracowanie i prezentacja zebranego materiału statystycznego
-opis i wnioskowanie statystyczne
Ustalić: cel, przedmiot badania, zakres badania
PRZEDMIOTEM BADAŃ JEST - populacja generalna ( zbiorowość statystyczna) zbiór przedmiotów bądź osób fizycznych bądź prawnych posiadających wiele cech wspólnych oraz przynajmniej jedną cechę pozwalającą na rozróżnienie elementu zbioru pomiędzy sobą.
JEDNOSTKĄ STATYSTYCZNĄ – nazywamy dowolny element populacji generalnej
Np. przeprowadzamy prognozę budżetu gospodarstw domowych na terenie miasta Katowice za miesiąc styczeń 2006 ( JEDNOSTKĄ STATYSTYCZNĄ JEST TU JEDNA OSOBA PROWADZĄCA GOSPODARSTWO)
Np. przeprowadzamy badania wyniku testów kier. Turystyka GWSH.
ZAKRES BADANIA – wszystkie badania ze względu na zakres dzielimy na :
a) badania pełne – kiedy badaniu podlega cała populacja
-rejestracja
-spisy
Ad a) są przeprowadzane na potrzeby zarządzania państwem bądź firmą. ( główny urząd statystyczny zbiera informacje)
b) badania częściowe – wybieramy tu pewien podzbiór informacji nazywany próbą statystyczną.
Spisy – są to badania które posiadają datę początku i koniec. Spis obsługuje GUS. Zajmują się tym dodatkowo zatrudnieni ludzie komisarze, spisowi. Np. spisy ludności rolne inwentarzowe.
Rejestracja – prowadzone są w rzeczywistym czasieciągłym, obsługiwane przez urzędy terenowe ( poparte są przepisami prawa)
Spisy ludności - przeprowadzamy co 10 lat ( ostatni był w 2002 ). Współpracujemy z eurostatą, następnie przekazujemy informacje do Banku Unii Europejskiej.
PRÓBA STATYSTYCZNA
( sposoby losowania próby)
- zadajemy sobie pytanie jak duża ma być próba?
- jak ma być wybrana?
DOBÓR CELOWY JEDNOSTKI STATYSTYCZNEJ DO PRÓBY – świadomie wybieramy te a nie inne jednostki i opisujemy je. Jest to metoda MONOGRAFICZNA W BADANIACH np. nowe jednostki chorobowe.
DOBÓR LOSOWY – Populację wyjściową dzielimy na kilka podzbiorów np. na dwie części choćby losowanie zespołowe. JEST TO METODA REPREZENTATYWNA.
PRÓBA REPREZENTATYWNA – Jest to próba taka że struktura jednostek statystycznych w tej próbie jest analogiczna do struktury jednostek statystycznych w populacji.
2. OBSERWACJA STATYSTYCZNA
a) cechy statystyczne
b)skala statystyczna
c)rodzaj ankiety
d)skontrolowanie ankiety
ad a) jakie cechy wyróżniamy:
do stałych:
- rzeczowe
-stałe
-czasowe
-przestrzenne
Do zmiennych:
-jakościowe
-ilościowe a te na:
-skokowe
-ciągłe
STAŁE – są to cechy które nie podlegają badaniom. Służą indentyikacji jednostki statystycznej z populacją statystyczną
ZMIENNE – to cechy które podlegają badaniu (realizują cel badania) np.jakie są koszty stałe.
JAKOŚCIOWE - to cechy których wartości nie wyrażamy liczbowo np: płeć, wykształcenie, forma zatrudnienia
ILOŚCIOWE – wyrażamy wartość za pomocą liczb np. zbiory liczbowe liczb rzeczywistych ( cechy ciągłe dowolna liczba rzeczywista, lub cecha skokowa)
Ad b) SKALE STATYSTYCZNE-
- oś liczbowa to cechy ilościowe ciągłe
Wyróżniamy cztery typy skal statystycznych
*nominalna ( stosowana dla cech jakościowych. Pozwala na klasyfikację wartości badanej cechy na podzbiory np. kolor żółty albo zielony lub płeć)
*porządkowa (pozwala na klasyfikacje i uporządkowanie określonych cech. Ma zastosowanie dla cech ilościowych i jakościowych np. wykształcenie, miejsce zamieszkania.
*przedziałowa ( stosowana dla cech ilościowych i jakościowych. Cechą tej skali jest brak stałego zera a określone przedziały na tej skali maja określoną długość np. w badaniu dowolnym, czy w badaniu rynku produktu jakiegoś tam. Zero ma pozycję ustaloną. Ta skala służy do badania rynku np. skale temperaturowe
*skala stosunkowa ( proporcjonalna) – w tej skali mamy zero absolutne. Jest tylko dla liczb a przedziały mają określoną długość
KONTROLA ZEBRANEGO MATERIAŁU
a) formalna
b) merytoryczna
ad a) sprawdzamy odpowiedzi dotyczące cech stałych ( co gdzie i kiedy?)
ad b) sprawdzamy odpowiedzi dotyczące cech zmiennych
CO TO JEST BŁĄD BRAKU ODPOWIEDZI – jest to niekompletna ankieta.
OPRACOWANIE ZEBRANEGO MATERIAŁU
a) szereg statystyczny
b) tablice statystyczne
c) wykresy statystyczne
ad a) szereg statystyczny dzielimy na:
- grupa pierwsza: wyliczający (szczegółowy)
- grupa druga: rozdzielcze ( strukturalny, lub ważony). Te dzielimy na rozdzielcze dla cechy ZEWNĘTRZNEJ oraz rozdzielcze dla cechy NIE MIERZALNEJ.
- grupa trzecia: przestrzenne
- grupa czwarta: czasowe w podziale na szeregi momentów i okresów.
Cecha mierzalna to inaczej ilościowa a cecha nie mierzalna to inaczej cecha jakościowa
Zadanie 1)
Szereg wyliczający czasu dojazdu studentów GWSH w Katowicach 05,04.2006 ( w minutach)
23,34,45,23,34,23,45 – jest to szereg wyliczający ( źródło dane umowne) ( jest ważne aby jednostka danych też była w opisie. W tym przypadku to minuty)
Cechy: charakter ciągły, szereg rozdzielczy punktowy.
Legenda:
n- liczba obserwacji w danej próbie
xi – ciąg wartości obserwacji w próbie
ni- liczebność albo częstość powtarzania się z x:
∑-suma
Szereg rozdzielczy przedziałowy –
Szereg ważony –
Rodzaje wag:
-częstość względna zapisujemy literką W i =
Szereg czasowy –
Tablica statystyczna – jest to więcej niż jeden szereg statystyczny
Wykresy statystyczne – są ilustracją do szeregów rozdzielczych
Opis statystyczny –to wykonanie analiz wartości badanych cech obserwowanych w próbie. Wyróżniamy trzy rodzaje analiz:
- analiza struktury zbiorowości
- analiza współzależności cech
- analiza zmian zjawisk w czasie
Wnioskowanie statystyczne – to wykorzystanie wyników powyższych analiz do opisu prawidłowości badanych cech w populacjach
ANALIZA STRUKTURY
Wszystkie analizy statystyczne prowadzimy z wykorzystaniem pewnych syntetycznych informacji czyli miar.
Parametry statystyczne – są to liczby służące do opisu zbiorowości statystycznej. Stosowane w analizach parametry dzielimy na cztery grupy:
- miary przeciętne
- zmienności
-asymetrii
-koncentracji
Miary poziomu przeciętnego: dzielimy na:
- klasyczne a te na ( średnią arytmetyczną, średnią geometryczną i harmoniczną)
- miary pozycyjne – Dominanta ( lub też wartość modalna ) i grupa mierników takich jak kwartyle ( kwartyl 1, mediana, kwartyl 2)
Wyznaczenie i interpretacja parametrów statystycznych jest uzależniona od typu szeregu bądź tablicy statystycznej, która służy do analiz
Zadanie 2) szereg wyliczający
_
X – średnia arytmetyczna
Xi – wartość badanej cechy w próbie
Srednia arytmetyczna ważona – szereg rozdzielczy punktowy
k- liczba wartośći cech w szeregu
ni – liczebność tej wartości cechy
n – suma liczebności ni
średnia arytmetyczna ważona – szereg rozdzielczy przedziałowy
k- liczba przedziałów klasowych
xi- środek tego przedziału
średnia arytmetyczna ma jednostkę taką samą jak badana cecha statystyczna ( badamy wiek w latach to średnia też w latach wychodzi)
Własności tego miernika:
a) jest to wypadkowa wartości wszystkich obserwacji z próby
b) suma odchyleń wartości cechy
c) powiększenie wszystkich wartości w próbie o pewną stałą powiększy średnią arytmetyczną o tą wielkość stała.
d) suma wartości zmiennej równa jest iloczynowi średniej arytmetycznej i liczebności próby
e) na poziom średniej bardzo silny wpływ mają wartości extremalne ( największa i najmniejsza w próbie)
średnia harmoniczna – jest pewną wersją średniej arytmetycznej
MIARY POZYCYJNE –
Dominanta ( wartość modalna). To wartość cechy która w danej próbie występuje najczęściej
Przykład szeregu rozdzielczego punktowego:
Przykład szeregu rozdzielczego przedziałowego – celem wyznaczenia dominanty po pierwsze wskazujemy przedział w którym jest wartość dominująca, po drugie wyznaczamy wartość dominanty ( wzór)
x- pierwsza kolumna
n- druga kolumna
k- numer przedziału w którym jest dominanta
x k – lewy koniec przedziału
delta Xk- długość tego wskazanego przedziału
HISTOGRAM – rozkład badanej cechy służy do wyznaczania wartości dominanty metodą graficzną.
KWARTYLE –
Mediana – wartość cechy która dzieli próbę na dwie części w taki sposób że połowa wartości jest nie większa oraz połowa wartości jest nie mniejsza od mediany
Np. 43,56,76,84,102 - Me (mediana)=76 ( szereg wyliczający)
Przy próbie parzystej wyliczamy następująco: 43,56,76,84 = 56+76:2 = 66 ( uśredniamy dwie wartości będące najbliżej środka badanej próby)
PAMIĘTAJ MEDIANA ZAWSZE JEST WYZNACZANA!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
WYZNACZANIE KWANTYLI – daną próbę zawsze trzeba uporządkować rosnąco
Próba nie parzysta – mediana to obserwacja o numerze Me =
Próba parzysta – mediana to Me =
Przykład:
Szereg rozdzielczy punktowy
ANALIZA STRUKTURY CZĘŚĆ DRUGA WYKŁADU
Na miary ZMIENNOŚCI składają się miary KLASYCZNE a do nich zaliczamy:
- wariancje
- Odchylenie przeciętne
- odchylenie standardowe
- Współczynniki zmienności
Na miary ZMIENNOŚCI składają się również miary POZYCYJNE a te na:
- miary proste
-odchylenie ćwiartkowe
-współczynnnik zmienności
Badając zmienność cechy statystycznej obserwowanej próby, badamy odchylenie wartości badanej cechy od wartości przeciętnej. Im mniejsze to odchylenie tym mniejsza zmienność wartości badanej cechy. Słowo zmienność możemy zastąpić w treści zadania ( zróżnicowanie lub dyspersja)np.
Porównaj zróżnicowanie wartość próbek
Próba I
1,2,3,4,5 szereg wyliczający ( mediana =3) mediana to średnia
Próba II
1,3,3,3,5 ( mediana =3) mediana to średnia
Miary poziomu przeciętnego dają nam TEN SAM OPIS!!!!!!!
Obserwujemy odchylenie od wartości średniej:
-2,-1,0,1,2
-2,0,0,0,2 – mniejsze zróżnicowanie wartości mamy w tej próbie badanej cechy
MIERNIKI:
WARIANCJA: jest to średnia ważona, kwadratów odchyleń wartości cechy od wartości przeciętnej
Wzór wariancji dla ( szeregu wyliczającego) –
n- wielkość badanej próby
xi- wartość badanej próby
Komentarz do wzoru – im mniejsza wartość ważonej tym mniejsza zmienność badanej cechy.
Wariancja dla próby pierwszej:
(wariancja w próbie pierwszej jest większa niż w próbie drugiej)
Wariancja dla próby drugiej:
( mniejsza zmienność jest tutaj w drugiej próbie)
Wzór wariancji dla ( szeregu rozdzielczego punktowego)
Wzór –
n – suma liczebności
k – liczba wartość cechy w szeregu
x- ( to jest średnia) ona musi być wyliczona tak jak dla szeregu punktowego ( srednia ważona)
Wzór wariancja dla ( szeregu rozdzielczego przedziałowego)
Wzór-
k- liczba klasz bądź przedziałów klasowych
n- suma liczebności
^
X- środek tego przedziału
IMPLEMENTACJA KAŻDEGO MIERNIKA ZALEŻY OD TYPU KAŻDEGO SZEREGU – im mniejsza wariancja tym mniejsza zmienność
Ze względu na jednostkę wariancji dla interpretacji pomiaru zmienności badanej cechy wyznaczamy dodatkowo pierwiastek kwadratowy z wariancji który nazywa się ODCHYLENIEM STANDARDOWYM
Wzór na odchylenie standardowe - ( oczywiści wzory są różne dla szeregów)
Odchylenie przeciętne : to średnia ważona bezwzględnych odchyleń wartości cechy od wartości przeciętnej .
Wzór na odchylenie przeciętne w szeregu rozdzielczym przedziałowym -
( im mniejsza wartość odchylenia przeciętnego, tym mniejsza wartość badanej cechy)
WSPÓŁCZYNNIK ZMIENNOŚCI:
Używamy go dla porównań poziomu zmienności cech statystycznych badanych z różnymi jednostkami np.: waga, wzrost. Wyznaczamy względną miarę zmienności.
Wzór na współczynnik zmienności –
( współczynnik zmienności jest liczbą niemianowaną, która dla interpretacji zamieniana jest na procent) np: waga 0,2 – 20% lub wzrost 0-35 – 35% ( więszą zmiennośc miała badana cecha wzrostu)
Zadanie numer 2)
Scharakteryzuj zużycie energii w 168 gospodarstwach domowych, na podstawie informacji.
Jest to szerego rozdzielczy przedziałowy
1)średnia arytmetyczna ważona –
...
kinga21114