Statystyka__WYKLADY.doc

(98 KB) Pobierz
Statystyka – obejmuje metody zbierania, prezentacji i analizy danych dotyczących zjawisk masowych

Statystyka – obejmuje metody zbierania, prezentacji i analizy danych dotyczących zjawisk masowych.

Zadaniem statystyki jest – badanie prawidłowości zachodzących w zjawiskach masowych na podstawie badań.

 

BADANIA STATYSTYCZNE –

- planowanie badania

-obserwacja statystyczna

-opracowanie i prezentacja zebranego materiału statystycznego

-opis i wnioskowanie statystyczne

 

Ustalić: cel, przedmiot badania, zakres badania

PRZEDMIOTEM BADAŃ JEST -  populacja generalna ( zbiorowość statystyczna) zbiór przedmiotów bądź osób fizycznych bądź prawnych posiadających wiele cech wspólnych oraz przynajmniej jedną cechę pozwalającą na rozróżnienie elementu zbioru pomiędzy sobą.

JEDNOSTKĄ STATYSTYCZNĄ – nazywamy dowolny element populacji generalnej

Np. przeprowadzamy prognozę budżetu gospodarstw domowych  na terenie miasta Katowice za miesiąc styczeń 2006 ( JEDNOSTKĄ STATYSTYCZNĄ JEST TU JEDNA OSOBA PROWADZĄCA GOSPODARSTWO)

Np. przeprowadzamy badania wyniku testów kier. Turystyka GWSH.

ZAKRES BADANIA – wszystkie badania ze względu na zakres dzielimy na :

a) badania pełne – kiedy badaniu podlega cała populacja

-rejestracja

-spisy

Ad a) są przeprowadzane na potrzeby zarządzania państwem bądź firmą. ( główny urząd statystyczny zbiera informacje)

b) badania częściowe – wybieramy tu pewien podzbiór informacji nazywany próbą statystyczną.

Spisy – są to badania które posiadają datę początku i koniec. Spis obsługuje GUS. Zajmują się tym dodatkowo zatrudnieni ludzie komisarze, spisowi. Np. spisy ludności rolne inwentarzowe.

Rejestracja – prowadzone są w rzeczywistym czasieciągłym, obsługiwane przez urzędy terenowe ( poparte są przepisami prawa)

Spisy ludności -  przeprowadzamy co 10 lat ( ostatni był w 2002 ). Współpracujemy z eurostatą, następnie przekazujemy informacje do Banku Unii Europejskiej.

 

PRÓBA STATYSTYCZNA

( sposoby losowania próby)

 

- zadajemy sobie pytanie jak duża ma być próba?

- jak ma być wybrana?

 

DOBÓR CELOWY JEDNOSTKI STATYSTYCZNEJ DO PRÓBY – świadomie wybieramy te a nie inne jednostki i opisujemy je. Jest to metoda MONOGRAFICZNA W BADANIACH np. nowe jednostki chorobowe.

DOBÓR LOSOWY – Populację wyjściową dzielimy na kilka podzbiorów np. na dwie części choćby losowanie zespołowe. JEST TO METODA REPREZENTATYWNA.

PRÓBA REPREZENTATYWNA – Jest to próba taka że struktura jednostek statystycznych w tej próbie jest analogiczna do struktury jednostek statystycznych w populacji.

 

2. OBSERWACJA STATYSTYCZNA

a) cechy statystyczne

b)skala statystyczna

c)rodzaj ankiety

d)skontrolowanie ankiety

ad a) jakie cechy wyróżniamy:

do stałych:

- rzeczowe

-stałe

-czasowe

-przestrzenne

Do zmiennych:

-jakościowe

-ilościowe a te na:

-skokowe

-ciągłe

 

STAŁE – są to cechy które nie podlegają badaniom. Służą indentyikacji jednostki statystycznej z populacją statystyczną

ZMIENNE – to cechy które podlegają badaniu (realizują cel badania) np.jakie są koszty stałe.

JAKOŚCIOWE -  to cechy których wartości nie wyrażamy liczbowo np: płeć, wykształcenie, forma zatrudnienia

ILOŚCIOWE – wyrażamy wartość za pomocą liczb np. zbiory liczbowe liczb rzeczywistych ( cechy ciągłe dowolna liczba rzeczywista, lub cecha skokowa)

 

Ad b) SKALE STATYSTYCZNE-

- oś liczbowa to cechy ilościowe ciągłe

Wyróżniamy cztery typy skal statystycznych

*nominalna ( stosowana dla cech jakościowych. Pozwala na klasyfikację wartości badanej cechy na podzbiory np. kolor żółty albo zielony lub płeć)

*porządkowa (pozwala na klasyfikacje i uporządkowanie określonych cech. Ma zastosowanie dla cech ilościowych i jakościowych np. wykształcenie, miejsce zamieszkania.

*przedziałowa ( stosowana dla cech ilościowych i jakościowych. Cechą tej skali jest brak stałego zera a określone przedziały na tej skali maja określoną długość np. w badaniu dowolnym, czy w badaniu rynku produktu jakiegoś tam. Zero ma pozycję ustaloną. Ta skala służy do badania rynku np. skale temperaturowe

*skala stosunkowa ( proporcjonalna) – w tej skali mamy zero absolutne. Jest tylko dla liczb a przedziały mają określoną długość

 

KONTROLA ZEBRANEGO MATERIAŁU

a) formalna

b) merytoryczna

ad a) sprawdzamy odpowiedzi dotyczące cech stałych ( co gdzie i kiedy?)

ad b) sprawdzamy odpowiedzi dotyczące cech zmiennych

CO TO JEST BŁĄD BRAKU ODPOWIEDZI – jest to niekompletna ankieta.

 

OPRACOWANIE ZEBRANEGO MATERIAŁU

a) szereg statystyczny

b) tablice statystyczne

c) wykresy statystyczne

ad a) szereg statystyczny dzielimy na:

- grupa pierwsza: wyliczający (szczegółowy)

- grupa druga: rozdzielcze ( strukturalny, lub ważony). Te dzielimy na rozdzielcze dla cechy ZEWNĘTRZNEJ oraz rozdzielcze dla cechy NIE MIERZALNEJ.

- grupa trzecia: przestrzenne

- grupa czwarta: czasowe w podziale na szeregi momentów i okresów.

Cecha mierzalna to inaczej ilościowa a cecha nie mierzalna to inaczej cecha jakościowa 

 

Zadanie 1)

Szereg wyliczający czasu dojazdu studentów GWSH w Katowicach 05,04.2006 ( w minutach)

23,34,45,23,34,23,45 – jest to szereg wyliczający ( źródło dane umowne) ( jest ważne aby jednostka danych też była w opisie. W tym przypadku to minuty)

Cechy: charakter ciągły, szereg rozdzielczy punktowy.

Legenda:

n- liczba obserwacji w danej próbie

xi – ciąg wartości obserwacji w próbie

ni- liczebność albo częstość powtarzania się z x:

∑-suma

 

Szereg rozdzielczy przedziałowy

 

 

 

 

 

 

 

Szereg ważony –

Rodzaje wag:

-częstość względna zapisujemy literką W i =

 

 

 

 

 

 

 

 

Szereg czasowy

 

 

 

 

 

 

Tablica statystyczna – jest to więcej niż jeden szereg statystyczny

Wykresy statystyczne są ilustracją do szeregów rozdzielczych

 

 

 

Opis statystyczny to wykonanie analiz wartości badanych cech obserwowanych w próbie. Wyróżniamy trzy rodzaje analiz:

- analiza struktury zbiorowości

- analiza współzależności cech

- analiza zmian zjawisk w czasie

Wnioskowanie statystyczne – to wykorzystanie wyników powyższych analiz do opisu prawidłowości badanych cech w populacjach

 

ANALIZA STRUKTURY

Wszystkie analizy statystyczne prowadzimy z wykorzystaniem pewnych syntetycznych informacji czyli miar.

Parametry statystyczne – są to liczby służące do opisu zbiorowości statystycznej. Stosowane w analizach parametry dzielimy na cztery grupy:

- miary przeciętne

- zmienności

-asymetrii

-koncentracji

Miary poziomu przeciętnego: dzielimy na:

- klasyczne a te na ( średnią arytmetyczną, średnią geometryczną i harmoniczną)

- miary pozycyjne – Dominanta ( lub też wartość modalna ) i grupa mierników takich jak kwartyle ( kwartyl 1, mediana, kwartyl 2)

 

Wyznaczenie i interpretacja parametrów statystycznych jest uzależniona od typu szeregu bądź tablicy statystycznej, która służy do analiz

 

Zadanie 2) szereg wyliczający

_

X – średnia arytmetyczna

Xi – wartość badanej cechy w próbie

 

 

Srednia arytmetyczna ważona – szereg rozdzielczy punktowy

 

 

 

k- liczba wartośći cech w szeregu

ni – liczebność tej wartości cechy

n – suma liczebności ni

 

średnia arytmetyczna ważona – szereg rozdzielczy przedziałowy

 

k- liczba przedziałów klasowych

xi- środek tego przedziału

 

średnia arytmetyczna ma jednostkę taką samą jak badana cecha statystyczna ( badamy wiek w latach to średnia też w latach wychodzi)

Własności tego miernika:

a) jest to wypadkowa wartości wszystkich obserwacji z próby

b) suma odchyleń wartości cechy

c) powiększenie wszystkich wartości w próbie o pewną stałą powiększy średnią arytmetyczną o tą wielkość stała.

d) suma wartości zmiennej równa jest iloczynowi średniej arytmetycznej i liczebności próby

e) na poziom średniej bardzo silny wpływ mają wartości extremalne ( największa i najmniejsza w próbie)

 

średnia harmoniczna jest pewną wersją średniej arytmetycznej

 

MIARY POZYCYJNE –

Dominanta ( wartość modalna). To wartość cechy która w danej próbie występuje najczęściej

Przykład szeregu rozdzielczego punktowego:

 

 

 

 

 

 

 

 

 

 

Przykład szeregu rozdzielczego przedziałowego – celem wyznaczenia dominanty po pierwsze wskazujemy przedział w którym jest wartość dominująca, po drugie wyznaczamy wartość dominanty  ( wzór)

Legenda:

x- pierwsza kolumna

n- druga kolumna

k- numer przedziału w którym jest dominanta

x k – lewy koniec przedziału

delta Xk- długość tego wskazanego przedziału

 

HISTOGRAM – rozkład badanej cechy służy do wyznaczania wartości dominanty metodą graficzną.

 

 

 

 

 

 

 

KWARTYLE –

Mediana – wartość cechy która dzieli próbę na dwie części w taki sposób że połowa wartości jest nie większa oraz połowa wartości jest nie mniejsza od mediany

Np. 43,56,76,84,102   - Me (mediana)=76 ( szereg wyliczający)

Przy próbie parzystej wyliczamy następująco: 43,56,76,84 = 56+76:2 = 66 ( uśredniamy dwie wartości będące najbliżej środka badanej próby)

PAMIĘTAJ MEDIANA ZAWSZE JEST WYZNACZANA!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

 

WYZNACZANIE KWANTYLI daną próbę zawsze trzeba uporządkować rosnąco

Próba nie parzysta – mediana to obserwacja o numerze  Me =

Próba parzysta – mediana to           Me =

             

Przykład:

Szereg rozdzielczy punktowy

 

 

 

 

 

 

 

 

 

ANALIZA STRUKTURY CZĘŚĆ DRUGA WYKŁADU

Na miary ZMIENNOŚCI składają się miary KLASYCZNE a do nich zaliczamy:

- wariancje

- Odchylenie przeciętne

- odchylenie standardowe

- Współczynniki zmienności

 

Na miary ZMIENNOŚCI składają się również miary POZYCYJNE a te na:

- miary proste

-odchylenie ćwiartkowe

-współczynnnik zmienności

 

Zadanie 1)

Badając zmienność cechy statystycznej obserwowanej próby, badamy odchylenie wartości badanej cechy od wartości przeciętnej. Im mniejsze to odchylenie tym mniejsza zmienność wartości badanej cechy. Słowo zmienność możemy zastąpić w treści zadania ( zróżnicowanie lub dyspersja)np.

Porównaj zróżnicowanie wartość próbek

Próba I

1,2,3,4,5 szereg wyliczający ( mediana =3) mediana to średnia

Próba II

1,3,3,3,5 ( mediana =3) mediana to średnia

Miary poziomu przeciętnego dają nam TEN SAM OPIS!!!!!!!

Obserwujemy odchylenie od wartości średniej:

-2,-1,0,1,2

-2,0,0,0,2 – mniejsze zróżnicowanie wartości mamy w tej próbie badanej cechy

 

MIERNIKI:

WARIANCJA: jest to średnia ważona, kwadratów odchyleń wartości cechy od wartości przeciętnej

Wzór wariancji dla ( szeregu wyliczającego) –

 

n- wielkość badanej próby

xi- wartość badanej próby

Komentarz do wzoru – im mniejsza wartość ważonej tym mniejsza zmienność badanej cechy.

Wariancja dla próby pierwszej:

 

(wariancja w próbie pierwszej jest większa niż w próbie drugiej)

Wariancja dla próby drugiej:

( mniejsza zmienność jest tutaj w drugiej próbie)

 

Wzór wariancji dla ( szeregu rozdzielczego punktowego)

Wzór –

 

 

n – suma liczebności

k – liczba wartość cechy w szeregu

x- ( to jest średnia) ona musi być wyliczona tak jak dla szeregu punktowego ( srednia ważona)

 

 

 

 

 

 

 

 

 

Wzór wariancja dla ( szeregu rozdzielczego przedziałowego)

Wzór-

 

 

k- liczba klasz bądź przedziałów klasowych

n- suma liczebności

^

X- środek tego przedziału

IMPLEMENTACJA KAŻDEGO MIERNIKA ZALEŻY OD TYPU KAŻDEGO SZEREGU – im mniejsza wariancja tym mniejsza zmienność

 

Ze względu na jednostkę wariancji dla interpretacji pomiaru zmienności badanej cechy wyznaczamy dodatkowo pierwiastek kwadratowy z wariancji który nazywa się ODCHYLENIEM STANDARDOWYM

 

Wzór na odchylenie standardowe -                        ( oczywiści wzory są różne dla szeregów)

 

Odchylenie przeciętne : to średnia ważona bezwzględnych odchyleń wartości cechy od wartości przeciętnej .

Wzór na odchylenie przeciętne w szeregu rozdzielczym przedziałowym -             

 

 

( im mniejsza wartość odchylenia przeciętnego, tym mniejsza wartość badanej cechy)

WSPÓŁCZYNNIK ZMIENNOŚCI:

Używamy go dla porównań poziomu zmienności cech statystycznych badanych z różnymi jednostkami np.: waga, wzrost. Wyznaczamy względną miarę zmienności.

Wzór na współczynnik zmienności –

 

( współczynnik zmienności jest liczbą niemianowaną, która dla interpretacji zamieniana jest na procent) np: waga 0,2 – 20% lub wzrost 0-35 – 35% ( więszą zmiennośc miała badana cecha wzrostu)

Zadanie numer 2)

Scharakteryzuj zużycie energii w 168 gospodarstwach domowych, na podstawie informacji.

 

Jest to szerego rozdzielczy przedziałowy

 

 

 

 

 

 

 

 

 

1)średnia arytmetyczna ważona –

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

Zgłoś jeśli naruszono regulamin