Niezbędnik ER & DOE.doc

(3138 KB) Pobierz

Strona 1 z 89


 

 

AND



 



 

 



 

 

by David Steppan, Joachim Werner, and Bob Yeater

 

FREEWARE

 

 

 

http://www.jowerner.homepage.t-online.de/index.html

 

Niezbędnik analizy regresji

i planowania eksperymentów

w Excelu

dla chemików i inżynierów

 

Przekład:

Robert Wiśniewski

 

 

http://chomikuj.pl/bobwis

WPROWADZENIE

 

Essential Regression and Experimental Design for Chemists and Engineers został opracowany jako łatwy w użyciu podręcznik towarzyszący pakietowi oprogramowania, który pozwala osobom nie obeznanym ze statystyką na analizowanie danych doświadczalnych i danych ilościowych  korzystanie z regresji wielomianowej i regresji liniowej wielu zmiennych w prosty i zrozumiały sposób. Wg naszego doświadczenia jako chemików i inżynierów, te dwa warianty analizy regresji są najczęściej stosowane do analizy danych. Stanowią one „niezbędne” narzędzia w analizie danych. Szerokie stosowanie programów Microsoft Office ® sprawiło, że opracowaliśmy program niezbędnika analizy regresji  Essential Regression jako dodatek Add-In do MS Excel (skompilowane makro Excela). Użytkownik może dzięki temu pracować w znanym sobie i silnym środowisku analizy danych Excela i nie musi uczyć się obsługi nowego pakietu statystycznego. Inna korzyścią związaną z bezpośrednim korzystaniem z Excela jest to, że ułatwia niektóre, często stosowane i pracochłonne kroki analizy regresji w porównaniu z wielkimi, konwencjonalnymi pakietami, ponieważ wszystkie wejścia i wyjścia regresji mieszczą się w jednym, standardowym zeszycie (pliku), co eliminuje potrzebę poznawania nowego interfejsu. Obejmuje to:

 

1.   Ustawianie tabel wprowadzania danych             
 

2.   Tworzenie, dostosowywanie i drukowanie wykresów             
 

3.   Transfer wyników analizy regresji do innych programów (procesory tekstu, np. Word, programy prezentacji, np. PowerPoint, itp.)  w celu tworzenia raportów (sprawozdań) końcowych             
 

4.   Drukowanie, zapisywanie i ponowne ładowanie wyników.

 

Podręcznik ten i towarzyszące mu programy są intuicyjne i prowadzą czytelnika przez proces ustawiania modelu regresji oraz jego analizy. Oprogramowanie zawiera również plik pomocy Help, który mieści w sobie miniaturowe opisy znaczenia wyników analizy regresji oraz szczegółowe instrukcje korzystania z tego oprogramowania. Wspomniany pomocnik nie jest zamiennikiem niniejszego podręcznika.

 

Podręcznik ten i towarzyszące mu programy opisują i implementują wszystkie narzędzia niezbędne do pełnej analizy regresji. Do analizy regresji  wielu zmiennych można wybierać do ponad 20 zmiennych niezależnych (regresorów), a modele drugiego i trzeciego stopnia (w tym interakcje) można łatwo ustawiać w otwieranych okienkach dialogowych. W module regresji wielomianowej można budować wielomiany do 9-tego stopnia. Towarzyszące oprogramowanie jest najlepiej dostosowane do małych i średniej wielkości zestawów danych liczących nawet do 50-100 punktów danych. Jest to rozmiar, który najczęściej występuje w „codziennych” problemach studentów i naukowców. Nie opracowywano tego oprogramowania do obsługi wielki zestawów danych rzędu tysięcy i więcej punktów danych z jakich korzystają np. badacze z dziedzin socjologii lub farmacji.

 

W podręczniku tym omawiano poniższe zagadnienia. Rozdziały objaśniające możliwości programów zaczynają się od rozdziałów omawiających techniki statystyczne i wprowadzenie do zagadnień teoretycznych. Zagadnienia te obejmują wstęp do analizy regresji, typy modeli, analiza wariancji ANOVA, testowanie hipotez statystycznych analiza wartości odbiegających oraz analiza graficzna z uwzględnieniem wykresów powierzchni. Na końcu podręcznika znajduje się samouczek Tutorial zawierający przykładowe zestawy danych (dołączono je również w postaci plików Excela). Wszystkie prezentowane analizy mogą być łatwo odtworzone przez Czytelnika. Podręcznik ten rozpoczyna się od typowego omówienia współczynników zmienności i analizy wariancji. Można tu znaleźć sekcje opisujące różne parametry statystyczne i analizę reszt przydatne przy sprawdzaniu adekwatności modeli.

 

Przykładowo, znajdują sie tu sekcje omawiające regresję krokową i techniki automatycznego dopasowania, wpływy odpowiedzi i transformacje czynników oraz wykrywanie wartości odbiegających.

 

Chociaż  zagadnienie regresji liniowej jest dobrze znane statystykom, to poświęcono  mu  również trochę miejsca aby mogli z nim zapoznać się również nie-statystycy przy korzystaniu z regresji liniowej do analizy własnych zestawów danych.

Omówiono tu również zagadnienia planowania eksperymentów jako bezpośrednio związane z analizą regresji. Ograniczono się przy tym do czynników i odpowiedzi w postaci zmiennych ciągłych oraz ilościowych. Dobór planów uwzględnia pełne i ułamkowe (rozdzielczość 3-5), dwupoziomowe plany eksperymentów oraz plany Placketta-Burmana. Modelowanie powierzchni odpowiedzi (RSM) obejmuje czołowe, centrowane, opisane oraz wpisane plany Box-Behnkena. Omówiono zalety i wady różnych typów planów. Objaśniono również cenne idee takie jak aliasy, ortogonalność, rotatabilność oraz eksperymenty sekwencyjne.

 

Towarzyszące oprogramowanie Essential Regression and Experimental Design for Chemists and Engineers zawiera wszystkie narzędzia niezbędne do skompletowania planów eksperymentów oraz analizy regresji liniowej w połączeniu z łatwą obsługą i wieloma możliwościami, jakie spotyka się w znacznie droższych komercyjnych pakietach statystycznych.

 

Chociaż powoli stajemy się społeczeństwem elektronicznym, to tradycyjne media wydawnicze rzadko zawierają elementy nowatorstwa pozwalające na poznawanie szczegółów pojęć technicznych. Nawet książki z przykładami oraz oprogramowaniem reprezentują zwykle tradycyjne podejście. Mamy nadzieję, że  prezentowane w tym podręczniku podejście „ucz się przez wykonanie” będzie odebrane jako nowość w dziedzinie edukacji. Jest to istotne zwłaszcza dla dobrze zdefiniowanych koncepcji jaką jest regresja.

 

 

Dave Steppan, Joachim Werner, Bob Yeater

Gibsonia, PA. Bethel Park, PA

Moundsville, WV

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SPIS TREŚCI

 

1. Modele regresji, zmienne, współczynniki

1.1. Podstawy teoretyczne

1.1.1. Wprowadzenie do regresji liniowej

1.1.2 Transformacja zmiennych

1.1.3. Równania modeli regresji

1.1.4. Metoda najmniejszych kwadratów

1.1.5. Przedziały ufności współczynników regresji i obserwacji

1.1.6. Wyraz wolny w modelach regresji

1.2.  Zastosowanie: menu Regress i okienka dialogowe wprowadzania danych do regresji

1.2.1. Przegląd ogólny

1.2.2. Menu Regress

1.2.3. Okienka dialogowe regresji wielomianowej i wielu zmiennych

2. Testowanie istotności modelu i parametrów regresji

2.1. Podstawy teoretyczne

2.1.1. Wprowadzenie do testowania hipotez

2.1.2. Test istotności modelu regresji

2.1.3. Test istotności indywidualnych współczynników regresji

2.1.4. Test braku dopasowania

2.2. Zastosowanie: główne okienko dialogowe regresji wielomianowej i wielu zmiennych (I),              
       wybór członów modelu, analiza wariancji ANOVA oraz tabela wyników

2.2.1. Przegląd ogólny

2.2.2. Obszar wprowadzania zmiennych w głównym okienku dialogowym

2.2.3. Obszar wyników w głównym okienku dialogowym,              
          Tabela analizy wariancji ANOVA i tabela współczynników regresji             
3. Diagnostyka regresji i sprawdzanie adekwatności modelu

3.1. Podstawy teoretyczne

3.1.1. Przegląd ogólny

3.1.2. Współczynniki wielokrotne w modelach w wyrazem wolnym

3.1.3. Współczynniki wielokrotne w modelach bez wyrazu wolnego

3.1.4. Reszty, reszty standardowe i wartości odbiegające

3.1.5. R2 prognozy, indeks precyzji i współczynniki zmienności

3.1.6. Test wielokolinearności, współczynniki inflacji wariancji

3.1.7. Autokorelacja

3.2. Zastosowania: główne okienko dialogowe regresji wielomianowej i wielu zmiennych (II),              
       podsumowanie regresji, analiza reszt, analiza wartości odbiegających oraz VIF

3.2.1. Obszar wyników głównego okienka dialogowego (II), podsumowanie regresji i VIF

3.2.2. Przycisk wartości odbiegających Outlier

3.2.3. Transformacja odpowiedzi w programie Essential Regression

3.2.4. Przycisk wykresów

4. Optymalizacja modelu

4.1. Podstawy teoretyczne

4.1.1. Problem poszukiwania najlepszego modelu regresji

4.1.2. Przeprowadzanie wszystkich możliwych regresji i kryteria szukania najlepszego modelu

4.1.3. Regresja krokowa. Wybór zmiennych w przód

4.1.4. Regresja krokowa. Eliminacja zmiennych wstecz

4.1.5. Automatyczna optymalizacja modelu

4.1.6. Transformacja odpowiedzi

4.2. Zastosowania: główne okienko dialogowe regresji wielomianowej i wielu zmiennych (III),

       obszar regresji automatycznej

4.2.1. Przegląd ogólny

4.2.2. Przeprowadzanie wszystkich możliwych regresji

4.2.3. Regresja krokowa w programie Essential Regression

5. Wyniki analizy regresji

5.1. Ocena graficzna reszt

5.2. Przewidywanie obserwacji

5.3. Zastosowania: arkusz wyników XLS Output Worksheet programu Essential Regression

5.3.1. Przycisk tworzenia arkusza Make XLS – przegląd ogólny

5.3.2. Tabela analizy wariancji ANOVA, tabela współczynników regresji i macierz korelacji

5.3.3. Tabele wyników obserwacji, prognoz, reszt i wartości odbiegających

5.3.4. Drukowanie wyników

5.3.5. Prognozowania nowych obserwacji

5.3.6. Szukanie zmiennych wejściowych dla danego wyniku (problem optymalizacji)

5.3.7. Wykresy: wykresy punktowe, przedziały ufności, wykresy 3D oraz animacje

5.3.8. Usuwanie lub duplikowanie arkusza wyników

5.3.9. Uruchamianie nowej regresji w arkuszu wyników

6. Planowanie eksperymentu

6.1. Wprowadzenie

6.2. Wybieranie planów

6.2.1. Pełny, dwupoziomowy plan czynnikowy eksperymentu

6.2.2. Dwupoziomowe, czynnikowe plany ułamkowe eksperymentu

6.2.3. Korzystanie z programu EED dla dwupoziomowego, ułamkowego planu eksperymentu

6.2.4. Plany Placketta-Burmana

6.3. Ortogonalność i rotatabilność

6.4. Modelowanie planów powierzchni odpowiedzi (RSM)

6.4.1. Wpisane, złożone plany centralne

6.4.2. Opisane, złożone plany centralne

6.4.3. Czołowe, złożone plany centralne

6.4.4. Plany Boxa-Behnkena

6.5. Podsumowanie

7. Szybki przewodnik i samouczek

7.1.  Ważne informacje

7.2.  Instalacja

7.3.  Ładowanie Essential Regression w MS Excel

7.4. Wykonywanie analizy regresji na podstawie pliku danych ER_Test.xls

7.5.  Usuwanie (rozładowanie) Essential Regression

7.6.  Ładowanie Essential Experiment Design do MS Excel

7.7.  Tworzenie prostego planu eksperymentu i analizowania go              
         za pomocą Essential Experimental Design (EED)

7.8.  Usuwanie (rozładowanie) Essential Experimental Design (EED)

8. Literatura

9. Indeks

 

 

SPIS TABEL

 

Tab.3-1. Wybieranie wartości krytycznych d wg Durbina-Watsona

Tab. 6-1. Pełny, dwupoziomowy plan eksperymentu dla dwóch czynników

Tab. 6-2. Pełny, dwupoziomowy plan eksperymentu dla trzech czynników

Tab. 6-3. Główny dwupoziomowy plan ułamkowy eksperymentu dla trzech czynników

Tab. 6-4. Definiowane rozdzielczości planu

Tab. 6-5. Arkusz planu eksperymentu (I)- Charakterystyka planu

Tab. 6-6. Arkusz planu eksperymentu (II) – Tabela planu

Tab. 6-7. Generatory arkusza aliasów

Tab. 6-8. Słowa definiujące na podstawie arkusza aliasów

Tab. 6-9. Raport wyników aliasów

Tab. 6-10. Symulowanie planów

Tab. 6-11. Główny, dwupoziomowy plan ułamkowy eksperymentu o rozdzielczości 3

Tab. 6-12. Arkusz wyników planu eksperymentu – Charakterystyka planu

Tab. 6-13. Arkusz wyników planu eksperymentu -  Tabela planu

Tab. 6-14. Wyniki wpisanego planu CCD dla dwóch czynników

Tab. 6-15. Plan wpisany CCD dla dwóch czynników z czterema punktami centralnymi

Tab. 6-16. Plan wpisany CCD dla trzech czynników

Tab. 6-17. Wyniki EED centralnego planu opisanego dla trzech czynników

Tab. 6-18. Wyniki EED czołowego planu centrowanego dla trzech czynników

Tab. 6-19. Plan Boxa-Behnkena dla trzech czynników

Tab. 6-20. Liczba czynników i prób dla każdego typu planu eksperymentu

Tab. 6-21. Możliwa i zalecana liczba punktów centralnych

 

 

SPIS RYSUNKÓW

 

Rys. 1-1. Menu regresji Regress

Rys. 1.2. Okienko dialogowe regresji wielu zmiennych

Rys. 1-3. Okienko dialogowe regresji wielomianowej

Rys. 2-1. Główne okienko dialogowe ER z wybraną nazwą modelu, ANOVA i tabelą współczynników

Rys. 3-1. Główne okienko dialogowe: z podświetloną tabelą podsumowania wyników i tabelą VIF

Rys. 4-1. Obszar regresji automatycznej AutoRegress

Rys. 4-2. Wyniki analizy wszystkich możliwych transformacji y.

Rys. 5-1. Wykres rozkładu normalnego (ranking w funkcji reszt)

Rys. 5-2. Wykres rozkładu normalnego z możliwym trendem (wyznaczonym za pomocą linii)

Rys. 5-3. Reszty w funkcji prognozowanego wyniku i możliwe transformacje dla stabilizacji wariancji

Rys. 5-4. Typowy wykres prognozy y z przedziałami ufności dla średniego wyniku na poziomie             
                 istotności 95 % w funkcji regresora X.

Rys. 5-5. Komunikat utworzenia arkusza po klinięciu przycisku Make XLS

Rys. 5-6. Przycisk Make XLS

...

Zgłoś jeśli naruszono regulamin