Regresja zaawansowana - Statgraphics Technology, Inc. - Statgraphics Centurion

Moduł Regresja Zaawansowana (Advanced Regression) obejmuje siedem typów analiz:

Główne modele liniowe (General Linear Models)
Modele kalibracyjne (Calibration Models)
Porównanie krzywych regresji (Comparison of Regression Lines)
Wybór modelu regresji (Regression Model Selection)
Regresja nieliniowa (Nonlinear Regression)
Regresja z wygładzaniem (Ridge Regression)
Regresja logistyczna (Logistic Regression)
Ogólna konstrukcja analiz regresji

Główne modele liniowe

Ta procedura pozwala analizować jedną lub więcej ciągłych zmiennych zależnych oraz jedną lub więcej zmiennych niezależnych, bez względu na to, czy są one typu kategorycznego czy ilościowego. Zależność pomiędzy zmiennymi wyrażona jest w postaci równania zawierającego człon sum ważonych wartości zmiennej niezależnej oraz człon wszystkich niewiadomych (z uwzględnieniem błędu nieznanych efektów). Procedurę tą stosuje się w przypadku regresji, analizy wariancji, wieloczynnikowej analizy wariancji lub do analizy kowariancji.
Analiza głównych modeli liniowych pozwala na wyspecyfikowanie więcej niż jednej zmiennej zależnej, dopasowuje model do każdej z nich; umożliwia również przeprowadzenie wieloczynnikowej analizy wariancji. Program dopuszcza efekty krzyżowe i grupowe (nested). Tworzy tabele zawierające wartości przewidywane oraz reszty. Pozwala na określenie członu błędu połączonego z każdym efektem modelu.

Porównanie krzywych regresji

Procedura ta pozwala dopasować prosty model regresji postaci Y=a+bX do dodatkowej zmiennej kategorycznej. Do każdego poziomu zmiennej kategorycznej są dopasowane oddzielne krzywe. Można wówczas porównać punkty przecięcia prostych z osiYąwspółrzędnych oraz ich nachylenie dla różnych poziomów zmiennej.

W analizie porównania krzywych regresji program automatycznie konstruuje potrzebne zmienne wskaźnikowe, pozwalające na porównanie dwu lub więcej modeli regresji prostej, zwykle w celu sprawdzenia możliwości zastosowania modelu dla kilku grup. Najpierw wprowadza się model postaci Y=a+bX i grupuje zmienne, a następnie program dodaje zmienne wskaźnikowe; dopasowuje oddzielne krzywe dla każdego z poziomów zmiennej kategorycznej i pozwala określić jak różnią się ich nachylenia oraz punkty przecięcia z osią współrzędnych.

Modele kalibracyjne

Polepszenie jakości wiąże się z główną strategią biznesu, dotycząca pewności, że części i procesy prowadzą do otrzymania produktu odpowiadającego wymaganiom kilenta. Wymaga to ciągłej analizy danych i włączania uzyskanych wyników w proces produkcyjny aby zapobiec ewentualnym błędom produkcji.

Analiza ta pozwala na zdefiniowanie jednostek standardowych, skalibrowanie instrumentów, tak by odpowiadały tym standardom, a następnie ich wykorzystanie do kontroli jakości procesu. Analiza modeli kalibracyjnych umożliwia znalezienie krzywej kalibracyjnej dopasowującej dane, pozwala na wybór dopasowania. Użytkownik ma możliwość odrzucenia stałej określającej przesunięcie krzywej kalibracyjnej względem początku układu współrzędnych, dołożenia wag dla każdej z obserwacji (regresja ważona). Jeśli wyniki doświadczalne powtarzają się, można przeprowadzić analizę zgodności dopasowania oraz stworzyć tabelę analizy wariancji. Program daje możliwość zapamiętania krzywej regresji do późniejszego wykorzystania.

Procedura ta wykorzystuje model regresji Y=aX+b do oszacowania wartości X i Y. Najpierw należy wyznaczyć doświadczalnie krzywą kalibracyjną: wziąć kilka prób o znanej wielkości (X), zmierzyć je za pomocą kalibrowanego urządzenia czy procesu (Y), a następnie wykreślić pary pomiarów w płaszczyźnie XY. Wówczas można zastosować krzywą kalibracyjną do przełożenia pomiarów ze skali urządzenia pomiarowego czy procesu na przedziałowe oszacowanie prawdziwej wielkości.

Wybór modelu regresji

Analiza ta dopasowuje modele regresji wielorakiej z uwzględnieniem wszystkich lub wybranych kombinacji zmiennych niezależnych. Przedstawia wyłącznie modele o największej wartości statystyki R-kwadrat lub najmniejszej wartości statystyki Mallowsa Cp. W analizie wyboru modelu regresji system wybiera najlepszy podzbiór badanych zmiennych, na podstawie kryteriów określonych przez użytkownika w polu dialogowym "Wyboru modelu regresji", liczy statystyki dla wszystkich możliwych modeli liniowych i porządkuje te wartości tak aby wybrał "najlepszy" model.

Regresja nieliniowa

Celem regresji nieliniowej jest znalezienie metodą najmniejszych kwadratów rozwiązania modelu nieliniowego. Model taki nie może być określony za pomocą algeby macierzy, tak jak w regresji liniowej. Najpierw należy zdefiniować funkcję, którą program wykorzysta do dopasowania danych. Następnie wybiera się algorytm poszukiwań iteracyjnych (Marquardta, Gaussa-Newtona lub metodę krokową). Każdy z nich wymaga określenia wartości początkowych oszacowanych parametrów. Niebezpieczeństwem tego typu optymalizacji jest znalezienie przez program minimum lokalnego zamiast globalnego. Aby zapobiec tego typu sytuacji proponuje się kilkakrotne przeprowadzenie analizy. Należy pamiętać że różne wartości startowe prowadzą do różnych oszacowań parametrów. Analiza ta dopasowuje nieliniowe modele regresji wielorakiej. Użytkownik ma możliwość określenia wartości początkowych dla każdego z oszacowanych parametrów oraz wyboru trzech różnych modeli estymacji (Marquardta, Gaussa-Newtona, model krokowy).

Regresja z wygładzaniem

Analiza ta pozwala na zmodyfikowanie metody najmniejszych kwadratów w celu oszacowania modelu regresji wielorakiej. Wyniki oszacowania są bardziej dokładne niż uzyskane za pomocą zwykłej metody najmniejszych kwadratów, w przypadku gdy zmienne niezależne są skorelowane, są one bliższe "wartości prawdziwej" parametru.

Rozwiązania multikolinearnych problemów uzyskuje się za pomocą zmodyfikowanej metody najmniejszych kwadratów (z dopuszczeniem estymatorów obciążonych dla współczynników regresji). Tabele i wykresy oryginalnych i standaryzowanych współczynników oraz współczynniki inflacji wariancji pomagają określić najbardziej wygładzony parametr.

Regresja logistyczna

Procedura regresji logistycznej umożliwia analizę danych dwu postaci:
- zmienna zależna składa się z indywidualnych obserwacji (o wartościach 0 lub 1), z których każda reprezentuje osobny wynik;
- zmienna zależna zawiera prawdopodobieństwa z przedziału pomiędzy 0 a 1, będące proporcjami sukcesów dla grup obserwacji (rozmiar grup może być różny).

Analiza ta oszacowuje modele regresji wielorakiej w przypadku gdy zmienna odpowiedzi ma postać binarną. Można analizować albo indywidualne obserwacje (0,1) lub proporcje (ilorazy) z rozmiarami grup. Zmienna niezależna może być zmienną kategoryczną lub ilościową. Opcje graficzne i tekstowe ułatwiają oszacowanie dokładności i adekwatności modelu.

Ogólna konstrukcja analiz regresji

Każda z analiz zawartych w module Regresja zaawansowana stosuje koncepcję budowania modelu (model-building).
Koncepcję tą można przedstawić w postaci następującej:
- zebranie i przygotowanie danych
- zredukowanie liczby analizowanych zmiennych (jeśli to możliwe)
- wybór modelu
- zweryfikowanie z założeniami; wyłapanie problemów dotyczących multikolinearności, autokorelacji lub źle uwarunkowanych danych
- stwierdzenie ważności modelu.

Zbieranie danych uzależnione jest od rodzaju analizy.
Stwierdzenie ważności modelu jest bardzo istotną częścią badań. Przed zastosowaniem danego modelu regresji do prognozowania nowych obserwacji dobrze jest sprawdzić go na znanych przykładach.

drukuj

« powrót