A A A



Statgraphics Centurion 19 to nowy krok w aktualizacji tego oprogramowania. Obecna wersja wprowadza m. in. nowy wstążkowy interfejs, 15 nowych procedur statystycznych, usprawnia także 40 procedur istniejących już w poprzedniej wersji, udostępnia interfejs dla języka Phyton, wprowadza ważne modyfikacje kreatora Design of Experiments Wizard oraz nowe procedury uczenia maszynowego.

UWAGA! - Obecna wersja wprowadza także zmiany w licencjonowaniu oprogramowania - jest ona dostępna tylko na zasadzie odnawianej corocznej subskrypcji.

Poniżej zebraliśmy najważniejsze nowości dodane w wersji 19.

Nowy interfejs w kształcie wstążki

Statgraphics 19 wprowadza nowy wstążkowy interfejs. Użytkownik ma także do dyspozycji pasek szybkiego dostępu, pozwalający na prostszy i szybszy dostęp do ulubionych i najczęściej wykorzystywanych procedur.


W obecnej wersji wprowadzono także tryb pojedynczego okna, łączącego wszystkie dane wyjściowe w jeden format, który ma postać raportu. Przełączenie pomiędzy trybami wyświetlania umożliwia opcja Switch.


Dashboard

Pośród okien StatFolio pojawił się nowy pulpit nawigacyjny Dashboard, który pozwala wyświetlać obok siebie tabele oraz wykresy z różnych analiz. W przypadku takich procedur jak wykresy kontrolne, analizy zdolności, regresje, czy badania pomiarowe, tło tabeli lub wykresu może mieć kolor zielony, żółty lub czerwony, w zależności od stanu wybranych wskaźników.


Mieszaniny rozkładów jednowymiarowych

Procedura Univariate Mixture Models dopasowuje rozkład do ciągłych danych liczbowych, które składają się mieszaniny dwóch (lub więcej) jednowymiarowych rozkładów normalnych. Składniki mieszaniny mogą reprezentować różne grupy w próbce stosowanej do dopasowania ogólnego rozkładu lub model mieszaniny może przybliżać pewien rozkład o skomplikowanym kształcie. Procedura dopasowuje rozkład, tworzy wykresy oraz oblicza wartości krytyczne i obszary leżące w długim ogonie.


Mieszaniny rozkładów dwuwymiarowych

Procedura Bivariate Mixture Models dopasowuje rozkład do ciągłych danych liczbowych, które składają się mieszaniny dwóch (lub więcej) dwuwymiarowych rozkładów normalnych. Składniki mieszaniny mogą reprezentować różne grupy w próbce stosowanej do dopasowania ogólnego rozkładu lub model mieszaniny może przybliżać pewien rozkład o skomplikowanym kształcie. Procedura dopasowuje rozkład i tworzy wykresy dopasowanego modelu. Dostępne są także narzędzia do określania ile komponentów jest wymaganych do reprezentacji próbki danych.


Odcinkowa regresja liniowa

Procedura Piecewise Linear Regression została zaprojektowana tak, by pasowała do modelu regresji, w którym zależność pomiędzy zmienną zależną Y a zmienną niezależną X jest funkcją ciągłą składającą się z dwóch lub więcej segmentów liniowych. Funkcja jest szacowana przy użyciu metody najmniejszych kwadratów. Użytkownik określa liczbę segmentów i wstępne szacunki lokalizacji , w których segmenty łączą się. Następnie procedura szacuje nachylenia oraz zmiany nachylenia i ich lokalizacje.


Badania stabilności

Badania stabilności są powszechnie stosowane przez firmy farmaceutyczne do szacowania tempa degradacji leków i określania okresu przydatności do spożycia. Pomiary są zwykle wykonywane na próbkach z wielu partii leków w różnych momentach czasu. Głównym przedmiotem zainteresowania jest oszacowanie czasu, w którym dolna granica przewidywana z modelu degradacji przekracza dolną granicę specyfikacji dla danego leku. W zależności od struktury danych partie mogą być traktowane jako czynnik stały lub losowy.


Regresja kwantylowa

Procedura ta implementuje proces uczenia maszynowego do przewidywania obserwacji z danych. Tworzy modele dwóch postaci: modele klasyfikacji i modele regresji. Modele są konstruowane przez utworzenie drzewa, którego każdy węzeł odpowiada decyzji binarnej. Biorąc pod uwagę szczególną obserwację, podróżuje się po gałęziach drzewa aż do znalezienia liści kończących. Każdy liść drzewa jest związany z przewidywaną klasą lub wartością.


Testy równoważności – Porównanie odchyleń

Dodano nowe procedury w celu wykazania równoważności lub równoważności wariancji populacji. Jedna procedura porównuje wariancję pojedynczej próbki z wartością docelową, podczas gdy druga porównuje wariancje próbek pobranych z dwóch różnych populacji. W drugim przypadku próbki uważa się za „równoważne”, jeśli stosunek ich odpowiednich odchyleń standardowych mieści się w określonym przedziale otaczającym 1.


Decision Forest

Procedura losowych lasów decyzyjnych implementuje proces uczenia maszynowego w celu przewidywania obserwacji na podstawie danych.
Procedura to tworzy modele dwóch form:
  • Modele klasyfikacyjne, które dzielą obserwacje na grupy na podstawie ich obserwowanych cech.
  • Modele regresji, przewidujące wartość zmiennej zależnej.

    Modele konstruowane są poprzez utworzenie dużej liczby drzew decyzyjnych i uśrednienie prognoz z tych drzew. Wiele drzew jest konstruowanych przy użyciu procedury podobnej do procedury drzew klasyfikacyjnych i regresyjnych, z losową optymalizacją węzłów i „baggingiem” tj. agregacją bootstrapową.


    Regresja zliczania zawyżonych zer

    Procedura Zero Inflated Count Regression jest zaprojektowana tak, aby pasowała do modelu regresji, w którym zmienna zależna Y składa się ze zliczeń. Dopasowany model regresji wiąże Y z jedną lub większą liczbą predyktorów X, które mogą być ilościowe lub jakościowe. Model ten jest podobny do procedur regresji Poissona i ujemnej regresji dwumianowej, z tym wyjątkiem, że zawiera dodatkowy składnik reprezentujący występowanie większej liczby zer, których można by oczekiwać w tych modelach. Dane zawierające nadmiar zer są bardzo powszechne, np. liczba dni, w których uczeń jest nieobecny w szkole, liczba roszczeń ubezpieczeniowych w populacji, w której nie każdy ma ubezpieczenie, czy liczba usterek w wyprodukowanym produkcie.


    Diagramy Venna i Eulera

    Procedura Venn and Euler Diagrams tworzy diagramy, które pokazują względną częstotliwość występowania zdarzeń dyskretnych. Składają się z okrągłych obszarów, które reprezentują częstotliwość określonych zdarzeń, gdzie nakładanie się kół wskazuje na jednoczesne wystąpienie więcej niż jednego zdarzenia.


    Wykresy typu Waterfall

    Do wersji Statgraphics Centurion 19 dodano 3 rodzaje wykresów typu Waterfall:
  • wykres uporządkowany
    Uporządkowane wykresy typu Watterfall służą do zilustrowania tego, w jaki sposób zmienna będąca przedmiotem zainteresowania wzrasta lub maleje w próbie osób(?). Wartości danych są sortowane i wykreślane jako wykres słupkowy, zazwyczaj w odniesieniu do linii bazowej równej 0. Do wykresu można dodać linię odniesienia, aby wyświetlić wartość docelową.
  • wykres sekwencyjny
    Wykresy sekwencyjne typu Waterfall służą do zilustrowania skumulowanego wpływu dodatnich i ujemnych wkładów w wartość całkowitą. Słupki przedstawiają każdy wkład, a także sumy i sumy częściowe. Aplikacje obejmują analizę finansową, analizę zapasów, analizę wydajności, zatrudnianie i dane demograficzne.
  • wykres trójwymiarowy
    Trójwymiarowe wykresy typu Waterfall służą do wyświetlania wielu kolumn danych w odniesieniu do wspólnej zmiennej. Jednym z często spotykanych przykładów jest wykres kumulatywnego rozpadu widmowego, na którym widma są nanoszone wielokrotnie, aby zilustrować zmiany amplitudy jako funkcję zarówno częstotliwości, jak i czasu. Ogólnie wykresy są używane do pokazania zmian zmiennej ilościowej w zależności od czasu i innego czynnika.


    Interface języka Phyton

    Wersja 19 wprowadza również interfejs do języka programowania Python. Dodano procedury, które ułatwiają przekazywanie danych pomiędzy programem Statgraphics Centurion i Python. Z poziomu Statgraphics można także pisać skrypty w tym języku i wykonywać je.


    K-Means Clustering

    Procedura K-Means Clustering implementuje proces uczenia maszynowego w celu tworzenia grup lub klastrów wielowymiarowych zmiennych ilościowych. Klastry tworzy się poprzez grupowanie obserwacji, które znajdują się blisko siebie w przestrzeni zmiennych wejściowych. Obliczenia wykonuje moduł Scikit-learn w programie Python.


    Nowe rozkłady prawdopodobieństwa

    Do listy rozkładów dostępnych do dopasowywania danych i generowania liczb losowych dodano kilka nowych rozkładów prawdopodobieństwa:
  • Rozkład Poissona zawyżonych zer (zero-zawyżone)
  • Ujemny rozkład dwumianowy zawyżonych zer (zero-zawyżone)
  • Dystrybucje Johnsona SB, SL i SU


    Analiza zgodności

    Analiza zgodności została dodana do procedur określania zdolności na podstawie danych atrybutów. Analiza ta służy do określenia, w jakim stopniu proces jest zgodny ze specyfikacjami podanymi pod względem liczby niezgodnych elementów w opakowaniu.


    Wykresy słupkowe

    Do pojedynczych i złożonych wykresów słupkowych można teraz dodać opcjonalnie linię.


    Ogólne modele liniowe (GLM)

    Do procedury GLM dodano stopniowy wybór zmiennych zarówno dla czynników ilościowych, jak i jakościowych. Ponadto uproszczono wprowadzanie interakcji i innych warunków wysokiego rzędu.


    Poza tym

  • Do istniejących procedur statystycznych dodano w wersji 19 kilka nowych testów:
    Test Levene'ado porównywania wariancji wielu próbek.
    Test Walda-Wolfowitza, który sprawdza hipotezę, że dwie niezależne próby pochodzą z tej samej populacji.
    Test wielokrotnych porównań Games-Howell Post-Hoc w procedurze Oneway ANOVA.
  • Wykresy statystycznej kontroli procesu - liczba punktów przeliczeniowych dla granic kontrolnych została zmieniona z 4 na 9.
  • Wykres brakujących danych – do opcji Data Viewer dodano wykres pokazujący lokalizację brakujących danych w zestawie danych.
  • Sparowane porównania próbek - do procedury porównania sparowanych próbek dodano dwa nowe wykresy diagnostyczne: wykres ukośny, który wykreśla sparowane wartości za pomocą linii ukośnej oraz drugi, który wykreśla residua z linii Y=X.

    Inne wybrane zmiany wprowadzone w wersji 19

    - możliwość cofnięcia kilku następujących po sobie operacji w edytorze danych,
    - możliwość odwrócenia kolejności wierszy w arkuszu danych,
    - możliwość zapisywania obrazów zawartych w StatGallery w postaci plików graficznych,
    - możliwość zapisywania wykresów z przezroczystym tłem,
    - możliwość zmiany wielkości punktu podczas zapisywania wykresów,
    - opcjonalne linie oddzielające skupienia na dendrogramie,
    - bezpośredni import danych z plików projektu Minitab, plików transportowych SAS i plików przenośnych SPSS.


    Nowości Statgraphics Centurion 19
    Zestawienie funkcjonalności Statgraphics Centurion 19
  •