A A A



Statgraphics Centurion 18 rozszerza działanie istniejących już procedur oraz dodaje nowe. Łącznie w najnowszej wersji programu pojawiło się 31 nowych procedur i Statletów. Wśród nich można znaleźć np Statlet Demographic Map Visualizer, który stanowi idealne narzędzie dla osób zajmujących się między innymi statystyką społeczną, jak również procedurę Heat Map, która może zainteresować choćby fizyków i inżynierów zajmujących się termodynamiką. Poniżej prezentujemy nowości dodane w wersji 18. Każdej procedurze oraz każdemu Statletowi towarzywy zrzut przedstawiający działanie oraz opis tego działania.

Statlet Attribute Capability Analysis

Statlet wykonuje analizę zdolności przy użyciu danych atrybutów. Dane mogą składać się zarówno z pewnej liczby niezgodnych elementów w próbce, jak i ze wszystkich niezgodności, jeśli dana pozycja może mieć więcej niż jedną niezgodność. Analiza oparta jest na rozkładzie dwumianowym lub rozkładzie Poissona. Statlet obliczy oszacowanie parametrów, granice ufności lub górne granice ufności, wskaźniki zdolności (zarówno najlepsze oszacowanie, jak i górną granicę) oraz DPM (defekty na milion). Analiza może opierać się na podejściu klasycznym lub subiektywnym.

Wielkie zbiory danych

W celu ułatwienia pracy z wielkimi zbiorami danych, opracowany został specjalny typ pliku o nazwie Statgraphics Big Data. Pliki tego typu mają rozszerzenie .sgb zamiast .sgd. Od standardowych plików danych programu Statgrahics, odróżniają je dwie ważne kwestie:
  • Przechowują dane liczbowe w formacie binarnym, a nie jako tekst. Pozwala to uniknąć etapu konwersji każdej wartości z danych na liczbę, gdy jest ona czytana w programie.
  • Dane przechowywane są w kolejnych kolumnach, a nie w kolejnych wierszach. Takie podejście znacznie skraca czas wykonywania operacji, gdy poszczególne kolumny są wczytywane do pamięci.
Korzystając z plików Statgraphics Big Data, program Statgraphics jest w stanie analizować zestawy danych składające się z wielu milionów rekordów i tysięcy kolumn. Dostęp do plików tego typu umożliwia jedynie
64-bitowa wersja programu Statgraphics 18.



Statlet Bivariate Density

Statlet ten zwraca szacowaną funkcję gęstości dla dwóch kolumn zawierających dane liczbowe. Generuje ją wykorzystując dwuwymiarowy wykres konturowy lub trójwymiarowy histogram częstości. Użytkownik może wcześniej zażądać, że ma zostać użyty rozkład wielowymiarowy, jak również, że szacowanie ma zostać wykonane przy użyciu podejścia nieparametrycznego.



Procedura Butterfly Plot

Wykres ten porównuje dwie próbki danych atrybutów. Składa się z dwóch zestawów słupków, które pokazują rozkład częstości każdej próbki w zestawie kategorii.



Procedura Capability Control Charts

Procedura ta tworzy wykresy statystycznego sterowania procesowego Phase II dla wskaźników zdolności monitorowania, takich jak Cp i Cpk. Biorąc pod uwagę proces, który uważa się za zdolny do zaspokojenia określonych wymagań w oparciu o analizę danych zmiennych, wykresy te monitorują stałą zgodność z tymi wymaganiami.



Statlet Capability Control Chart Design

Ten Statlet pomaga analitykom w określaniu, jak duże powinny być próbki przy konstruowaniu wykresów kontroli zdolności. Wykresy kontroli zdolności monitorują procesy, które okazały się stabilne i zdolne do uzyskiwania wyników, które powodują niewielką liczbę niezgodności.



Procedura Classification and Regression Trees

Procedura ta implementuje proces uczenia maszynowego do przewidywania obserwacji z danych. Tworzy modele dwóch postaci: modele klasyfikacji i modele regresji. Modele są konstruowane przez utworzenie drzewa, którego każdy węzeł odpowiada decyzji binarnej. Biorąc pod uwagę szczególną obserwację, podróżuje się po gałęziach drzewa aż do znalezienia liści kończących. Każdy liść drzewa jest związany z przewidywaną klasą lub wartością.



Statlet Demographic Map Visualizer

Ten Statlet ma na celu zilustrowanie zmian statystyk lokalizacji w czasie. Biorąc pod uwagę dane w każdej z k lokalizacji podczas p czasowych okresów, program generuje dynamiczną ilustrację, która pokazuje, jak dane zostały zmienione w każdej lokalizacji. Dane w każdej lokalizacji są ilustrowanej za pomocą bąbli, których rozmiar jest proporcjonalny do obserwowanej wartości danych.



Procedura Diamond Plot

Procedura ta tworzy wykres dla pojedynczej zmiennej ilościowej przedstawiającej n obserwacji próbki oraz przedział ufności dla średniej populacji. Odrębna procedura pozwala wygenerować wiele wykresów tego typu w celu pogrupowania danych.



Procedura Distribution Fitting for Arbitrarily Censored Data

Ta procedura analizuje dane, w których jedna lub więcej obserwacji nie jest dokładnie znana. W szczególności obserwacje mogą być poddane prawej-cenzurze, lewej-cenzurze, przedziałowej-cenzurze lub kombinacji wszystkich trzech typów. Procedura generuje podsumowującą statystykę, dopasowuje rozkłady, tworzy wykresy i oblicza nieparametryczne oszacowanie funkcji przetrwania.



Procedura Donut Chart

Wykres ten jest alternatywą dla wykresu kołowego. Od wykresu kołowego odróżnia go pusty środek.



Procedura Equivalence and Noninferiority Tests

Dodano cztery nowe procedury w celu wykazania równoważności (dwustronne) lub nienaruszalności (jednostronne). Są one wykorzystywane do porównywania dwóch niezależnych średnich, porównania dwóch sparowanych średnich, porównania pojedynczej średniej z wartością docelową i analizy wyników badania krzyżowego (2x2). W przeciwieństwie do standardowych testów hipotezowych mających na celu udowodnienie wyższości jednej metody względem drugiej, testy równoważności mają na celu wykazanie, że dwie metody mają zasadniczo taką samą średnią.



Procedura Heat Map

Ta procedura pokazuje rozkład zmiennej ilościowej we wszystkich kombinacjach dwóch czynników kategorycznych. Jeśli jeden z dwóch czynników reprezentuje czas, to ewolucję zmiennej można łatwo pokazać przy użyciu mapy. Skala kolorów gradientu jest używana do reprezentowania wartości zmiennej ilościowej.



Procedura Likert Plot

Procedura ta analizuje dane zapisane w skali Likerta. Wagi Likerta są powszechnie wykorzystywane w badaniach ankietowych do zapisywania odpowiedzi użytkownika na oświadczenie. Typowa, 5-poziomowa skala Likerta może kodować odpowiedzi użytkownika od zdecydowanie nie zgadzających się, do zdecydowanie zgadzających się. Ta analiza generuje podsumowującą statystykę i wyświetla wyniki wykorzystując wykres słupkowy.



Procedura Multidimensional Scaling

Procedura ta została zaprojektowania w celu wyświetlania danych wielowymiarowych w przestrzeni nieskowymiarowej. Biorąc pod uwagę macierz odległości n x n między każdą parą n obserwacji wielowymiarowych, procedura poszukuje niskowymiarowej reprezentacji tych obserwacji, które zachowują dystans między sobą jak najlepiej. Podstawowym efektem uzyskanym w wyniku działania procedury jest mapa punktów w tej niskowymiarowej przestrzeni (zwykle dwu- lub trójwymiarowej). Obliczenia są wykonywane przez R przy użyciu funkcji cmdscale oraz isoMDS.



Procedura Multivariate Normal Random Numbers

Ta procedura generuje liczby losowe zgodnie z wielomianowym rozkładem normalnym obejmującym do 12 zmiennych losowych. Użytkownik wprowadza wartości średnie zmiennych, ich odchylenia standardowe oraz macierz korelacji. Generowane są losowe próbki, które można zapisać w arkuszu programu Statgraphics.



Procedura Multivariate Normality Test

Ta procedura sprawdza, czy dany zestaw zmiennych losowych mógłby zostać wygenerowany z wykorzystaniem wielowymiarowego rozkładu normalnego. Obejmuje to H test Roystona oraz testy bazujące na wykresie chi-kwadratowym odległości każdej obserwacji z centroida próbki.



Procedura Multivariate Tolerance Limits

Procedura ta wyznacza statystyczne granice dla danych składających się z więcej niż jednej zmiennej. Obejmuje obszar tolerancji, który ogranicza wybrane p% ludności z ufnością 100(1-a)%. Obejmuje również połączone równoczesne granice tolerancji dla każdej ze zmiennych, wykorzystując podejścia Bonferroni. Przyjmuje się, że dane są losową próbką wygenerowaną zgodnie z wielowymiarowym rozkładem normalnym. Wielowymiarowe granice tolerancji są często porównywane ze specyfikacjami wielu zmiennych w celu określenia, czy większość populacji znajduje się w obrębie specyfikacji.



Procedura Orthogonal Regression

Procedura ta ma na celu skonstruowanie modelu statystycznego opisującego wpływ pojedynczego czynnika ilościowego X na zmienną zależną Y, gdy zarówno X jak i Y obserwane są z błędem. Każdy z 27 modeli liniowych i nieliniowych może być dopasowany.



Statlet Population Pyramid

Ten Statlet został zaprojektowany w celu porównywania rozkładu liczby populacji (lub podobnych wartości) między dwiema grupami. Można za jego pomocą wyświetlić ten rozkład w pojedynczej chwili lub można go użyć do zaprezentowania rozkładu zmieniającego się dynamicznie w czasie.



Procedura Ribbon Plot

Ta nowa metoda wyświetlania zdefiniowanej przez użytkownika powierzchni została dodana do różnych procedur, w tym do Kreatora DOE.



Statlet Sunflower Plot

Ten Statlet służy do wyświetlania wykresu punktowego XY, gdy liczba obserwacji jest duża. Aby uniknąć problemów z nakładaniem się symboli punktów, wykorzystywane są glify w kształcie słoneczników służące do wyświetlania liczby obserwacji położonych w małych obszarach przestrzeni XY.



Procedura Text Mining

Ta procedura dialogowa pozwala na wyszukiwanie tekstu przy użyciu biblioteki tm. Użytkownik może wyodrębnić informacje z wielu dokumentów tekstowych lub analizować kolumny danych już załadowanych do arkusza programu Statgraphics.



Procedura Time Series Baseline Plot

Ta procedura generuje wykresy szeregów czasowych w ustalonym porządku, identyfikując punkty przekraczające dolne i/lub górne granice. Jest ona powszechnie używana do tworzenia wykresów danych miesięcznych, takich jak Oceanic Niño Index.



Procedura Tornado Plot

Wykres porównuje dwie próbki danych atrybutów. Składa się z dwóch zestawów słupków, które pokazują rozkład częstości każdej próbki w zestawie kategorii.



Procedura Sensitivity Tornado Plot

Ten wykres pokazuje wpływ każdej zmiennej wejściowej na uzyskany rezultat, gdy ta jest zmieniana w określonym procencie swojego rozkładu prawdopodobieństwa, przy czym wszystkie inne zmienne są utrzymywane w ich wartościach mediany. Zmienne są sortowane od góry do dołu w kolejności ich ogólnego efektu.



Statlet Trivariate Density

Ten Statlet wyświetla szacowaną funkcję gęstości dla trzech kolumn danych liczbowych. Wykonuje to za pomocą trójwymiarowego wykresu konturowego lub trójwymiarowego wykresu siatkowego. Użytkownik może zażądać, aby wspólny rozkład trzech zmiennych był wielowymiarowy lub, aby był szacowany przy użyciu podejścia nieparametrycznego.



Procedura Violin Plot

Wykres ten prezentuje dane dla pojedynczej próbki ilościowej, wykorzystując kombinację wykresu pudełkowego z wąsami oraz nieparametrycznego estymatora gęstości. Jest on bardzo przydatny do wizualizacji kształtu funkcji gęstości prawdopodobieństwa dla populacji, z której pochodzą dane. Odrębna procedura pozwala uzyskać wiele wykresów tego typy dla zgrupowanych danych.



Statlet Wind Rose

Ten Statlet wyświetla dane w postaci okrągłego wykresu przedstawiającego rozkład częstości zmiennych, takich jak prędkość i kierunek wiatru. Można go użyć do wyświetlenia rozkładu w pojedynczej chwili lub można za jego pomocą zademonstrować rozkład dynamicznie zmieniający się w czasie.



Procedura X-13ARIMA-SEATS

Ta procedura przeprowadza okresową korektę danych szeregów czasowych przy użyciu procedury obecnie stosowanej przez Biuro Spisu Powszechnego Stanów Zjednoczonych. W ramach działania procedury szereg czasowy jest rozkładany na 3 elementy: cykl trendu, sezonowość i losowość. Każdy element może być przedstawiony oddzielnie w postaci wykresu lub zapisany wraz z danymi skorygowanymi okresowo. Obliczenia okresowej korekty są realizowane przez pakiet "okresowy" w R.