ANALIZA DANYCH NIE TYLKO DLA SPECJALISTÓW CO OFERUJE STATSOFT POLSKA? Piotr Ocalewicz, StatSoft Polska Sp. z o.o. Wstęp StatSoft Polska jest polskim biurem StatSoft Inc. - jednego z największych na świecie dostawców rozwiązań służących do wydobywania z danych użytecznej wiedzy. Produkty StatSoft wykorzystywane są powszechnie na całym świecie przez globalne korporacje, przedsiębiorstwa usługowe, handlowe i przemysłowe, instytucje rządowe, instytuty naukowo-badawcze. Biuro StatSoft Polska dostarcza oprogramowanie, zapewnia użytkownikom pomoc techniczną, prowadzi kursy oraz świadczy usługi wdrożeniowe i konsultingowe. Oferowane rozwiązania znajdują zastosowanie praktycznie w każdej branży i w wielu obszarach biznesowych, wszędzie tam, gdzie dzięki nowoczesnym metodom analizy danych można wspomagać procesy decyzyjne i organizacyjne. Niniejszy artykuł zawiera informacje o: programach z rodziny STATISTICA, szkoleniach StatSoft Polska, innych usługach (doradczych, wdrożeniowych itp.), nowościach w ofercie StatSoft Polska. Programy z rodziny STATISTICA ogólne cechy STATISTICA to rodzina profesjonalnych programów wspomagających analizy danych wszelkiego rodzaju: od obliczania podstawowych charakterystyk i wizualizacji danych, poprzez modelowanie klasycznymi metodami statystycznymi, po wykorzystanie nowoczesnych technik optymalizujących pracę z dużymi zbiorami danych (sieci neuronowe, data mining). Narzędzia STATISTICA umożliwiają automatyzację wykonywanych analiz, zapisywanie makr wykonywanych czynności (STATISTICA Visual Basic) oraz wykonywanie analiz danych przez Internet. Wykorzystanie procesorów wielordzeniowych umożliwia wielowątkowe wykonywanie wybranych procedur analitycznych i przekształceń danych. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 5
Programy STATISTICA są dostępne w polskiej, a także innych wersjach językowych. Każdy użytkownik STATISTICA ma dostęp do obszernej pomocy elektronicznej, w której opisana jest każda opcja modułów dostępnych w programie. Zawarte w niej liczne przykłady analiz znacznie ułatwiają poznawanie kolejnych modułów analitycznych. Więcej ogólnych informacji o STATISTICA jest zamieszczonych na stronach internetowych www.statsoft.pl, menu Programy, sekcja Ogólna charakterystyka. Środowisko pracy Programy STATISTICA są znane z prostego w użyciu, intuicyjnego, graficznego środowiska pracy. Można wybrać pracę z menu w postaci wstążki (patrz poniżej) lub z klasycznym menu (użytkownik może w każdej chwili dokonać wyboru). Oprócz interakcyjnego graficznego środowiska użytkownicy mają także dostęp do interfejsu bazującego na STATISTICA Visual Basic, a w specjalnych wersjach dostępny jest interfejs bazujący na przeglądarce internetowej. STATISTICA zapewnia integrację z pakietem MS Office. Dzięki temu, pracując z danymi i wynikami analiz otrzymanymi w STATISTICA, można jednocześnie wykorzystywać narzędzia obu tych popularnych pakietów analitycznego i biurowego. Więcej informacji na www.statsoft.pl/interfac.html. Najwyższej jakości grafika Dostępne w każdym produkcie z rodziny STATISTICA wysokiej jakości narzędzia wizualizacji wyników analiz umożliwiają czytelną prezentację danych i wyników analiz. STATISTICA oferuje setki typów dwuwymiarowych i trójwymiarowych obrazów graficznych, a praktycznie każdy szczegół wyglądu wykresu może być dowolnie zmieniany przez użytkownika. Przy zapisie wykresów STATISTICA w formacie pliku graficznego można określić rozdzielczość (w dpi) dla takich formatów jak TIFF, GIF, PNG, JPG oraz BMP, dzięki czemu można dostosować jakość obrazów do celu, w jakim później chcemy je wykorzystać. Więcej informacji na www.statsoft.pl/graphics.html. 6 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
STATISTICA Mapy to dodatek dla użytkowników aktualnej wersji STATISTICA. Umożliwia graficzne przedstawienie danych dotyczących jednostek administracyjnych na dostępnych szablonach map (podział na województwa oraz powiaty). Więcej informacji na www.statsoft.pl, menu Pobieranie plików, sekcja Mapa Polski. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 7
Zarządzanie wynikami analiz STATISTICA zawiera mechanizmy elastycznego i wygodnego zarządzania wynikami analiz. W trakcie przeprowadzania analiz na wyjściu otrzymujemy wyniki w postaci multimedialnych tabel (arkuszy) i wykresów. Skoroszyty, które zachowują każdy z wynikowych dokumentów w postaci osobnej karty, stanowią domyślny sposób zarządzania wynikami. Możliwe jest także zapisanie utworzonego skoroszytu w formacie HTML, dzięki czemu publikacja wyników pracy w Internecie czy intranecie jest znacznie ułatwiona. Wynikowe arkusze i wykresy mogą być kolejno wstawiane do raportów (w pliku raportu STATISTICA i/lub MS Word) lub zapisywane jako pliki PDF (dotyczy to także m.in. raportów STATISTICA). Więcej informacji na www.statsoft.pl/output.html. Dostęp do danych STATISTICA jest zoptymalizowana pod kątem pracy z dużymi plikami danych. Możliwa jest wymiana danych z innymi aplikacjami. Programy STATISTICA dysponują wieloma możliwościami zarówno pobierania danych zewnętrznych, jak i udostępniania swoich danych innym programom. Pliki danych z rozmaitych aplikacji (np. Excel, pliki tekstowe,.xml i wiele innych) można wczytać do arkusza STATISTICA. Każdy program z rodziny STATISTICA zawiera także STATISTICA Query. Narzędzie to umożliwia łatwy dostęp do danych gromadzonych w różnego typu bazach danych (np. Sybase, Oracle, MS SQL Server itp.) za pomocą standardu OLE DB lub ODBC. System pozwala łatwo tworzyć zapytania w trybie graficznym (bez znajomości języka SQL), a użytkownicy znający SQL mogą także tworzyć zapytania w trybie tekstowym. Więcej informacji na www.statsoft.pl/query.html. Opcjonalnie możliwa jest praca z bazą danych przy pomocy technologii IDP (In-Place Database Processing), która pozwala uniknąć zapisywania na lokalnym dysku kopii całego zbioru danych wymaganego do analizy. Więcej informacji na www.statsoft.pl/idp.html. Skalowalność Rozwiązania z rodziny STATISTICA są skalowalne pod każdym względem: liczby użytkowników od wersji jednostanowiskowych po sieciowe i korporacyjne systemy wieloużytkownikowe z kontrolą dostępu i pracą przez Internet lub Intranet, wielkości przetwarzanych danych STATISTICA jest zoptymalizowana pod kątem szybkości wykonywanych analiz, a technologia IDP umożliwia analizę ekstremalnie dużych zbiorów danych; szybkość analiz wykonywanych na dużych zbiorach danych można dodatkowo przyspieszyć poprzez wykorzystanie wersji STATISTICA dla procesorów wielordzeniowych oraz wielowątkowe wykonywanie wybranych procedur analitycznych i przekształceń danych oraz korzystanie z 64-bitowej wersji programu, 8 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
zakresu procedur analitycznych w każdym momencie można rozszerzyć licencję o dodatkowe metody analityczne, cały czas pracując w tym samym środowisku, bez konieczności zmiany interfejsu użytkownika i związanych z nim przyzwyczajeń. Programowalność i otwarta architektura Każdy z programów z rodziny STATISTICA ma wbudowane bardzo rozbudowane i bogate środowisko programistyczne STATISTICA Visual Basic (zgodne ze standardowym MS Visual Basic). Umożliwia ono programowy dostęp do praktycznie każdego elementu i każdej funkcji programu. Programy STATISTICA Visual Basic można uruchamiać nie tylko w STATISTICA, lecz (dzięki zgodności ze standardami) także w innych środowiskach bazujących na konwencjach MS Visual Basic (np. Excel, Word lub w samodzielnych instalacjach Visual Basic). Więcej informacji na www.statsoft.pl, menu Porady, sekcja STATISTICA Visual Basic. Rozwiązania StatSoft STATISTICA to najlepsze narzędzia analityczne, systemy korporacyjne z elementami pracy grupowej i kontroli dostępu oraz możliwością zdalnej pracy przez Internet, mechanizmy dostępu do baz i hurtowni danych oraz systemy rozpowszechniania informacji. Wybierając poszczególne produkty z rodziny STATISTICA, można zbudować rozwiązanie dostosowane do aktualnych potrzeb użytkowników. Przykładową architekturę rozwiązania opartego na oprogramowaniu STATISTICA przedstawia poniższy schemat: Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 9
Narzędzia analityczne Każda z aplikacji analitycznych może pracować zarówno jako wersja jednostanowiskowa (na pojedynczym komputerze), w sieci (na wielu komputerach użytkowników), jak i może być elementem korporacyjnego systemu analizy danych. Zakres metod analitycznych oferowanych przez STATISTICA jest niezwykle bogaty. Metody analityczne zostały podzielone na różne programy, z których można zbudować odpowiedni zestaw analityczny. Poszczególne programy z rodziny STATISTICA można łączyć w jednym pakiecie, który może być z czasem rozszerzany o dodatkowe moduły. Dzięki temu możemy mieć dostęp do bardzo wielu różnych metod analitycznych zawartych w jednej aplikacji STATISTICA. Oto lista wybranych programów STATISTICA (podobna lista jest zamieszczona na stronach www.statsoft.pl, menu Programy, sekcja Lista programów): STATISTICA Pakiet Podstawowy jest obszernym zestawem najpopularniejszych metod statystycznych, obejmującym m.in. statystyki opisowe, tabele wielodzielcze, korelacje, testy parametryczne i nieparametryczne, analizę regresji, STATISTICA Query, STATISTICA Visual Basic. Więcej informacji na www.statsoft.pl/base.html. STATISTICA Pakiet Zaawansowany zawiera wszystkie funkcjonalności programu STATISTICA Pakiet Podstawowy, a także moduły do analizy rozkładów, modelowania liniowego i nieliniowego, analizy szeregów czasowych (www.statsoft.pl/advanced.html), analiz wielowymiarowych (www.statsoft.pl/exploratory.html) oraz analizy mocy testów (www.statsoft.pl/power_an.html). STATISTICA QC zawiera wszystkie funkcjonalności programu STATISTICA Pakiet Podstawowy, a także moduły STATISTICA: Karty Kontrolne (www.statsoft.pl/karty-kontrolne.html), Analiza Procesu (www.statsoft.pl/wskazniki-zdolnosci-procesu.html), Planowanie Doświadczeń DOE (www.statsoft.pl/doe.html), Wielowymiarowe Karty Kontrolne, Analiza Mocy Testów. 10 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
STATISTICA Pakiet Zaawansowany + QC zawiera wszystkie funkcjonalności programów STATISTICA QC i STATISTICA Pakiet Zaawansowany. STATISTICA MSPC (Multivariate SPC Wielowymiarowe SPC, procesy wsadowe) to kompletne narzędzie do wielowymiarowego sterowania jakością procesów. Więcej informacji na www.statsoft.pl/products/mspc.htm. STATISTICA Zestaw Skoringowy jest rozwiązaniem wspierającym proces budowy, oceny oraz utrzymania modeli i kart skoringowych stosowanym do różnego rodzaju skoringów kredytowego, marketingowego, medycznego i innych. Więcej informacji na www.statsoft.pl/industries/skoring.html oraz www.statsoft.pl/industries/skoring1.html. STATISTICA Zestaw do Analiz Marketingowych i Rynkowych ułatwia i przyspiesza proces opracowania wyników badań, ze szczególnym uwzględnieniem badań ankietowych. Więcej informacji na www.statsoft.pl/industries/analizy-marketingowe-i-rynkowe.html. Gromadzenie i analiza danych ankietowych. W ofercie StatSoft dostępne są narzędzia, wspierające prowadzenie badań ankietowych. Zintegrowany system wprowadzania i gromadzenia danych ankietowych umożliwia m.in. wprowadzanie danych z uzupełnionych ankiet lub ich wypełnianie on-line, za pośrednictwem komputera z dostępem do Internetu i przeglądarkę. Więcej informacji na www.statsoft.pl/industries/ankiety-elektroniczne.html. STATISTICA Zestaw Medyczny wspiera opracowywanie wyników badań medycznych. Zawiera moduły Metaanaliza, Miary powiązania/efektów, Krzywe ROC, Wykres Blanda- Altmana, Test post hoc ANOVA Friedmana oraz Kreator regresji logistycznej. Program ten umożliwia m.in. rozszerzenie wniosków z pojedynczych badań na szerszą populację, wyliczenie miar efektu dla pojedynczych badań, przeprowadzanie analizy wrażliwości wyników na wyłączenie badania lub grupy badań z analizy, automatyczny wybór badań adekwatnych dla wskazanej miary efektu. Więcej informacji na www.statsoft.pl/industries/zestaw-medyczny.html. STATISTICA Zestaw Plus stanowi uzupełnienie funkcjonalności programów z rodziny STATISTICA. W skład pakietu wchodzi bogaty zestaw narzędzi do czyszczenia i przygotowania danych, kreator reguł poprawności danych czy też moduł umożliwiający ważenie wieńcowe przypadków. Zestaw udostępnia także narzędzia do wykonywania analizy ROC, conjoint, PROFIT oraz metaanalizy i metaregresji. Zawiera także kreator regresji logistycznej oraz szereg narzędzi przydatnych w badaniach naukowych oraz wielu branżach biznesu. Więcej informacji na www.statsoft.pl/products/statistica-plus.html. STATISTICA Zestaw Farmaceutyczny zawiera narzędzia wspomagające automatyzację analiz statystycznych w przemyśle farmaceutycznym. Składa się z programów: Profile Uwalniania, Ocena Stabilności, Walidacja Procesu, Przegląd Jakości Produktu, Walidacja Metod Pomiarowych. Więcej informacji na stronie internetowej www.statystyka-farmacja.pl w sekcji Pakiet farmaceutyczny. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 11
STATISTICA Zestaw Laboratoryjny (STATISTICA Walidacja Metod Pomiarowych, STATISTICA Badania Międzylaboratoryjne) zawiera narzędzia do automatycznej obróbki danych walidacyjnych oraz obróbki danych z badań i porównań międzylaboratoryjnych. Więcej informacji na www.statsoft.pl/industries/laboratorium.htm. STATISTICA w Six Sigma. STATISTICA jest platformą analityczną w pełni wspierającą metodykę Six Sigma niezależnie od wielkości i zakresu jej implementacji. Więcej informacji na www.statsoft.pl/sixsigma.html. STATISTICA VEPAC (Variance Estimation and Precision - szacowanie wariancji i precyzji) to kompletny zestaw technik służący do analizy danych otrzymanych w wyniku doświadczeń, na które wpływ miały zarówno efekty stałe, jak i losowe. Więcej informacji w pliku www.statsoft.pl/pdf/vepac.pdf. Data mining w STATISTICA Data mining jest procesem analitycznym zaprojektowanym do eksploracji dużych zbiorów danych w poszukiwaniu pewnych wzorców lub zależności. Wykryte prawidłowości można przekładać na konkretne decyzje biznesowe, badawcze, technologiczne. Tam gdzie zawodzą tradycyjne metody analizy danych, często sprawdza się data mining. Aby z powodzeniem stosować data mining niezbędne są odpowiednie narzędzia informatyczne wydajne oprogramowanie zawierające odpowiednie techniki analizy danych, ale także mechanizmy dostępu do danych zgromadzonych w różnych repozytoriach (plikach, bazach czy hurtowniach danych i innych), narzędzia przeglądania danych i ich przygotowania (np. czyszczenia), narzędzia wspomagające raportowanie itd. Takimi cechami charakteryzują się rozwiązania z rodziny STATISTICA. W zależności od potrzeb można dobrać rozwiązanie, zawierające odpowiednie moduły analityczne STATISTICA od zestawów dających użytkownikowi dostęp do wybranych technik (np. STATISTICA Data Mining Starter Pack), po systemy zawierające pełny wybór metod data mining i dodatkowe narzędzia ułatwiające tworzenie i modyfikowanie projektów data mining (przestrzeń robocza STATISTICA Data Miner), wdrażanie modeli (ich stosowanie dla nowych danych) czy prowadzące użytkownika przez wszystkie etapy procesu data mining (Przepisy Data Miner). Poniżej wymienione są najpopularniejsze z programów STATISTICA, zawierające różne zakresy metod data mining. Więcej informacji na www.statsoft.pl, menu Programy, sekcja Systemy data mining. STATISTICA Data Mining Starter Pack umożliwia rozpoczęcie korzystania z metod data mining oferując spore możliwości i przystępną cenę. Zestaw zawiera programy STATISTICA: Pakiet Zaawansowany (narzędzia klasycznej statystyki), Automatyczne Sieci Neuronowe oraz Trees (drzewa decyzyjne i drzewa wzmacniane). STATISTICA Automatyczne Sieci Neuronowe jest to program zawierający narzędzia do budowy oraz wdrażania modeli bazujących na sieciach neuronowych. Więcej informacji na stronie www.statsoft.pl/stat_nn.html. 12 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
STATISTICA Trees to zestaw narzędzi do budowy drzew decyzyjnych klasyfikacyjnych i regresyjnych: moduły C&RT, CHAID, drzewa interakcyjne, drzewa wzmacniane, losowy las. STATISTICA Data Miner to kompletny zestaw narzędzi data mining. Jest łatwym w użyciu i wydajnym systemem do realizacji wszystkich etapów wydobywania z danych użytecznej wiedzy: od pobierania danych z baz czy hurtowni danych, poprzez etapy czyszczenia i transformacji danych, wykonywanie analiz danych, po tworzenie raportów. Specjalne techniki data mining w STATISTICA Data Miner są zoptymalizowane pod kątem przetwarzania olbrzymich zbiorów danych. System STATISTICA Data Miner jest wyposażony w bardzo bogaty wybór metod analitycznych, zarówno wbudowanych w gotowe projekty data mining (szeroki wybór predefiniowanych, gotowych do użycia projektów dla różnego typu zagadnień), jak i dostępnych do budowy własnych projektów. STATISTICA Data Miner zawiera następujące techniki data mining: Interakcyjne drążenie danych Ogólne modele drzew klasyfikacyjnych i regresyjnych (G-Trees) Ogólne modele CHAID (Chi-squared Automatic Interaction Detection) Drzewa interakcyjne (C&RT, CHAID) Drzewa wzmacniane (Boosted Trees) Automatyczne sieci neuronowe Losowy las (Random Forest) Analiza składowych niezależnych (ICA Independent Component Analysis) Analiza skupień uogólnioną metodą EM i k-średnich Analiza koszykowa (Association Rules, Basket Analysis) Uogólnione modele addytywne (General Additive Models) MARSplines (Multivariate Adaptive Regression Splines Wielozmienna regresja adaptacyjna z użyciem funkcji sklejanych) Inne metody uczenia maszyn (Machine Learning): wektory nośne (Support Vector Machines), naiwny klasyfikator Bayesa, K-najbliższych sąsiadów (K-Nearest Neighbors) Szybkie wdrażanie modeli predykcyjnych (PMML) Dobroć dopasowania, klasyfikacji, predykcji (Goodness of fit) Dobór i eliminacja zmiennych Łączenie klas (grup) do predykcyjnego data mining Przepisy Data Miner oraz pełną funkcjonalność programu STATISTICA Pakiet Zaawansowany i składnik IDP. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 13
Specjalne środowisko graficzne tworzenia projektów analitycznych bazuje na konwencji przeciągnij i upuść, dzięki czemu tworzenie projektów data mining jest intuicyjne, a praca z systemem nie wymaga długich przygotowań. Sprawia to, że z systemu STATISTICA Data Miner korzystać mogą nawet nowicjusze. Jest on jednocześnie wysoce elastyczny i dostosowywalny. Obszar roboczy w STATISTICA Data Miner podzielony jest na cztery sekcje. Podział ten odpowiada czterem etapom projektu data mining. W jednym projekcie data mining mamy możliwość stosowania różnych technik i modeli. Po opracowaniu gotowych modeli STATISTICA Data Miner oferuje narzędzia do wdrażania i stosowania modeli, zintegrowane ze środowiskiem tworzenia projektów, które umożliwia sterowanie przetwarzaniem danych w obiektach analizy (węzłach) za pomocą zgodnych ze standardami przemysłu informatycznego skryptów STATISTICA Visual Basic. System STATISTICA Data Miner cechuje łatwość w korzystaniu z danych zewnętrznych. Można podłączyć różne źródła danych, tak że jakakolwiek zmiana danych na wejściu powoduje przeliczenie całego projektu, tak aby wyniki odpowiadały aktualnym danym. W jednym projekcie data mining możemy używać różnych technik i modeli. Stosowanie modeli dla nowych danych jest w STATISTICA Data Miner bardzo wydajne, dzięki zastosowaniu przenaszalnego, bazującego na XML, języka PMML (Predictive Models Markup Language), który można stosować zarówno dla modeli klasyfikacyjnych i regresyjnych. Raz oszacowane modele mogą być później wielokrotnie stosowane dla nowych danych. Możemy także na bieżąco modyfikować ich parametry w miarę napływu danych. Opcjonalnie, w przypadku wybranych modułów analitycznych, oszacowane modele można 14 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
zapisywać w postaci kodu w językach programowania C/C++, SVB i SAS, dzięki czemu modele przygotowane w STATISTICA Data Miner mogą być wykorzystywane także w innych aplikacjach. Do korzystania z tej opcji wymagana jest specjalna licencja. Przepisy Data Miner to nowe podejście do wykonywania analiz oferuje użytkownikowi predefiniowane ścieżki przeprowadzające analityka przez cały proces analizy danych: połączenie z danymi, przekształcanie i przygotowanie danych, przeprowadzenie obliczeń, podsumowanie wyników, zapis i wdrożenie. Przepisy udostępniają intuicyjny graficzny interfejs, przy pomocy którego nawet osoby bez dużego doświadczenia w zakresie data mining mogą same wykonać krok po kroku zaprojektowany proces data mining. Oprócz korzystania ze zdefiniowanych przepisów na analizę, można definiować własne przepisy data mining dla wykonywanych rutynowo zadań. Więcej informacji na www.statsoft.pl/dataminer.html. STATISTICA SAL (Sequence, Association and Link Analysis analiza sekwencji, asocjacji i połączeń) wykorzystuje szereg najnowszych technik analitycznych przeznaczonych do znajdowania w zbiorach danych reguł dotyczących wspólnego występowania zjawisk (elementy występujące często razem lub w określonej kolejności itp.). Więcej informacji na www.statsoft.pl/products/sal.htm. STATISTICA Text Miner jest rozszerzeniem systemu STATISTICA Data Miner, służącym do przekształcania pozbawionych struktury danych (głównie tekstów) w użyteczną wiedzę. Więcej informacji na www.statsoft.pl/textminer.html. STATISTICA Process Optimization (QC Data Miner) to specjalne narzędzie będące połączeniem znanych narzędzi statystycznego sterowania jakością (SPC) z zaawansowaną technologią data mining i QC mining (czyli technikami data mining w sterowaniu jakością). Więcej informacji na www.statsoft.pl/qcminer.html. Systemy korporacyjne Każde z wyżej opisanych narzędzi analitycznych STATISTICA może działać na pojedynczym komputerze lub w systemach sieciowych, na wielu stacjach roboczych. Łącząc wszystkie lub wybrane narzędzia analityczne z jednym z niżej opisanych systemów korporacyjnych, otrzymujemy rozwiązanie, które pozwala na korzystanie z odpowiednich narzędzi analitycznych przez wielu użytkowników, a także pomaga organizować współpracę różnych osób. Systemy korporacyjne STATISTICA pozwalają wielu użytkownikom korzystać ze wspólnych szablonów zapytań do baz danych, analiz, raportów przechowywanych w jednym miejscu z zapewnieniem kontroli dostępu. Więcej informacji na www.statsoft.pl, menu Programy, sekcja Systemy korporacyjne. STATISTICA Enterprise to system analizy danych ogólnego przeznaczenia, m.in. dla zastosowań typu business intelligence w marketingu, finansach i innych obszarach. Użytkownicy mogą korzystać ze wspólnych danych (zapytań do baz danych), współużytkować centralnie uaktualniane skrypty analiz, udostępniać wyniki swoich analiz itp. STATISTICA Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 15
Enterprise ma własny system użytkowników i grup z możliwością zarządzania uprawnieniami do zasobów systemu, narzędzie do definiowania szablonów raportów oraz generator raportów (raporty mogą być generowane automatycznie co pewien czas lub o określonym czasie). Wyniki pracy mogą być udostępniane w środowisku lokalnym (innym użytkownikom STATISTICA Enterprise) oraz rozpowszechniane w szerszym zakresie (np. jako raporty publikowane w Internecie lub intranecie). Więcej informacji na www.statsoft.pl/sedas.html. STATISTICA Enterprise QC zaprojektowano dla potrzeb sterowania jakością i optymalizacji jakości z uwzględnieniem wymagań m.in. TQM, ISO 9000, ISO/TS 16949 i Six Sigma. System ten łączy w sobie najwyższej jakości technologię integracji systemów z elastycznością i skalowalnością zaimplementowaną tak, aby umożliwić dostosowanie do potrzeb użytkowników, modyfikację i rozszerzanie go przy użyciu kreatorów. System można stosować dla pojedynczych procesów produkcyjnych, jak i globalnie dla całej korporacji. System oferuje środowisko pracy użytkownika zależne od uprawnień pracownika i jego roli w organizacji. Inżynierom oferuje pełny zestaw narzędzi analitycznych, kierownictwu bogate możliwości raportowania, a operatorom proste i odporne na pomyłki środowisko monitorowania procesu. Więcej informacji na www.statsoft.pl/sewss.html. STATISTICA MAS (Monitoring and Alerting Server) rozszerza STATISTICA Enterprise QC o scentralizowane i zautomatyzowane narzędzia monitorowania wielu właściwości procesów i produktów. Użytkownik MAS określa warunki i zdarzenia, których wystąpienie powoduje podjęcie pewnych działań. Definicja zdarzenia może być prosta (np. przekroczenie granicy kontrolnej) albo bardzo skomplikowana. Dla każdej monitorowanej właściwości można określić konkretne działanie. STATISTICA MAS może współpracować z różnorodnymi systemami zbierania i gromadzenia danych (np. transakcyjnymi bazami danych, systemami LIMS). Więcej informacji na www.statsoft.pl/products/mas.htm. STATISTICA MultiStream jest pakietem umożliwiającym tworzenie i implementację efektywnych metod monitorowania i sterowania zaawansowanymi wielowymiarowymi procesami produkcyjnymi. System dostarcza szerokiego zestawu narzędzi pozwalających na znajdowanie i wdrażanie metod umożliwiających rozwiązywanie różnorakich problemów w zakładach przemysłowych. Rozwiązanie to zostało stworzone z myślą o wszystkich procesach przemysłowych, jednak w przemyśle farmaceutycznym, zakładach energetycznych czy przy obróbce rud metali oferuje najwięcej korzyści z zastosowania. Rozwiązanie to posiada wbudowany systemem zarządzania dokumentami. Dodatkowe informacje są na stronach www.statsoft.pl/products/msdlapharmac.html, www.statsoft.pl/products/msdlaenergetyki.html. StatSoft Power Solutions to grupa rozwiązań, które są najszybszym i najtańszym sposobem na zmniejszenie emisji szkodliwych (czy niepożądanych) substancji i zwiększenia wydajności elektrowni, elektrociepłowni, cementowni i innych zakładów, w których do procesu spalania przywiązuje się szczególną wagę. Korzystając z tych rozwiązań, można m.in.: zoptymalizować spalanie (zwiększyć jego temperaturę, zmniejszyć zmienność), zwiększyć wydajność, sprawność i stabilność działania sprzętu, przewidywać problemy. Bardzo ważne jest to, że można to osiągnąć bez inwestycji w nowy sprzęt, długotrwałych przestojów 16 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
w pracy itp. Więcej informacji na www.statsoft.pl, menu Rozwiązania, sekcja Zastosowania technologiczne, dział Zmniejszenie emisji. STATISTICA Enterprise Server jest internetowym systemem udostępniania i analizy danych. Umożliwia zdalne uruchamianie STATISTICA w ramach przeglądarki internetowej (wszystkie obliczenia są wykonywane na serwerze), a także szybki i łatwy dostęp do danych, raportów i narzędzi analitycznych z praktycznie każdego komputera połączonego z Internetem. System jest oferowany jako kompletne rozwiązanie, zawierające funkcjonalność wybranych produktów z rodziny STATISTICA. Więcej informacji na www.statsoft.pl, menu Programy, sekcja Systemy klient-serwer. STATISTICA Live Score to silnik skoringowy (serwer) wchodzący w skład platformy analitycznej STATISTICA Enterprise, który służy do wdrażania modeli opracowanych w środowisku analitycznym STATISTICA. Umożliwia wydajne obliczanie skoringów oraz prognoz on-line na potrzeby rozmaitych zastosowań biznesowych (cross-selling, upselling, churn, ryzyko kredytowe, ryzyko nadużyć, prognozowanie sprzedaży i wiele innych) z wykorzystaniem mechanizmów WebService (SOAP). Architektura systemu umożliwia wielowątkowe przetwarzanie danych oraz współpracę ze wszystkimi standardowymi rozwiązaniami IT. Rozpowszechnianie wiedzy i raportowanie STATISTICA Enterprise Server Knowledge Portal oraz Interactive Knowledge Portal to wydajne systemy dostarczania informacji w Internecie lub intranecie, umożliwiające korzystanie z wyników analiz i raportów. Zawierają generator raportów, za pomocą którego można tworzyć odpowiednio sformatowane raporty. Interactive Knowledge Portal umożliwia dodatkowo definiowanie przez użytkownika nowych raportów, aktualizowanie raportów na życzenie, uruchamianie zapytań do baz danych, wykonywanie własnych analiz, drążenie danych i tworzenie przekrojów wielowymiarowych danych. Więcej informacji na www.statsoft.pl/output_portal.html. Zarządzanie dokumentami STATISTICA Document Management System to kompletny, skalowalny system do zarządzania wszelkiego typu dokumentami zapisanymi w formie elektronicznej (nie tylko dokumentami STATISTICA). Produkt ten umożliwia wydajne i bezpieczne operowanie dokumentami różnych typów, szybkie odnajdywanie dokumentów, udostępnianie, przeszukiwanie ich zawartości itp. Więcej informacji na www.statsoft.pl/dms.html. Nowości w ofercie StatSoft Polska STATISTICA Decisioning Platform jest rozwiązaniem pomagającym firmom sprawniej podejmować trafne decyzje z wykorzystaniem analizy danych. Łączy ono siedem Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 17
kluczowych funkcji, wymaganych do sprawnego wykorzystania predykcji w codziennej działalności organizacji: 1. Zarządzanie i sprawdzanie reguł decyzyjnych (wynikających z zasad prowadzenia działalności w danej organizacji, zewnętrznych regulacji oraz interpretacji wyników modeli i zasad ich stosowania). 2. Modelowanie predykcyjne (wykorzystanie danych historycznych do segmentacji, klasyfikacji, przewidywania i prognozowania). 3. Zarządzanie modelami (wdrażanie i uruchamianie modeli, system uprawnień oraz nadzorowanie działania modeli predykcyjnych). 4. Text mining (wykorzystanie w modelach tekstów w języku naturalnym). 5. Obliczanie przewidywań na życzenie i w zadanych odstępach czasu (stosowanie modeli dla nowych danych na życzenie lub w oparciu o harmonogram z zapisem wyników w bazie lub hurtowni danych). 6. Automatyzacja i integracja z innymi systemami (z wykorzystaniem standardowych technologii, np. OLE DB, SOAP oraz skryptów Visual Basic). 7. Wizualizacja danych (ułatwienie zrozumienia wykrytych wzorców i prezentacja wyników za pomocą wykresów). STATISTICA Decisioning Platform to sprawdzone rozwiązanie umożliwiające uwzględnienie modeli predykcyjnych i scenariuszy decyzyjnych w wydajnym, łatwym do zarządzania środowisku, w którym przetwarzanie danych reprezentowane jest graficznie przez przepływ informacji (workflow). Przepływ taki można łatwo wdrożyć w systemie skoringu na żądanie lub skoringu wsadowego (wykonywanego regularnie dla określonego zbioru obiektów), bez konieczności ponownego programowania. Dzięki specjalnie zaimplementowanym procedurom do analizy można wykorzystywać zarówno dane standardowe (o strukturze zmiennych i przypadków), jak i pozbawione struktury dane tekstowe. Więcej informacji na www.statsoft.pl/products/decisioning_platform.html. 18 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
Szkolenia StatSoft Polska Kursy organizowane przez StatSoft Polska przeznaczone są dla wszystkich, którzy w krótkim czasie chcą zdobyć lub pogłębić wiedzę w zakresie przetwarzania i analizy danych w różnych dziedzinach i zastosowaniach oraz obsługi programów STATISTICA. Oprócz kursów otwartych realizujemy także szkolenia i warsztaty na zamówienie. Nasze kursy są kursami autorskimi, a nie kalkami szkoleń przygotowanych za granicą i przetłumaczonych na język polski. Dzięki temu są one doskonale dopasowane do polskich realiów i spełniają oczekiwania uczestników. Gwarancją najwyższej jakości naszych szkoleń są prowadzący specjaliści w zakresie analizy danych, mający rozległe doświadczenie praktyczne. W ciągu kilkunastu lat przeszkoliliśmy tysiące osób na kilkuset szkoleniach. Uczestnicy naszych kursów otrzymują obszerne materiały szkoleniowe, a także pliki z danymi, które prowadzący wykorzystują w czasie szkoleń. Dzięki temu późniejsze samodzielne przypomnienie zagadnień omawianych w czasie kursów jest znacznie ułatwione. Oprócz szkoleń współpracujemy także z renomowanymi polskimi uczelniami wyższymi przy organizacji studiów podyplomowych, które związane są z analizą danych. Kursy otwarte w Krakowie Kursy otwarte StatSoft Polska odbywają się w naszej pracowni szkoleniowej w Krakowie, w małych grupach. Lista dostępnych kursów jest stale rozszerzana obecnie jest już ponad 50 różnych tematów kursów do wyboru. Proponujemy m.in. gotowe cykle szkoleniowe: Statystyczna analiza danych Prognozowanie Data mining Statystyka w medycynie Marketing i badania rynku Dla inżynierów jakości Six Sigma na poziomie Green Belt To tylko przykładowe ścieżki kursowe. Chętnie pomożemy w doborze tematów i zaplanowaniu odpowiedniej kolejności potrzebnych kursów każdej zainteresowanej osobie czy instytucji. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Kursy i szkolenia. Można tam znaleźć m.in. takie informacje o kursach otwartych jak aktualny terminarz, szczegółowe programy, informacje organizacyjne, formularz zgłoszeniowy. Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 19
Szkolenia i warsztaty na zamówienie Szkolenia na zamówienie mogą zostać przeprowadzone zgodnie z naszymi standardowymi programami lub można je w dowolnym stopniu dopasować. Możemy też przygotować zupełnie nowe szkolenie, dopasowane do indywidualnych, specjalistycznych wymagań. Zajęcia mogą mieć formę warsztatów, w czasie których wykorzystywane są dane dostarczone przez uczestników szkolenia. Dzięki takiemu podejściu wiedza z zakresu analizy danych jest przyswajana znacznie łatwiej. Szkolenia na zamówienie mogą odbyć się w dowolnym miejscu w Polsce w siedzibie zamawiającego, pracowni StatSoft czy innym miejscu. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Kursy na zamówienie. Studia podyplomowe StatSoft Polska współpracuje z renomowanymi polskimi uczelniami wyższymi przy organizacji studiów podyplomowych: Praktyczne prognozowanie i analiza szeregów czasowych z Uniwersytetem Ekonomicznym w Krakowie Analizy Marketingowe z wykorzystaniem Data Mining z Krakowską Szkołą Biznesu Business Intelligence Systemy Wspomagania Decyzji Biznesowych ze Szkołą Główną Handlową Narzędzia analizy polityk publicznych z Małopolską Szkołą Administracji Publicznej Powyższe studia to nie tylko teoretyczne podstawy różnych metod analitycznych, ale także praktyczne możliwości ich zastosowania, w tym z wykorzystaniem narzędzi STATISTICA. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Studia podyplomowe. Usługi konsultingowe, wdrożeniowe i walidacyjne StatSoft Polska oferuje różnego rodzaju usługi związane z analizą danych (statystyczną, data mining itp.) i oprogramowaniem STATISTICA. Są to usługi konsultingowe (doradcze), implementacyjne, walidacyjne itp. Każda firma czy instytucja może skorzystać z doświadczenia konsultantów StatSoft Polska, specjalistów w zakresie analizy danych i wykorzystania oprogramowania STATISTICA, aby zapewnić poprawność i efektywność wykonywanych analiz, powodzenie wdrożenia systemów analitycznych i ich zgodność z normami czy innymi wymogami itd. Członkowie zespołu StatSoft brali udział w projektach i przygotowywali opracowania dla wielu przedsiębiorstw i instytucji. Doświadczenie i rozległa wiedza konsultantów, zorientowanie na potrzeby klientów, terminowość i zaangażowanie analityków oraz stosowanie 20 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
najlepszych narzędzi analitycznych to nasz sposób na powodzenie projektów i zadowolenie klientów. Usługi konsultingowe Usługi konsultingowe StatSoft Polska w zakresie analizy danych i budowy systemów analitycznych mogą obejmować praktycznie dowolne zagadnienia, np.: analizę zgromadzonych danych, budowę modeli analitycznych i wdrożenie ich w STATISTICA, opracowanie i implementację kompletnych systemów analitycznych, doradztwo w zakresie gromadzenia i analizy danych. Usługi doradcze mogą być związane z dowolnymi zastosowaniami, np.: analityczny CRM i marketing relacyjny, prognozowanie (sprzedaży, zapotrzebowania, zasobów itp.), budowa modeli skoringowych (skoring kredytowy, marketingowy, medyczny i inne), badania ankietowe, statystyczne sterowanie procesami (SPC) i ich optymalizacja, analiza w przemyśle farmaceutycznym (walidacja, PAT, analiza stabilności, profile uwalniania, APR), opracowywanie i ocena metod diagnostyki i terapii medycznej. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Usługi konsultingowe. Usługi implementacyjne StatSoft Polska oferuje szeroką gamę usług polegających na implementacji i integracji systemów od niewielkich systemów monitorowania i analiz czy dostosowania oprogramowania STATISTICA do pracy z istniejącą bazą danych, po wdrożenia zintegrowanych, korporacyjnych systemów analitycznych, obejmujących zbieranie danych, hurtownię oraz system analiz oraz raportowania i publikacji. StatSoft ma wieloletnie doświadczenie w realizacji zaawansowanych projektów informatycznych w dziedzinie analizy statystycznej, data mining, monitorowania i raportowania dla różnorodnych zastosowań i klientów. Są wśród nich rozwiązania dla setek użytkowników w ramach największych, międzynarodowych korporacji oraz wysoce wyspecjalizowane systemy wspierające prace niewielkich zespołów inżynierów i ekspertów. Wdrożeniom naszych systemów informatycznych towarzyszą szkolenia dotyczące obsługi systemów i stosowanych metod analizy danych oraz usługi konsultingowe. Nasze rozwiązania zwykle obejmują: stworzenie systemu ETL łączącego dane z różnych źródeł i przygotowującego je do analizy, Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 21
zaprojektowanie i wdrożenie hurtowni lub analitycznej bazy danych na potrzeby tworzenia i stosowania modeli, opracowanie modeli predykcyjnych, przygotowanie systemów automatycznie stosujących modele dla nowych klientów, transakcji, okresów, partii produkcyjnych itp., stworzenie systemu raportowego, automatycznie tworzącego raporty i rozpowszechniającego je, np. w portalu internetowym lub poprzez pocztę elektroniczną. Opracowywanie modeli Reguły biznesowe Transakcyjne bazy danych Integracja źródeł danych Repozytorium reguł i modeli System akwizycji danych Analityczna baza danych Użytkownicy ETL ABD Silnik reguł i modeli Inne aplikacje System raportowy Plikowe źródła danych Zewnętrzna baza danych Monitorowanie kluczowych parametrów 20 33 15 % 10% 14 %% 8% % Portal Pulpit menadżerski Realizujemy wdrożenia modeli analitycznych (np. prognostycznych) i rozwiązań data mining, przemysłowych rozwiązań SPC, aplikacji dla przemysłu farmaceutycznego, laboratoriów badawczych i pomiarowych, bankowości i finansów, medycyny, badań rynku i wiele innych. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Usługi implementacyjne. 22 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012
Usługi walidacyjne Wiele dziedzin, w których stosuje się statystyczną analizę danych, jest regulowanych przez różnego rodzaju normy, wytyczne, a także wymagania wewnętrzne tworzone przez same organizacje. Konieczność spełnienia tych wymagań często wiąże się z potrzebą walidacji oprogramowania. W szczególności walidacja oprogramowania jest wymagana w przemyśle farmaceutycznym oraz wszelkiego rodzaju laboratoriach pomiarowych i badawczych. Dla każdego typu wdrażanego rozwiązania (niezależnie od tego czy rozwiązanie informatyczne jest typu COTS oprogramowanie z półki, MOTS pakiet wymagający konfiguracji czy CUSTOM oprogramowanie tworzone od podstaw) możemy dobrać odpowiedni zakres walidacji, obejmującej przygotowanie odpowiedniej dokumentacji, testów i raportów potwierdzających poprawne działanie rozwiązania. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Usługi walidacyjne. Popularyzacja wiedzy z zakresu analizy danych StatSoft od wielu lat przyczynia się w dużym stopniu do popularyzacji wiedzy związanej z analizą danych i jej prawidłowym stosowaniem w różnych dziedzinach. Szkolimy osoby zajmujące się analizą danych, pomagamy w doborze i optymalizacji wykorzystywania różnych narzędzi analitycznych. Organizujemy seminaria, webinaria, konferencje i inne wydarzenia, podczas których specjaliści i praktycy zajmujący się na co dzień analizą danych dzielą się swoimi doświadczeniami. Na naszych stronach internetowych udostępniamy obszerne zasoby różnych materiałów, które dotyczą różnych zastosowań analizy danych, narzędzi analitycznych itp. Seminaria, konferencje Regularnie organizujemy seminaria i konferencje, na których przedstawiane są zastosowania różnych technik analizy danych i narzędzia z rodziny STATISTICA. Tematykę poszczególnych wydarzeń dostosowujemy do aktualnych trendów i oczekiwań. Nasze seminaria co roku przyciągają setki zainteresowanych. W ostatnim czasie odbyły się: konferencje: o Recepta na statystykę czyli analiza danych w badaniach medycznych o Praktyczna analiza danych w marketingu i badaniach rynku o Skoring w zarządzaniu ryzykiem o Praktyczna analiza danych w przemyśle farmaceutycznym seminaria: o Zastosowanie nowoczesnej analizy danych w marketingu i badaniach rynku o Praktyczna analiza danych w ubezpieczeniach o Analiza danych w programie STATISTICA przegląd o Zastosowania statystyki i data mining w badaniach naukowych o Zastosowania nowoczesnej analizy danych w administracji publicznej cykl prezentacji: STATISTICA w badaniach naukowych i nauczaniu statystyki Copyright StatSoft Polska 2012 www.statsoft.pl/czytelnia.html 23
Nasze seminaria i konferencje to przede wszystkim ciekawe wystąpienia, prezentowane przez specjalistów w zakresie analizy danych, a także możliwość nawiązania nowych kontaktów i wymiany doświadczeń z osobami z całej Polski, a wszystko to w miłej atmosferze. Więcej informacji na www.statsoft.pl, menu Usługi, sekcja Seminaria. Prezentacje internetowe webinaria, webcasty Idąc z duchem czasu organizujemy w ostatnim czasie coraz częściej prezentacje internetowe webinaria. Jest to doskonały sposób, aby za pośrednictwem Internetu wysłuchać ciekawych wystąpień, nie ruszając się sprzed własnego komputera. Przeprowadziliśmy już wiele webinariów, m.in.: Wprowadzenie do pracy w STATISTICA Automatyzacja przetwarzania danych na potrzeby przeglądu produktu (APR) Drzewa interakcyjne Fraud w instytucjach finansowych Sieci neuronowe w STATISTICA Analiza wariancji (ANOVA) metoda analizy statystycznej czy coś więcej? Analiza regresji na czym polega i kiedy warto ją zastosować? Jak skutecznie zarządzać jakością systemowe podejście do gromadzenia i analizy danych Na naszych stronach WWW zamieszczane są nagrania tych i wielu innych prezentacji internetowych. Dzięki temu można pozyskać wiele ciekawych informacji na tematy związane z nowoczesną analizą danych w dowolnym miejscu i o dogodnej porze. Zasoby na stronach internetowych StatSoft Strony internetowe StatSoft są skarbnicą wiedzy z zakresu analizy danych w różnych dziedzinach. Każdy zainteresowany tą tematyką znajdzie tu coś dla siebie. Poniżej wymienione są wybrane zasoby. Podane opisy wyjaśniają jak łatwo uzyskać przekierowanie ze strony głównej StatSoft Polska www.statsoft.pl do odpowiedniego zasobu, poprzez grupy menu dostępne na początku strony: 1. Portal data mining menu Strona główna, sekcja Portal data mining można tam znaleźć m.in. kurs Data mining w 35 lekcjach 2. Portal inżyniera jakości (SPC) menu Strona główna, sekcja Portal inżyniera jakości można tam znaleźć m.in. Poradnik inżyniera jakości 3. Portal farmaceutyczny menu Strona główna, sekcja Portal farmaceutyczny 24 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2012