SAS ENTERPRISE MINER JAKO NARZĘDZIE ANALITYKA MARIUSZ DZIECIĄTKO

Podobne dokumenty
BLOK 3 FUNKCJONALNOŚCI OPROGRAMOWANIA DOSTĘPNEGO W RAMACH PIBUK

Część 2: Data Mining

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Szkolenia SAS Cennik i kalendarz 2017

Analityka wysokiej wydajności. Przegląd możliwości technologii SAS. Adam Bartos

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

StatSoft profesjonalny partner w zakresie analizy danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

Hurtownie i eksploracja danych

ANALIZA I PRZETWARZANIE DUŻYCH WOLUMENÓW DANYCH NA PLATFORMIE SAS MARIUSZ DZIECIĄTKO

w ekonomii, finansach i towaroznawstwie

ZALETY NOWSZYCH WERSJI I KIERUNKI ROZWOJU SPDS-A SŁAWOMIR BOKINIEC

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Hurtownia danych szansa na nowe życie (starej idei) Jakub Skuratowicz Technical Sales

Learn SAS. Training Certification Coaching. Grow With Us. Szkolenia Certyfikaty Mentoring Analiza potrzeb szkoleniowych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Oracle Data Mining 10g

Narzędzia IT we współczesnych strategiach utrzymaniowych

data mining machine learning data science

Przykład Rezygnacja z usług operatora

Architecture Best Practices for Big Data Deployments

Wprowadzenie do SAS. Wprowadzenie. Historia SAS. Struktura SAS 8. Interfejs: SAS Explorer. Interfejs. Część I: Łagodny wstęp do SAS Rafał Latkowski

Tematy projektów Edycja 2019

Zaawansowana analityka biznesowa w oparciu o najnowsze rozwiązania SAP i CISCO. SAP FORUM Polska. Paweł Gajda SAP Polska

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak

Metody scoringowe w regresji logistycznej

Co to jest Business Intelligence?

Scoring kredytowy w pigułce

BigData. Czy zawsze oznacza BigProblem? Artur Górnik, SAP Polska Piotr Zacharek, HP Polska 14 kwietnia, 2015

KLASYFIKACJA. Słownik języka polskiego

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

PERFORMANCE POINT SERVICE NIE TYLKO DLA ORŁÓW

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski

Wprowadzenie do technologii informacyjnej.

Analityka predykcyjna w marketingu i sprzedaży

IBM SPSS Modeler 18.0 podręcznik eksploracji w bazie danych IBM

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

HP Service Anywhere Uproszczenie zarządzania usługami IT

Zakup oprogramowania SAS

Aktualizacja środowiska JAVA a SAS

Zabbix -Monitoring IT bez taśmy klejącej. Paweł Tomala Barcamp 15 czerwca 2015

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Eksploracja danych (data mining)

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Implementacja metod eksploracji danych - Oracle Data Mining

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

MONITOROWANIE DOSTĘPNOŚCI USŁUG IT

Portale raportowe, a narzędzia raportowe typu self- service

SAS Data Quality. Technologia i wykorzystanie

Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera. Katarzyna Wyszomierska

STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA

Wprowadzenie do Hurtowni Danych

Laboratorium 11. Regresja SVM.

Rozwiązania bazodanowe EnterpriseDB

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 8 OPROGRAMOWANIE DO ANALIZ MARKETINGOWYCH (pom. nr 1.21)

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

L.p Nazwa przedmiotu Kod przedmiotu Osoba(y) prowadząca(e) WDP PDP WIR DAW BDZ

RODO w pigułce. 4 października Andrzej Syta - COMPAREX. D i g i t a l T r a n s f o r m a t i o n

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.

Bezpieczeństwo systemów internetowych

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

WYKŁAD 1. Wprowadzenie w tematykę kursu

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY

Zajęcia nr VII poznajemy Rattle i pakiet R.

Szczegółowy opis przedmiotu zamówienia

Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym

Ewolucja sieci Sztuczna inteligencja i uczenie maszynowe

Drzewa decyzyjne w SAS Enterprise Miner

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:


PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Zakup oprogramowania SAS CIS-10/2014 ZAŁĄCZNIK NR 1 DO SIWZ. str. 1. Załącznik nr 1 do SIWZ

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Nowoczesne narzędzia do ochrony informacji. Paweł Nogowicz

Tytuł kursu: Oracle 11g XE Administracja (kompleksowe)

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 4 Performance Point Services Bartłomiej Graczyk

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Analityka i BigData w służbie cyberbezpieczeństa

Serwery LDAP w środowisku produktów w Oracle

KNIME podstawy obsługi programu. Pracownia Chemometrii Środowiska Katedra Chemii i Radiochemii Środowiska Wydział Chemii UG

Widzenie komputerowe (computer vision)

Skuteczna operacjonalizacja środowiska analitycznego

Spis tre±ci. Przedmowa... Cz ± I

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Łatwa czy niełatwa droga do celu? - wdrożenie COSMIC w ZUS

Learning to rank: RankLib. Krzysztof Pawlak, Jakub Sobieski

Ewolucja sieci Sztuczna inteligencja i uczenie maszynowe

Transkrypt:

SAS MINER JAKO NARZĘDZIE ANALITYKA MARIUSZ DZIECIĄTKO

METODYKA SEMMA (SAMPLE, EXPLORE, MODIFY, MODEL, ASSESS)

Prognoza Historia MODEL ANALITYCZNY PRZYGOTOWANIE DANYCH Funkcja przypisująca określoną wartość Zmienne wejściowe, zmienne wyjściowe Kod skoringowy Zastosowanie Predykcja, klasyfikacja, klasteryzacja, reguła decyzyjna, Atrybuty modelu Algorytm, formuła, zastosowanie, zmienna celu ID Y X1 X2 X3... Xn???

PRZYKŁADY ZASTOSOWAŃ MODELI ANALITYCZNYCH Naliczenie punktów ryzyka kredytowego (credit scoring) Naliczenie kwoty ubezpieczenia na podstawie karty wyników Określenie prawdopodobieństwa: Odejścia klienta (churn) Zaprzestania płacenia faktur Rezygnacji z produktu Zakupu produktu Naliczenie przewidywanej kwoty zakupu Określenie szansy na sprzedaż Dodatkowych produktów (cross-sell) Nowszych/bogatszych wersji produktów (up-sell) Określenie przynależności do segmentu Detekcja nadużyć

INTEGRACJA DANYCH Dostęp do danych strukturalnych i niestrukturalnych* Próbkowanie i partycjonowanie danych Filtrowanie danych, eliminacja wartości odstających Przygotowanie danych i analiza szeregów czasowych Tworzenie ad hoc zasad i reguł opartych o dane *Requires SAS Text Miner Add-on License

EKSPLORACJA DANYCH Łatwy w użyciu kreator oraz węzeł Graphics Explore Interaktywnie linkowane wykresy i tabele Analityka deskryptywna Asocjacje, Analiza koszykowa, Klastering Rozkłady zmiennych i statystyki opisowe Profilowanie segmentów i wykresy interaktywne Analiza sekwencji dla ścieżek Web

MODYFIKACJA DANYCH I DOBÓR ZMIENNYCH Usuwanie zmiennych Uzupełnianie braków danych Interaktywne dzielenie na klasy zmiennych wejściowych Przypisywanie i konsolidacja poziomów zmiennych wejściowych Transformacje zmiennych

TECHNIKI MODELOWANIA Nadzorowane Regression Gradient Boosting Decision Trees Neural Networks Random Woods Bayesian Networks, Support Vector Machines, itd. Nienadzorowane Clustering, Dimension reduction Associations, Principal Components, itd. Modele złożone Integracja z R Węzły High-Performance Analytics

OCENA JAKOŚCI MODELU Generalizacja Zapobieganie nadmiernemu dopasowaniu Champion / Challenger Trenowanie i monitoring Porównywanie konkurencyjnych modeli z użyciem metryk statystycznych i ROI. Przetwarzanie grupowe przy wielu zmiennych celu i segmentach. Estymacja wydajności produkcyjnej

OPERACJONALIZACJA MODELI Zoptymalizowany kod skoringowy i transformacji danych pod procesy czasu rzeczywistego lub procesy wsadowe: SAS 4GL, C, Java lub PMML do użycia w aplikacjach Funkcje In-database (Teradata, DB2, Oracle, Netezza, Pivotal, Netezza, Aster Data oraz Hadoop)* Przetwarzanie In-memory (Teradata, Pivotal, Oracle, Cloudera, HortonWorks)* Zadanie oceny punktowej w procesie SAS Data Management Zadanie oceny punktowej w SAS Enterprise Guide *Add-on product. Requires separate license.

LISTA WĘZŁÓW SAS SAMPLE Append Data Partition File Import Filter Merge Sample Input Data EXPLORE Association Cluster Graph Explore Variable Clustering DMDB MultiPlot Market Basket StatExplore Link Analysis Path Analysis Variable Selection SOM/Kohonen MODIFY Drop Impute Interactive Binning Principal Components Replacement Rules Builder Transform Variables Decision Tree AutoNeural Regression Neural Network Partial Least Squares Dmine Regression DM Neural Ensemble Rule Induction Gradient Boosting LARS MBR Two Stage Model Import MODEL Incremental Response Survival Analysis Credit Scoring* TS Correlation TS Data Prep TS Dimension Reduction TS Decomp. TS Similarity TS Exponential Smoothing HP Explore HP Impute HP Regression HP Transform HP Variable Selection HP Neural HP Forest HP Decision Tree HP Data Partition HP GLM HP SVM HP Cluster HP Principal Components ASSESS Cutoff Decisions Model Comparison Score Segment Profile UTILITY Control Point End Groups Start Groups Open Source Integration Reporter Score Code Export Metadata SAS Code Ext Demo Save Data Register Metadata *Requires Credit Scoring for SAS Enterprise Miner Add-on License.

SKALOWALNOŚĆ SAS Enterprise Miner SINGLE SERVER (Traditional) SAS GRID MANAGER* (On-premise Grid) SAS ANALYTICS ACCELERATOR* (In-database) SAS HIGH- PERFORMANCE DATA MINING* (In-memory) SAS Model Manager* SAS Scoring Accelerator (In-database)* *Add-on product. Requires separate license

DEMO

PRZYKŁADOWY SCENARIUSZ ORGANIZACJA CHARYTATYWNA Dane: 19372 obserwacje 45 zmiennych Na potrzeby scenariusza załóżmy, że jesteśmy analitykiem danych w organizacji charytatywnej. Organizacja ta stara się wykorzystać wyniki poprzedniej akcji wysyłania pocztówek zachęcających do przekazania darowizny aby lepiej ukierunkować swoją następną kampanię. W szczególności, trzeba określić, które z osób w korespondencyjnej bazie danych posiadają cechy podobne do najbardziej dochodowych darczyńców. Poprzez zabieganie tylko o takich ludzi, organizacja może wydawać mniej pieniędzy na akwizycję a więcej pieniędzy wykorzystać na cele charytatywne.

GŁÓWNE ZALETY Nowoczesne środowisko do rozwiązywania różnorodnych zagadnień Adekwatne wnioski dla różnych grup użytkowników NAJLEPSZY W SWOJEJ KLASIE UŻYTECZNOŚĆ INSIGHTS Szybko i intuicyjnie uzyskaj wnioski i poprawę efektywności procesów Łatwość wdrożenia modeli i procesu oceny punktowej SZYBKOŚĆ WYDAJNOŚĆ

DZIĘKUJĘ ZA UWAGĘ