Odczarowujemy modele predykcyjne Teoria i Praktyka

Wielkość: px
Rozpocząć pokaz od strony:

Download "Odczarowujemy modele predykcyjne Teoria i Praktyka"

Transkrypt

1 Odczarowujemy modele predykcyjne Teoria i Praktyka Mariusz Gromada, MathSpace.PL mariuszgromada.org@gmail.com 1

2 Kilka słów o mnie Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych Kierunek: Matematyka Uniwersytet Warszawski Wydział Nauk Ekonomicznych Kierunek: Metody Statystyczne w Biznesie Departament Business Intelligence Kierownik Zespołu Analiz Data Mining, Architekt Rozwiązań BI, Analityk 2014 Departament Zarządzania Kampaniami Kierownik Zespołu Analitycznego Wsparcia Kampanii 2

3 hobby / projekty / publikacje 3

4 Agenda O czym będę mówił, a o czym mówił nie będę Analityka Predykcyjna Model Predykcyjny Confusion Matrix / Macierz błędu Strategie doboru punktu odcięcia Ocena jakości klasyfikacji Krzywa zysku Krzywa Lift Krzywa ROC i wskaźnik Giniego Krzywa Zysku vs ROC - równoważność? Modele teoretycznie idealne Dalsze materiały - Ocena jakości klasyfikacji - MathSpace.pl 4

5 O czym będę mówił, a o czym mówił nie będę Przedstawię najczęstsze obszary wykorzystania modeli predykcyjnych w procesach biznesowych (na styku z Klientem), nie będę omawiał całej gamy możliwości płynących z analityki predykcyjnej. Przybliżę szereg intuicji związanych z problemem klasyfikacji binarnej, nie będę omawiał algorytmów, technik i narzędzi służących do budowy modeli. Podzielę się własnym doświadczeniem z zakresu oceny jakości klasyfikacji, nawiążę do kwestii teoretycznych i praktycznych, pomijając obszar weryfikacji założeń wstępnych niezbędnych (w teorii) do zastosowania danej metody (abstrahujemy od metody). Materiał w dużej mierze oparty na tekstach, które opublikowałem w okresie pod adresem: 5

6 Analityka Predykcyjna Mariusz Gromada, MathSpace.PL 6

7 Analityka predykcyjna Analityka predykcyjna to analiza bieżących lub historycznych faktów w celu dokonania predykcji co do przyszłych zdarzeń lub zdarzeń nieznanych (np. scenariusze what-if ). W zastosowaniach biznesowych najczęściej poszukuje się trendów / wzorców w danych historycznych i transakcyjnych w celu identyfikacji szans i ryzyk. Analityka predykcyjna jest częścią szerszej gałęzi metod wydobywania wiedzy z danych zwanej Data Mining. Podstawowym narzędziem stosowanym w analityce predykcyjnej jest statystyczny model predykcyjny często nazywany modelem scoringowym. 7

8 Analityka predykcyjna vs Statystyka matematyczna Niskie ryzyko / niski potencjał Analityka Predykcyjna Statystyka Analityka Predykcyjna Wysokie ryzyko / Wysoki potencjał 8

9 Analityka predykcyjna w zastosowaniach biznesowych!!! tylko najważniejsze obszary, z którymi faktycznie pracowałem!!! Pozyskanie klienta Modele oceny ryzyka kredytowego Modele ryzyka nadużyć CRM głównie x-sell Modele skłonności do zakupu produktu Modele up-lift (wpływ inkrementalny komunikacji marketingowej) Modele oceny ryzyka kredytowego Modele churn (modele atrycji) Systemy rekomendacji Wartości oczekiwane - plany sprzedażowe / cele sprzedażowe SNA Social Network Analysis Windykacja Prognoza optymalnej ścieżki windykacyjnej 9

10 Model Predykcyjny Mariusz Gromada, MathSpace.PL rozpowszechnianie, przeniesienie na osoby trzecie wymaga zgody autora. 10

11 Model predykcyjny podstawowe pojęcia Model statystyczny to reguła wiążąca zmienne objaśniające ze zmienną objaśnianą. Przykład - jeśli chcemy wyjaśnić zależność wagi ciała od wzrostu i płci to waga nazywana jest zmienną objaśnianą (zmienną celu lub targetem) natomiast wzrost i płeć stanowią zmienne objaśniające (predyktory). Podstawową własnością modelu jest jakość modelu, na którą składają się dwa główne czynniki: błąd przewidywań modelu (bezpośredni wpływ na efekty wykorzystania modelu) stabilność modelu w czasie (wpływ na możliwość wykorzystania modelu w dłuższym horyzoncie czasowym) Jakość / interpretowalność współczynników modelu, choć ważna, to w zastosowaniach biznesowych często stanowi jedynie dodatkowy element. Modele bezbłędne w praktyce nie są możliwe do skonstruowania i z tego też powodu nazywane są teoretycznymi modelami idealnymi. 11

12 Model predykcyjny i Problem klasyfikacji binarnej - identyfikacja szans i ryzyk Szansa / Ryzyko czyli to czego szukamy (np. szansa - klient skłonny do skorzystania z oferty, ryzyko potencjalny fraud) Model budowany jest na binarnej zmiennej celu (złożonej z dwóch klas): Klasa 1 (TAK - pozytywna) stan faktyczny pozytywny (np. klient skorzystał z oferty, klient dokonał nadużycia) Klasa 0 (NIE - negatywna) stan faktyczny negatywny W tym przypadku model predykcyjny szacuje prawdopodobieństwo wystąpienia szansy / ryzyka zwracana jest wartość ciągła. X - przestrzeń obiektów (np. baza Klientów) p 1 x : X [0,1] model Klasyfikacja do jednej z powyższych klas odbywa się za pomocą ustalonego punktu decyzji (punkt odcięcia, cut-off) i niesie za sobą 4 możliwe decyzje. 12

13 Confusion Matrix / Macierz błędu Precyzja wskazania pozytywnego Precyzja wskazania negatywnego Czułość Zasięg / pokrycie klasy faktycznie pozytywnej Specyficzność Zasięg / pokrycie klasy faktycznie negatywnej 13

14 Confusion Matrix Optymalizacja Medyczny test przesiewowy PPV niekoniecznie duże Potencjalnie chorych kierujemy do dalszej diagnostyki Czułość wysoka False-Negative kosztuje życie Chcemy wyłapać możliwie wszystkich chorych Bardzo wysokie NPV Odsiewamy zdrowych Specyficzność mniejsza False-Positive kosztuje mniej Kierujemy tylko do dalszej diagnostyki 14

15 Confusion Matrix Optymalizacja Medyczny test diagnostyczny PPV bardzo duże Musimy wiedzieć, że (i co) trzeba leczyć Bardzo wysokie NPV Musimy mieć pewność, że leczenie jest zbędne Czułość wysoka Wykrywamy niemal wszystkich chorych Specyficzność wysoka Wychwytujemy niemal wszystkich zdrowych 15

16 Model + Confusion Matrix + Cut-off 16

17 Cut-off: Niska, średnia, wysoka skłonność 17

18 Dobór punktu cut-off Mariusz Gromada, MathSpace.PL rozpowszechnianie, przeniesienie na osoby trzecie wymaga zgody autora. 18

19 Strategie doboru punktu odcięcia Strategie, z którymi miałem do czynienia w pracy zawodowej Całkowicie biznesowa - metoda najprostsza, nadal popularna, jednak coraz rzadziej stosowana. Wyłącznie analityczna - rzadko stosowane w biznesie, częściej widoczna pracach / badaniach naukowych. Hybryda powyższych - wariant dziś preferowany przez różne jednostki CRM. 19

20 Dobór całkowicie biznesowy Nadal częsta praktyka, która przy wnikliwej analizie okazuje się nie być najbardziej optymalną. Dobór punktu odcięcia jest pochodną zasobów (np. dostępność / pojemność kanałów komunikacji). Przykład: współpracujemy z Call Center, które miesięcznie może zadzwonić do 100 tys. Klientów. W takiej sytuacji dosyć naturalnie powstaje potrzeba wybrania "100 tys. najlepszych Klientów" (najlepszych do danej akcji). Model predykcyjny posłuży więc do "posortowania" Klientów, a punkt odcięcia będzie zależny od wskazanej oczekiwanej liczby 100 tys. Problem ze strategią całkowicie biznesową polega na tym, że "najlepszy" mylony jest z "dobry". Dodatkowo zdarza się, że siła modelu jest błędnie interpretowana jako zdolność do znalezienie większej liczby "dobrych" klientów - w rzeczywistości jest na odwrót - im lepszy model, tym mniejsze optymalne bazy. Równie istotna kwestia to skąd się właściwie wzięła liczba 100 tys.? 20

21 Dobór wyłącznie analityczny Dobór wyłącznie analityczny polega na optymalizacji błędów klasyfikacji. W nieco bardziej zgeneralizowanym podejściu optymalizuje się funkcję kosztu błędów (najczęściej jeśli koszty są mocno asymetryczne). Podejście analityczne jest zupełnie poprawna i uzasadnione, jednak w biznesie prawie nieobecne ze względu na brak uwzględnionego aspektu celu biznesowego, priorytetów, zasobów, itp. 21

22 Dobór analityczno-biznesowy Dobór analityczno-biznesowy najlepiej sprawdza się w sytuacji analizy szerszego portfela produktów (tzn. bazy i cut-off y dobierane do różnych działań stanowią element realizacji szerszej polityki CRM). Zaczynamy od celów biznesowych, priorytetów, analizy zasobów, pojemności kanałów. Następnie weryfikujemy Klientów, ich potrzeby w kontekście możliwie wielu produktów. Ostatecznie - w wyniku kilku iteracji - dążymy do "zmapowania" segmentów Klientów na cele i zasoby, zawsze koniecznie modyfikując obie strony równania. Jest to trudne i wielowymiarowe zadanie, zadanie zawsze "niedokończone", coraz bardziej opierające się na różnego rodzaju eksperymentach. 22

23 Ocena jakości klasyfikacji Model predykcyjny Separacja klas Korelacja rangowa Mariusz Gromada, MathSpace.PL 23

24 Prawdopodobieństwo a-priori cecha populacji a-priori Liczba obiektów z klasy faktycznie pozytywnej P(1) = # klasa = 1 # klasa = 1 lub klasa = 0 Łączna liczba obiektów 24

25 Przypadek 1 brak separacji klas Prawdopodobieństwo w przedziale P 1 q = # klasa = 1 q q # q q Prawdopodobieństwo w przedziale Zwielokrotnienie prawdopodobieństwa Lift( q) = P(1 q) P(1) Prawdopodobieństwo w całej bazie 25

26 Przypadek 2 niska separacja klas Prawdopodobieństwo w przedziale P 1 q = # klasa = 1 q q # q q Prawdopodobieństwo w przedziale Zwielokrotnienie prawdopodobieństwa Lift( q) = P(1 q) P(1) Prawdopodobieństwo w całej bazie 26

27 Przypadek 3 wysoka separacja klas Prawdopodobieństwo w przedziale P 1 q = # klasa = 1 q q # q q Prawdopodobieństwo w przedziale Zwielokrotnienie prawdopodobieństwa Lift( q) = P(1 q) P(1) Prawdopodobieństwo w całej bazie 27

28 Przypadek 4 maksymalna separacja klas Prawdopodobieństwo w przedziale P 1 q = # klasa = 1 q q # q q Prawdopodobieństwo w przedziale Zwielokrotnienie prawdopodobieństwa Lift( q) = P(1 q) P(1) Prawdopodobieństwo w całej bazie 28

29 Przypadek 5 ujemna separacja klas Prawdopodobieństwo w przedziale P 1 q = # klasa = 1 q q # q q Prawdopodobieństwo w przedziale Zwielokrotnienie prawdopodobieństwa Lift( q) = P(1 q) P(1) Prawdopodobieństwo w całej bazie 29

30 Zatem model predykcyjny to zmiana porządku Analogia: Siła modelu jako siła podmuchu wiatru 30

31 Krzywa zysku (Gain Curve, Captured Response, TPR) 31

32 Krzywa Lift 32

33 Krzywa ROC i wskaźnik Giniego Mariusz Gromada, MathSpace.PL 33

34 Krzywa ROC - Receiver Operating Characteristic W statystyce matematycznej krzywa ROC jest graficzną reprezentacją efektywności modelu predykcyjnego. ROC to wykreślenie charakterystyki jakościowej klasyfikatorów binarnych powstałych z modelu przy zastosowaniu wielu różnych punktów odcięcia. ROC = 1 TNR TPR 34

35 Krzywa ROC - Receiver Operating Characteristic Klasyfikator idealny to maksymalne pokrycie klasy faktycznie pozytywnej przy jednocześnie zerowym błędzie na klasie faktycznie negatywnej: TPR = 100%, FPR = 0% = 100% - TNR. Inaczej czułość = 100%, specyficzność = 100%. Klasyfikatory losowe to punkty leżące na prostej TPR = FPR. Jak zawsze chodzi o pewien kompromis, tzn. dobierając "cut-off" chcemy maksymalizować TPR "trzymając w ryzach" błąd FPR. 35

36 AUROC Area Under ROC AUROC Area Under ROC 0 AUROC 1 AUROC - p-ństwo, że ocena losowo wybranego elementy z klasy 1 będzie wyższa niż ocena losowo wybranego obiektu z klasy 0. AUROC = 1 dla modelu teoretycznie idealnego AUROC = ½ dla modelu losowego (rzut monetą?) 36

37 Wskaźnik Giniego na bazie ROC 0 Gini 1 Gini - % idealności: modelu. Gini = 1 dla modelu teoretycznie idealnego. Gini = 0 dla modelu losowego 37

38 Krzywa Zysku (TPR, Captured Response) = ROC x apriori 38

39 Wskaźnik Giniego na bazie Krzywej zysku 39

40 Modele teoretycznie idealne Mariusz Gromada, MathSpace.PL 40

41 Model teoretycznie idealny a prawdopodobieństwo a-priori Model teoretycznie idealny to taki model, który daje najlepsze możliwe uporządkowanie - inaczej mówiąc najlepszą możliwą separację klas. Taki model nie myli się przy założeniu, że punkt odcięcia odpowiada prawdopodobieństwu a-priori. Wtedy faktycznie cała klasa pozytywna jest po jednej stronie, a cała klasa negatywna po drugiej stronie punktu cut-off. 41

42 Model teoretycznie idealny również popełnia błąd Przy każdym innym cut-off model teoretycznie idealny popełnia mniejszy lub większy błąd. 42

43 Model teoretycznie idealny i Przestrzeń na model Krzywa zysku / Captured Response / TPR 43

44 Model teoretycznie idealny i Przestrzeń na model Krzywa zysku / Captured Response / TPR 44

45 Model teoretycznie idealny i Przestrzeń na model Krzywa ROC 45

46 Model teoretycznie idealny i Przestrzeń na model Lift / prawdopodobieństwo nieskumulowane 46

47 Model teoretycznie idealny i Przestrzeń na model Lift / prawdopodobieństwo skumulowane 47

48 Cykl Ocena jakości klasyfikacji na blogu MathSpace.pl zapraszam Mariusz Gromada, MathSpace.PL 48

49 Cykl Ocena jakości klasyfikacji MathSpace.pl 1. Confusion matrix, Macierz błędu 2. Zasięg (TPR - czułość / TNR - specyficzność) i precyzja (PPV / NPV) 3. Model predykcyjny i punkt odcięcia (cut-off point) 4. Model predykcyjny i siła separacji klas 5. Strategie doboru punktów odcięcia 6. Skumulowane miary siły modelu predykcyjnego 7. Receiver Operating Characteristic - Krzywa ROC 8. TPR = ROC x apriori 9. Analiza estymacji prawdopodobieństwa 10.Model teoretycznie idealny 11.TPR vs Lift 12.Wskaźnik Giniego na bazie TPR 13.Lift nieskumulowany jako gęstość, TPR jako dystrybuanta 14.Wskaźnik KS na bazie TPR 15.Dwie klasy, ale jeden wskaźnik Giniego 16."Sympatyczny" punkt przecięcia 17.PPV i FDR na bazie TPR 18.TPR i FNR na bazie Liftu Skumulowanego 19.Wskaźnik Giniego na bazie wartości oczekiwanej 49

50 Dziękuję za uwagę Mariusz Gromada, MathSpace.PL 50

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek Cel projektu Celem projektu jest przygotowanie systemu wnioskowania, wykorzystującego wybrane algorytmy sztucznej inteligencji; Nabycie

Bardziej szczegółowo

Indukowane Reguły Decyzyjne I. Wykład 8

Indukowane Reguły Decyzyjne I. Wykład 8 Indukowane Reguły Decyzyjne I Wykład 8 IRD Wykład 8 Plan Powtórka Krzywa ROC = Receiver Operating Characteristic Wybór modelu Statystyka AUC ROC = pole pod krzywą ROC Wybór punktu odcięcia Reguły decyzyjne

Bardziej szczegółowo

StatSoft profesjonalny partner w zakresie analizy danych

StatSoft profesjonalny partner w zakresie analizy danych Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta Stan dotychczasowy OCENA KLASYFIKACJI w diagnostyce Wybraliśmy metodę uczenia maszynowego (np. sieć neuronowa lub drzewo decyzyjne), która będzie klasyfikować nieznane przypadki Na podzbiorze dostępnych

Bardziej szczegółowo

9. Praktyczna ocena jakości klasyfikacji

9. Praktyczna ocena jakości klasyfikacji Algorytmy rozpoznawania obrazów 9. Praktyczna ocena jakości klasyfikacji dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Zbiór uczacy i zbiór testowy 1. Zbiór uczacy służy do konstrukcji (treningu)

Bardziej szczegółowo

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład II bogumil.konopka@pwr.edu.pl 2017/2018 Określenie rzeczywistej dokładności modelu Zbiór treningowym vs zbiór testowy Zbiór treningowy

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Baza dla predykcji medycznej

Baza dla predykcji medycznej 1 rof. Danuta Makowiec Instytut Fizyki Teoretycznej i Astrofizyki UG Kontakt: pok. 353 tel.: 58 523 2466 e-mail danuta.makowiec at gmail.com http://www.fizdm.strony.ug.edu.pl/me/biostatystyka.html Reguła

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Narzędzia IT we współczesnych strategiach utrzymaniowych

Narzędzia IT we współczesnych strategiach utrzymaniowych Narzędzia IT we współczesnych strategiach utrzymaniowych - NAJNOWSZE TRENDY - Piotr Rzepakowski, CEO Decitum Sp. z o.o. Od predykcji churn, przez analizę retencji do optymalizacji utrzymania Przyszła Analityczny

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

Metody scoringowe w regresji logistycznej

Metody scoringowe w regresji logistycznej Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

10/15/2016. Reguła. Czułość PV(+) Bayesa. Swoistość PV(-)

10/15/2016. Reguła. Czułość PV(+) Bayesa. Swoistość PV(-) A=symptom B= choroba Czułość Swoistość A ~ A ~ Reguła Bayesa ~ B ~ A) PV(+) PV(-) 1 / 2016_10_13 PV ( ) A PV ( ) A A ~ ~ sensitivity * PV ( ) sensitivity * (1 specificity)(1- ) specificity *(1- ) specificity

Bardziej szczegółowo

Skuteczna operacjonalizacja środowiska analitycznego

Skuteczna operacjonalizacja środowiska analitycznego Skuteczna operacjonalizacja środowiska analitycznego Komponenty Integracja Pomiar wartości Budowa i wykorzystanie wiedzy Mariusz Gromada, MathSpace.PL mariuszgromada.org@gmail.com 2015-10- rozpowszechnianie,

Bardziej szczegółowo

Jak wybrać 45 najlepszych. prezentacji na FORUM?

Jak wybrać 45 najlepszych. prezentacji na FORUM? Ile wart jest Twój najlepszy klient? Czyli jak mierzyć Customer Lifetime Value Jak wybrać 45 najlepszych i dlaczego warto to robić. prezentacji na FORUM? Łukasz Dziekan Joanna Komuda, IAB Polska Katarzyna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Miary jakości w Call Center

Miary jakości w Call Center OFERTA SZKOLENIOWA Miary jakości w Call Center TELEAKADEMIA to profesjonalne centrum szkoleniowe mające swoją siedzibę w Pomorskim Parku Naukowo-Technologicznym w Gdyni. TELEAKADEMIA realizuje szkolenia

Bardziej szczegółowo

Statystyka opisowa. Robert Pietrzykowski.

Statystyka opisowa. Robert Pietrzykowski. Statystyka opisowa Robert Pietrzykowski email: robert_pietrzykowski@sggw.pl www.ekonometria.info 2 Na dziś Sprawy bieżące Przypominam, że 14.11.2015 pierwszy sprawdzian Konsultacje Sobota 9:00 10:00 pok.

Bardziej szczegółowo

Ocena dokładności diagnozy

Ocena dokładności diagnozy Ocena dokładności diagnozy Diagnoza medyczna, w wielu przypadkach może być interpretowana jako działanie polegające na podjęciu jednej z dwóch decyzji odnośnie stanu zdrowotnego pacjenta: 0 pacjent zdrowy

Bardziej szczegółowo

Biznes plan innowacyjnego przedsięwzięcia

Biznes plan innowacyjnego przedsięwzięcia Biznes plan innowacyjnego przedsięwzięcia 1 Co to jest biznesplan? Biznes plan można zdefiniować jako długofalowy i kompleksowy plan działalności organizacji gospodarczej lub realizacji przedsięwzięcia

Bardziej szczegółowo

Krzywe ROC i inne techniki oceny jakości klasyfikatorów

Krzywe ROC i inne techniki oceny jakości klasyfikatorów Krzywe ROC i inne techniki oceny jakości klasyfikatorów Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 20 maja 2009 1 2 Przykład krzywej ROC 3 4 Pakiet ROCR Dostępne metryki Krzywe

Bardziej szczegółowo

Data Mining Wykład 4. Plan wykładu

Data Mining Wykład 4. Plan wykładu Data Mining Wykład 4 Klasyfikacja danych Klasyfikacja poprzez indukcje drzew decyzyjnych Plan wykładu Sformułowanie problemu Kryteria oceny metod klasyfikacji Metody klasyfikacji Klasyfikacja poprzez indukcje

Bardziej szczegółowo

Wykorzystanie i monitorowanie scoringu

Wykorzystanie i monitorowanie scoringu Analiza danych Data mining Sterowanie jakością Analityka przez Internet Wykorzystanie i monitorowanie scoringu Tomasz Sudakowski Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Systemy uczące się wykład 2

Systemy uczące się wykład 2 Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania

Bardziej szczegółowo

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY Piotr Wójtowicz, Grzegorz Migut StatSoft Polska Jakie są różnice pomiędzy osobami prawidłowo regulującymi swoje zobowiązania a niechętnie spłacającymi swoje długi,

Bardziej szczegółowo

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym

Bardziej szczegółowo

Konstrukcja miernika szans na bankructwo firmy

Konstrukcja miernika szans na bankructwo firmy Natalia Nehrebecka / Departament Statystyki Konstrukcja miernika szans na bankructwo firmy Statystyka Wiedza Rozwój, 17-18 października 2013 r. w Łodzi Konstrukcja miernika szans na bankructwo firmy 2

Bardziej szczegółowo

z wyszczególnieniem usług automatyzacji procesów mgr inż. Adam Smółkowski mgr inż. Marcin Wójciuk Aspartus (Grupa ProService FINTECO)

z wyszczególnieniem usług automatyzacji procesów mgr inż. Adam Smółkowski mgr inż. Marcin Wójciuk Aspartus (Grupa ProService FINTECO) Przewidywane kierunki outsourcingu w ubezpieczeniach z wyszczególnieniem usług automatyzacji procesów mgr inż. Adam Smółkowski mgr inż. Marcin Wójciuk Aspartus (Grupa ProService FINTECO) Outsourcing definicja

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Analiza Popytu. Metody analizy rynku produktowego

Analiza Popytu. Metody analizy rynku produktowego Analiza Popytu Metody analizy rynku produktowego Cele szacowania rynku Czy wielkość rynku jest wystarczająca? Czy warto się zajmować tym rynkiem? Jak dostosować strategię i działania operacyjne? Ile gotówki

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Algorytmy klasyfikacji

Algorytmy klasyfikacji Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): I stopnia

Bardziej szczegółowo

Model Matematyczny Call Center

Model Matematyczny Call Center OFERTA SZKOLENIOWA Model Matematyczny Call Center TELEAKADEMIA to profesjonalne centrum szkoleniowe mające swoją siedzibę w Pomorskim Parku Naukowo-Technologicznym w Gdyni. TELEAKADEMIA realizuje szkolenia

Bardziej szczegółowo

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia. D A R I U S Z P I W C Z Y Ń S K I 2 2 ROZKŁAD ZMIENNEJ LOSOWEJ Polega na przyporządkowaniu

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego

Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego Proces i narzędzia analizy potencjału wybranych obszarów rynku farmaceutycznego Przyglądając się rynkowi farmaceutycznemu w Polsce możemy zauważyć, że jest to jedna z lepiej zwymiarowanych i opisanych

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

TRENING KOMPETENCJI MENEDŻERSKICH

TRENING KOMPETENCJI MENEDŻERSKICH TRENING KOMPETENCJI MENEDŻERSKICH Przykładowy program szkolenia Dzień Sesja 1: Wprowadzenie do zarządzania strategicznego Definicje i podstawowe terminy z zakresu zarządzania strategicznego Interesariusze

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU

Bardziej szczegółowo

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Digital Analytics vs Business Analytics Jak łączyć by osiągnąć maksimum korzyści? Maciej Gałecki

Digital Analytics vs Business Analytics Jak łączyć by osiągnąć maksimum korzyści? Maciej Gałecki Digital Analytics vs Business Analytics Jak łączyć by osiągnąć maksimum korzyści? Maciej Gałecki Jak Digital Analytics może wpływać na biznes? 2 Jak rozumiem Digital Analytics? Digital Analytics to na

Bardziej szczegółowo

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem. Teoria błędów Wskutek niedoskonałości przyrządów, jak również niedoskonałości organów zmysłów wszystkie pomiary są dokonywane z określonym stopniem dokładności. Nie otrzymujemy prawidłowych wartości mierzonej

Bardziej szczegółowo

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006 SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

Zarządzanie sprzedażą Doradztwo strategiczne Restrukturyzacje

Zarządzanie sprzedażą Doradztwo strategiczne Restrukturyzacje Zarządzanie sprzedażą Doradztwo strategiczne Restrukturyzacje winstar Strategie rozwoju biznesu 2011 Winstar Wszystkie prawa zastrzeżone Rozdział: Błąd! W dokumencie nie ma tekstu o podanym stylu. Winstar

Bardziej szczegółowo

Zintegrowane Systemy Informatyczne analiza, projektowanie, wdrażanie

Zintegrowane Systemy Informatyczne analiza, projektowanie, wdrażanie dr hab. Grzegorz Bartoszewicz, prof. nadzw. UEP Katedra Informatyki Ekonomicznej Zintegrowane Systemy Informatyczne analiza, projektowanie, wdrażanie Tematyka seminarium związana jest z wykorzystaniem

Bardziej szczegółowo

Imię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr

Imię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr Tryb studiów Stacjonarne Nazwa kierunku studiów EKONOMIA Poziom studiów Stopień pierwszy Rok studiów/ semestr III; semestr 5 Specjalność Bez specjalności Kod przedmiotu w systemie USOS 1000-ES1-3EC1 Liczba

Bardziej szczegółowo

Analityka predykcyjna w marketingu i sprzedaży

Analityka predykcyjna w marketingu i sprzedaży Analityka predykcyjna w marketingu i sprzedaży Marcin Górzyński Partner Zarządzający Jędrzej Traczykowski Partner Zarządzający Czym jest data mining i analizy predykcyjne? Analiza dużej ilości danych w

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Po co w ogóle prognozujemy?

Po co w ogóle prognozujemy? Po co w ogóle prognozujemy? Pojęcie prognozy: racjonalne, naukowe przewidywanie przyszłych zdarzeń stwierdzenie odnoszącym się do określonej przyszłości formułowanym z wykorzystaniem metod naukowym, weryfikowalnym

Bardziej szczegółowo

STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA

STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA Mirosław Popieluch, StatSoft Polska Sp. z o.o. Gromadzenie coraz większych ilości danych w każdej dziedzinie życia i gospodarki

Bardziej szczegółowo

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

Odzyskać pożyczone. Przyjrzyjmy się praktycznym aspektom modelowania ryzyka kredytowego. Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu

Odzyskać pożyczone. Przyjrzyjmy się praktycznym aspektom modelowania ryzyka kredytowego. Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu Autorzy Jadwiga Żarna Can-Pack SA, Dział Zarządzania Ryzykiem Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu Ilustracja Maciej Grzesiak 53 Odzyskać pożyczone Przyjrzyjmy się praktycznym aspektom

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Wprowadzenie do uczenia maszynowego

Wprowadzenie do uczenia maszynowego Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania

Bardziej szczegółowo

Co matematyka może dać bankowi?

Co matematyka może dać bankowi? Co matematyka może dać bankowi? Biznes zakres pracy matematyków Pomiar i analiza miar detalicznych procesów kredytowych i ubezpieczeniowych, inicjowanie działań zapewniających poprawę efektywności i obniżenie

Bardziej szczegółowo

Optymalizacja Automatycznych Testów Regresywnych

Optymalizacja Automatycznych Testów Regresywnych Optymalizacja Automatycznych Testów Regresywnych W Organizacji Transformującej do Agile Adam Marciszewski adam.marciszewski@tieto.com Agenda Kontekst projektu Typowe podejście Wyzwania Cel Założenia Opis

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Walidacja metod wykrywania, identyfikacji i ilościowego oznaczania GMO. Magdalena Żurawska-Zajfert Laboratorium Kontroli GMO IHAR-PIB

Walidacja metod wykrywania, identyfikacji i ilościowego oznaczania GMO. Magdalena Żurawska-Zajfert Laboratorium Kontroli GMO IHAR-PIB Walidacja metod wykrywania, identyfikacji i ilościowego oznaczania GMO Magdalena Żurawska-Zajfert Laboratorium Kontroli GMO IHAR-PIB Walidacja Walidacja jest potwierdzeniem przez zbadanie i przedstawienie

Bardziej szczegółowo

Statystyczna analiza Danych

Statystyczna analiza Danych Statystyczna analiza Danych Dla bioinformatyków Wykład pierwszy: O testowaniu hipotez Plan na dziś Quiz! Cele wykładu Plan na semestr Kryteria zaliczenia Sprawy organizacyjne Quiz (15 minut) Jakie znasz

Bardziej szczegółowo

SYSTEMY WCZESNEGO OSTRZEGANIA W BIZNESIE

SYSTEMY WCZESNEGO OSTRZEGANIA W BIZNESIE SYSTEMY WCZESNEGO OSTRZEGANIA W BIZNESIE Plan seminarium Po co systemy wczesnego ostrzegania? Narzędzia do budowy systemów wczesnego ostrzegania Najlepszy sposób śledzenia wykonania założonych celów Dynamiczne

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) Statystyka I Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) 1 Zmienne jakościowe qzmienne jakościowe niemierzalne kategorie: np. pracujący / bezrobotny qzmienna binarna Y=0,1 qczasami

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Modelowanie glikemii w procesie insulinoterapii

Modelowanie glikemii w procesie insulinoterapii Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą

Bardziej szczegółowo

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw dr Karolina Borowiec-Mihilewicz Uniwersytet Ekonomiczny we Wrocławiu Zastosowania

Bardziej szczegółowo

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy

Nadajemy pracy sens. Raport Zbiorczy ANALIZA RENTOWNOŚCI. Klient / Klient testowy Raport Zbiorczy ANALIZA RENTOWNOŚCI Klient / Klient testowy Wygenerowano: 04/03/2016 Informacje o ValueView ValueView to pomiar rentowności zadań, stanowisk i komórek organizacyjnych. Rentowność rozumiana

Bardziej szczegółowo

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011 SYLLABUS na rok akademicki 00/0 Tryb studiów Stacjonarne Nazwa kierunku studiów EKONOMIA Poziom studiów Stopień pierwszy Rok studiów/ semestr III; semestr 5 Specjalność Bez specjalności Kod przedmiotu

Bardziej szczegółowo

Statystyka Matematyczna Anna Janicka

Statystyka Matematyczna Anna Janicka Statystyka Matematyczna Anna Janicka wykład IX, 25.04.2016 TESTOWANIE HIPOTEZ STATYSTYCZNYCH Plan na dzisiaj 1. Hipoteza statystyczna 2. Test statystyczny 3. Błędy I-go i II-go rodzaju 4. Poziom istotności,

Bardziej szczegółowo

Wykład ze statystyki. Maciej Wolny

Wykład ze statystyki. Maciej Wolny Wykład ze statystyki Maciej Wolny T1: Zajęcia organizacyjne Agenda 1. Program wykładu 2. Cel zajęć 3. Nabyte umiejętności 4. Literatura 5. Warunki zaliczenia Program wykładu T1: Zajęcia organizacyjne T2:

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Jakość procedury klasyfikacyjnej:

Jakość procedury klasyfikacyjnej: Jakość procedury klasyfikacyjnej: poglądowa interpretacja i szacowanie możliwości poprawy na podstawie charakterystyki ROC Maciej Górkiewicz mygorkie@cyf-kr.edu.pl Uniwersytet Jagielloński w Krakowie Collegium

Bardziej szczegółowo

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Zarządzanie ryzykiem finansowym

Zarządzanie ryzykiem finansowym Zarządzanie projektami Wrocław, 30 października 2013 Spis treści Motywacja Rachunek prawdopodobieństwa Koherentne miary ryzyka Przykłady zastosowań Podsumowanie Po co analizować ryzyko na rynkach finansowych?

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo