ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK"

Transkrypt

1 ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK Streszczenie Paweł Pandzierski Akademia Ekonomiczna im. Oskara Langego we Wrocławiu Artykuł ten przedstawia zwięzły szkic przykładowych rozwaŝań, które mogą wpłynąć na decyzję zastosowania i wyboru pakietu Data Mining. Pierwsza część rozwaŝań jest powierzchowną prezentacją niektórych zastosowań eksploracji. Zawarte jest tam równieŝ proste porównanie najwaŝniejszych pakietów Data Mining. Kolejny rozdział zawiera przykład odkrywania uŝytecznych zaleŝności w danych kredytowych banku. W zakończeniu przedstawiono zestawienie wybranych narzędzi i technik budowy modelu, oraz podsumowanie przeprowadzonych rozwaŝań. Słowa kluczowe: Data Mining, eksploracja danych, klasyfikacja. 1. Wstęp Znaczenie posiadania właściwej wiedzy w określonym czasie przez decydenta jest wartością nie do przecenienia. Wiedza moŝe pochodzić z róŝnych źródeł, moŝe teŝ być pozyskiwana z danych gromadzonych latami w przedsiębiorstwie. Lista moŝliwych zastosowań eksploracji danych, a tym samym zastosowań odpowiedniego oprogramowania jest bardzo długa i systematycznie poszerzana. Koszt analiz marketingowych, moŝe ulec obniŝeniu o bardzo istotny składnik - nakłady na samo zebranie danych, gdy zaczniemy eksplorować juŝ posiadane, archiwalne dane. Trudno teŝ stwierdzić, co jest bardziej zaawansowanym raportem z zapytania, a co moŝemy juŝ określić jako Data Mining, ale zawsze mówimy wtedy o pozyskiwaniu wiedzy z bazy danych, wiedzy która nie jest oczywista [WYRO02]. Przy wyborze narzędzia kierujemy się róŝnymi kryteriami, jak np. do czego narzędzie będzie zastosowane (obszar tematyczny aplikacji), dostępność narzędzi, ich jakość oraz koszt. Wybór spośród ofert róŝnych producentów jest spory. Raz zakupione narzędzie powinno być uŝyteczne przez dłuŝszy okres, a nie tylko jednorazowo. Zatem problem wyboru narzędzia jest waŝny dla przedsiębiorstwa. Właściwy zakup to dla firmy korzyść, zakup niewłaściwy to czysta strata.

2 348 Zarządzanie wiedzą i rozwiązania Business Intelligence 2.Metody eksploracji danych Istnieje wiele metod eksploracji danych, od klasycznej statystyki aŝ po sieci neuronowe i algorytmy genetyczne. KaŜda z reguł reprezentuje zaleŝności odkryte w posiadanych bazach danych i kaŝda moŝe być wykorzystana do predykcji przyszłych wartości i zachowań. Przykłady zastosowań eksploracji danych: Przy: analizie dostępów do stron w Web, analizie koszyka, badaniu zachowań klientów w czasie, bezpośrednim marketingu, planowaniu inwestycji giełdowych, przewidywaniu sprzedaŝy (ubezpieczenia, telekomunikacja) uŝyteczne jest odkrywanie wzorców sekwencji - czasowych wzorców zachowań, Do zastosowań takich jak: rozpoznawanie obrazów (biologia, medycyna), określanie segmentów rynku na podstawie cech klientów (telekomunikacja, ubezpieczenia), poprawa jakości produktu, wczesne ostrzeganie przed awariami stosujemy klastrowanie, celem jest tu znajdowanie skończonego zbioru klas obiektów - klastrów (o stałej ilości), czyli podzbiorów podobnych rekordów. Klastrowanie przebiega najczęściej, w dwóch cyklach: cykl zewnętrzny przebiega po liczbie moŝliwych klastrów, cykl wewnętrzny próbuje znaleźć optymalny podział obiektów pomiędzy klastry, Do zastosowań takich jak: analiza koszyka zakupów, bezpośredni marketing, planowanie kampanii promocyjnych, planowanie rozmieszczenia stoisk sprzedaŝy w supermarketach, opracowania nowych taryf firm ubezpieczeniowych, zmniejszenie skali zjawiska migracji abonentów operatorów telekomunikacyjnych stosowane jest odkrywanie asocjacji. Jest to szeroka klasa metod, które obejmują głównie odkrywanie pomiędzy obiektami zaleŝności, które posiadają pewne miary statystyczne określające ich wsparcie i ufność, W przypadku, np. : weryfikacji kredytobiorców, przydziału kart kredytowych, marketingu bezpośredniego, planowania lokalizacji sklepów, diagnostyki medycznej, klasyfikacji pacjentów, rozpoznawania trendów na rynkach finansowych, segmentacji wielkiej grupy klientów ze względu na potencjalną zyskowność dla przedsiębiorstwa - odkrywanie klasyfikacji jest doskonałą metodą., a celem jest tu znajdowanie zaleŝności pomiędzy klasyfikacją obiektów (naturalną lub wprowadzoną przez eksperta) a ich charakterystyką, Gdy szukamy klientów o podobnej konsumpcji energii elektrycznej, identyfikujemy na giełdzie firmy o podobnej dynamice wzrostu cen akcji, szukamy surowców o podobnej charakterystyce sprzedaŝy stosujemy odkrywanie podobieństw w przebiegach czasowych, opisujących pewne procesy, Do: analizy danych pochodzących z ubezpieczalni, duŝych supermarketów, danych opisujących zachowania posiadaczy kart kredytowych, klientów banków, wykrywania naduŝyć, gdzie staramy się zrozumieć trendy i zmiany zachodzące w procesach generujących te dane - wykrywanie zmian i od-

3 Zagadnienie wyboru narzędzia do data mining. Analiza 349 chyleń -znajdujemy róŝnice pomiędzy aktualnymi a oczekiwanymi wartościami danych. Gotowe rozwiązania tego typu są szczególnie uŝyteczne przy ogromnych wolumenach elektronicznych danych 3.Wybór narzędzi Dokonanie wyboru pakietu narzędzi Data Mining nie jest rzeczą prostą. Zasadniczą barierą jest cena i dość wysoki stopień skomplikowania obsługi oprogramowania. Popularne pakiety istniejące na rynku to np.: Clementine firmy SPSS, Data Miner STATISTICA, Affinium Model, Insightful Miner, KXEN. Kompletne pakiety narzędzi do Data Mining oferowane przez poszczególnych producentów są uŝyteczne takŝe dla osób nie będących statystykami, osób, które ograniczają swoje analizy do najprostszych modeli. To wszystko dzięki temu, Ŝe oferowane programy są w stanie np. automatycznie przetestować szeroki wachlarz architektur sieci neuronowych, dokonać wyboru spośród wielu postaci drzew, automatycznie dobrać najlepszy podzbiór zmiennych predykcyjnych uŝywając zaawansowanych ogólnych i uogólnionych modeli. UŜytkownik tym sposobem otrzymuje lepsze, dokładniejsze i bardziej powtarzalne wyniki. Ma równieŝ moŝliwość przełączania się na graficzną prezentację wszelkich danych, na kaŝdym etapie procesu Data Mining (w trakcie budowania modelu, jego wykonywania, a nawet w procesie wdraŝania gotowego modelu). Pozwala to równieŝ interakcyjnie, wizualnie eksplorować dane i poruszyć wyobraźnię. Tabela 1 Pakiety DM, opracowanie własne na podstawie: [NISB04]. PAKIET: CLEM STAT IM AM KXEN Ilość punktów [pkt.] Cena [k$] Cena / Ilość punktów [$/pkt.] Dostępność algorytmów [pkt.] Cena / Dostępność algorytmów [$/pkt.] Przykład analizy Data Minning Wykorzystując wybrany np. na podstawie powyŝszego opracowania pakiet narzędzi do Data Mining, przeprowadzono przykładową analizę. Do instytucji, gdzie właśnie eksploracja danych moŝe zostać wykorzystana dla znalezienia bliskiego optymalnemu rozwiązania, z pewnością naleŝą banki. Gromadzą wiele szczegółowych informacji dotyczących swoich kredytobiorców: dochody, histo-

4 350 Zarządzanie wiedzą i rozwiązania Business Intelligence ria kredytowa klienta, stanowisko pracy, wiek, stan cywilny, wydatki itp. Przykładowe dane moŝna znaleźć na witrynie internetowej Uniwersytetu w Monachium(http://www.stat.uni-muenchen.de/service/datenarchiv/ kredit/kredit.html). Kiedy klient banku ubiega się o przyznanie kredytu, wtedy informacje te są uŝyteczne dla podjęcia właściwej decyzji: czy przyznać kredyt, osiągać z tego tytułu zyski, czy ryzykować moŝliwość bankructwa klienta, czy teŝ nie przyznawać kredytu, ale pomniejszyć swoje potencjalne zyski z odsetek [MLAS02]. 4.1.Liniowy model klasyfikacyjny Analizując bazy danych kredytów przyznawanych w przeszłości, generowane są reguły asocjacyjne uzaleŝniające np. regularną spłatę kredytów od pewnych cech osobowych klienta. Budując przykładowy liniowy model klasyfikacyjny dla danych dotyczących decyzji kredytowych przewidujemy, jaką decyzję podjął bank w zaleŝności od zestawu cech osoby starającej się o kredyt. W oryginalne, zbiór danych zawiera 1000 obserwacji: 300 klientów nie miało zdolności kredytowej, a 700 miało. W zborze danych mamy 20 predyktorów skategoryzowanych. W naszym przypadku wykonamy analizę na zmodyfikowanym podzbiorze, w którym proporcje decyzji pozytywnych do negatywnych są wyrównane. Stosując procedurę sprawdzająca jakość naszego modelu, tworzymy tabelę krzy- Ŝową pokazująca trafność przewidywań dla danych testowych. Z liczności trafnych i błędnych przewidywań widzimy, jak sprawnie model przewiduje decyzje dla danych z próby testowej. Przykładowa macierz pomyłek, opracowanie własne. Decyzja Przewidywanie Nie Nie[%] Tak Tak[%] Ogół Trafne 86 57,72% ,12% 201 Błędne 63 42,28% 49 29,88% 112 Razem ,00% ,00% 313 Tabela 2 Zastosowano tu ogólne modele analizy dyskryminacyjnej (GDA) - uogólnienie zwykłej analizy dyskryminacyjnej, pozwalające na korzystanie z predyktorów skategoryzowanych. Jeśli uznamy, ze uzyskane wyniki są zadawalające, moŝemy wdroŝyć nasz model, a znalezione reguły mogą zostać zaaplikowane do nowych kredytobiorców, pozwalając na predykcję przyszłego postępowania kredytobiorcy wobec banku. 4.2.Porównanie wybranych technik modelowania W celu porównania kilku róŝnych metod i narzędzi diagnostyki modelu, pracując na dostępnej bazie danych kredytów, wygenerowano odpowiadające im

5 Zagadnienie wyboru narzędzia do data mining. Analiza 351 ilość błędnych klasyfikacji. Przeprowadzając analizę na oryginalnych danych, z proporcją decyzji pozytywnych do negatywnych 7/3, z prostego powodu większej częstości występowania w danych obserwacji z pozytywną decyzją kredytową - uzyskujemy gorsze wyniki dla obserwowanej klasy Nie. UŜyty model CHAID (Chisquare Automatic Interaction Detection), jest metodą drzew klasyfikacyjnych i regresyjnych, w której kolejne węzły mogą być dzielone na wiele grup (z kaŝdego węzła mogą wychodzić więcej niŝ dwie gałęzie). Obserwujemy, Ŝe metoda CHAID ma dość duŝo błędnych klasyfikacji. Najlepszy wydaje się model uzyskany metodą BT (Boosted Tress). Są to drzewa klasyfikacyjne i regresyjne ze wzmacnianiem. Dla pewnych trudnych zadań estymacji i predykcji, przewidywania generowane przez sekwencje stosunkowo prostych drzew są bliŝsze rzeczywistym wartościom, niŝ prognozy sieci neuronowych lub jednego, złoŝonego drzewa. Wzmacnianiem (ang. boosting) nazywamy tu technikę polegająca na stosowaniu sekwencji prostych modeli, przy czym kaŝdy kolejny model przykłada większą wagę do tych obserwacji, które zostały błędnie zaklasyfikowane przez poprzednie modele [STAT03]. W prowadzonej analizie zastosowano równieŝ ogólne modele drzew klasyfikacyjnych i regresyjnych (GC&RT - General Classification and Regression Trees). Wykorzystano równieŝ sieci neuronowe RBF (Radial Basis Function - sieci o radialnych funkcjach bazowych) oraz prognozy zagregowane uzyskane poprzez głosowanie modeli (Voting). Jest to metoda, w której zamiast dopasowywać model, wyszukujemy podobne obiekty. Podstawą tej metody jest intuicyjne przeświadczenie, Ŝe podobne obiekty trafią do tej samej klasy. Występowanie błędnych klasyfikacji, opracowanie własne. Tabela 3 Błędne klasyfikacje [%] BT Voting GDA RBF GC&RT CHAID PROPORCJA Tak/Nie Faktyczna decyzja: Tak /30 Faktyczna decyzja: Nie Cały zbiór PROPORCJA Tak/Nie Faktyczna decyzja: Tak /50 Faktyczna decyzja: Nie Z LOSOWANIEM Cały zbiór Przeprowadzając modyfikację i losując automatycznie zadane liczności obydwu kategorii w próbie uczącej, wg predyktora decyzja, procent błędnych przewidywań wygląda korzystniej. W próbie testowej zachowano oryginalne proporcje odpowiedzi pozytywnych i negatywnych. Tym razem błędy dla obu decyzji występują duŝo rzadziej.

6 352 Zarządzanie wiedzą i rozwiązania Business Intelligence 5. Podsumowanie Jednoznacznie moŝna stwierdzić, Ŝe narzędzia Data Mining mogą znacznie usprawnić proces wnioskowania oraz przyśpieszyć cykl tworzenia modelu. Trzeba teŝ pamiętać, Ŝe nie zawsze mogą one zastępować ekspertyzy statystyczne. UŜytkownicy systemów powinni testować zawarte narzędzia i powinni być wyczuleni na upgrade produktów. Literatura [MLAS02] Mirosława Lasek: Data Mining. Zastosowania w analizach i ocenach klientów bankowych, Biblioteka MenedŜera i Bankowca, Warszawa, [EGAT01] Gatnar E.: Nieparametryczna metoda dyskryminacji i regresji, PWN Warszawa, [STAT99] Marketing i statystyka, StatSoft Polska, Kraków, [BELI97] Berry M. J. A., Linoff G.: Data Mining Techniques, for Marketing, Sales and Customer Support, John Wiley &Sons, Inc., [ZABO98] Zaborski A.: Skalowanie wielowymiarowe jako metoda badań marketingowych, Akademia Ekonomiczna we Wrocławiu, Wydział Gospodarki Regionalnej i Turystyki w Jeleniej Górze, [HAKA01] Han J., Kamber M.: Data Mining, Concepts and Techniques, Morgan Kaufmann Publishers, [STAT03] STATISTICA Data Miner Manual, StatSoft Inc., [HATI02] Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, [WALE93] Walesiak M.: Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe AE, Wrocław, Monografie i Opracowania Nr 101, [WYRO02] Wyrozumski T.: Eksploracja danych dlaczego nie w przemyśle?, VIII Konferencja PLOUG Kościelisko, [ZAKR98] Zakrzewicz M.: On-Line Data Mining, Konferencja PLOUG Zakopane, [MORZ04] Morzy T.: Eksploracja danych: problemy i rozwiązania, Konferencja PLOUG Zakopane, 1999 [NISB04] internet: Nisbet R.A.: nisbetreview.pdf z dn r. eview.pdf

7 Zagadnienie wyboru narzędzia do data mining. Analiza 353 QUESTION OF CHOICE A DATA MINING SUITE. COMPARATIVE ANALYSIS OF SELECTED PRODUCTS AND TECHNIQUES This article provides a brief outline of some considerations that could affect your decision of apply and choice a Data Mining suite. First point of the consider is superficial presentation of some exploration applications. There is simply comparison of leading Data Minning suites, too. Next part include a case of discovery useful summaries of bank credit information data. The end of the article contain comparison of some selected data analysis tools, techniques to build models and think over conclusions. Key words: Data Mining, data exploration, classyfication.

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

StatSoft profesjonalny partner w zakresie analizy danych

StatSoft profesjonalny partner w zakresie analizy danych Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

w ekonomii, finansach i towaroznawstwie

w ekonomii, finansach i towaroznawstwie w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez

Bardziej szczegółowo

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH Streszczenie Małgorzata Nycz, Barbara Smok Akademia Ekonomiczna we Wrocławiu {malgorzata.nycz,barbara.smok}@ae.wroc.pl Artykuł prezentuje

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

> funkcjonalność aplikacji

> funkcjonalność aplikacji Oferowane przez Bankier.pl narzędzie umożliwia pracownikom Banku porównanie jakości i istotnych cech swoich produktów z podobnymi oferowanymi przez inne Banki. Bazy danych o produktach finansowych aktualizowane

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

1. Informacje o StatSoft Polska

1. Informacje o StatSoft Polska 1. Informacje o StatSoft Polska StatSoft Polska jest największym w Polsce dostawcą programów do statystycznej analizy danych, a także największym w Polsce organizatorem specjalistycznych kursów i szkoleń

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

Bardziej szczegółowo

Sposoby analizy i interpretacji statystyk strony WWW.

Sposoby analizy i interpretacji statystyk strony WWW. Sposoby analizy i interpretacji statystyk strony WWW. Jak oceniać sprzedaŝ przez WWW? Grzegorz Skiera, Łukasz PraŜmowski grzegorz.skiera@cyberstudio.pl lukasz.prazmowski@cyberstudio.pl O czym powiemy?

Bardziej szczegółowo

IX EKSPLORACJA DANYCH

IX EKSPLORACJA DANYCH Zastosowanie drzew decyzyjnych do analizy danych Artur Soroczyński Politechnika Warszawska Instytut Technologii Materiałowych Terminologia Datamining Drzewa decyzyjne Plan wykładu Przykład wykorzystania

Bardziej szczegółowo

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych PRZEDMIOT (liczba godzin konwersatoriów/ćwiczeń) Statystyka opisowa z elementami analizy regresji (4/19) Wnioskowanie

Bardziej szczegółowo

CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER

CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER Michał Kusy, StatSoft Polska Sp. z o.o. W bardzo krótkim czasie urządzenia mobilne stały się ogólnodostępne.

Bardziej szczegółowo

SKORING KREDYTOWY A MODELE DATA MINING

SKORING KREDYTOWY A MODELE DATA MINING SKORING KREDYTOWY A MODELE DATA MINING Janusz Wątroba StatSoft Polska Sp. z o.o. Przedmiotem rozważań w niniejszym artykule jest problematyka oceny ryzyka kredytowego oraz wybrane zagadnienia związane

Bardziej szczegółowo

Koniunktura w Small Business

Koniunktura w Small Business Koniunktura w Small Business Wyniki badania ilościowego mikro i małych przedsiębiorstw realizowanego w ramach projektu Small Business DNA Organizatorzy Projektu: 17 września 2010 Informacje o badaniu CEL

Bardziej szczegółowo

Zagadnienie klasyfikacji (dyskryminacji)

Zagadnienie klasyfikacji (dyskryminacji) Zagadnienie klasyfikacji (dyskryminacji) Przykład Bank chce klasyfikować klientów starających się o pożyczkę do jednej z dwóch grup: niskiego ryzyka (spłacających pożyczki terminowo) lub wysokiego ryzyka

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Scoring kredytowy a modele data mining

Scoring kredytowy a modele data mining Grzegorz Migut, Janusz Wątroba Scoring kredytowy a modele data mining Wprowadzenie Jedną z najbardziej charakterystycznych cech otaczającej nas rzeczywistości jest niepewność. Dotyczy to zarówno zjawisk

Bardziej szczegółowo

Piotr Wójtowicz StatSoft Polska Sp. z o.o.

Piotr Wójtowicz StatSoft Polska Sp. z o.o. ROZWIĄZANIA STATISTICA DLA SKORINGU Piotr Wójtowicz StatSoft Polska Sp. z o.o. Skuteczność działania systemu skoringowego przede wszystkim zależy od dostępności, zakresu i jakości gromadzonych danych.

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74 3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15

Bardziej szczegółowo

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2 2015 SAS Education sas.com/poland/training Centrum Szkoleniowe SAS Institute sp. z o.o. ul. Gdańska 27/31, 01-633 Warszawa (22) 560 46 20 cs@spl.sas.com Kalendarz szkoleń Grow With Us Nazwa szkolenia Kod

Bardziej szczegółowo

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH Janusz Wątroba, StatSoft Polska Sp. z o.o. Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Sklepu Internetowego sprzedawca w Internecie Oferta e-mail: biuro@garg.pl, www.garg.pl 1. Wstęp Handel Internetowy zdobywa coraz większą

Bardziej szczegółowo

Metody scoringowe w regresji logistycznej

Metody scoringowe w regresji logistycznej Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19

Bardziej szczegółowo

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI StatSoft Polska, tel. (1) 48400, (601) 414151, info@statsoft.pl, www.statsoft.pl DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI I LOJALNOŚCI KLIENTÓW Mariusz Łapczyński Akademia Ekonomiczna w Krakowie,

Bardziej szczegółowo

OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów)

OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów) OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów) Nazwa modułu/ przedmiotu Przetwarzanie danych w organizacji przedsiębiorstwa Nazwa jednostki prowadzącej przedmiot Instytut Matematyki Przedmioty:

Bardziej szczegółowo

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN Tomasz Demski, StatSoft Polska Sp. z o.o. Przewidywanie właściwości produktu na podstawie składu surowcowego oraz parametrów przebiegu

Bardziej szczegółowo

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Case Study Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Zadanie Naszym zadaniem było zaprojektowanie interfejsu aplikacji do sprzedaŝy ubezpieczeń

Bardziej szczegółowo

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia

Bardziej szczegółowo

Drzewa decyzyjne w SAS Enterprise Miner

Drzewa decyzyjne w SAS Enterprise Miner Drzewa decyzyjne w SAS Enterprise Miner Aneta Ptak-Chmielewska Instytut Statystyki i Demografii Zakład Analizy Historii Zdarzeń i Analiz Wielopoziomowych www.sgh.waw.pl/zaklady/zahziaw 1 struktura ćwiczeń

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):

Bardziej szczegółowo

Implementacja metod eksploracji danych - Oracle Data Mining

Implementacja metod eksploracji danych - Oracle Data Mining Implementacja metod eksploracji danych - Oracle Data Mining 395 Plan rozdziału 396 Wprowadzenie do eksploracji danych Architektura Oracle Data Mining Możliwości Oracle Data Mining Etapy procesu eksploracji

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

SIECI RBF (RADIAL BASIS FUNCTIONS)

SIECI RBF (RADIAL BASIS FUNCTIONS) SIECI RBF (RADIAL BASIS FUNCTIONS) Wybrane slajdy z prezentacji prof. Tadeusiewicza Wykład Andrzeja Burdy S. Osowski, Sieci Neuronowe w ujęciu algorytmicznym, Rozdz. 5, PWNT, Warszawa 1996. opr. P.Lula,

Bardziej szczegółowo

Etapy przygotowań do przeprowadzenia badań marketingowych. dr Grzegorz Kotliński, Katedra Bankowości AE w Poznaniu

Etapy przygotowań do przeprowadzenia badań marketingowych. dr Grzegorz Kotliński, Katedra Bankowości AE w Poznaniu 1 Etapy przygotowań do przeprowadzenia badań marketingowych 2 Badania marketingowe a funkcje marketingu Analiza otoczenia Analiza klientów Planowanie produktów i usług Planowanie dystrybucji Planowanie

Bardziej szczegółowo

Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym

Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?

Bardziej szczegółowo

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych Sebastian Kokot XXI Krajowa Konferencja Rzeczoznawców Majątkowych, Międzyzdroje 2012 Rzetelnie wykonana analiza rynku nieruchomości

Bardziej szczegółowo

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym 1 NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym Przyszedł czas, aby po nowemu spojrzeć na zarządzanie ryzykiem w banku spółdzielczym, zwłaszcza przed wyborem oferty systemu

Bardziej szczegółowo

bo od managera wymaga się perfekcji

bo od managera wymaga się perfekcji bo od managera wymaga się perfekcji MODELOWANIE PROCESÓW Charakterystyka modułu Modelowanie Procesów Biznesowych (BPM) Modelowanie procesów biznesowych stanowi fundament wdroŝenia systemu zarządzania jakością

Bardziej szczegółowo

PRZEWIDYWANIE AWARII I PROBLEMÓW Z JAKOŚCIĄ

PRZEWIDYWANIE AWARII I PROBLEMÓW Z JAKOŚCIĄ PRZEWIDYWANIE AWARII I PROBLEMÓW Z JAKOŚCIĄ Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Jednym z najważniejszych zadań nowoczesnej produkcji jest zapewnienie odpowiedniej jakości wytwarzanych produktów.

Bardziej szczegółowo

Warsztaty. podjęcie pracy/ własnej działalności jako Webmaster CMS. Oferta

Warsztaty. podjęcie pracy/ własnej działalności jako Webmaster CMS. Oferta Warsztaty podjęcie pracy/ własnej działalności jako Webmaster CMS Oferta e-mail: biuro@garg.pl, www.garg.pl 1. Wstęp Internet, to miejsce, w którym powinien znaleźć się kaŝdy przedsiębiorca. Jeśli kogoś

Bardziej szczegółowo

Ćwiczenie 12. Metody eksploracji danych

Ćwiczenie 12. Metody eksploracji danych Ćwiczenie 12. Metody eksploracji danych Modelowanie regresji (Regression modeling) 1. Zadanie regresji Modelowanie regresji jest metodą szacowania wartości ciągłej zmiennej celu. Do najczęściej stosowanych

Bardziej szczegółowo

P R E Z E N T A C J A

P R E Z E N T A C J A P R E Z E N T A C J A decyzje-it.pl internetowy serwis branŝy IT specjalizujący się w oprogramowaniu dla biznesu Serwis decyzje-it.pl Kim jesteśmy? decyzje-it.pl to specjalistyczny, internetowy serwis

Bardziej szczegółowo

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej II Konferencja Diagnostów Laboratoryjnych Śląski Urząd Wojewódzki w Katowicach 14 września 2015 Acusera 24. 7 - główne funkcje: 1.Prowadzenie

Bardziej szczegółowo

N a s z e D ł u g i A. D. 2 0 0 9. Nasze Długi - główne wyniki badań. Próba badawcza

N a s z e D ł u g i A. D. 2 0 0 9. Nasze Długi - główne wyniki badań. Próba badawcza N AS Z E DŁUGI A. D. 2009 N a s z e D ł u g i A. D. 2 0 0 9 Nasze Długi - główne wyniki badań 45% Polaków ma obecnie większe problemy finansowe, niŝ przed kryzysem 77% społeczeństwa uwaŝa, Ŝe osoby, które

Bardziej szczegółowo

SPIS TREŚCI. Do Czytelnika... 7

SPIS TREŚCI. Do Czytelnika... 7 SPIS TREŚCI Do Czytelnika.................................................. 7 Rozdział I. Wprowadzenie do analizy statystycznej.............. 11 1.1. Informacje ogólne..........................................

Bardziej szczegółowo

Case study: Mobilny serwis WWW dla Kolporter

Case study: Mobilny serwis WWW dla Kolporter Case study: Mobilny serwis WWW dla Kolporter Sklep internetowy Kolporter.pl oferuje swoim Klientom blisko 100 000 produktów w tym: ksiąŝki, muzykę, film i gry. Kolporter postanowił stworzyć nowy kanał

Bardziej szczegółowo

WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU

WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU StatSoft Polska, tel. 2 428 43, 6 4 4 5, info@statsoft.pl, www.statsoft.pl WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU Grzegorz Migut, StatSoft Polska Sp. z o.o.

Bardziej szczegółowo

ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ

ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ prof. dr hab. Andrzej Sokołowski, dr Adam Sagan Jednym z ważniejszych obszarów zastosowań programu STATISTICA w badaniach

Bardziej szczegółowo

Projektowanie zorientowane na uŝytkownika

Projektowanie zorientowane na uŝytkownika Uniwersytet Jagielloński Interfejsy graficzne Wykład 2 Projektowanie zorientowane na uŝytkownika Barbara Strug 2011 Hall of shame Hall of shame Model wodospad Feedback Problem z modelem waterfall Projektowanie

Bardziej szczegółowo

System sprzedaŝy rezerwacji

System sprzedaŝy rezerwacji System sprzedaŝy rezerwacji 2009 2 Spis treści 1. O PROGRAMIE... 2 2. ZAKRES FUNKCJONALNY... 3 2.1 Funkcje standardowe... 3 2.2 Moduły dodatkowe... 4 2.3. AuroraCMS... 5 1. O PROGRAMIE Dziś prawie kaŝdy

Bardziej szczegółowo

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Wydział Informatyki i Zarządzania Politechnika Wrocławska kazienko@pwr.wroc.pl Dlaczego eksploracja danych w serwisach internetowych? Kanały

Bardziej szczegółowo

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com XI Konferencja PLOUG Kościelisko Październik 2005 Zastosowanie reguł asocjacyjnych, pakietu Oracle Data Mining for Java do analizy koszyka zakupów w aplikacjach e-commerce. Integracja ze środowiskiem Oracle

Bardziej szczegółowo

REGULAMIN UDZIELANIA KREDYTU ODNAWIALNEGO DLA POSIADACZY KONTA FIRMOWEGO SGB24 ORAZ KONTA KORPORACYJNEGO SGB24 w zrzeszonych Bankach Spółdzielczych i

REGULAMIN UDZIELANIA KREDYTU ODNAWIALNEGO DLA POSIADACZY KONTA FIRMOWEGO SGB24 ORAZ KONTA KORPORACYJNEGO SGB24 w zrzeszonych Bankach Spółdzielczych i REGULAMIN UDZIELANIA KREDYTU ODNAWIALNEGO DLA POSIADACZY KONTA FIRMOWEGO SGB24 ORAZ KONTA KORPORACYJNEGO SGB24 w zrzeszonych Bankach Spółdzielczych i Gospodarczym Banku Wielkopolski S.A. Poznań, lipiec

Bardziej szczegółowo

Business Intelligence narzędziem wsparcia sprzedaży

Business Intelligence narzędziem wsparcia sprzedaży Forum Sektora Finansowego 2007 Business Intelligence narzędziem wsparcia sprzedaży Filip Łapiński Konsultant Zarządzający IBM Polska 05/06/2007 Prognozy IBM Institute for Business Value IBM Institute for

Bardziej szczegółowo

Data Mining Kopalnie Wiedzy

Data Mining Kopalnie Wiedzy Data Mining Kopalnie Wiedzy Janusz z Będzina Instytut Informatyki i Nauki o Materiałach Sosnowiec, 30 listopada 2006 Kopalnie złota XIX Wiek. Odkrycie pokładów złota spowodowało napływ poszukiwaczy. Przeczesywali

Bardziej szczegółowo

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak Tytuł: Autor: ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak Wstęp Zaawansowane metody analiz statystycznych przenoszą analizy statystyczne na kolejny wyższy poziom. Określenie tego wyższego

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Wykorzystanie informacji kredytowej w procesie oceny ryzyka ubezpieczeniowego w ubezpieczeniach komunikacyjnych

Wykorzystanie informacji kredytowej w procesie oceny ryzyka ubezpieczeniowego w ubezpieczeniach komunikacyjnych Wykorzystanie informacji kredytowej w procesie oceny ryzyka ubezpieczeniowego w ubezpieczeniach komunikacyjnych Ubezpieczeniowy Fundusz Gwarancyjny mgr Karolina Pasternak-Winiarska mgr Kamil Gala Zagadnienia

Bardziej szczegółowo

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business www.comarch.pl Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Tomasz Matysik Kołobrzeg, 19.11.2009

Bardziej szczegółowo

Co to jest SUR-FBD? 3

Co to jest SUR-FBD? 3 1 Utrzymanie Ruchu Często firmy funkcjonują w swoistym błędnym kole, polegającym na skupieniu uwagi na naprawach tego co się psuje, tym samym powielają wzorce biernego utrzymania ruchu Z powodu braku danych,

Bardziej szczegółowo

WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską

WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.

Bardziej szczegółowo

W gąszczu cen.... czyli jak optymalizować cenę w dobie masowej customizacji?

W gąszczu cen.... czyli jak optymalizować cenę w dobie masowej customizacji? W gąszczu cen... czyli jak optymalizować cenę w dobie masowej customizacji? 1 2 3 4 5 O jakim gąszczu cen mówimy Case Study 1 skuter Case Study 2 konto bankowe Case Study 3 usługi telekomunikacyjne czy

Bardziej szczegółowo

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY Piotr Wójtowicz, Grzegorz Migut StatSoft Polska Jakie są różnice pomiędzy osobami prawidłowo regulującymi swoje zobowiązania a niechętnie spłacającymi swoje długi,

Bardziej szczegółowo

Quick Launch Manual:

Quick Launch Manual: egresja Odds atio Quick Launch Manual: regresja logistyczna i odds ratio Uniwesytet Warszawski, Matematyka 28.10.2009 Plan prezentacji egresja Odds atio 1 2 egresja egresja logistyczna 3 Odds atio 4 5

Bardziej szczegółowo

MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II - ANALIZA STATYSTYCZNA

MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II - ANALIZA STATYSTYCZNA InŜynieria Rolnicza 6/2005 Stanisław Kokoszka, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza w Krakowie MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II

Bardziej szczegółowo

Metody szacowania zdolności kredytowej klientów indywidualnych. Mateusz Kobos 15.11.2006

Metody szacowania zdolności kredytowej klientów indywidualnych. Mateusz Kobos 15.11.2006 Metody szacowania zdolności kredytowej klientów indywidualnych Mateusz Kobos 15.11.2006 Spis treści Czym jest Credit Scoring (CS)? Analizowane dane Zalety i ograniczenia CS CS w praktyce CS jako zagadnienie

Bardziej szczegółowo

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining 0LNRáDM0RU]\ Marek Wojciechowski Instytut Informatyki PP Eksploracja danych 2GNU\ZDQLHZ]RUFyZZGX*\FK

Bardziej szczegółowo

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie SZKOLENIA SAS ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie DANIEL KUBIK ŁUKASZ LESZEWSKI ROLE ROLE UŻYTKOWNIKÓW MODUŁU

Bardziej szczegółowo

Wykorzystywanie narzędzi Data Mining w systemie SAS. Rysunek 0.1. Miejsce OLAP i metod eksploracji danych w piramidzie systemów wspomagania decyzji

Wykorzystywanie narzędzi Data Mining w systemie SAS. Rysunek 0.1. Miejsce OLAP i metod eksploracji danych w piramidzie systemów wspomagania decyzji Wstęp Praca przedstawia podstawy użytkowania programu Enterprise Miner firmy SAS oraz krótki opis metod eksploracji danych (data mining), których wykorzystanie umożliwia ten program. Pod pojęciem eksploracji

Bardziej szczegółowo

CBP sprzedaż ubezpieczeń w kanałach, mobilnym Bancassurance oraz Direct Zakładu Ubezpieczeń

CBP sprzedaż ubezpieczeń w kanałach, mobilnym Bancassurance oraz Direct Zakładu Ubezpieczeń CBP sprzedaż ubezpieczeń w kanałach, mobilnym Bancassurance oraz Direct Zakładu Ubezpieczeń Andrzej Pasek Products & Sales Director Commercial Insurance Division Warszawa, dnia 7 października 015 r. Asseco

Bardziej szczegółowo

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński Zarządzanie ryzykiem Opracował: Dr inŝ. Tomasz Zieliński I. OGÓLNE INFORMACJE O PRZEDMIOCIE Cel przedmiotu: Celem przedmiotu jest zaprezentowanie studentom podstawowych pojęć z zakresu ryzyka w działalności

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Metody statystyczne w segmentacji rynku The statistical methods used in market segmentation

Metody statystyczne w segmentacji rynku The statistical methods used in market segmentation The statistical methods used in market segmentation Katarzyna Dębkowska Politechnika Białostocka, Wydział Zarządzania, Katedra Informatyki Gospodarczej i Logistyki Abstract This article aims to present

Bardziej szczegółowo

Kształtowanie się cen m 2 mieszkania we Wrocławiu w krótkim okresie

Kształtowanie się cen m 2 mieszkania we Wrocławiu w krótkim okresie Kształtowanie się cen m 2 mieszkania we Wrocławiu w krótkim okresie Projekt prognostyczny ElŜbieta Bulak Piotr Olszewski Michał Tomanek Tomasz Witka IV ZI gr. 13. Wrocław 2007 I. Sformułowanie zadania

Bardziej szczegółowo

ZNACZENIE WYMIANY DANYCH MIĘDZY BIK i UFG DLA BEZPIECZEŃSTWA TRANSAKCJI UBEZPIECZENIOWO-BANKOWYCH. dr Mariusz Cholewa Prezes Zarządu BIK S.A.

ZNACZENIE WYMIANY DANYCH MIĘDZY BIK i UFG DLA BEZPIECZEŃSTWA TRANSAKCJI UBEZPIECZENIOWO-BANKOWYCH. dr Mariusz Cholewa Prezes Zarządu BIK S.A. ZNACZENIE WYMIANY DANYCH MIĘDZY BIK i UFG DLA BEZPIECZEŃSTWA TRANSAKCJI UBEZPIECZENIOWO-BANKOWYCH dr Mariusz Cholewa Prezes Zarządu BIK S.A. Informacje o BIK GRUPA BIK NAJWIĘKSZY ZBIÓR INFORMACJI O ZOBOWIĄZANIACH

Bardziej szczegółowo

BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA

BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA Kamila Karnowska i Katarzyna Cioch, SKOK im. Franciszka Stefczyka Wykorzystanie metod scoringowych do oceny punktowej klientów

Bardziej szczegółowo

TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE

TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Badanie przebiegu rozmaitych wielkości w czasie w celu znalezienia

Bardziej szczegółowo

Szanowny kliencie. Dlaczego rozwiązania firmy CISCO. Przykładowe ceny office@reseler.com www.reseler.com GSM 602199158

Szanowny kliencie. Dlaczego rozwiązania firmy CISCO. Przykładowe ceny office@reseler.com www.reseler.com GSM 602199158 Szanowny kliencie Firma VoIP Partners powstała w 2001r. od samego początku zajmujemy się systemami sieciowymi, dokładniejsze informacje moŝna znaleźć na naszych stronach www.reseler.com Od roku 2002 specjalizujemy

Bardziej szczegółowo

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Przegląd oprogramowania GIS do tworzenia map tematycznych

Przegląd oprogramowania GIS do tworzenia map tematycznych MATERIAŁY SZKOLENIOWE OPROGRAMOWANIE GIS Jacek Jania Przegląd oprogramowania GIS do tworzenia map tematycznych 1 IV OPROGRAMOWANIE GIS Mapy tematyczne Mapy tematyczne to mapy eksponujące jeden lub kilka

Bardziej szczegółowo

Systemy rozgrywek sportowych OGÓLNE ZASADY ORGANIZOWANIA ROZGRYWEK SPORTOWYCH

Systemy rozgrywek sportowych OGÓLNE ZASADY ORGANIZOWANIA ROZGRYWEK SPORTOWYCH Systemy rozgrywek sportowych OGÓLNE ZASADY ORGANIZOWANIA ROZGRYWEK SPORTOWYCH Rozgrywki sportowe moŝna organizować na kilka róŝnych sposobów, w zaleŝności od liczby zgłoszonych druŝyn, czasu, liczby boisk

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1 Bazy danych wprowadzenie teoretyczne Piotr Prekurat 1 Baza danych Jest to zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody. Zatem jest

Bardziej szczegółowo

TARYFA PROWIZJI I OPŁAT POBIERANYCH PRZEZ PBS LUBACZÓW ZA CZYNNOŚCI BANKOWE I USŁUGI O CHARAKTERZE NIEBANKOWYM

TARYFA PROWIZJI I OPŁAT POBIERANYCH PRZEZ PBS LUBACZÓW ZA CZYNNOŚCI BANKOWE I USŁUGI O CHARAKTERZE NIEBANKOWYM AZałącznik nr 12 do Uchwały nr 34/2012 Zarządu Powiatowego Banku Spółdzielczego w Lubaczowie z dnia 23.10.2012 r. TARYFA PROWIZJI I OPŁAT POBIERANYCH PRZEZ PBS LUBACZÓW ZA CZYNNOŚCI BANKOWE I USŁUGI O

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo