ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK"

Transkrypt

1 ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK Streszczenie Paweł Pandzierski Akademia Ekonomiczna im. Oskara Langego we Wrocławiu paweell@op.pl Artykuł ten przedstawia zwięzły szkic przykładowych rozwaŝań, które mogą wpłynąć na decyzję zastosowania i wyboru pakietu Data Mining. Pierwsza część rozwaŝań jest powierzchowną prezentacją niektórych zastosowań eksploracji. Zawarte jest tam równieŝ proste porównanie najwaŝniejszych pakietów Data Mining. Kolejny rozdział zawiera przykład odkrywania uŝytecznych zaleŝności w danych kredytowych banku. W zakończeniu przedstawiono zestawienie wybranych narzędzi i technik budowy modelu, oraz podsumowanie przeprowadzonych rozwaŝań. Słowa kluczowe: Data Mining, eksploracja danych, klasyfikacja. 1. Wstęp Znaczenie posiadania właściwej wiedzy w określonym czasie przez decydenta jest wartością nie do przecenienia. Wiedza moŝe pochodzić z róŝnych źródeł, moŝe teŝ być pozyskiwana z danych gromadzonych latami w przedsiębiorstwie. Lista moŝliwych zastosowań eksploracji danych, a tym samym zastosowań odpowiedniego oprogramowania jest bardzo długa i systematycznie poszerzana. Koszt analiz marketingowych, moŝe ulec obniŝeniu o bardzo istotny składnik - nakłady na samo zebranie danych, gdy zaczniemy eksplorować juŝ posiadane, archiwalne dane. Trudno teŝ stwierdzić, co jest bardziej zaawansowanym raportem z zapytania, a co moŝemy juŝ określić jako Data Mining, ale zawsze mówimy wtedy o pozyskiwaniu wiedzy z bazy danych, wiedzy która nie jest oczywista [WYRO02]. Przy wyborze narzędzia kierujemy się róŝnymi kryteriami, jak np. do czego narzędzie będzie zastosowane (obszar tematyczny aplikacji), dostępność narzędzi, ich jakość oraz koszt. Wybór spośród ofert róŝnych producentów jest spory. Raz zakupione narzędzie powinno być uŝyteczne przez dłuŝszy okres, a nie tylko jednorazowo. Zatem problem wyboru narzędzia jest waŝny dla przedsiębiorstwa. Właściwy zakup to dla firmy korzyść, zakup niewłaściwy to czysta strata.

2 348 Zarządzanie wiedzą i rozwiązania Business Intelligence 2.Metody eksploracji danych Istnieje wiele metod eksploracji danych, od klasycznej statystyki aŝ po sieci neuronowe i algorytmy genetyczne. KaŜda z reguł reprezentuje zaleŝności odkryte w posiadanych bazach danych i kaŝda moŝe być wykorzystana do predykcji przyszłych wartości i zachowań. Przykłady zastosowań eksploracji danych: Przy: analizie dostępów do stron w Web, analizie koszyka, badaniu zachowań klientów w czasie, bezpośrednim marketingu, planowaniu inwestycji giełdowych, przewidywaniu sprzedaŝy (ubezpieczenia, telekomunikacja) uŝyteczne jest odkrywanie wzorców sekwencji - czasowych wzorców zachowań, Do zastosowań takich jak: rozpoznawanie obrazów (biologia, medycyna), określanie segmentów rynku na podstawie cech klientów (telekomunikacja, ubezpieczenia), poprawa jakości produktu, wczesne ostrzeganie przed awariami stosujemy klastrowanie, celem jest tu znajdowanie skończonego zbioru klas obiektów - klastrów (o stałej ilości), czyli podzbiorów podobnych rekordów. Klastrowanie przebiega najczęściej, w dwóch cyklach: cykl zewnętrzny przebiega po liczbie moŝliwych klastrów, cykl wewnętrzny próbuje znaleźć optymalny podział obiektów pomiędzy klastry, Do zastosowań takich jak: analiza koszyka zakupów, bezpośredni marketing, planowanie kampanii promocyjnych, planowanie rozmieszczenia stoisk sprzedaŝy w supermarketach, opracowania nowych taryf firm ubezpieczeniowych, zmniejszenie skali zjawiska migracji abonentów operatorów telekomunikacyjnych stosowane jest odkrywanie asocjacji. Jest to szeroka klasa metod, które obejmują głównie odkrywanie pomiędzy obiektami zaleŝności, które posiadają pewne miary statystyczne określające ich wsparcie i ufność, W przypadku, np. : weryfikacji kredytobiorców, przydziału kart kredytowych, marketingu bezpośredniego, planowania lokalizacji sklepów, diagnostyki medycznej, klasyfikacji pacjentów, rozpoznawania trendów na rynkach finansowych, segmentacji wielkiej grupy klientów ze względu na potencjalną zyskowność dla przedsiębiorstwa - odkrywanie klasyfikacji jest doskonałą metodą., a celem jest tu znajdowanie zaleŝności pomiędzy klasyfikacją obiektów (naturalną lub wprowadzoną przez eksperta) a ich charakterystyką, Gdy szukamy klientów o podobnej konsumpcji energii elektrycznej, identyfikujemy na giełdzie firmy o podobnej dynamice wzrostu cen akcji, szukamy surowców o podobnej charakterystyce sprzedaŝy stosujemy odkrywanie podobieństw w przebiegach czasowych, opisujących pewne procesy, Do: analizy danych pochodzących z ubezpieczalni, duŝych supermarketów, danych opisujących zachowania posiadaczy kart kredytowych, klientów banków, wykrywania naduŝyć, gdzie staramy się zrozumieć trendy i zmiany zachodzące w procesach generujących te dane - wykrywanie zmian i od-

3 Zagadnienie wyboru narzędzia do data mining. Analiza 349 chyleń -znajdujemy róŝnice pomiędzy aktualnymi a oczekiwanymi wartościami danych. Gotowe rozwiązania tego typu są szczególnie uŝyteczne przy ogromnych wolumenach elektronicznych danych 3.Wybór narzędzi Dokonanie wyboru pakietu narzędzi Data Mining nie jest rzeczą prostą. Zasadniczą barierą jest cena i dość wysoki stopień skomplikowania obsługi oprogramowania. Popularne pakiety istniejące na rynku to np.: Clementine firmy SPSS, Data Miner STATISTICA, Affinium Model, Insightful Miner, KXEN. Kompletne pakiety narzędzi do Data Mining oferowane przez poszczególnych producentów są uŝyteczne takŝe dla osób nie będących statystykami, osób, które ograniczają swoje analizy do najprostszych modeli. To wszystko dzięki temu, Ŝe oferowane programy są w stanie np. automatycznie przetestować szeroki wachlarz architektur sieci neuronowych, dokonać wyboru spośród wielu postaci drzew, automatycznie dobrać najlepszy podzbiór zmiennych predykcyjnych uŝywając zaawansowanych ogólnych i uogólnionych modeli. UŜytkownik tym sposobem otrzymuje lepsze, dokładniejsze i bardziej powtarzalne wyniki. Ma równieŝ moŝliwość przełączania się na graficzną prezentację wszelkich danych, na kaŝdym etapie procesu Data Mining (w trakcie budowania modelu, jego wykonywania, a nawet w procesie wdraŝania gotowego modelu). Pozwala to równieŝ interakcyjnie, wizualnie eksplorować dane i poruszyć wyobraźnię. Tabela 1 Pakiety DM, opracowanie własne na podstawie: [NISB04]. PAKIET: CLEM STAT IM AM KXEN Ilość punktów [pkt.] Cena [k$] Cena / Ilość punktów [$/pkt.] Dostępność algorytmów [pkt.] Cena / Dostępność algorytmów [$/pkt.] Przykład analizy Data Minning Wykorzystując wybrany np. na podstawie powyŝszego opracowania pakiet narzędzi do Data Mining, przeprowadzono przykładową analizę. Do instytucji, gdzie właśnie eksploracja danych moŝe zostać wykorzystana dla znalezienia bliskiego optymalnemu rozwiązania, z pewnością naleŝą banki. Gromadzą wiele szczegółowych informacji dotyczących swoich kredytobiorców: dochody, histo-

4 350 Zarządzanie wiedzą i rozwiązania Business Intelligence ria kredytowa klienta, stanowisko pracy, wiek, stan cywilny, wydatki itp. Przykładowe dane moŝna znaleźć na witrynie internetowej Uniwersytetu w Monachium( kredit/kredit.html). Kiedy klient banku ubiega się o przyznanie kredytu, wtedy informacje te są uŝyteczne dla podjęcia właściwej decyzji: czy przyznać kredyt, osiągać z tego tytułu zyski, czy ryzykować moŝliwość bankructwa klienta, czy teŝ nie przyznawać kredytu, ale pomniejszyć swoje potencjalne zyski z odsetek [MLAS02]. 4.1.Liniowy model klasyfikacyjny Analizując bazy danych kredytów przyznawanych w przeszłości, generowane są reguły asocjacyjne uzaleŝniające np. regularną spłatę kredytów od pewnych cech osobowych klienta. Budując przykładowy liniowy model klasyfikacyjny dla danych dotyczących decyzji kredytowych przewidujemy, jaką decyzję podjął bank w zaleŝności od zestawu cech osoby starającej się o kredyt. W oryginalne, zbiór danych zawiera 1000 obserwacji: 300 klientów nie miało zdolności kredytowej, a 700 miało. W zborze danych mamy 20 predyktorów skategoryzowanych. W naszym przypadku wykonamy analizę na zmodyfikowanym podzbiorze, w którym proporcje decyzji pozytywnych do negatywnych są wyrównane. Stosując procedurę sprawdzająca jakość naszego modelu, tworzymy tabelę krzy- Ŝową pokazująca trafność przewidywań dla danych testowych. Z liczności trafnych i błędnych przewidywań widzimy, jak sprawnie model przewiduje decyzje dla danych z próby testowej. Przykładowa macierz pomyłek, opracowanie własne. Decyzja Przewidywanie Nie Nie[%] Tak Tak[%] Ogół Trafne 86 57,72% ,12% 201 Błędne 63 42,28% 49 29,88% 112 Razem ,00% ,00% 313 Tabela 2 Zastosowano tu ogólne modele analizy dyskryminacyjnej (GDA) - uogólnienie zwykłej analizy dyskryminacyjnej, pozwalające na korzystanie z predyktorów skategoryzowanych. Jeśli uznamy, ze uzyskane wyniki są zadawalające, moŝemy wdroŝyć nasz model, a znalezione reguły mogą zostać zaaplikowane do nowych kredytobiorców, pozwalając na predykcję przyszłego postępowania kredytobiorcy wobec banku. 4.2.Porównanie wybranych technik modelowania W celu porównania kilku róŝnych metod i narzędzi diagnostyki modelu, pracując na dostępnej bazie danych kredytów, wygenerowano odpowiadające im

5 Zagadnienie wyboru narzędzia do data mining. Analiza 351 ilość błędnych klasyfikacji. Przeprowadzając analizę na oryginalnych danych, z proporcją decyzji pozytywnych do negatywnych 7/3, z prostego powodu większej częstości występowania w danych obserwacji z pozytywną decyzją kredytową - uzyskujemy gorsze wyniki dla obserwowanej klasy Nie. UŜyty model CHAID (Chisquare Automatic Interaction Detection), jest metodą drzew klasyfikacyjnych i regresyjnych, w której kolejne węzły mogą być dzielone na wiele grup (z kaŝdego węzła mogą wychodzić więcej niŝ dwie gałęzie). Obserwujemy, Ŝe metoda CHAID ma dość duŝo błędnych klasyfikacji. Najlepszy wydaje się model uzyskany metodą BT (Boosted Tress). Są to drzewa klasyfikacyjne i regresyjne ze wzmacnianiem. Dla pewnych trudnych zadań estymacji i predykcji, przewidywania generowane przez sekwencje stosunkowo prostych drzew są bliŝsze rzeczywistym wartościom, niŝ prognozy sieci neuronowych lub jednego, złoŝonego drzewa. Wzmacnianiem (ang. boosting) nazywamy tu technikę polegająca na stosowaniu sekwencji prostych modeli, przy czym kaŝdy kolejny model przykłada większą wagę do tych obserwacji, które zostały błędnie zaklasyfikowane przez poprzednie modele [STAT03]. W prowadzonej analizie zastosowano równieŝ ogólne modele drzew klasyfikacyjnych i regresyjnych (GC&RT - General Classification and Regression Trees). Wykorzystano równieŝ sieci neuronowe RBF (Radial Basis Function - sieci o radialnych funkcjach bazowych) oraz prognozy zagregowane uzyskane poprzez głosowanie modeli (Voting). Jest to metoda, w której zamiast dopasowywać model, wyszukujemy podobne obiekty. Podstawą tej metody jest intuicyjne przeświadczenie, Ŝe podobne obiekty trafią do tej samej klasy. Występowanie błędnych klasyfikacji, opracowanie własne. Tabela 3 Błędne klasyfikacje [%] BT Voting GDA RBF GC&RT CHAID PROPORCJA Tak/Nie Faktyczna decyzja: Tak /30 Faktyczna decyzja: Nie Cały zbiór PROPORCJA Tak/Nie Faktyczna decyzja: Tak /50 Faktyczna decyzja: Nie Z LOSOWANIEM Cały zbiór Przeprowadzając modyfikację i losując automatycznie zadane liczności obydwu kategorii w próbie uczącej, wg predyktora decyzja, procent błędnych przewidywań wygląda korzystniej. W próbie testowej zachowano oryginalne proporcje odpowiedzi pozytywnych i negatywnych. Tym razem błędy dla obu decyzji występują duŝo rzadziej.

6 352 Zarządzanie wiedzą i rozwiązania Business Intelligence 5. Podsumowanie Jednoznacznie moŝna stwierdzić, Ŝe narzędzia Data Mining mogą znacznie usprawnić proces wnioskowania oraz przyśpieszyć cykl tworzenia modelu. Trzeba teŝ pamiętać, Ŝe nie zawsze mogą one zastępować ekspertyzy statystyczne. UŜytkownicy systemów powinni testować zawarte narzędzia i powinni być wyczuleni na upgrade produktów. Literatura [MLAS02] Mirosława Lasek: Data Mining. Zastosowania w analizach i ocenach klientów bankowych, Biblioteka MenedŜera i Bankowca, Warszawa, [EGAT01] Gatnar E.: Nieparametryczna metoda dyskryminacji i regresji, PWN Warszawa, [STAT99] Marketing i statystyka, StatSoft Polska, Kraków, [BELI97] Berry M. J. A., Linoff G.: Data Mining Techniques, for Marketing, Sales and Customer Support, John Wiley &Sons, Inc., [ZABO98] Zaborski A.: Skalowanie wielowymiarowe jako metoda badań marketingowych, Akademia Ekonomiczna we Wrocławiu, Wydział Gospodarki Regionalnej i Turystyki w Jeleniej Górze, [HAKA01] Han J., Kamber M.: Data Mining, Concepts and Techniques, Morgan Kaufmann Publishers, [STAT03] STATISTICA Data Miner Manual, StatSoft Inc., [HATI02] Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, [WALE93] Walesiak M.: Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe AE, Wrocław, Monografie i Opracowania Nr 101, [WYRO02] Wyrozumski T.: Eksploracja danych dlaczego nie w przemyśle?, VIII Konferencja PLOUG Kościelisko, [ZAKR98] Zakrzewicz M.: On-Line Data Mining, Konferencja PLOUG Zakopane, [MORZ04] Morzy T.: Eksploracja danych: problemy i rozwiązania, Konferencja PLOUG Zakopane, 1999 [NISB04] internet: Nisbet R.A.: nisbetreview.pdf z dn r. eview.pdf

7 Zagadnienie wyboru narzędzia do data mining. Analiza 353 QUESTION OF CHOICE A DATA MINING SUITE. COMPARATIVE ANALYSIS OF SELECTED PRODUCTS AND TECHNIQUES This article provides a brief outline of some considerations that could affect your decision of apply and choice a Data Mining suite. First point of the consider is superficial presentation of some exploration applications. There is simply comparison of leading Data Minning suites, too. Next part include a case of discovery useful summaries of bank credit information data. The end of the article contain comparison of some selected data analysis tools, techniques to build models and think over conclusions. Key words: Data Mining, data exploration, classyfication.

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Rok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne

Rok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne Nazwa modułu: Komputerowe wspomaganie decyzji Rok akademicki: 2030/2031 Kod: ZZP-2-403-MK-n Punkty ECTS: 3 Wydział: Zarządzania Kierunek: Zarządzanie Specjalność: Marketing Poziom studiów: Studia II stopnia

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

StatSoft profesjonalny partner w zakresie analizy danych

StatSoft profesjonalny partner w zakresie analizy danych Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W

Bardziej szczegółowo

Opis efektów kształcenia dla modułu zajęć

Opis efektów kształcenia dla modułu zajęć Nazwa modułu: Eksploracja danych Rok akademicki: 2030/2031 Kod: MIS-2-105-MT-s Punkty ECTS: 5 Wydział: Inżynierii Metali i Informatyki Przemysłowej Kierunek: Informatyka Stosowana Specjalność: Modelowanie

Bardziej szczegółowo

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych - Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,

Bardziej szczegółowo

Analiza danych i data mining.

Analiza danych i data mining. Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561

Bardziej szczegółowo

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,

Bardziej szczegółowo

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,

Bardziej szczegółowo

Analiza metod prognozowania kursów akcji

Analiza metod prognozowania kursów akcji Analiza metod prognozowania kursów akcji Izabela Łabuś Wydział InŜynierii Mechanicznej i Informatyki Kierunek informatyka, Rok V Specjalność informatyka ekonomiczna Politechnika Częstochowska izulka184@o2.pl

Bardziej szczegółowo

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006 SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

> funkcjonalność aplikacji

> funkcjonalność aplikacji Oferowane przez Bankier.pl narzędzie umożliwia pracownikom Banku porównanie jakości i istotnych cech swoich produktów z podobnymi oferowanymi przez inne Banki. Bazy danych o produktach finansowych aktualizowane

Bardziej szczegółowo

Drzewa decyzyjne i lasy losowe

Drzewa decyzyjne i lasy losowe Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM

Bardziej szczegółowo

w ekonomii, finansach i towaroznawstwie

w ekonomii, finansach i towaroznawstwie w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez

Bardziej szczegółowo

Opisy przedmiotów do wyboru

Opisy przedmiotów do wyboru Opisy przedmiotów do wyboru moduły specjalistyczne oferowane na stacjonarnych studiach II stopnia (magisterskich) dla 2 roku matematyki semestr letni, rok akademicki 2017/2018 Spis treści 1. Data mining

Bardziej szczegółowo

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH Streszczenie Małgorzata Nycz, Barbara Smok Akademia Ekonomiczna we Wrocławiu {malgorzata.nycz,barbara.smok}@ae.wroc.pl Artykuł prezentuje

Bardziej szczegółowo

PRZEWIDYWANIE LOJALNOŚCI KLIENTÓW

PRZEWIDYWANIE LOJALNOŚCI KLIENTÓW PRZEWIDWANIE LOJALNOŚCI KLIENTÓW Tomasz Demski StatSoft Polska Sp. z o.o. Wprowadzenie Podstawowe znaczenie terminu lojalność klienta oznacza jego skłonność do wielokrotnych zakupów u jednego dostawcy.

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

8. Drzewa decyzyjne, bagging, boosting i lasy losowe Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

Proces odkrywania wiedzy z baz danych

Proces odkrywania wiedzy z baz danych Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia

Bardziej szczegółowo

Koniunktura w Small Business

Koniunktura w Small Business Koniunktura w Small Business Wyniki badania ilościowego mikro i małych przedsiębiorstw realizowanego w ramach projektu Small Business DNA Organizatorzy Projektu: 17 września 2010 Informacje o badaniu CEL

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

1. Informacje o StatSoft Polska

1. Informacje o StatSoft Polska 1. Informacje o StatSoft Polska StatSoft Polska jest największym w Polsce dostawcą programów do statystycznej analizy danych, a także największym w Polsce organizatorem specjalistycznych kursów i szkoleń

Bardziej szczegółowo

Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych

Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy

Bardziej szczegółowo

Sposoby analizy i interpretacji statystyk strony WWW.

Sposoby analizy i interpretacji statystyk strony WWW. Sposoby analizy i interpretacji statystyk strony WWW. Jak oceniać sprzedaŝ przez WWW? Grzegorz Skiera, Łukasz PraŜmowski grzegorz.skiera@cyberstudio.pl lukasz.prazmowski@cyberstudio.pl O czym powiemy?

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie oceny efektywności i jakości działań biblioteczno-informacyjnych

Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie oceny efektywności i jakości działań biblioteczno-informacyjnych III Konferencja Biblioteki Politechniki Łódzkiej, 25 27.06.2008 Biblioteki w procesie dydaktycznym i badaniach naukowych Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie

Bardziej szczegółowo

Projekt Sieci neuronowe

Projekt Sieci neuronowe Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków

Bardziej szczegółowo

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim: Eksploracja Danych Nazwa w języku angielskim: Data Mining Kierunek studiów (jeśli dotyczy): MATEMATYKA I STATYSTYKA Stopień studiów i forma:

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

Bardziej szczegółowo

SKORING KREDYTOWY A MODELE DATA MINING

SKORING KREDYTOWY A MODELE DATA MINING SKORING KREDYTOWY A MODELE DATA MINING Janusz Wątroba StatSoft Polska Sp. z o.o. Przedmiotem rozważań w niniejszym artykule jest problematyka oceny ryzyka kredytowego oraz wybrane zagadnienia związane

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Opis efektów kształcenia dla modułu zajęć

Opis efektów kształcenia dla modułu zajęć Nazwa modułu: Metody eksploracji danych Rok akademicki: 2015/2016 Kod: OWT-1-607-s Punkty ECTS: 4 Wydział: Odlewnictwa Kierunek: Wirtotechnologia Specjalność: - Poziom studiów: Studia I stopnia Forma i

Bardziej szczegółowo

PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING

PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Prognozowanie jest jednym z najczęściej występujących zadań analizy danych któż nie chciałby

Bardziej szczegółowo

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2 Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Szkolenia SAS Cennik i kalendarz 2017

Szkolenia SAS Cennik i kalendarz 2017 Szkolenia SAS Spis treści NARZĘDZIA SAS FOUNDATION 2 ZAAWANSOWANA ANALITYKA 2 PROGNOZOWANIE I EKONOMETRIA 3 ANALIZA TREŚCI 3 OPTYMALIZACJA I SYMULACJA 3 3 ROZWIĄZANIA DLA HADOOP 3 HIGH-PERFORMANCE ANALYTICS

Bardziej szczegółowo

METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE

METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE Streszczenie Wiesław Wolny Akademia Ekonomiczna Katowice wolny@ae.katowice.pl Business Intelligence nie jest pojedyńczym systemem ani produktem.

Bardziej szczegółowo

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych Tomasz Demski StatSoft Polska www.statsoft.pl Analiza danych Zaawansowana analityka, data

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania

Bardziej szczegółowo

Opisy przedmiotów do wyboru

Opisy przedmiotów do wyboru Opisy przedmiotów do wyboru moduły specjalistyczne oferowane na stacjonarnych studiach II stopnia (magisterskich) dla 2 roku matematyki semestr letni, rok akademicki 2017/2018 Spis treści 1. Data mining

Bardziej szczegółowo

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Jednym z ważnych obszarów analizy danych jest prognozowanie szeregów czasowych. Któż nie chciałby znać przyszłości

Bardziej szczegółowo

Aplikacja przeznaczona dla wszystkich firm produkcyjnych, handlowych oraz usługowych działających w modelu B2B

Aplikacja przeznaczona dla wszystkich firm produkcyjnych, handlowych oraz usługowych działających w modelu B2B Aplikacja przeznaczona dla wszystkich firm produkcyjnych, handlowych oraz usługowych działających w modelu B2B Zamień anonimowych użytkowników w swoich klientów! WebSource to aplikacja internetowa dla

Bardziej szczegółowo

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej

Bardziej szczegółowo

Eksploracja danych (data mining)

Eksploracja danych (data mining) Eksploracja (data mining) Tadeusz Pankowski www.put.poznan.pl/~pankowsk Czym jest eksploracja? Eksploracja oznacza wydobywanie wiedzy z dużych zbiorów. Eksploracja badanie, przeszukiwanie; np. dziewiczych

Bardziej szczegółowo

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU) SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU) 1. Opis problemu - ocena końcowa projektu Projekt jako nowe, nietypowe przedsięwzięcie wymaga właściwego zarządzania. Podjęcie się realizacji

Bardziej szczegółowo

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Temat: Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Autorzy: Tomasz Małyszko, Edyta Łukasik 1. Definicja eksploracji danych Eksploracja

Bardziej szczegółowo

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii

Bardziej szczegółowo

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Sklepu Internetowego sprzedawca w Internecie Oferta e-mail: biuro@garg.pl, www.garg.pl 1. Wstęp Handel Internetowy zdobywa coraz większą

Bardziej szczegółowo

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L Nazwa przedmiotu: Kierunek: Metody komputerowe statystyki Computer Methods in Statistics Matematyka Rodzaj przedmiotu: przedmiot obowiązkowy dla specjalności matematyka przemysłowa Rodzaj zajęć: wykład,

Bardziej szczegółowo

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS Dotyczy cyklu kształcenia 2014-2018 Realizacja w roku akademickim 2016/2017 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu

Bardziej szczegółowo

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej II Konferencja Diagnostów Laboratoryjnych Śląski Urząd Wojewódzki w Katowicach 14 września 2015 Acusera 24. 7 - główne funkcje: 1.Prowadzenie

Bardziej szczegółowo

WYKAZ PRAC PUBLIKOWANYCH

WYKAZ PRAC PUBLIKOWANYCH Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu

Bardziej szczegółowo

Jak nie tylko być zgodnym z regulacją, ale wyciągnąć korzyści biznesowe z lepszego dopasowania oferty

Jak nie tylko być zgodnym z regulacją, ale wyciągnąć korzyści biznesowe z lepszego dopasowania oferty Jak nie tylko być zgodnym z regulacją, ale wyciągnąć korzyści biznesowe z lepszego dopasowania oferty 5.10.2017 Copyright Sollers Consulting 2017 Jak być zgodnym z regulacją? Ale nie o tym jest ta prezentacja

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE

METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE Zeszyty Naukowe PWSZ w Płocku Nauki Ekonomiczne, t. XXI, 2015. Państwowa Wyższa Szkoła Zawodowa w Płocku METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE Wprowadzenie Współczesne firmy przechowują i przetwarzają

Bardziej szczegółowo

IX EKSPLORACJA DANYCH

IX EKSPLORACJA DANYCH Zastosowanie drzew decyzyjnych do analizy danych Artur Soroczyński Politechnika Warszawska Instytut Technologii Materiałowych Terminologia Datamining Drzewa decyzyjne Plan wykładu Przykład wykorzystania

Bardziej szczegółowo

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw dr Karolina Borowiec-Mihilewicz Uniwersytet Ekonomiczny we Wrocławiu Zastosowania

Bardziej szczegółowo

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek: Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych I KARTA PRZEDMIOTU CEL PRZEDMIOTU Informatics systems for the statistical treatment of data Kierunek: Forma studiów Informatyka Stacjonarne

Bardziej szczegółowo

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2 2015 SAS Education sas.com/poland/training Centrum Szkoleniowe SAS Institute sp. z o.o. ul. Gdańska 27/31, 01-633 Warszawa (22) 560 46 20 cs@spl.sas.com Kalendarz szkoleń Grow With Us Nazwa szkolenia Kod

Bardziej szczegółowo

Piotr Wójtowicz StatSoft Polska Sp. z o.o.

Piotr Wójtowicz StatSoft Polska Sp. z o.o. ROZWIĄZANIA STATISTICA DLA SKORINGU Piotr Wójtowicz StatSoft Polska Sp. z o.o. Skuteczność działania systemu skoringowego przede wszystkim zależy od dostępności, zakresu i jakości gromadzonych danych.

Bardziej szczegółowo

strona 1 / 12 Autor: Walesiak Marek Publikacje:

strona 1 / 12 Autor: Walesiak Marek Publikacje: Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.

Bardziej szczegółowo

data mining machine learning data science

data mining machine learning data science data mining machine learning data science deep learning, AI, statistics, IoT, operations research, applied mathematics KISIM, WIMiIP, AGH 1 Machine Learning / Data mining / Data science Uczenie maszynowe

Bardziej szczegółowo

System sprzedaŝy rezerwacji

System sprzedaŝy rezerwacji System sprzedaŝy rezerwacji 2009 2 Spis treści 1. O PROGRAMIE... 2 2. ZAKRES FUNKCJONALNY... 3 2.1 Funkcje standardowe... 3 2.2 Moduły dodatkowe... 4 2.3. AuroraCMS... 5 1. O PROGRAMIE Dziś prawie kaŝdy

Bardziej szczegółowo

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych PRZEDMIOT (liczba godzin konwersatoriów/ćwiczeń) Statystyka opisowa z elementami analizy regresji (4/19) Wnioskowanie

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki

Bardziej szczegółowo

OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 8 OPROGRAMOWANIE DO ANALIZ MARKETINGOWYCH (pom. nr 1.21)

OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 8 OPROGRAMOWANIE DO ANALIZ MARKETINGOWYCH (pom. nr 1.21) Zamówienie publiczne współfinansowane przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Regionalnego Programu Operacyjnego Województwa Mazowieckiego 2007-2013 w związku

Bardziej szczegółowo

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74 3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15

Bardziej szczegółowo

Dostawa oprogramowania. Nr sprawy: ZP /15

Dostawa oprogramowania. Nr sprawy: ZP /15 ........ (pieczątka adresowa Oferenta) Zamawiający: Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu, ul. Staszica,33-300 Nowy Sącz. Strona: z 5 Arkusz kalkulacyjny określający minimalne parametry techniczne

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):

Bardziej szczegółowo

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna STUDIA PODYPLOMOWE Analiza i Eksploracja Danych Rynkowych i Marketingowych Rodzaj studiów: doskonalące Liczba godzin: 250 Liczba semestrów: dwa semestry Kierownik studiów: dr Paweł Kaczmarczyk Koszt studiów

Bardziej szczegółowo

PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS

PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 507 2018 Taksonomia 30 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania e-issn

Bardziej szczegółowo

Mail: Pokój 214, II piętro

Mail: Pokój 214, II piętro Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,

Bardziej szczegółowo

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 6 Modelowanie przypadków uŝycia i czynności. Materiały dla studentów

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 6 Modelowanie przypadków uŝycia i czynności. Materiały dla studentów Zakład Elektrotechniki Teoretycznej i Informatyki Stosowanej Wydział Elektryczny, Politechnika Warszawska Laboratorium modelowania oprogramowania w języku UML Ćwiczenie 6 Modelowanie przypadków uŝycia

Bardziej szczegółowo

ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH

ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH Ewa Ziemba Proces analizy i oceny funkcjonowania serwisu Nieodzownym etapem przedsięwzięcia budowy i uŝytkowania serwisu internetowego

Bardziej szczegółowo

Drzewa Decyzyjne, cz.2

Drzewa Decyzyjne, cz.2 Drzewa Decyzyjne, cz.2 Inteligentne Systemy Decyzyjne Katedra Systemów Multimedialnych WETI, PG Opracowanie: dr inŝ. Piotr Szczuko Podsumowanie poprzedniego wykładu Cel: przewidywanie wyniku (określania

Bardziej szczegółowo

Program do obsługi ubezpieczeń minifort

Program do obsługi ubezpieczeń minifort Program do obsługi ubezpieczeń minifort Dokumentacja uŝytkownika Rozliczanie z TU Kraków, grudzień 2008r. Rozliczanie z TU Pod pojęciem Rozliczenie z Towarzystwem Ubezpieczeniowym będziemy rozumieć ogół

Bardziej szczegółowo

Platforma przetargowa, rozliczeniowa i raportowa. Prezentacja systemu

Platforma przetargowa, rozliczeniowa i raportowa. Prezentacja systemu 1 Platforma przetargowa, rozliczeniowa i raportowa Prezentacja systemu 3 I. Elementy systemu 1. Platforma gwarancji przetargowych 2. Platforma zarządzania kampaniami 3. Platforma rozliczania realizacji

Bardziej szczegółowo

Implementacja metod eksploracji danych - Oracle Data Mining

Implementacja metod eksploracji danych - Oracle Data Mining Implementacja metod eksploracji danych - Oracle Data Mining 395 Plan rozdziału 396 Wprowadzenie do eksploracji danych Architektura Oracle Data Mining Możliwości Oracle Data Mining Etapy procesu eksploracji

Bardziej szczegółowo

Metody Eksploracji Danych. Klasyfikacja

Metody Eksploracji Danych. Klasyfikacja Metody Eksploracji Danych Klasyfikacja w wykładzie wykorzystano: 1. materiały dydaktyczne przygotowane w ramach projektu Opracowanie programów nauczania na odległość na kierunku studiów wyższych Informatyka

Bardziej szczegółowo

Metody scoringowe w regresji logistycznej

Metody scoringowe w regresji logistycznej Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19

Bardziej szczegółowo

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja

Bardziej szczegółowo

Scoring kredytowy a modele data mining

Scoring kredytowy a modele data mining Grzegorz Migut, Janusz Wątroba Scoring kredytowy a modele data mining Wprowadzenie Jedną z najbardziej charakterystycznych cech otaczającej nas rzeczywistości jest niepewność. Dotyczy to zarówno zjawisk

Bardziej szczegółowo

Drzewa decyzyjne w SAS Enterprise Miner

Drzewa decyzyjne w SAS Enterprise Miner Drzewa decyzyjne w SAS Enterprise Miner Aneta Ptak-Chmielewska Instytut Statystyki i Demografii Zakład Analizy Historii Zdarzeń i Analiz Wielopoziomowych www.sgh.waw.pl/zaklady/zahziaw 1 struktura ćwiczeń

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI StatSoft Polska, tel. (1) 48400, (601) 414151, info@statsoft.pl, www.statsoft.pl DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI I LOJALNOŚCI KLIENTÓW Mariusz Łapczyński Akademia Ekonomiczna w Krakowie,

Bardziej szczegółowo