ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK"

Transkrypt

1 ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK Streszczenie Paweł Pandzierski Akademia Ekonomiczna im. Oskara Langego we Wrocławiu Artykuł ten przedstawia zwięzły szkic przykładowych rozwaŝań, które mogą wpłynąć na decyzję zastosowania i wyboru pakietu Data Mining. Pierwsza część rozwaŝań jest powierzchowną prezentacją niektórych zastosowań eksploracji. Zawarte jest tam równieŝ proste porównanie najwaŝniejszych pakietów Data Mining. Kolejny rozdział zawiera przykład odkrywania uŝytecznych zaleŝności w danych kredytowych banku. W zakończeniu przedstawiono zestawienie wybranych narzędzi i technik budowy modelu, oraz podsumowanie przeprowadzonych rozwaŝań. Słowa kluczowe: Data Mining, eksploracja danych, klasyfikacja. 1. Wstęp Znaczenie posiadania właściwej wiedzy w określonym czasie przez decydenta jest wartością nie do przecenienia. Wiedza moŝe pochodzić z róŝnych źródeł, moŝe teŝ być pozyskiwana z danych gromadzonych latami w przedsiębiorstwie. Lista moŝliwych zastosowań eksploracji danych, a tym samym zastosowań odpowiedniego oprogramowania jest bardzo długa i systematycznie poszerzana. Koszt analiz marketingowych, moŝe ulec obniŝeniu o bardzo istotny składnik - nakłady na samo zebranie danych, gdy zaczniemy eksplorować juŝ posiadane, archiwalne dane. Trudno teŝ stwierdzić, co jest bardziej zaawansowanym raportem z zapytania, a co moŝemy juŝ określić jako Data Mining, ale zawsze mówimy wtedy o pozyskiwaniu wiedzy z bazy danych, wiedzy która nie jest oczywista [WYRO02]. Przy wyborze narzędzia kierujemy się róŝnymi kryteriami, jak np. do czego narzędzie będzie zastosowane (obszar tematyczny aplikacji), dostępność narzędzi, ich jakość oraz koszt. Wybór spośród ofert róŝnych producentów jest spory. Raz zakupione narzędzie powinno być uŝyteczne przez dłuŝszy okres, a nie tylko jednorazowo. Zatem problem wyboru narzędzia jest waŝny dla przedsiębiorstwa. Właściwy zakup to dla firmy korzyść, zakup niewłaściwy to czysta strata.

2 348 Zarządzanie wiedzą i rozwiązania Business Intelligence 2.Metody eksploracji danych Istnieje wiele metod eksploracji danych, od klasycznej statystyki aŝ po sieci neuronowe i algorytmy genetyczne. KaŜda z reguł reprezentuje zaleŝności odkryte w posiadanych bazach danych i kaŝda moŝe być wykorzystana do predykcji przyszłych wartości i zachowań. Przykłady zastosowań eksploracji danych: Przy: analizie dostępów do stron w Web, analizie koszyka, badaniu zachowań klientów w czasie, bezpośrednim marketingu, planowaniu inwestycji giełdowych, przewidywaniu sprzedaŝy (ubezpieczenia, telekomunikacja) uŝyteczne jest odkrywanie wzorców sekwencji - czasowych wzorców zachowań, Do zastosowań takich jak: rozpoznawanie obrazów (biologia, medycyna), określanie segmentów rynku na podstawie cech klientów (telekomunikacja, ubezpieczenia), poprawa jakości produktu, wczesne ostrzeganie przed awariami stosujemy klastrowanie, celem jest tu znajdowanie skończonego zbioru klas obiektów - klastrów (o stałej ilości), czyli podzbiorów podobnych rekordów. Klastrowanie przebiega najczęściej, w dwóch cyklach: cykl zewnętrzny przebiega po liczbie moŝliwych klastrów, cykl wewnętrzny próbuje znaleźć optymalny podział obiektów pomiędzy klastry, Do zastosowań takich jak: analiza koszyka zakupów, bezpośredni marketing, planowanie kampanii promocyjnych, planowanie rozmieszczenia stoisk sprzedaŝy w supermarketach, opracowania nowych taryf firm ubezpieczeniowych, zmniejszenie skali zjawiska migracji abonentów operatorów telekomunikacyjnych stosowane jest odkrywanie asocjacji. Jest to szeroka klasa metod, które obejmują głównie odkrywanie pomiędzy obiektami zaleŝności, które posiadają pewne miary statystyczne określające ich wsparcie i ufność, W przypadku, np. : weryfikacji kredytobiorców, przydziału kart kredytowych, marketingu bezpośredniego, planowania lokalizacji sklepów, diagnostyki medycznej, klasyfikacji pacjentów, rozpoznawania trendów na rynkach finansowych, segmentacji wielkiej grupy klientów ze względu na potencjalną zyskowność dla przedsiębiorstwa - odkrywanie klasyfikacji jest doskonałą metodą., a celem jest tu znajdowanie zaleŝności pomiędzy klasyfikacją obiektów (naturalną lub wprowadzoną przez eksperta) a ich charakterystyką, Gdy szukamy klientów o podobnej konsumpcji energii elektrycznej, identyfikujemy na giełdzie firmy o podobnej dynamice wzrostu cen akcji, szukamy surowców o podobnej charakterystyce sprzedaŝy stosujemy odkrywanie podobieństw w przebiegach czasowych, opisujących pewne procesy, Do: analizy danych pochodzących z ubezpieczalni, duŝych supermarketów, danych opisujących zachowania posiadaczy kart kredytowych, klientów banków, wykrywania naduŝyć, gdzie staramy się zrozumieć trendy i zmiany zachodzące w procesach generujących te dane - wykrywanie zmian i od-

3 Zagadnienie wyboru narzędzia do data mining. Analiza 349 chyleń -znajdujemy róŝnice pomiędzy aktualnymi a oczekiwanymi wartościami danych. Gotowe rozwiązania tego typu są szczególnie uŝyteczne przy ogromnych wolumenach elektronicznych danych 3.Wybór narzędzi Dokonanie wyboru pakietu narzędzi Data Mining nie jest rzeczą prostą. Zasadniczą barierą jest cena i dość wysoki stopień skomplikowania obsługi oprogramowania. Popularne pakiety istniejące na rynku to np.: Clementine firmy SPSS, Data Miner STATISTICA, Affinium Model, Insightful Miner, KXEN. Kompletne pakiety narzędzi do Data Mining oferowane przez poszczególnych producentów są uŝyteczne takŝe dla osób nie będących statystykami, osób, które ograniczają swoje analizy do najprostszych modeli. To wszystko dzięki temu, Ŝe oferowane programy są w stanie np. automatycznie przetestować szeroki wachlarz architektur sieci neuronowych, dokonać wyboru spośród wielu postaci drzew, automatycznie dobrać najlepszy podzbiór zmiennych predykcyjnych uŝywając zaawansowanych ogólnych i uogólnionych modeli. UŜytkownik tym sposobem otrzymuje lepsze, dokładniejsze i bardziej powtarzalne wyniki. Ma równieŝ moŝliwość przełączania się na graficzną prezentację wszelkich danych, na kaŝdym etapie procesu Data Mining (w trakcie budowania modelu, jego wykonywania, a nawet w procesie wdraŝania gotowego modelu). Pozwala to równieŝ interakcyjnie, wizualnie eksplorować dane i poruszyć wyobraźnię. Tabela 1 Pakiety DM, opracowanie własne na podstawie: [NISB04]. PAKIET: CLEM STAT IM AM KXEN Ilość punktów [pkt.] Cena [k$] Cena / Ilość punktów [$/pkt.] Dostępność algorytmów [pkt.] Cena / Dostępność algorytmów [$/pkt.] Przykład analizy Data Minning Wykorzystując wybrany np. na podstawie powyŝszego opracowania pakiet narzędzi do Data Mining, przeprowadzono przykładową analizę. Do instytucji, gdzie właśnie eksploracja danych moŝe zostać wykorzystana dla znalezienia bliskiego optymalnemu rozwiązania, z pewnością naleŝą banki. Gromadzą wiele szczegółowych informacji dotyczących swoich kredytobiorców: dochody, histo-

4 350 Zarządzanie wiedzą i rozwiązania Business Intelligence ria kredytowa klienta, stanowisko pracy, wiek, stan cywilny, wydatki itp. Przykładowe dane moŝna znaleźć na witrynie internetowej Uniwersytetu w Monachium(http://www.stat.uni-muenchen.de/service/datenarchiv/ kredit/kredit.html). Kiedy klient banku ubiega się o przyznanie kredytu, wtedy informacje te są uŝyteczne dla podjęcia właściwej decyzji: czy przyznać kredyt, osiągać z tego tytułu zyski, czy ryzykować moŝliwość bankructwa klienta, czy teŝ nie przyznawać kredytu, ale pomniejszyć swoje potencjalne zyski z odsetek [MLAS02]. 4.1.Liniowy model klasyfikacyjny Analizując bazy danych kredytów przyznawanych w przeszłości, generowane są reguły asocjacyjne uzaleŝniające np. regularną spłatę kredytów od pewnych cech osobowych klienta. Budując przykładowy liniowy model klasyfikacyjny dla danych dotyczących decyzji kredytowych przewidujemy, jaką decyzję podjął bank w zaleŝności od zestawu cech osoby starającej się o kredyt. W oryginalne, zbiór danych zawiera 1000 obserwacji: 300 klientów nie miało zdolności kredytowej, a 700 miało. W zborze danych mamy 20 predyktorów skategoryzowanych. W naszym przypadku wykonamy analizę na zmodyfikowanym podzbiorze, w którym proporcje decyzji pozytywnych do negatywnych są wyrównane. Stosując procedurę sprawdzająca jakość naszego modelu, tworzymy tabelę krzy- Ŝową pokazująca trafność przewidywań dla danych testowych. Z liczności trafnych i błędnych przewidywań widzimy, jak sprawnie model przewiduje decyzje dla danych z próby testowej. Przykładowa macierz pomyłek, opracowanie własne. Decyzja Przewidywanie Nie Nie[%] Tak Tak[%] Ogół Trafne 86 57,72% ,12% 201 Błędne 63 42,28% 49 29,88% 112 Razem ,00% ,00% 313 Tabela 2 Zastosowano tu ogólne modele analizy dyskryminacyjnej (GDA) - uogólnienie zwykłej analizy dyskryminacyjnej, pozwalające na korzystanie z predyktorów skategoryzowanych. Jeśli uznamy, ze uzyskane wyniki są zadawalające, moŝemy wdroŝyć nasz model, a znalezione reguły mogą zostać zaaplikowane do nowych kredytobiorców, pozwalając na predykcję przyszłego postępowania kredytobiorcy wobec banku. 4.2.Porównanie wybranych technik modelowania W celu porównania kilku róŝnych metod i narzędzi diagnostyki modelu, pracując na dostępnej bazie danych kredytów, wygenerowano odpowiadające im

5 Zagadnienie wyboru narzędzia do data mining. Analiza 351 ilość błędnych klasyfikacji. Przeprowadzając analizę na oryginalnych danych, z proporcją decyzji pozytywnych do negatywnych 7/3, z prostego powodu większej częstości występowania w danych obserwacji z pozytywną decyzją kredytową - uzyskujemy gorsze wyniki dla obserwowanej klasy Nie. UŜyty model CHAID (Chisquare Automatic Interaction Detection), jest metodą drzew klasyfikacyjnych i regresyjnych, w której kolejne węzły mogą być dzielone na wiele grup (z kaŝdego węzła mogą wychodzić więcej niŝ dwie gałęzie). Obserwujemy, Ŝe metoda CHAID ma dość duŝo błędnych klasyfikacji. Najlepszy wydaje się model uzyskany metodą BT (Boosted Tress). Są to drzewa klasyfikacyjne i regresyjne ze wzmacnianiem. Dla pewnych trudnych zadań estymacji i predykcji, przewidywania generowane przez sekwencje stosunkowo prostych drzew są bliŝsze rzeczywistym wartościom, niŝ prognozy sieci neuronowych lub jednego, złoŝonego drzewa. Wzmacnianiem (ang. boosting) nazywamy tu technikę polegająca na stosowaniu sekwencji prostych modeli, przy czym kaŝdy kolejny model przykłada większą wagę do tych obserwacji, które zostały błędnie zaklasyfikowane przez poprzednie modele [STAT03]. W prowadzonej analizie zastosowano równieŝ ogólne modele drzew klasyfikacyjnych i regresyjnych (GC&RT - General Classification and Regression Trees). Wykorzystano równieŝ sieci neuronowe RBF (Radial Basis Function - sieci o radialnych funkcjach bazowych) oraz prognozy zagregowane uzyskane poprzez głosowanie modeli (Voting). Jest to metoda, w której zamiast dopasowywać model, wyszukujemy podobne obiekty. Podstawą tej metody jest intuicyjne przeświadczenie, Ŝe podobne obiekty trafią do tej samej klasy. Występowanie błędnych klasyfikacji, opracowanie własne. Tabela 3 Błędne klasyfikacje [%] BT Voting GDA RBF GC&RT CHAID PROPORCJA Tak/Nie Faktyczna decyzja: Tak /30 Faktyczna decyzja: Nie Cały zbiór PROPORCJA Tak/Nie Faktyczna decyzja: Tak /50 Faktyczna decyzja: Nie Z LOSOWANIEM Cały zbiór Przeprowadzając modyfikację i losując automatycznie zadane liczności obydwu kategorii w próbie uczącej, wg predyktora decyzja, procent błędnych przewidywań wygląda korzystniej. W próbie testowej zachowano oryginalne proporcje odpowiedzi pozytywnych i negatywnych. Tym razem błędy dla obu decyzji występują duŝo rzadziej.

6 352 Zarządzanie wiedzą i rozwiązania Business Intelligence 5. Podsumowanie Jednoznacznie moŝna stwierdzić, Ŝe narzędzia Data Mining mogą znacznie usprawnić proces wnioskowania oraz przyśpieszyć cykl tworzenia modelu. Trzeba teŝ pamiętać, Ŝe nie zawsze mogą one zastępować ekspertyzy statystyczne. UŜytkownicy systemów powinni testować zawarte narzędzia i powinni być wyczuleni na upgrade produktów. Literatura [MLAS02] Mirosława Lasek: Data Mining. Zastosowania w analizach i ocenach klientów bankowych, Biblioteka MenedŜera i Bankowca, Warszawa, [EGAT01] Gatnar E.: Nieparametryczna metoda dyskryminacji i regresji, PWN Warszawa, [STAT99] Marketing i statystyka, StatSoft Polska, Kraków, [BELI97] Berry M. J. A., Linoff G.: Data Mining Techniques, for Marketing, Sales and Customer Support, John Wiley &Sons, Inc., [ZABO98] Zaborski A.: Skalowanie wielowymiarowe jako metoda badań marketingowych, Akademia Ekonomiczna we Wrocławiu, Wydział Gospodarki Regionalnej i Turystyki w Jeleniej Górze, [HAKA01] Han J., Kamber M.: Data Mining, Concepts and Techniques, Morgan Kaufmann Publishers, [STAT03] STATISTICA Data Miner Manual, StatSoft Inc., [HATI02] Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, [WALE93] Walesiak M.: Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe AE, Wrocław, Monografie i Opracowania Nr 101, [WYRO02] Wyrozumski T.: Eksploracja danych dlaczego nie w przemyśle?, VIII Konferencja PLOUG Kościelisko, [ZAKR98] Zakrzewicz M.: On-Line Data Mining, Konferencja PLOUG Zakopane, [MORZ04] Morzy T.: Eksploracja danych: problemy i rozwiązania, Konferencja PLOUG Zakopane, 1999 [NISB04] internet: Nisbet R.A.: nisbetreview.pdf z dn r. eview.pdf

7 Zagadnienie wyboru narzędzia do data mining. Analiza 353 QUESTION OF CHOICE A DATA MINING SUITE. COMPARATIVE ANALYSIS OF SELECTED PRODUCTS AND TECHNIQUES This article provides a brief outline of some considerations that could affect your decision of apply and choice a Data Mining suite. First point of the consider is superficial presentation of some exploration applications. There is simply comparison of leading Data Minning suites, too. Next part include a case of discovery useful summaries of bank credit information data. The end of the article contain comparison of some selected data analysis tools, techniques to build models and think over conclusions. Key words: Data Mining, data exploration, classyfication.

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

StatSoft profesjonalny partner w zakresie analizy danych

StatSoft profesjonalny partner w zakresie analizy danych Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych - Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,

Bardziej szczegółowo

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Opis efektów kształcenia dla modułu zajęć

Opis efektów kształcenia dla modułu zajęć Nazwa modułu: Eksploracja danych Rok akademicki: 2030/2031 Kod: MIS-2-105-MT-s Punkty ECTS: 5 Wydział: Inżynierii Metali i Informatyki Przemysłowej Kierunek: Informatyka Stosowana Specjalność: Modelowanie

Bardziej szczegółowo

Analiza metod prognozowania kursów akcji

Analiza metod prognozowania kursów akcji Analiza metod prognozowania kursów akcji Izabela Łabuś Wydział InŜynierii Mechanicznej i Informatyki Kierunek informatyka, Rok V Specjalność informatyka ekonomiczna Politechnika Częstochowska izulka184@o2.pl

Bardziej szczegółowo

w ekonomii, finansach i towaroznawstwie

w ekonomii, finansach i towaroznawstwie w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez

Bardziej szczegółowo

> funkcjonalność aplikacji

> funkcjonalność aplikacji Oferowane przez Bankier.pl narzędzie umożliwia pracownikom Banku porównanie jakości i istotnych cech swoich produktów z podobnymi oferowanymi przez inne Banki. Bazy danych o produktach finansowych aktualizowane

Bardziej szczegółowo

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH

ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH Streszczenie Małgorzata Nycz, Barbara Smok Akademia Ekonomiczna we Wrocławiu {malgorzata.nycz,barbara.smok}@ae.wroc.pl Artykuł prezentuje

Bardziej szczegółowo

Analiza danych i data mining.

Analiza danych i data mining. Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data

Bardziej szczegółowo

PRZEWIDYWANIE LOJALNOŚCI KLIENTÓW

PRZEWIDYWANIE LOJALNOŚCI KLIENTÓW PRZEWIDWANIE LOJALNOŚCI KLIENTÓW Tomasz Demski StatSoft Polska Sp. z o.o. Wprowadzenie Podstawowe znaczenie terminu lojalność klienta oznacza jego skłonność do wielokrotnych zakupów u jednego dostawcy.

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

1. Informacje o StatSoft Polska

1. Informacje o StatSoft Polska 1. Informacje o StatSoft Polska StatSoft Polska jest największym w Polsce dostawcą programów do statystycznej analizy danych, a także największym w Polsce organizatorem specjalistycznych kursów i szkoleń

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

Proces odkrywania wiedzy z baz danych

Proces odkrywania wiedzy z baz danych Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Sposoby analizy i interpretacji statystyk strony WWW.

Sposoby analizy i interpretacji statystyk strony WWW. Sposoby analizy i interpretacji statystyk strony WWW. Jak oceniać sprzedaŝ przez WWW? Grzegorz Skiera, Łukasz PraŜmowski grzegorz.skiera@cyberstudio.pl lukasz.prazmowski@cyberstudio.pl O czym powiemy?

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

Bardziej szczegółowo

Szkolenia SAS Cennik i kalendarz 2017

Szkolenia SAS Cennik i kalendarz 2017 Szkolenia SAS Spis treści NARZĘDZIA SAS FOUNDATION 2 ZAAWANSOWANA ANALITYKA 2 PROGNOZOWANIE I EKONOMETRIA 3 ANALIZA TREŚCI 3 OPTYMALIZACJA I SYMULACJA 3 3 ROZWIĄZANIA DLA HADOOP 3 HIGH-PERFORMANCE ANALYTICS

Bardziej szczegółowo

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Temat: Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Autorzy: Tomasz Małyszko, Edyta Łukasik 1. Definicja eksploracji danych Eksploracja

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

SKORING KREDYTOWY A MODELE DATA MINING

SKORING KREDYTOWY A MODELE DATA MINING SKORING KREDYTOWY A MODELE DATA MINING Janusz Wątroba StatSoft Polska Sp. z o.o. Przedmiotem rozważań w niniejszym artykule jest problematyka oceny ryzyka kredytowego oraz wybrane zagadnienia związane

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Jednym z ważnych obszarów analizy danych jest prognozowanie szeregów czasowych. Któż nie chciałby znać przyszłości

Bardziej szczegółowo

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2 Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł

Bardziej szczegółowo

Koniunktura w Small Business

Koniunktura w Small Business Koniunktura w Small Business Wyniki badania ilościowego mikro i małych przedsiębiorstw realizowanego w ramach projektu Small Business DNA Organizatorzy Projektu: 17 września 2010 Informacje o badaniu CEL

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Eksploracja danych (data mining)

Eksploracja danych (data mining) Eksploracja (data mining) Tadeusz Pankowski www.put.poznan.pl/~pankowsk Czym jest eksploracja? Eksploracja oznacza wydobywanie wiedzy z dużych zbiorów. Eksploracja badanie, przeszukiwanie; np. dziewiczych

Bardziej szczegółowo

Scoring kredytowy a modele data mining

Scoring kredytowy a modele data mining Grzegorz Migut, Janusz Wątroba Scoring kredytowy a modele data mining Wprowadzenie Jedną z najbardziej charakterystycznych cech otaczającej nas rzeczywistości jest niepewność. Dotyczy to zarówno zjawisk

Bardziej szczegółowo

IX EKSPLORACJA DANYCH

IX EKSPLORACJA DANYCH Zastosowanie drzew decyzyjnych do analizy danych Artur Soroczyński Politechnika Warszawska Instytut Technologii Materiałowych Terminologia Datamining Drzewa decyzyjne Plan wykładu Przykład wykorzystania

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania

Bardziej szczegółowo

WYKAZ PRAC PUBLIKOWANYCH

WYKAZ PRAC PUBLIKOWANYCH Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu

Bardziej szczegółowo

Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie oceny efektywności i jakości działań biblioteczno-informacyjnych

Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie oceny efektywności i jakości działań biblioteczno-informacyjnych III Konferencja Biblioteki Politechniki Łódzkiej, 25 27.06.2008 Biblioteki w procesie dydaktycznym i badaniach naukowych Projekt Analiza funkcjonowania bibliotek naukowych w Polsce (AFBN) jako narzędzie

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2 2015 SAS Education sas.com/poland/training Centrum Szkoleniowe SAS Institute sp. z o.o. ul. Gdańska 27/31, 01-633 Warszawa (22) 560 46 20 cs@spl.sas.com Kalendarz szkoleń Grow With Us Nazwa szkolenia Kod

Bardziej szczegółowo

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych

Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych Studia podyplomowe w zakresie przetwarzanie, zarządzania i statystycznej analizy danych PRZEDMIOT (liczba godzin konwersatoriów/ćwiczeń) Statystyka opisowa z elementami analizy regresji (4/19) Wnioskowanie

Bardziej szczegółowo

ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH

ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH ZASTOSOWANIE EKSPLORACJI DANYCH DO ANALIZY I OCENY SERWISÓW INTERNETOWYCH Ewa Ziemba Proces analizy i oceny funkcjonowania serwisu Nieodzownym etapem przedsięwzięcia budowy i uŝytkowania serwisu internetowego

Bardziej szczegółowo

Piotr Wójtowicz StatSoft Polska Sp. z o.o.

Piotr Wójtowicz StatSoft Polska Sp. z o.o. ROZWIĄZANIA STATISTICA DLA SKORINGU Piotr Wójtowicz StatSoft Polska Sp. z o.o. Skuteczność działania systemu skoringowego przede wszystkim zależy od dostępności, zakresu i jakości gromadzonych danych.

Bardziej szczegółowo

bo od managera wymaga się perfekcji

bo od managera wymaga się perfekcji bo od managera wymaga się perfekcji MODELOWANIE PROCESÓW Charakterystyka modułu Modelowanie Procesów Biznesowych (BPM) Modelowanie procesów biznesowych stanowi fundament wdroŝenia systemu zarządzania jakością

Bardziej szczegółowo

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej

Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej Acusera 24.7 - zarządzanie wynikami kontroli wewnątrzlaboratoryjnej II Konferencja Diagnostów Laboratoryjnych Śląski Urząd Wojewódzki w Katowicach 14 września 2015 Acusera 24. 7 - główne funkcje: 1.Prowadzenie

Bardziej szczegółowo

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego

Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Warsztaty przygotowujące osoby bezrobotne do prowadzenia własnego Sklepu Internetowego sprzedawca w Internecie Oferta e-mail: biuro@garg.pl, www.garg.pl 1. Wstęp Handel Internetowy zdobywa coraz większą

Bardziej szczegółowo

Analiza i wizualizacja danych Data analysis and visualization

Analiza i wizualizacja danych Data analysis and visualization KARTA MODUŁU / KARTA PRZEDMIOTU Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013

Bardziej szczegółowo

Mail: Pokój 214, II piętro

Mail: Pokój 214, II piętro Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,

Bardziej szczegółowo

OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów)

OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów) OPIS MODUŁU KSZTAŁCENIA (przedmiot lub grupa przedmiotów) Nazwa modułu/ przedmiotu Przetwarzanie danych w organizacji przedsiębiorstwa Nazwa jednostki prowadzącej przedmiot Instytut Matematyki Przedmioty:

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

Program do obsługi ubezpieczeń minifort

Program do obsługi ubezpieczeń minifort Program do obsługi ubezpieczeń minifort Dokumentacja uŝytkownika Rozliczanie z TU Kraków, grudzień 2008r. Rozliczanie z TU Pod pojęciem Rozliczenie z Towarzystwem Ubezpieczeniowym będziemy rozumieć ogół

Bardziej szczegółowo

Zagadnienie klasyfikacji (dyskryminacji)

Zagadnienie klasyfikacji (dyskryminacji) Zagadnienie klasyfikacji (dyskryminacji) Przykład Bank chce klasyfikować klientów starających się o pożyczkę do jednej z dwóch grup: niskiego ryzyka (spłacających pożyczki terminowo) lub wysokiego ryzyka

Bardziej szczegółowo

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI

DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI StatSoft Polska, tel. (1) 48400, (601) 414151, info@statsoft.pl, www.statsoft.pl DRZEWA KLASYFIKACYJNE W BADANIACH SATYSFAKCJI I LOJALNOŚCI KLIENTÓW Mariusz Łapczyński Akademia Ekonomiczna w Krakowie,

Bardziej szczegółowo

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Case Study Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Zadanie Naszym zadaniem było zaprojektowanie interfejsu aplikacji do sprzedaŝy ubezpieczeń

Bardziej szczegółowo

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):

Bardziej szczegółowo

Etapy przygotowań do przeprowadzenia badań marketingowych. dr Grzegorz Kotliński, Katedra Bankowości AE w Poznaniu

Etapy przygotowań do przeprowadzenia badań marketingowych. dr Grzegorz Kotliński, Katedra Bankowości AE w Poznaniu 1 Etapy przygotowań do przeprowadzenia badań marketingowych 2 Badania marketingowe a funkcje marketingu Analiza otoczenia Analiza klientów Planowanie produktów i usług Planowanie dystrybucji Planowanie

Bardziej szczegółowo

CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER

CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER CO WIE SMARTFON? ROZPOZNAWANIE AKTYWNOŚCI CZŁOWIEKA METODAMI KLASYFIKACYJNYMI STATISTICA DATA MINER Michał Kusy, StatSoft Polska Sp. z o.o. W bardzo krótkim czasie urządzenia mobilne stały się ogólnodostępne.

Bardziej szczegółowo

DATA MINING W PROGNOZOWANIU ZAPOTRZEBOWANIA

DATA MINING W PROGNOZOWANIU ZAPOTRZEBOWANIA DATA MINING W PROGNOZOWANIU ZAPOTRZEBOWANIA NA NOŚNIKI ENERGII Andrzej Sokołowski, Agnieszka Pasztyła StatSoft Polska Sp. z o. o.; Akademia Ekonomiczna w Krakowie, Katedra Statystyki Wprowadzenie Metody

Bardziej szczegółowo

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH Janusz Wątroba, StatSoft Polska Sp. z o.o. Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu

Bardziej szczegółowo

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74 3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15

Bardziej szczegółowo

Metody scoringowe w regresji logistycznej

Metody scoringowe w regresji logistycznej Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19

Bardziej szczegółowo

Drzewa decyzyjne w SAS Enterprise Miner

Drzewa decyzyjne w SAS Enterprise Miner Drzewa decyzyjne w SAS Enterprise Miner Aneta Ptak-Chmielewska Instytut Statystyki i Demografii Zakład Analizy Historii Zdarzeń i Analiz Wielopoziomowych www.sgh.waw.pl/zaklady/zahziaw 1 struktura ćwiczeń

Bardziej szczegółowo

OD POJEDYNCZYCH DRZEW DO LOSOWEGO LASU

OD POJEDYNCZYCH DRZEW DO LOSOWEGO LASU OD POJEDYNCZYCH DRZEW DO LOSOWEGO LASU Tomasz Demski, StatSoft Polska Sp. z o.o. Zgłębianie danych (data mining) Obecnie coraz częściej dysponujemy dużą liczbą danych opisujących interesujące nas zjawisko

Bardziej szczegółowo

Dostawa oprogramowania. Nr sprawy: ZP /15

Dostawa oprogramowania. Nr sprawy: ZP /15 ........ (pieczątka adresowa Oferenta) Zamawiający: Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu, ul. Staszica,33-300 Nowy Sącz. Strona: z 5 Arkusz kalkulacyjny określający minimalne parametry techniczne

Bardziej szczegółowo

Krótki kurs data mining. StatSoft Polska, Kraszewskiego 36, Kraków, tel

Krótki kurs data mining. StatSoft Polska, Kraszewskiego 36, Kraków,  tel Krótki kurs data mining StatSoft Polska, Kraszewskiego 36, 30-110 Kraków, www.statsoft.pl, tel. 12 4284300. e-mail:info@statsoft.pl Informacje ogólne Co to jest data mining Wykorzystywane modele Metodyka

Bardziej szczegółowo

System sprzedaŝy rezerwacji

System sprzedaŝy rezerwacji System sprzedaŝy rezerwacji 2009 2 Spis treści 1. O PROGRAMIE... 2 2. ZAKRES FUNKCJONALNY... 3 2.1 Funkcje standardowe... 3 2.2 Moduły dodatkowe... 4 2.3. AuroraCMS... 5 1. O PROGRAMIE Dziś prawie kaŝdy

Bardziej szczegółowo

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna STUDIA PODYPLOMOWE Analiza i Eksploracja Danych Rynkowych i Marketingowych Rodzaj studiów: doskonalące Liczba godzin: 250 Liczba semestrów: dwa semestry Kierownik studiów: dr Paweł Kaczmarczyk Koszt studiów

Bardziej szczegółowo

Dopasowywanie modelu do danych

Dopasowywanie modelu do danych Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;

Bardziej szczegółowo

Warsztaty. podjęcie pracy/ własnej działalności jako Webmaster CMS. Oferta

Warsztaty. podjęcie pracy/ własnej działalności jako Webmaster CMS. Oferta Warsztaty podjęcie pracy/ własnej działalności jako Webmaster CMS Oferta e-mail: biuro@garg.pl, www.garg.pl 1. Wstęp Internet, to miejsce, w którym powinien znaleźć się kaŝdy przedsiębiorca. Jeśli kogoś

Bardziej szczegółowo

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN Tomasz Demski, StatSoft Polska Sp. z o.o. Przewidywanie właściwości produktu na podstawie składu surowcowego oraz parametrów przebiegu

Bardziej szczegółowo

P R E Z E N T A C J A

P R E Z E N T A C J A P R E Z E N T A C J A decyzje-it.pl internetowy serwis branŝy IT specjalizujący się w oprogramowaniu dla biznesu Serwis decyzje-it.pl Kim jesteśmy? decyzje-it.pl to specjalistyczny, internetowy serwis

Bardziej szczegółowo

Implementacja metod eksploracji danych - Oracle Data Mining

Implementacja metod eksploracji danych - Oracle Data Mining Implementacja metod eksploracji danych - Oracle Data Mining 395 Plan rozdziału 396 Wprowadzenie do eksploracji danych Architektura Oracle Data Mining Możliwości Oracle Data Mining Etapy procesu eksploracji

Bardziej szczegółowo

Metody eksploracji danych. Reguły asocjacyjne

Metody eksploracji danych. Reguły asocjacyjne Metody eksploracji danych Reguły asocjacyjne Analiza podobieństw i koszyka sklepowego Analiza podobieństw jest badaniem atrybutów lub cech, które są powiązane ze sobą. Metody analizy podobieństw, znane

Bardziej szczegółowo

Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym

Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym Rozdział I Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym Streszczenie. W rozdziale przedstawiono przegląd zastosowań metod eksploracji danych (ang. data mining)

Bardziej szczegółowo

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business www.comarch.pl Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Tomasz Matysik Kołobrzeg, 19.11.2009

Bardziej szczegółowo

SIECI RBF (RADIAL BASIS FUNCTIONS)

SIECI RBF (RADIAL BASIS FUNCTIONS) SIECI RBF (RADIAL BASIS FUNCTIONS) Wybrane slajdy z prezentacji prof. Tadeusiewicza Wykład Andrzeja Burdy S. Osowski, Sieci Neuronowe w ujęciu algorytmicznym, Rozdz. 5, PWNT, Warszawa 1996. opr. P.Lula,

Bardziej szczegółowo

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym 1 NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym Przyszedł czas, aby po nowemu spojrzeć na zarządzanie ryzykiem w banku spółdzielczym, zwłaszcza przed wyborem oferty systemu

Bardziej szczegółowo

Adrian Horzyk

Adrian Horzyk Metody Inteligencji Obliczeniowej Metoda K Najbliższych Sąsiadów (KNN) Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU

WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU StatSoft Polska, tel. 2 428 43, 6 4 4 5, info@statsoft.pl, www.statsoft.pl WSPOMAGANIE KAMPANII SPRZEDAŻY KRZYŻOWEJ (CROSS-SELLING) NA PRZYKŁADZIE OFERTY BANKU Grzegorz Migut, StatSoft Polska Sp. z o.o.

Bardziej szczegółowo

Business Intelligence

Business Intelligence Business Intelligence Paweł Mielczarek Microsoft Certified Trainer (MCT) MCP,MCSA, MCTS, MCTS SQL 2005, MCTS SQL 2008, MCTS DYNAMICS, MBSS, MBSP, MCITP DYNAMICS. Geneza Prowadzenie firmy wymaga podejmowania

Bardziej szczegółowo

W gąszczu cen.... czyli jak optymalizować cenę w dobie masowej customizacji?

W gąszczu cen.... czyli jak optymalizować cenę w dobie masowej customizacji? W gąszczu cen... czyli jak optymalizować cenę w dobie masowej customizacji? 1 2 3 4 5 O jakim gąszczu cen mówimy Case Study 1 skuter Case Study 2 konto bankowe Case Study 3 usługi telekomunikacyjne czy

Bardziej szczegółowo

ALGORYTM ROZPOZNAWANIA OBRAZÓW MATERIAŁÓW BIOLOGICZNYCH

ALGORYTM ROZPOZNAWANIA OBRAZÓW MATERIAŁÓW BIOLOGICZNYCH InŜynieria Rolnicza 7/2005 Bogusława Łapczyńska-Kordon, Jerzy Langman, Norbert Pedryc Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie ALGORYTM ROZPOZNAWANIA OBRAZÓW MATERIAŁÓW

Bardziej szczegółowo

IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej

IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej Co warto wiedzieć o łączeniu komputerów w sieci? Spójrz na rysunek IV.3p, który przedstawia właściwości Połączeń lokalnych,

Bardziej szczegółowo

Podstawy sztucznej inteligencji

Podstawy sztucznej inteligencji wykład 7 Eksploracja danych 25 stycznia 2011 Plan wykładu Co to jest eksploracja danych? 1 Co to jest eksploracja danych? 2 3 Definicja Eksploracja danych ED (Data mining) Metody wydobywania ukrytych informacji

Bardziej szczegółowo

N a s z e D ł u g i A. D. 2 0 0 9. Nasze Długi - główne wyniki badań. Próba badawcza

N a s z e D ł u g i A. D. 2 0 0 9. Nasze Długi - główne wyniki badań. Próba badawcza N AS Z E DŁUGI A. D. 2009 N a s z e D ł u g i A. D. 2 0 0 9 Nasze Długi - główne wyniki badań 45% Polaków ma obecnie większe problemy finansowe, niŝ przed kryzysem 77% społeczeństwa uwaŝa, Ŝe osoby, które

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY

PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY Piotr Wójtowicz, Grzegorz Migut StatSoft Polska Jakie są różnice pomiędzy osobami prawidłowo regulującymi swoje zobowiązania a niechętnie spłacającymi swoje długi,

Bardziej szczegółowo

Projektowanie zorientowane na uŝytkownika

Projektowanie zorientowane na uŝytkownika Uniwersytet Jagielloński Interfejsy graficzne Wykład 2 Projektowanie zorientowane na uŝytkownika Barbara Strug 2011 Hall of shame Hall of shame Model wodospad Feedback Problem z modelem waterfall Projektowanie

Bardziej szczegółowo

Podstawy sztucznej inteligencji

Podstawy sztucznej inteligencji wykład 7 Eksploracja danych 09 stycznia 2013 Plan wykładu Co to jest eksploracja danych? 1 Co to jest eksploracja danych? 2 3 Definicja Eksploracja danych ED (Data mining) Metody wydobywania ukrytych informacji

Bardziej szczegółowo

Platforma przetargowa, rozliczeniowa i raportowa. Prezentacja systemu

Platforma przetargowa, rozliczeniowa i raportowa. Prezentacja systemu 1 Platforma przetargowa, rozliczeniowa i raportowa Prezentacja systemu 3 I. Elementy systemu 1. Platforma gwarancji przetargowych 2. Platforma zarządzania kampaniami 3. Platforma rozliczania realizacji

Bardziej szczegółowo

MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II - ANALIZA STATYSTYCZNA

MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II - ANALIZA STATYSTYCZNA InŜynieria Rolnicza 6/2005 Stanisław Kokoszka, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza w Krakowie MECHANIZACJA PRAC ŁADUNKOWYCH A NAKŁADY W TRANSPORCIE ROLNICZYM CZ. II

Bardziej szczegółowo

PRZYKŁAD ROZWIĄZANIA ZAGADNIENIA PREDYKCYJNEGO ZA POMOCĄ TECHNIK DATA MINING

PRZYKŁAD ROZWIĄZANIA ZAGADNIENIA PREDYKCYJNEGO ZA POMOCĄ TECHNIK DATA MINING PRZYKŁAD ROZWIĄZANIA ZAGADNIENIA PREDYKCYJNEGO ZA POMOCĄ TECHNIK DATA MINING dr Janusz Wątroba, StatSoft Polska Sp. z o.o. W przykładzie prezentowane jest zastosowanie technik data mining do zagadnienia

Bardziej szczegółowo

Zarządzanie kompetencjami pracowników

Zarządzanie kompetencjami pracowników Zarządzanie kompetencjami pracowników Kompetencje IT w dobie cyfryzacji i informatyzacji życia gospodarczego Baza wymaganych kompetencji i jej zmiana w czasie Kompetencje a stanowisko pracy Indywidualizacja

Bardziej szczegółowo