Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym
|
|
- Joanna Skiba
- 7 lat temu
- Przeglądów:
Transkrypt
1 Rozdział I Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym Streszczenie. W rozdziale przedstawiono przegląd zastosowań metod eksploracji danych (ang. data mining) do analizy baz danych sprzedaży. Następnie opisano sposób przygotowania bazy danych sprzedaży do analiz. Analizy objęły badanie czynników wpływających na wartość sprzedaży, predykcję sprzedaży, znalezienie sposobu zwiększenia wartości sprzedaży, ocenę pracy menadżerów sprzedaży, grupowanie klientów. Zastosowano następujące metody eksploracji danych: drzewa decyzyjne, reguły asocjacji, grupowanie, analizę regresji. 1 Zastosowania eksploracji danych Eksploracja danych (ang. data mining) to termin, który obejmuje szeroki zakres technik używanych w różnych dziedzinach przemysłu. Zgodnie z definicją The Gartner Group [1] jest to proces odkrywania nowych, znaczących związków, wzorców i trendów poprzez badanie dużych ilości zgromadzonych danych, zarówno przy użyciu technik wykrywania wzorców jak i metod statystycznych i matematycznych. Techniki eksploracji można podzielić na trzy podstawowe grupy: analiza powiązań, obejmuje znajdowanie reguł asocjacji, odkrywanie wzorców sekwencji, podobnych sekwencji czasowych [3], [11], analiza skupień, polega na grupowaniu (ang. clustering) obiektów danych na podstawie zestawu cech określających stopień ich podobieństwa [3], [10], [14], klasyfikacja i predykcja, stosują takie narzędzia, jak drzewa decyzyjne, sieci neuronowe, regresja liniowa i nieliniowa, sieci Bayesa, polegają na przewidywaniu przyszłych zachowań na podstawie danych historycznych [3], [10], [11], [12], [14], [15], [16], [19]. Odkrywanie reguł asocjacji polega na znajdowaniu związków pomiędzy występowaniem grup atrybutów w bazie danych. Podstawę do oceny reguły stanowią trzy statystyki (zakładamy, że zależność ma postać A=>B): wsparcie (ang. support), czyli procent klientów, którzy zakupili zarówno produkt A i B, ufność (ang. confidence), tj. prawdopodobieństwo, że klient zakupi produkt B, jeśli wiadomo, że posiada on już produkt A oraz współczynnik podwyższenia (ang. lift), o który wzrasta prawdopodobieństwo zakupu produktu B, jeśli wiadomo, że klient posiada produkt A, w porównaniu do sytuacji, gdy nie wiadomo, czy klient ten produkt posiada. Znajdują one zastosowanie najczęściej do Justyna Kowalska, Bogdan Trawiński: Politechnika Wrocławska, Instytut Informatyki Stosowanej, Wybrzeże Wyspiańskiego 27, Wrocław, Polska carrot@o2.pl, trawinski@pwr.wroc.pl
2 J. Kowalska, B. Trawiński analizy koszyka zakupów, pozwalają podejmować decyzje dotyczące np. promocji i obniżek cen, reklam i akcji marketingowych lub rozmieszczenia produktów [1], [5], [17]. Grupowanie znajduje zastosowanie do segmentacji i profilowania klientów, do właściwego adresowania kampanii marketingowych [1], [13], [17], [19], a także do identyfikacji i grupowania produktów [3], [8], wykrywania odchyleń [4]. Drzewa decyzyjne pozwalają na eksplorację zbioru danych poprzez analizę wartości decydujących o powstaniu węzła i mogą służyć do klasyfikacji klientów lub wyrobów [1], [5], [17]. Stosowane do predykcji, drzewa decyzyjne umożliwiają oszacowanie wartości (lub przedziału wartości), jaką z dużym prawdopodobieństwem może przyjąć atrybut analizowanego obiektu [2], [8], [15]. Analiza regresji prowadzi do przewidywania wysokości sprzedaży, cen, itp. [2], [4], a także do wykrywania odchyleń co pozwala na wykrywanie oszustw [1]. 2 Charakterystyka analizowanych danych sprzedaży Do badań użyto danych systemu sprzedaży rzeczywistego przedsiębiorstwa produkcyjnego, które wytwarza produkty konsumpcyjne. Były to dane obejmujące faktury sprzedaży wyrobów za okres pierwszych dziewięciu miesięcy 2005 roku, a ponadto odbiorców i ich lokalizację oraz menedżerów sprzedaży. Odbiorcami wyrobów były hurtownie oraz duże centra handlowe. Strukturę danych sprzedaży przedstawiono na rys. 1. Rys. 1. Struktura danych sprzedaży badanego przedsiębiorstwa Wyroby były opatrzone różnorodnymi atrybutami, takimi jak marka, rodzaj, kategoria, model, funkcja, sposób użytkowania, wymiar, kolor, oferta itp. Przygotowanie danych w pierwszej kolejności polegało na dokonaniu ich pełnej anonimizacji, poprzez zastąpienie wszystkich nazw stosowanych w źródłowym systemie odpowiednimi kodami, np. Wyrob_1705, GrupaProd_15, FunProd_19, Model_0439, Odbiorca_0920 itp. Strukturę danych o wyrobach przedstawiono na rys. 2. W dalszym ciągu, dane ze źródłowej, struktury relacyjnej przekształcono do płaskiej struktury, zbudowanej wokół pozycji faktur, zawierających ilości, wartości oraz daty sprzedaży poszczególnych wyrobów. W strukturze tej zawarto również wartości atrybutów wyrobów oraz atrybutów odbiorców. W czasie tego etapu przygotowania odrzucono dane niespójne i posiadające zerową wartość sprzedaży. Łącznie do badań klientów oraz sprzedaży użyto rekordów. Ze względu na charakter produkcji oraz sposób prowadzenia bazy danych w badanym przedsiębiorstwie, nie wszystkie wyroby miały określone wartości wszystkich atrybutów. Stąd też wielokrotnie w czasie analiz pojawiały się puste kategorie danych. Badania przeprowadzono za pomocą narzędzia SAS Enterprise Miner [7]. 2
3 Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym Rys. 2. Struktura danych o wyrobach badanego przedsiębiorstwa 3 Analiza uzyskanych wyników Analizy objęły badanie czynników wpływających na wartość sprzedaży, predykcję sprzedaży, znalezienie sposobu zwiększenia wartości sprzedaży, ocenę pracy menadżerów sprzedaży, grupowanie klientów. Zastosowano następujące metody eksploracji danych: drzewa decyzyjne, reguły asocjacji, grupowanie, analizę regresji. 3.1 Analiza czynników wpływających na wartość sprzedaży Analizę czynników wpływających na wartość sprzedaży przeprowadzono za pomocą funkcji Tree w narzędziu SAS Enterprise Miner. Utworzone zostało drzewo decyzyjne, którego fragment pokazano na rys. 3. Do utworzenia drzewa użyto algorytmu Variance reduction (przeprowadzono także próby dla algorytmu F test i otrzymano bardzo zbliżone wyniki, jednak w przypadku algorytmu Variance reduction dokładniej określone zostały grupy odbiorców). Określono maksymalną liczbę gałęzi wychodzących z węzła na dwa (drzewo binarne) i maksymalną głębokość drzewa na sześć poziomów. Podział nastąpił tu ze względu na grupy produktów i odbiorców. Widać tu przede wszystkim, że średnia wartość sprzedaży wyrobów z zbioru grup 0 jest bardzo niska (ok. 407 zł). Te wyroby mogą być dołączane w ramach sprzedaży wiązanej lub promocyjnej do wyrobów z grup sprzedających się bardzo dobrze. Np. do produktów ze zbioru grup wyrobów 1 można dołączyć produkt z grupy funkcjonalnej 0 i sprzedawać je razem w cenie promocyjnej. Drzewo może także posłużyć do predykcji wielkości sprzedaży nowych produktów wprowadzanych na rynek. Na przykład dla wyrobu należącego do zerowego zbioru grup produktów (Group:GRUPAPRODKOD=0) i dla grup odbiorców 5, 7 lub 8 (Group:ODBIORCAKOD=5...) średnia przewidywana wartość transakcji zakupu wynosi 543,59 zł. 3
4 J. Kowalska, B. Trawiński N Average Group: GRUPAPRODKOD N Average Group: GRUPAPRODKOD 0 1 N 4152 Average Group: ODBIORCAKOD N Average Group: ODBIORCAKOD N 2347 Average N 1805 Average N Average N 183 Average Rys. 3. Badanie czynników wpływających na wartość sprzedaży za pomocą drzewa decyzyjnego Podobne drzewo zostało utworzone dla zmiennej celu ILOSC, która określa liczbę wyrobów zakupionych w pojedynczej transakcji. To badanie pozwoli przewidzieć średnią liczbę produktów z pewnej grupy produktów kupowanych przez danego odbiorcę. Takie szacunki mogą być pomocne przy planowaniu wielkości produkcji nowo wprowadzanego wyrobu z danej grupy produktów. Analogiczne badania przeprowadzono dla różnych poziomów kategoryzacji wyrobów, począwszy od marki produktu aż do szczegółowego wyróżnienia modeli. 3.2 Predykcja sprzedaży za pomocą analizy regresji Analiza regresji w odróżnieniu od drzew decyzyjnych pozwala przewidzieć zakres wartości transakcji sprzedaży produktów z danej grupy, a nie tylko średnią ich wartość. Dokonuje ona także predykcji spodziewanej liczby takich transakcji im większe zagęszczenie punktów dla danej wartości tym większa liczba operacji zakupu (Rys. 4). Rys. 4. Przewidywanie wartości sprzedaży grup wyrobów za pomocą analizy regresji 4
5 Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym Analizując wykres regresji uzyskany przy użyciu funkcji Regression w narzędziu SAS Enterprise Miner możemy określić m.in. grupy produktów, których przewidywana sprzedaż jest bliska zeru. Na rys. 4 są to gp17, gp16 i gp12 i dla nich można podjąć adekwatne działania zapobiegawcze. Wyniki te posłużyły również do pojęcia próby znalezienia sposobu zwiększenia sprzedaży wyrobów z gr13, którą opisano w następnym punkcie. 3.3 Użycie reguł asocjacji do zwiększenia sprzedaży Analiza wartości sprzedaży przedstawiona na rys. 5 wykazuje, że niektóre grupy produktów sprzedawane są poza którąkolwiek z ofert sprzedaży (normalna, promocyjna, itp.) a ich sprzedaż jest bardzo niska. Produkty z tych grup mogą być dołączone do produktów z grup dobrze się sprzedających. To, do jakich grup można je dołączyć można określić za pomocą reguł asocjacji. W tabeli 1 przedstawiono reguły asocjacji dla wyrobów z grupy gp13, które mają niską sprzedaż, wyniki posortowano wg wartości współczynnika podwyższenia (ang. lift). Rys. 5. Analiza wartości sprzedaży grup produktów w zależności od oferty Tabela 1. Reguły asocjacji pozwalające zwiększyć sprzedaż produktów z grupy gp13 Lp. Liczność Podwyższenie Poparcie (%) Pewność (%) Liczba transakcji Reguła gp15 & gp07 ==> gp gp16 & gp01 ==> gp gp16 ==>gp gp11 & gp07 ==> gp gp17 & gp05 ==> gp gp12 & gp05 ==>gp gp17 & gp01 ==> gp13 5
6 J. Kowalska, B. Trawiński Przydatna jest reguła z numerem 31 (Tabela 1), która pokazuje, że sprzedaż można zwiększyć dołączając produkty z gp13 do produktów z gp11 i gp07. Dzięki temu można ponad 1,5-krotnie zwiększyć prawdopodobieństwo sprzedaży. Reguła ta ma 30-procentowe wsparcie i występuje w dużej liczbie transakcji. W tabeli 2 pokazano reguły jednoelementowe. Liczba transakcji jest tu mniejsza niż w przypadku poprzednich reguł, ale reguła druga ma największą liczność (76) i najwyższe wsparcie. Wskazuje ona, że produkty z grupy gp16 pozwolą zwiększyć ponad 1,5-krotnie prawdopodobieństwo sprzedaży produktów z gp13. Tabela 2. Dwuelementowe reguły asocjacji Lp. Liczność Podwyższenie Poparcie (%) Pewność (%) Liczba transakcji Reguła gp14 ==> gp gp16 ==> gp gp17 ==>gp gp12 ==> gp Analiza sprzedaży w układzie terytorialnym Zależność wartości sprzedaży w poszczególnych województwach od czasu pokazano na rys. 6. Województwa o niskim poziomie sprzedaży odnotowują niewielkie zmiany wartości sprzedaży w poszczególnych miesiącach. Jednak w przypadku dużych pod względem liczby ludności województw, np. w w07 wyraźny jest spadek sprzedaży w kwietniu i maju, po którym następuje gwałtowny wzrost w lipcu i sierpniu. Wiedząc z wyprzedzeniem o mającym nastąpić spadku sprzedaży można przedsięwziąć odpowiednie działania zapobiegawcze, jak np. nasilona reklama przy użyciu mediów regionalnych, promocje w lokalnych sieciach i sklepach. Rys. 6. Analiza zmian wartości sprzedaży w województwach 6
7 Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym 3.5 Analiza wyników pracy menedżerów sprzedaży Wyniki pracy menedżerów sprzedaży w poszczególnych województwach przedstawiono na rys. 7. Menedżer KAM_4 osiągnął najgorsze wyniki w praktycznie wszystkich województwach. Można skierować jego wysiłki do współpracy z innymi, pomniejszymi klientami sprzedającymi mniejsze ilości wyrobów, ale za to droższych co mogłoby wpłynąć na zwiększenie obrotu w transakcjach. Rys. 7. Analiza wartości sprzedaży w transakcjach dokonanych przez menedżerów sprzedaży 3.6 Badanie klientów za pomocą analizy skupień W celu zróżnicowania klientów dokonano analizy skupień. Użyto funkcji Clustering dostępnej w narzędziu SAS Enterprise Miner. Do pogrupowania klientów wykorzystano algorytm K-means. Liczbę grup ustalono na 4. Przy takiej liczbie wyeliminowana została większość grup, których zawartość w dużej części się pokrywała. Rezultaty grupowania przedstawiono na rys. 8. Wykres kołowy po lewej stronie przedstawia charakterystykę grup: natężenie koloru obrazuje maksymalną odległość rekordów od centrum grupy, wysokość wycinka jest proporcjonalna do liczby rekordów w danej grupie, powierzchnia wycinka odpowiada wartości odchylenia standardowego. Zestawienie wyświetlane po prawej stronie rysunku charakteryzuje rekordy zawarte w grupie nr 1. Jaśniejszy kwadrat pokazuje średnią znormalizowaną wartość zmiennej w całym badanym zbiorze danych, natomiast kwadrat ciemniejszy przedstawia znormalizowaną średnią wartość zmiennej w badanej grupie. W wyniku działania algorytmu wyróżniono cztery grupy klientów: klienci, którzy kupują duże ilości wyrobów o niskiej cenie i średniej marży (procent marży oznacza upust jaki klient otrzymuje przy danej transakcji, są to wartości ujemne, więc im mniejsza wartość marży tym większy upust). Ta grupa obejmuje dużą liczbę transakcji. Klienci, którzy się w niej znajdują generują wysokie zyski, pomimo że nie dokonują zakupów najdroższego sprzętu (grupa 1). 7
8 J. Kowalska, B. Trawiński odbiorcy, którzy kupują minimalną liczbę produktów o wysokiej cenie i średniej marży. Sprzedaż najdroższych wyrobów jest bardzo korzystna dla przedsiębiorstwa, jednak zdecydowanie należałoby zwiększyć liczbę sprzedawanych produktów z tej grupy, np. poprzez sprzedaż promocyjną polegającą na dołączaniu niedrogich wyrobów bez zmiany ceny podstawowej (grupa 2). klienci kupujący bardzo małą liczbę produktów o niewysokiej cenie i niskim upuście. Liczba transakcji jest tu nieduża, jest to więc grupa klientów przynosząca bardzo małe zyski. W ich przypadku konieczne jest nasilenie działań zmierzających do zwiększenia wartości dokonywanych zakupów, np. po zbadaniu, które grupy produktów są najczęściej zakupywane przez tych klientów można im zaoferować atrakcyjne promocje tych wyrobów (grupa 3). klienci, którzy kupują małą liczbę wyrobów o średniej cenie i niskiej marży. Działania wobec tych klientów powinny być podobne do działań podjętych wobec klientów z grupy 3 (grupa 4). Rys. 8.. Wyniki analizy skupień klientów 4 Podsumowanie W rozdziale przedstawiono wstępne wyniki badań danych z systemu sprzedaży przedsiębiorstwa produkcyjnego, dostarczającego wyroby konsumpcyjne. Osiągnięte rezultaty potwierdzają przydatność zastosowanych metod eksploracji danych. Pozwalają one na sformułowanie wniosków dotyczących poprawy organizacji procesu sprzedaży. Uzyskane wyniki zostaną zweryfikowane przy współpracy ze specjalistami z działu marketingu badanego przedsiębiorstwa. Przewiduje się przeprowadzenie dalszej serii szczegółowych analiz w ramach poszczególnych modeli oraz grup wyrobów i klientów. 8
9 Literatura Zastosowanie metod eksploracji danych do badania sprzedaży w przedsiębiorstwie produkcyjnym 1. Bauer K.: The power of metrics: Predictive analytics - addressing the business vicissitudes, DM Review Magazine, January Bauer K.: The power of metrics: Predictive analytics: Data mining with a twist, DMReview Magazine, December Berry M., Linoff G.: Data mining techniques for marketing, sales and customer relationship management, Wiley Publishing Berson A., Smith S., Thearling K.: Building data mining applications for CRM, Mc-Graw-Hill Professional Blundon W.: Predicting success: using analytics to drive more profitable customer interactions, DM Direct Newsletter, December Brand E., Gerritsen R.: Decision trees, DBMS Magazine, February Data Mining Using SAS Enterprise Miner: A Case Study Approach, Second Edition. SAS Institute Inc Edelstein H.: Mining large databases, Two Crows Corporation 9. The Gartner Group, Han J., Kamber M.: Data mining: concepts and techniques, Morgan Kaufmann Publishers Hand D., Mannila H., Smith P.: Eksploracja danych, Wydawnictwo Naukowo-Techniczne Larose D.T.: Discovering knowledge in data. An introduction to data mining, John Wiley & Sons Lasek M.: Data mining. Zastosowania w analizach i ocenach klientów bankowych, Oficyna Wydawnicza Zarządzanie i Finanse, Warszawa Nong Ye (ed.): The handbook of data mining, Lawrence Erlbaum Associates Pankowski T.: Drzewa decyzyjne, Parr Rud O.: Data mining cookbook. Modeling data for Marketing, Risk and Customer Relationship Management, John Wiley & Sons Shearer C.: Anticipating consumer behavior with analytics, CRM Today Sokołowski A: Metody stosowane w data mining, zeszyt: Data mining metody i przykłady, Seminarium StatSoft, Warszawa StatConsulting, Paper title: Use of data mining methods for the analysis of sale data in a manufacturing enterprise Abstract. A review of the use of data mining methods for the analysis of sale data has been presented. The method of data preparation for the analysis has been described. The analysis comprised the investigation of factors influencing sale value, sale prediction, ways of sale increasing, assessment of sale managers work, client clustering, etc. Following data mining methods: decision trees, association rules, clustering and regression analysis have been used in the investigation. Słowa kluczowe: Eksploracja danych, przedsiębiorstwo produkcyjne, analiza sprzedaży, wyroby konsumpcyjne. 9
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
Bardziej szczegółowodr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych
- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,
Bardziej szczegółowoEwelina Dziura Krzysztof Maryański
Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład
Bardziej szczegółowoWprowadzenie do technologii informacyjnej.
Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja
Bardziej szczegółowoAnaliza danych i data mining.
Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data
Bardziej szczegółowoZalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel
według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology
Bardziej szczegółowodata mining machine learning data science
data mining machine learning data science deep learning, AI, statistics, IoT, operations research, applied mathematics KISIM, WIMiIP, AGH 1 Machine Learning / Data mining / Data science Uczenie maszynowe
Bardziej szczegółowoSAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Bardziej szczegółowoProces odkrywania wiedzy z baz danych
Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia
Bardziej szczegółowoInżynieria biomedyczna
Inżynieria biomedyczna Projekt Przygotowanie i realizacja kierunku inżynieria biomedyczna studia międzywydziałowe współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.
Bardziej szczegółowoEksploracja danych (data mining)
Eksploracja (data mining) Tadeusz Pankowski www.put.poznan.pl/~pankowsk Czym jest eksploracja? Eksploracja oznacza wydobywanie wiedzy z dużych zbiorów. Eksploracja badanie, przeszukiwanie; np. dziewiczych
Bardziej szczegółowoZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 50 2012 ANALIZA WŁASNOŚCI OPCJI SUPERSHARE
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 5 212 EWA DZIAWGO ANALIZA WŁASNOŚCI OPCJI SUPERSHARE Wprowadzenie Proces globalizacji rynków finansowych stwarza
Bardziej szczegółowoDOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,
Bardziej szczegółowoData Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski
Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,
Bardziej szczegółowoKlasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)
Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania
Bardziej szczegółowoSzkolenia SAS Cennik i kalendarz 2017
Szkolenia SAS Spis treści NARZĘDZIA SAS FOUNDATION 2 ZAAWANSOWANA ANALITYKA 2 PROGNOZOWANIE I EKONOMETRIA 3 ANALIZA TREŚCI 3 OPTYMALIZACJA I SYMULACJA 3 3 ROZWIĄZANIA DLA HADOOP 3 HIGH-PERFORMANCE ANALYTICS
Bardziej szczegółowoSZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie
SZKOLENIA SAS ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie DANIEL KUBIK ŁUKASZ LESZEWSKI ROLE ROLE UŻYTKOWNIKÓW MODUŁU
Bardziej szczegółowoData mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych
Temat: Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Autorzy: Tomasz Małyszko, Edyta Łukasik 1. Definicja eksploracji danych Eksploracja
Bardziej szczegółowoMETODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE
Zeszyty Naukowe PWSZ w Płocku Nauki Ekonomiczne, t. XXI, 2015. Państwowa Wyższa Szkoła Zawodowa w Płocku METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE Wprowadzenie Współczesne firmy przechowują i przetwarzają
Bardziej szczegółowoWprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2
Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł
Bardziej szczegółowoAlgorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Bardziej szczegółowoWeryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Bardziej szczegółowoCLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
Bardziej szczegółowoSylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.
Załącznik nr 4 do zarządzenia nr 12 Rektora UJ z 15 lutego 2012 r. Sylabus modułu kształcenia na studiach wyższych Nazwa Wydziału Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia Wydział Matematyki
Bardziej szczegółowoOkoliczności powstania raportu
Okoliczności powstania raportu jest największą w Polsce giełdą domen internetowych, zawierającą ponad 250 tysięcy ofert sprzedaży domen. Każdego roku na giełdzie dokonuje się około 15000 transakcji kupna-sprzedaży
Bardziej szczegółowoMETODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Bardziej szczegółowoAnaliza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Bardziej szczegółowoZastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym
POLITECHNIKA WARSZAWSKA Instytut Technik Wytwarzania Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym Marcin Perzyk Dlaczego eksploracja danych?
Bardziej szczegółowoCena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO 1 1 200 1 260 2 20 4 1 7 2
2015 SAS Education sas.com/poland/training Centrum Szkoleniowe SAS Institute sp. z o.o. ul. Gdańska 27/31, 01-633 Warszawa (22) 560 46 20 cs@spl.sas.com Kalendarz szkoleń Grow With Us Nazwa szkolenia Kod
Bardziej szczegółowoANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 31 Ewa Dziawgo Uniwersytet Mikołaja Kopernika w Toruniu ANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII Streszczenie W artykule przedstawiono
Bardziej szczegółowoZad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Bardziej szczegółowoAnaliza i wizualizacja danych Data analysis and visualization
KARTA MODUŁU / KARTA PRZEDMIOTU Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
Bardziej szczegółowoRok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne
Nazwa modułu: Komputerowe wspomaganie decyzji Rok akademicki: 2030/2031 Kod: ZZP-2-403-MK-n Punkty ECTS: 3 Wydział: Zarządzania Kierunek: Zarządzanie Specjalność: Marketing Poziom studiów: Studia II stopnia
Bardziej szczegółowoWpoprzedniej części cyklu (nr 11/2009) Studium przypadku Rachunek kosztów działań w przedsiębiorstwie MK. 12 www.controlling.infor.
Studium przypadku w przedsiębiorstwie MK Michał Seheńczuk konsultant w departamencie systemów Business Intelligence w ABC Akademia Sp. z o.o.; Pytania: czytelnicy.controlling@infor.pl Wdrożenie sytemu
Bardziej szczegółowoPODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE
UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Bardziej szczegółowoMail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Bardziej szczegółowoBADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
Bardziej szczegółowoHurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
Bardziej szczegółowoData Mining podstawy analizy danych Część druga
Data Mining podstawy analizy danych Część druga W części pierwszej dokonaliśmy procesu analizy danych treningowych w oparciu o algorytm drzewa decyzyjnego. Proces analizy danych treningowych może być realizowany
Bardziej szczegółowoĆwiczenie 12. Metody eksploracji danych
Ćwiczenie 12. Metody eksploracji danych Modelowanie regresji (Regression modeling) 1. Zadanie regresji Modelowanie regresji jest metodą szacowania wartości ciągłej zmiennej celu. Do najczęściej stosowanych
Bardziej szczegółowoOpisy przedmiotów do wyboru
Opisy przedmiotów do wyboru moduły specjalistyczne oferowane na stacjonarnych studiach II stopnia (magisterskich) dla 2 roku matematyki semestr letni, rok akademicki 2017/2018 Spis treści 1. Data mining
Bardziej szczegółowoStatystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Bardziej szczegółowoWykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Bardziej szczegółowoALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Bardziej szczegółowoPomiar i doskonalenie jakości procesów usługowych, metody oceny procesu usługowego- SERIQUAL, CIT, CSI.
Anna Jurek 133846 Izabela Sokołowska 133991 Gr. Pon. P godz. 15.15 Procesowe Zarządzanie Przedsiębiorstwem- seminarium. Pomiar i doskonalenie jakości procesów usługowych, metody oceny procesu usługowego-
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Bardziej szczegółowoSystemy baz danych i hurtowni danych
Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2005/06 Celem wykładu jest przypomnienie
Bardziej szczegółowoANALIZA SYSTEMU POMIAROWEGO (MSA)
StatSoft Polska, tel. 1 484300, 601 414151, info@statsoft.pl, www.statsoft.pl ANALIZA SYSTEMU POMIAROWEGO (MSA) dr inż. Tomasz Greber, Politechnika Wrocławska, Instytut Organizacji i Zarządzania Wprowadzenie
Bardziej szczegółowoOBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp
tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE
Bardziej szczegółowoSCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Bardziej szczegółowoHurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
Bardziej szczegółowoFunkcje analityczne w SAP CRM
Akademia Wiedzy BCC /akademia Funkcje analityczne w SAP CRM Wiedzieć więcej i lepiej Kompletne rozwiązanie CRM SAP CRM bywa postrzegany jako narzędzie służące zautomatyzowaniu procesów interakcji z klientami.
Bardziej szczegółowoWidzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Bardziej szczegółowoRozkład prędkości statków na torze wodnym Szczecin - Świnoujście
KASYK Lech 1 Rozkład prędkości statków na torze wodnym Szczecin - Świnoujście Tor wodny, strumień ruchu, Zmienna losowa, Rozkłady dwunormalne Streszczenie W niniejszym artykule przeanalizowano prędkości
Bardziej szczegółowoWPŁYW TECHNICZNEGO UZBROJENIA PROCESU PRACY NA NADWYŻKĘ BEZPOŚREDNIĄ W GOSPODARSTWACH RODZINNYCH
Inżynieria Rolnicza 4(102)/2008 WPŁYW TECHNICZNEGO UZBROJENIA PROCESU PRACY NA NADWYŻKĘ BEZPOŚREDNIĄ W GOSPODARSTWACH RODZINNYCH Sławomir Kocira Katedra Eksploatacji Maszyn i Zarządzania w Inżynierii Rolniczej,
Bardziej szczegółowoANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Bardziej szczegółowoStrategie wspó³zawodnictwa
Strategie wspó³zawodnictwa W MESE można opracować trzy podstawowe strategie: 1) niskich cen (dużej ilości), 2) wysokich cen, 3) średnich cen. STRATEGIA NISKICH CEN (DUŻEJ ILOŚCI) Strategia ta wykorzystuje
Bardziej szczegółowoLaboratorium 11. Regresja SVM.
Laboratorium 11 Regresja SVM. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk Dalej>. 3. Z
Bardziej szczegółowoPlanowanie finansowe
1-1 Planowanie finansowe Grzegorz Michalski Podstawy planowania finansowego 1-2 Plan operacyjny znany też jako plan pięcioletni, może dotyczyć dowolnego horyzontu czasowego, ale większość przedsiębiorstw
Bardziej szczegółowoStatystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
Bardziej szczegółowoANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Bardziej szczegółowoEksploracja danych a serwisy internetowe Przemysław KAZIENKO
Eksploracja danych a serwisy internetowe Przemysław KAZIENKO Wydział Informatyki i Zarządzania Politechnika Wrocławska kazienko@pwr.wroc.pl Dlaczego eksploracja danych w serwisach internetowych? Kanały
Bardziej szczegółowoEkonometryczna analiza popytu na wodę
Jacek Batóg Uniwersytet Szczeciński Ekonometryczna analiza popytu na wodę Jednym z czynników niezbędnych dla funkcjonowania gospodarstw domowych oraz realizacji wielu procesów technologicznych jest woda.
Bardziej szczegółowo8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Bardziej szczegółowoMODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY
MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY WYKORZYSTANIU METOD STATYSTYCZNYCH mgr Małgorzata Pelczar 6 Wprowadzenie Reforma służby zdrowia uwypukliła problem optymalnego ustalania kosztów usług zdrowotnych.
Bardziej szczegółowoSummary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Bardziej szczegółowoZad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku:
Zad. 1. Wartość pożyczki ( w tys. zł) kształtowała się następująco w pewnym banku: Kwota Liczba pożyczek pożyczki 0 4 0 4 8 8 12 40 12 16 16 Zbadać asymetrię rozkładu kwoty pożyczki w tym banku. Wynik
Bardziej szczegółowoSemestr letni Ekonometria i prognozowanie Nie
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 2012/2013 Wydobywanie wiedzy z baz danych Knowedge discovery in databases A. USYTUOWANIE
Bardziej szczegółowoSymulacyjne metody wyceny opcji amerykańskich
Metody wyceny Piotr Małecki promotor: dr hab. Rafał Weron Instytut Matematyki i Informatyki Politechniki Wrocławskiej Wrocław, 0 lipca 009 Metody wyceny Drzewko S 0 S t S t S 3 t S t St St 3 S t St St
Bardziej szczegółowoMetody eksploracji danych. Reguły asocjacyjne
Metody eksploracji danych Reguły asocjacyjne Analiza podobieństw i koszyka sklepowego Analiza podobieństw jest badaniem atrybutów lub cech, które są powiązane ze sobą. Metody analizy podobieństw, znane
Bardziej szczegółowoStatystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Bardziej szczegółowoWykrywanie nietypowości w danych rzeczywistych
Wykrywanie nietypowości w danych rzeczywistych dr Agnieszka NOWAK-BRZEZIŃSKA, mgr Artur TUROS 1 Agenda 1 2 3 4 5 6 Cel badań Eksploracja odchyleń Metody wykrywania odchyleń Eksperymenty Wnioski Nowe badania
Bardziej szczegółowoAnaliza praktyk zarządczych i ich efektów w zakładach opieki zdrowotnej Województwa Opolskiego ROK 2008 STRESZCZENIE.
Analiza praktyk zarządczych i ich efektów w zakładach opieki zdrowotnej Województwa Opolskiego ROK 2008 STRESZCZENIE Marcin Kautsch Opracowanie dla Urzędu Marszałkowskiego Województwa Opolskiego Kraków,
Bardziej szczegółowoEKONOMIA XL NAUKI HUMANISTYCZNO-SPOŁECZNE ZESZYT 391 TORUŃ Ewa Dziawgo WYCENA POTĘGOWEJ ASYMETRYCZNEJ OPCJI KUPNA
ACTA UNIVERSITATIS NICOLAI COPERNICI EKONOMIA XL NAUKI HUMANISTYCZNO-SPOŁECZNE ZESZYT 391 TORUŃ 2009 Uniwersytet Mikołaja Kopernika w Toruniu Katedra Ekonometrii i Statystyki Ewa Dziawgo WYCENA POTĘGOWEJ
Bardziej szczegółowoStatSoft profesjonalny partner w zakresie analizy danych
Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego
Bardziej szczegółowoZachowania odbiorców. Grupa taryfowa G
Zachowania odbiorców. Grupa taryfowa G Autor: Jarosław Tomczykowski Biuro PTPiREE ( Energia elektryczna luty 2013) Jednym z założeń wprowadzania smart meteringu jest optymalizacja zużycia energii elektrycznej,
Bardziej szczegółowoLABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Bardziej szczegółowot y x y'y x'x y'x x-x śr (x-x śr)^2
Na podstawie:w.samuelson, S.Marks Ekonomia menedżerska Zadanie 1 W przedsiębiorstwie toczy się dyskusja na temat wpływu reklamy na wielkość. Dział marketingu uważa, że reklama daje wysoce pozytywne efekty,
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Bardziej szczegółowoEksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.
Eksploracja danych KLASYFIKACJA I REGRESJA cz. 2 Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki
Bardziej szczegółowo3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych
3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach 1995-2005 3.1. Opis danych statystycznych Badanie zmian w potencjale opieki zdrowotnej można przeprowadzić w oparciu o dane dotyczące
Bardziej szczegółowoHURTOWNIE DANYCH I BUSINESS INTELLIGENCE
BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej
Bardziej szczegółowo1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoData Mining Kopalnie Wiedzy
Data Mining Kopalnie Wiedzy Janusz z Będzina Instytut Informatyki i Nauki o Materiałach Sosnowiec, 30 listopada 2006 Kopalnie złota XIX Wiek. Odkrycie pokładów złota spowodowało napływ poszukiwaczy. Przeczesywali
Bardziej szczegółowoAnaliza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Bardziej szczegółowoMichał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska
Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości
Bardziej szczegółowoGIMNAZJALNA OLIMPIADA PRZEDSIĘBIORCZOŚCI MARKETING TEST Z KLUCZEM I KOMENTARZAMI
GIMNAZJALNA OLIMPIADA PRZEDSIĘBIORCZOŚCI MARKETING TEST Z KLUCZEM I KOMENTARZAMI edycja I eliminacje centralne 14 maja 2015 r. 9. Strategia polegająca na zaspokajaniu potrzeb klientów mało wrażliwych na
Bardziej szczegółowoKonkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Bardziej szczegółowoSYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy
Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS Dotyczy cyklu kształcenia 2014-2018 Realizacja w roku akademickim 2016/2017 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
Bardziej szczegółowoSystem CRM jako wsparcie procesów sprzedaży i serwisu w przedsiębiorstwach z branży produkcyjnej
System CRM jako wsparcie procesów sprzedaży i serwisu w przedsiębiorstwach z branży produkcyjnej 19 listopada 2009 Targi PROTECH 09 Michał Rok Professional Services Manager, update CRM Sp. z o.o. widok
Bardziej szczegółowoAlgorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska
Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja
Bardziej szczegółowoEKSPLORACJA DANYCH DLA OPTYMALIZACJI KAMPANII MARKETINGOWYCH W SIECI SPOŁECZNEJ
EKSPLORACJA DANYCH DLA OPTYMALIZACJI KAMPANII MARKETINGOWYCH W SIECI SPOŁECZNEJ Jerzy Surma, Szkoła Główna Handlowa Biznesowe wykorzystanie sieci społecznych jest naturalną konsekwencją ich niezwykle intensywnego
Bardziej szczegółowoWYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU
WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim: Eksploracja Danych Nazwa w języku angielskim: Data Mining Kierunek studiów (jeśli dotyczy): MATEMATYKA I STATYSTYKA Stopień studiów i forma:
Bardziej szczegółowoStatystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Bardziej szczegółowoZintegrowany System Informatyczny (ZSI)
Zintegrowany System Informatyczny (ZSI) ZSI MARKETING Modułowo zorganizowany system informatyczny, obsługujący wszystkie sfery działalności przedsiębiorstwa PLANOWANIE ZAOPATRZENIE TECHNICZNE PRZYGOTOWANIE
Bardziej szczegółowoDane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.
STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą
Bardziej szczegółowo