Elementy modelowania matematycznego

Wielkość: px
Rozpocząć pokaz od strony:

Download "Elementy modelowania matematycznego"

Transkrypt

1 Elemety modelowaia matematyczego Wstęp Jakub Wróblewski TEMATYKA PRZEDMIOTU Modelowaie daych (ilościowe): Metody statystycze: estymacja parametrów modelu, testowaie hipotez statystyczych Aaliza dyskrymiacyja Problemy decyzyje i klasyfikatory, eksploracja daych Programowaie liiowe i ieliiowe Modele kolejkowe Modele Markowa Modelowaie metodami teorii gier

2 LITERATURA Statystyka i eksploracja daych: Koroacki, J. Mieliczuk. Statystyka dla studetów kieruków techiczych i przyrodiczych. WNT, Warszawa. P. Cichosz. Systemy uczące się. WNT, Warszawa. A. Webb. Statistical Patter Recogitio. Wiley,. J. Jakubowski, R. Sztecel. Wstęp do teorii prawdopodobieństwa. SCRIPT, Warszawa. MODELOWANIE DANYCH - RÓŻNE ASPEKTY Dae opisują pewe aspekty (umerycze lub jakościowe) pewego badaego przez as zjawiska. Aaliza daych prowadzoa jest w celu zalezieia / zweryfikowaia / dostrojeia modelu tego zjawiska. Zajomość modelu pozwala a: opis zjawiska w sposób zrozumiały dla człowieka, określeie pewych cech zjawiska, przewidywaie wartości iezaych (p. przyszłych) związaych z daym zjawiskiem.

3 PRZYKŁADY Mamy dae w postaci rekordów w bazie daych CRM (opisujących aszą wiedzę o klietach hurtowi butów i ich zakupach). Budowa modelu daych może mieć a celu m.i.: zaprezetowaie raportu o liczbie klietów w różych przedziałach obrotów, sprawdzeie hipotezy, że miejsce zamieszkaia klieta ie wpływa a tygodiową liczbę wizyt w hurtowi, odalezieie towarów, które są często kupowae jedocześie, przewidywaie, który kliet zamierza zrezygować z aszych usług. NARZĘDZIA ANALIZY DANYCH Statystyka matematycza metody estymacji testowaie hipotez Odkrywaie wiedzy w bazach daych techiki wstępej obróbki daych tworzeie owych cech i ich selekcja Eksploracja daych techiki wykorzystywae w KDD metody reprezetacji wiedzy (modelu daych) 3

4 RÓŻNE PODEJŚCIA estymacja parametru x, testowaie hipotez Statystyka Rodzia modeli (x) obiekt rzeczywisty dae obserwacja, pomiar Model probabilistyczy wioski W statystyce zakładamy, że model probabilistyczy ależy do pewej rodziy (p. sparametryzowaej). Aalizujemy dae, by wybrać ajlepszą wartość parametru (ajwłaściwszy model). RÓŻNE PODEJŚCIA Eksploracja daych (klasyfikacja) budowa modelu obiekt rzeczywisty dae obserwacja, pomiar Model daych wioski (klasyfikator) W metodach eksploracji daych stosujemy zaczie łagodiejsze założeia. Kształt modelu jest w większym stopiu dopasoway do daych, przez co jest bardziej złożoy (p. drzewo decyzyje). 4

5 ZAŁOŻENIA Aaliza daych przyjmuje pewe, jawe lub ukryte, założeia dotyczące daych. Zaa próbka jest reprezetatywym podzbiorem całości. To zakładamy prawie zawsze. Istieje pewie rozkład prawdopodobieństwa (stały w czasie), z którego pochodzą próbki daych. To umożliwia stosowaie aparatu statystyczego i probabilistyczego; iektóre sytuacje zmiee w czasie (p. otowaia giełdowe) też możemy modelować. Dae mają pewie kokrety rozkład prawdopodobieństwa (p. ormaly). To sile założeie, często stosowae w statystyce. Możemy szacować, a ile kokrete dae pasują do tego założeia, a także estymować parametry tego rozkładu. ZAŁOŻENIA Metody eksploracji daych kostruują model bez zakładaia globalego rozkładu prawdopodobieństwa (por. sieci euroowe). Zamiast tego posługują się zwykle zasadą: Jeżeli dae mogą być opisae (zamodelowae) a kilka różych sposobów, to za ajbliższy rzeczywistości (ajbardziej pożąday) uzajemy model ajprostszy. (Zasada miimalego opisu.) Czy moża całkowicie uikąć założeń? Twierdzeie No free luch : Chcemy a podstawie daych przykładów zgadąć, według jakiej zasady są oe klasyfikowae do dwóch klas decyzyjych, a astepie zastosować tę zasadę do owych daych. Wówczas jeżeli ie przyjmiemy żadych założeń odośie zasad klasyfikacji, to dowolie zaawasoway algorytm klasyfikujący będzie działał rówie (ie)sprawie, jak klasyfikator czysto losowy. 5

6 PODSTAWOWE POJĘCIA Dae do aalizy zwykle będziemy przechowywali w tablicach daych, w których koleje wiersze odpowiadają obiektom (obserwacjom). Obiekty składają się a próbę (populację, zbiór treigowy). Obiekty opisae są określoymi z góry cechami (atrybutami), mogą też dzielić się a pewe kategorie (klasy decyzyje). Wartości atrybutów (cechy obiektów) Obiekty o o o3.3 AAC AAA -. BBB Decyzje (kategorie obiektów) PODSTAWOWE POJĘCIA Cechy (atrybuty) mogą być: ilościowe (umerycze, ciągłe) p. waga, wiek klieta, dochód, wyik pomiaru apięcia, jakościowe (symbolicze, dyskrete) p. kolor samochodu, płeć, położeie geograficze (miasto) Cechy ilościowe moża zamieić a jakościowe (i odwrotie). 6

7 PRZYKŁAD - PROBLEM DECYZYJNY Aalizujemy bazę daych klietów salou samochodowego. Mamy day opis osób, którzy wystąpili o przyzaie karty stałego klieta. Chcielibyśmy przewidzieć, którzy klieci mogliby być w przyszłości rówież zaiteresowai. Zasada działaia: badamy, jakie cechy wyróżiają przypadki pozytywe (klieci z kartami) od egatywych (pozostali). Budujemy model daych. Wartości atrybutów (cechy klietów) Obiekty (klieci) o o o3.3 AAC AAA -. BBB Decyzje (kliet pozytywy/egatywy) PRZYKŁAD - WYKORZYSTANIE MODELU Tworzymy model daych (p. statystyczy) i wykorzystujemy go do przewidywaia cechy decyzyjej dla owych obiektów. Dae treigowe (zaa decyzja) o o o3.3 AAC AAA -. BBB budowa modelu Model daych - dyskrymiacja liiowa - drzewo decyzyje - sieć euroowa - Dae testowe (iezaa decyzja) o o o3 5. BBA BBB BAB -4??? przewidywaa decyzja dla daych testowych 7

8 PROSTY MODEL DANYCH: przybliżamy rozkład histogramem Modelem daych będzie pewie rozkład prawdopodobieństwa. Przybliżamy jego wykres histogramem. Oś pozioma: wartość atrybutu podzieloa a przedziały. Oś pioowa: częstość (liczba obiektów w daym przedziale). Kształt histogramu zależy od szerokości przedziałów i położeia ich graic. 4 4,5 5 5,5 6 6,5 7 7, ,5 5 5,5 6 6,5 7 7,5 8 4,8 5,3 5,8 6,3 6,8 7,3 7,8 8,3 Średia INNE STATYSTYKI PRÓBY wskaźiki położeia x= x i i= Mediaa i kwatyle Kwatyl rzędu p (,) to taka wartość q p, że (p) elemetów próby ma wartość miejszą od q p. Kwatyl rzędu,5 to mediaa. Kwatyle rzędu /4, /4 i 3/4 azywae są kwartylami Q, Q, Q 3. Kwartyle mogą posłużyć do wykoaia wykresu ramkowego. 8

9 INNE STATYSTYKI PRÓBY Wariacja wskaźiki rozproszeia = Odchyleie stadardowe (pierwiastek z wariacji) Odchyleie przecięte s ( x i x) i= Rozstęp międzykwartylowy IQR = Q 3 - Q d = i= x i x

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

EKSPLORACJA DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

EKSPLORACJA DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego EKSPLORACJA DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego http://www.jakubw.pl/zajecia/hur/bi.pdf http://www.jakubw.pl/zajecia/hur/dw.pdf http://www.jakubw.pl/zajecia/hur/dw2.pdf http://www.jakubw.pl/zajecia/hur/dm.pdf

Bardziej szczegółowo

Przemysław Jaśko Wydział Ekonomii i Stosunków Międzynarodowych, Uniwersytet Ekonomiczny w Krakowie

Przemysław Jaśko Wydział Ekonomii i Stosunków Międzynarodowych, Uniwersytet Ekonomiczny w Krakowie MODELE SCORINGU KREDYTOWEGO Z WYKORZYSTANIEM NARZĘDZI DATA MINING ANALIZA PORÓWNAWCZA Przemysław Jaśko Wydział Ekoomii i Stosuków Międzyarodowych, Uiwersytet Ekoomiczy w Krakowie 1 WROWADZENIE Modele aplikacyjego

Bardziej szczegółowo

8. Optymalizacja decyzji inwestycyjnych

8. Optymalizacja decyzji inwestycyjnych 8. Optymalizacja decyzji iwestycyjych 8. Wprowadzeie W wielu różych sytuacjach, w tym rówież w czasie wyboru iwestycji do realizacji, podejmujemy decyzje. Sytuacje takie azywae są sytuacjami decyzyjymi.

Bardziej szczegółowo

BADANIA DOCHODU I RYZYKA INWESTYCJI

BADANIA DOCHODU I RYZYKA INWESTYCJI StatSoft Polska, tel. () 484300, (60) 445, ifo@statsoft.pl, www.statsoft.pl BADANIA DOCHODU I RYZYKA INWESTYCJI ZA POMOCĄ ANALIZY ROZKŁADÓW Agieszka Pasztyła Akademia Ekoomicza w Krakowie, Katedra Statystyki;

Bardziej szczegółowo

5. METODY MONTE CARLO A SYMULACJA POTOKÓW RUCHU (wg Drew, 1968)

5. METODY MONTE CARLO A SYMULACJA POTOKÓW RUCHU (wg Drew, 1968) 5. MEODY MONE CARLO A SYMULACJA POOKÓW RUCHU (wg Drew, 968) 5.. Wprowadzeie Moeta jest rzucaa aż do osiągięcia orła. Jeżeli to zdarzy się w pierwszym rzucie, gracz otrzymuje zł od baku. Jeżeli poraz pierwszy

Bardziej szczegółowo

STATYSTYKA OPISOWA WYKŁAD 1 i 2

STATYSTYKA OPISOWA WYKŁAD 1 i 2 STATYSTYKA OPISOWA WYKŁAD i 2 Literatura: Marek Cieciura, Jausz Zacharski, Metody probabilistycze w ujęciu praktyczym, L. Kowalski, Statystyka, 2005 2 Statystyka to dyscyplia aukowa, której zadaiem jest

Bardziej szczegółowo

Akustyczno-fonetyczne cechy mowy polskiej

Akustyczno-fonetyczne cechy mowy polskiej II PRACOWNIA FIZYCZNA Akustyczo-foetycze cechy mowy polskiej Opis ćwiczeia w ramach II Pracowi Fizyczej Adrzej Wicher Aleksader Sęk Jacek Koieczy Istytut Akustyki UAM Pozań, 5 . WSTĘP... 3. SYGNAŁY ORAZ

Bardziej szczegółowo

Materiały Konferencji MathPAD 2008

Materiały Konferencji MathPAD 2008 Materiały Koferecji MathPAD 2008 Wydział Matematyki i Iformatyki Uiwersytetu Mikołaja Koperika w Toruiu 9-22 sierpia 2008 Redakcja materiałów: Mirosław Majewski (e-mail: mirek.majewski@yahoo.com) Robert

Bardziej szczegółowo

Aplikacyjne aspekty metody Six Sigma w kwalitatywnej ocenie funkcjonowania systemów logistycznych

Aplikacyjne aspekty metody Six Sigma w kwalitatywnej ocenie funkcjonowania systemów logistycznych Aplikacyje aspekty metody Six Sigma w kwalitatywej oceie fukcjoowaia systemów logistyczych Applicatio aspects of the Six Sigma method i qualitative ratig of the workig of logistic systems Moika Dopytalska*,

Bardziej szczegółowo

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu. Rachuek prawdopodobieństwa i statystyka W12: Statystycza aaliza daych jakościowych Dr Aa ADRIAN Paw B5, pok 407 ada@agh.edu.pl Wprowadzeie Rozróżia się dwa typy daych jakościowych: Nomiale jeśli opisują

Bardziej szczegółowo

METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH

METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH QUANTITATIVE METHODS IN ECONOMICS Vol. XI, No. Szkoła Główa Gospodarstwa Wiejskiego Wydział Zastosowań Iformatyki i Matematyki Katedra Ekoometrii i Statystyki

Bardziej szczegółowo

Opracowanie i analiza materiału statystycznego 419[01].O1.04

Opracowanie i analiza materiału statystycznego 419[01].O1.04 MINISTERSTWO EDUKACJI NARODOWEJ Ewa Kawczyńska-Kiełbasa Opracowaie i aaliza materiału statystyczego 419[01].O1.04 Poradik dla uczia Wydawca Istytut Techologii Eksploatacji Państwowy Istytut Badawczy Radom

Bardziej szczegółowo

Coraz większe wymagania jakości produkcji oraz

Coraz większe wymagania jakości produkcji oraz Dobór oprogramowaia do modelowaia i symulacji procesów wytwarzaia Ryszard Zdaowicz* Ogrome zapotrzebowaie a programy symulacyje powoduje ich ciągły rozwój, ale także coraz większą różorodość oprogramowaia

Bardziej szczegółowo

Podpis elektroniczny. zastosowanie i korzyści

Podpis elektroniczny. zastosowanie i korzyści Podpis elektroiczy sposób działaia, zastosowaie i korzyści Miisterstwo Gospodarki Warszawa 2005 Nadzór merytoryczy: Departamet Przedsiębiorczości Miisterstwa Gospodarki Autorzy: Artur Kruk Uizeto Techologies

Bardziej szczegółowo

Harmonogramowanie linii montażowej jako element projektowania cyfrowej fabryki

Harmonogramowanie linii montażowej jako element projektowania cyfrowej fabryki 52 Sławomir Herma Sławomir HERMA atedra Iżyierii Produkcji, ATH w Bielsku-Białej E mail: slawomir.herma@gmail.com Harmoogramowaie liii motażowej jako elemet projektowaia cyfrowej fabryki Streszczeie: W

Bardziej szczegółowo

Michał Gruca ZASADY OPRACOWANIA WYNIKÓW POMIARÓW

Michał Gruca ZASADY OPRACOWANIA WYNIKÓW POMIARÓW Michał Gruca ZASADY OPRACOWANIA WYNIKÓW POMIARÓW 1. Wstęp Pomiarem jest procesem pozawczm, któr umożliwia odwzorowaie właściwości fizczch obiektów w dziedziie liczb. Sam proces pomiarow jest ciągiem czości

Bardziej szczegółowo

METODYKA WYKONYWANIA POMIARÓW ORAZ OCENA NIEPEWNOŚCI I BŁĘDÓW POMIARU

METODYKA WYKONYWANIA POMIARÓW ORAZ OCENA NIEPEWNOŚCI I BŁĘDÓW POMIARU METODYKA WYKONYWANIA POMIARÓW ORAZ OCENA NIEPEWNOŚCI I BŁĘDÓW POMIARU Celem każdego ćwiczeia w laboratorium studeckim jest zmierzeie pewych wielkości, a astępie obliczeie a podstawie tych wyików pomiarów

Bardziej szczegółowo

Budowa mierników agregatowych do oceny poziomu rozwoju społeczno-gospodarczego

Budowa mierników agregatowych do oceny poziomu rozwoju społeczno-gospodarczego Krzysztof Kompa Katedra Ekoometrii i Statystyki Szkoła Główa Gospodarstwa Wiejskiego w Warszawie Budowa mierików agregatowych do ocey poziomu rozwoju społeczo-gospodarczego Wstęp Uia Europejska przywiązuje

Bardziej szczegółowo

Metody Podejmowania Decyzji

Metody Podejmowania Decyzji Metody Podejmowaia Decyzji Wzrost liczby absolwetów w Politechice Wrocławsiej a ieruach o luczowym zaczeiu dla gospodari opartej a wiedzy r UDA-POKL.04.0.0-00-065/09-0 Recezet: Prof. dr hab. iż. Ja Iżyowsi

Bardziej szczegółowo

PERSPECTIVES OF STATISTICAL METHODS IN DESIGN OF TRADING STRATEGIES FOR FINANCIAL MARKETS USING HIERARCHICAL STRUCTURES AND REGULARIZATION

PERSPECTIVES OF STATISTICAL METHODS IN DESIGN OF TRADING STRATEGIES FOR FINANCIAL MARKETS USING HIERARCHICAL STRUCTURES AND REGULARIZATION STUDIA INFORMATICA 2013 Volume 34 Number 2A (111) Alia MOMOT Politechika Śląska, Istytut Iformatyki Michał MOMOT Istytut Techiki i Aparatury Medyczej ITAM PERSPEKTYWY ZASTOSOWAŃ METOD STATYSTYCZNYCH W

Bardziej szczegółowo

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA SPIS TREŚCI Rozdział I O egzamiie... Rozdział II Elemety matematyki fiasowej dr hab. Michał Szurek... 6 Rozdział III Wzory... 9 Rozdział

Bardziej szczegółowo

Sprawność językowa dzieci 5-letnich a ich aktywność i doświadczenia raport z badań

Sprawność językowa dzieci 5-letnich a ich aktywność i doświadczenia raport z badań EETP 36(2015)2, ISSN 1896-2327 DOI: 10.14632/eetp_36.5 Patrycja Brydiak Sprawość językowa dzieci 5-letich a ich aktywość i doświadczeia raport z badań The Liguistic Skills of 5-Year-Old Childre Versus

Bardziej szczegółowo

Mirosława Gazińska. Magdalena Mojsiewicz

Mirosława Gazińska. Magdalena Mojsiewicz STUDIA DEMOGRAFICZNE 1(145) 2004 Mirosława Gazińska Katedra Ekoometrii i Statystyki Magdalea Mojsiewicz Katedra Ubezpieczeń i Ryków Kapitałowych Uiwersytet Szczeciński MODELOWANIE CZASU TRWANIA ŻYCIA BEZ

Bardziej szczegółowo

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA

BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA BIULETYN MATURALNY NR 4 CENTRALNEJ KOMISJI EGZAMINACYJNEJ MATEMATYKA SPIS TREŚCI Rozdział I O egzamiie... Rozdział II Elemety matematyki fiasowej dr hab. Michał Szurek... 6 Rozdział III Wzory... 9 Rozdział

Bardziej szczegółowo

Metody oceny projektów inwestycyjnych

Metody oceny projektów inwestycyjnych Metody ocey projektów iwestycyjych PRZEDMIIOT : EFEKTYWNOŚĆ SYSTEMÓW IINFORMATYCZNYCH Pla wykładu Temat: Metody ocey projektów iwestycyjych 5 FINANSOWE METODY OCENY PROJEKTÓW INWESTYCYJNYCH... 4 5.1. WPROWADZENIE...

Bardziej szczegółowo

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Wprowadzenie Podstawowe cele analizy zbiorów danych Uogólniony opis poszczególnych

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

Andrzej Pogorzelski Materiały pomocnicze do studiowania przedmiotu FINANSE PRZEDSIEBIORSTWA

Andrzej Pogorzelski Materiały pomocnicze do studiowania przedmiotu FINANSE PRZEDSIEBIORSTWA . CHARAKTERYSTYKA PIENIĄDZA JAKO TWORZYWA FINANSÓW.. Fukcje pieiądza Najwygodiejszym sposobem defiiowaia pieiądza jest wymieieie jego główych, klasyczych fukcji. I tak pieiądz jest: mierikiem wartości

Bardziej szczegółowo

Metoda analizy hierarchii Saaty ego Ważnym problemem podejmowania decyzji optymalizowanej jest często występująca hierarchiczność zagadnień.

Metoda analizy hierarchii Saaty ego Ważnym problemem podejmowania decyzji optymalizowanej jest często występująca hierarchiczność zagadnień. Metoda aalizy hierarchii Saaty ego Ważym problemem podejmowaia decyzji optymalizowaej jest często występująca hierarchiczość zagadień. Istieje wiele heurystyczych podejść do rozwiązaia tego problemu, jedak

Bardziej szczegółowo