1. Wprowadzenie Podejście wielomodelowe polega, ogólnie rzecz ujmując, na łączeniu (agregacji) M modeli bazowych. w jeden model zagregowany
|
|
- Włodzimierz Kaczor
- 5 lat temu
- Przeglądów:
Transkrypt
1 Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Podeście wielomodelowe w analizie danych symbolicznych metoda bagging Streszczenie: W artykule przedstawiono podstawowe poęcia związane z metodą bagging oraz metodą k-nabliższych sąsiadów (NN) dla danych symbolicznych. Zaprezentowano w nim także możliwość zastosowania podeścia wielomodelowego bagging w metodzie k- nabliższych sąsiadów dla danych symbolicznych. W części empiryczne przedstawiono zastosowanie podeścia wielomodelowego dla danych symbolicznych w przypadku przykładowych zbiorów danych wygenerowanych za pomocą funkci cluster.gen z pakietu clustersim w programie R. Słowa kluczowe: analiza danych symbolicznych, podeście wielomodelowe, bagging.. Wprowadzenie Podeście wielomodelowe polega, ogólnie rzecz umuąc, na łączeniu (agregaci) M modeli bazowych D,, DM w eden model zagregowany D [por. uncheva 2004, s. 6-7]. Celem zastosowania podeścia wielomodelowego w miesce poedynczego modelu est zmnieszenie błędu predykci. Model zagregowany est bardzie dokładny niż akikolwiek z poedynczych modeli, które go tworzą [zob. np. Gatnar 2008, s. 62]. Jedną z bardzie znanych metod agregaci modeli bazowych est metoda agregaci bootstrapowe, zaproponowana przez Breimana w 996 r., znana ako bagging [zob. np. Gatnar 2008, s. 40; Breiman 996, s. 23]. Celem artykułu est zaprezentowanie możliwości zastosowania metody bagging w agregaci modeli dyskryminacynych dla danych symbolicznych na przykładzie metody k- nabliższych sąsiadów dla obiektów symbolicznych. Oprócz tego przetestowana zostanie skuteczność metody bagging wykorzystuące metodę k-nabliższych sąsiadów w przypadku, gdy mamy do czynienia ze zmiennymi zakłócaącymi (noisy variables) i obserwacami odstaącymi (outliers). W części empiryczne przedstawiono wyniki symulaci z wykorzystaniem sztucznych zbiorów danych interwałowych wygenerowanych za pomocą pakietu clustersim w programie R. 2. Dane symboliczne
2 Obiekty symboliczne mogą być opisywane przez następuące rodzae zmiennych symbolicznych [Bock, Diday 2000, s. 2-3]: ) zmienne w uęciu klasycznym, t. ilorazowe, przedziałowe, porządkowe, nominalne; 2) zmienne symboliczne, t. zmienne: interwałowe realizacą są przedziały liczbowe rozłączne lub nierozłączne; wielowariantowe realizacą zmienne est więce niż eden wariant (liczba lub kategoria); wielowariantowe z wagami realizacą zmienne oprócz wielu wariantów są dodatkowo wagi (lub prawdopodobieństwa) dla każdego z wariantów zmienne dla danego obiektu. Niezależnie od typu zmienne w analizie danych symbolicznych możemy mieć do czynienia ze zmiennymi strukturalnymi [Bock, Diday 2000, s. 2-3; 33-37]. Do tego typu zmiennych zalicza się zmienne hierarchiczne (ustalone są a priori reguły decyduące o tym, czy dana zmienna opisue dany obiekt czy nie), taksonomiczne (ustalone są a priori realizace dane zmienne), logiczne (ustalono dla nich a priori reguły logiczne lub funkcyne, które decyduą o wartościach zmienne). W analizie danych symbolicznych wyróżnia się dwa typy obiektów symbolicznych: obiekty symboliczne pierwszego rzędu rozumiane w sensie klasycznym (obiekty elementarne), np. konsument, przedsiębiorstwo, produkt, pacent czy gospodarstwo domowe, obiekty symboliczne drugiego rzędu utworzone w wyniku agregaci zbioru obiektów symbolicznych pierwszego rzędu, np. grupa konsumentów preferuąca określony produkt, region geograficzny (ako wynik agregaci podregionów). 3. Algorytm metody k-nabliższych sąsiadów dla danych symbolicznych Metoda k-nabliższych sąsiadów w swym klasycznym kształcie została zaproponowana przez E. Fixa i J.L. Hodgesa [95]. Adaptacę klasyczne metody k-nabliższych sąsiadów dla danych symbolicznych zawarł w swe pracy zespół Malerby [2003]. Algorytm te metody dla danych symbolicznych można zapisać w następuący sposób: ) Dla każdego obiektu O ze zbioru testowego obliczana est odległość tego obiektu od obiektów ze zbioru uczącego. W pomiarze odległości w analizie danych symbolicznych wykorzystywanych est wiele różnych miar odległości, m.in. miary Ichino-Yaguchiego, miary de Carvalho, miara wzaemnego sąsiedztwa (Gowdy-rishny-Didaya) czy wreszcie 2
3 uogólniona miara Minkowskiego, pozwalaąca uwzględnić zmienne wielowariantowe z wagami [por. np. Bock, Diday 2000, s. 82]. 2) Znadowanych est k obiektów ze zbioru uczącego nabliższych obiektowi O. Malerba in. [2006] sugeruą, by liczbę k sąsiadów wyznaczyć z przedziału, n, gdzie n liczba obiektów w zbiorze uczącym [zob. Malerba i in. 2006, s. 3], 3) obliczane est prawdopodobieństwo przydzielenia obiektu O do poszczególnych klas zbioru uczącego. Prawdopodobieństwo przydzielenia obiektu O do klasy est obliczane na trzy sposoby [por. Malerba i in. 2004, s. 25, 2006, s. 30-3]: ) eżeli odległość między obiektem O a wszystkimi ego sąsiadami est równa zero, i dodatkowo wszyscy sąsiedzi należą do te same klasy, wówczas prawdopodobieństwo przydzielenia obiektu O do te klasy wynosi ; 2) eżeli odległość między obiektem O a wszystkimi ego sąsiadami est równa zero, a sąsiedzi ci należą do różnych klas, prawdopodobieństwo przydzielenia obiektu O do poszczególnych klas wyraża się wzorem: gdzie: liczba sąsiadów należących do -te klasy, liczba sąsiadów,,, J liczba klas w zbiorze uczącym; P( O C ),,, J, () 3) eżeli odległość między obiektem O a wszystkimi ego sąsiadami est różna od zera, wówczas prawdopodobieństwo przydzielenia obiektu O do poszczególnych klas wyraża się wzorem: gdzie: P( O C ),,, J, (2) J w C, C ), (4) i ( k w i d( O, X ) wagi, (5) i 3
4 ( C, C k ), eżeli klasa, do które należy k-ty sąsiad, est taka sama, ak klasa, do które przyporządkowuemy obiekt O; ( C, C k ) 0, eżeli klasa, do które należy k-ty sąsiad est różna od klasy, do które przyporządkowuemy obiekt O, pozostałe oznaczenia ak we wzorze. W metodzie k-nabliższych sąsiadów dla danych symbolicznych ważnieszy est głos sąsiadów bliższych obiektowi klasyfikowanemu niż pozostałych sąsiadów. 4. Idea metody bagging Jedną z bardzie znanych metod agregaci modeli bazowych est metoda agregaci bootstrapowe, znana ako bagging [por. Gatnar 2008, s. 40; Breinman 996, s. 23; uncheva 2004, s. 203]. Metoda bagging realizue w swe konstrukci architekturę równoległą modeli zagregowanych (zob. rys. ). D D 2 O D 3 Y D(O)... D M Rys.. Architektura równoległa łączenia modeli bazowych Źródło: [Gatnar 2008, s. 68]. Architektura równoległa łączenia modeli bazowych zakłada niezależne działanie każdego z M modeli bazowych za pomocą funkci Dˆ daąc w rezultacie model zagregowany O, O ( O) Y Dˆ,, ˆ D M D [zob. Gatnar 2008, s. 63, 68]. Metoda bagging polega na zbudowaniu M modeli bazowych na podstawie prób uczących U,,U M losowanych ze zwracaniem ze zbioru uczącego U. Próby te nazywane są próbami bootstrapowymi [Gatnar 2008, s. 40; Polikar 2007, s. 60; Polikar 2006, s. 29]. Zwykle około 37% zbioru uczącego nie trafia do żadne z prób uczących. Tworzą one dodatkowy zbiór, tzw. OOB (Out-Of-Bag), który est często wykorzystywany ako dodatkowy zbiór testowy [Gatnar 2008, s. 40]. Algorytm metody bagging można przedstawić za pomocą następuących kroków [Gatnar 2008, s. 40; Polikar 2007, s. 60-6, 2006, s. 29; uncheva 2004, s. 204]: 4
5 . Ustalenie liczby modeli bazowych M. 2. Następnie dla każdego z modeli bazowych m,,m a) wylosowanie próby bootstrapowe ze zbioru uczącego, : b) zbudowanie modelu bazowego na podstawie próby bootstrapowe (metoda k- nabliższych sąsiadów dla danych symbolicznych). 3. Dokonanie predykci modelu zagregowanego za pomocą modeli bazowych stosuąc metodę głosowania większościowego w przypadku dyskryminaci lub uśrednia wyniki w przypadku regresi. Metoda głosowania większościowego (maority voting) polega na przydzieleniu obserwaci do klasy, którą wskazała nawiększa liczba modeli bazowych [Gatnar 2008, s. 4]: Dˆ M ˆ m m O arg max I D O C 5. Wyniki badań symulacynych Zbiór pierwszy (model I) to 000 obiektów podzielonych na pięć niezbyt dobrze separowalnych klas, opisywanych przez dwie zmienne symboliczne interwałowe. Zbiór uczący stanowiło 800 obiektów, a zbiór testowy 200 obiektów. Zmienne w tym zbiorze są losowane z dwuwymiarowego rozkładu normalnego o średnich (5, 5), ( 3, 3), (3, 3), (0, 0), ( 5, 5) oraz macierzy kowarianci, 0,9. Zbiór ten nie zawiera zmiennych zakłócaących czy obserwaci odstaących. Zbiór drugi (model II) to 200 obiektów podzielonych na dwie klasy o wydłużonym kształcie, opisywane prze dwie zmienne symboliczne interwałowe. Zmienne w tym zbiorze są losowane z dwuwymiarowego rozkładu normalnego o średnich (0, 0), (, 5) i macierzy kowarianci, 0,9. Zbiór nie zawiera zmiennych zakłócaących i l obserwaci odstaących. Elementy zbioru podzielono na zbiór uczący (20 obiektów) i zbiór testowy (80 obiektów). Zbiór trzeci (model III) to 800 obiektów podzielonych na trzy klasy o wydłużonym kształcie, opisywane przez trzy zmienne symboliczne interwałowe. Zbiór uczący zawiera 640 obiektów, a zbiór testowy 60. Zmienne opisuące te obiekty są losowane z dwuwymiarowego rozkładu normalnego o średnich (0, 0), (,5, 7), (3, 4) oraz macierzy l 5
6 kowarianci, 0,9. Zbiór zawiera edną zmienną zakłócaącą, natomiast l nie zawiera obserwaci odstaących. Zbiór czwarty (model IV) to 660 obiektów podzielonych na dwie klasy o wydłużonym kształcie, opisywane przez dwie zmienne symboliczne interwałowe. Zbiór uczący stanowiło 528 obserwaci, a zbiór testowy 32 obserwace. Zmienne opisuące te zbiory są losowane z dwuwymiarowego rozkładu normalnego o średnich (0, 0), (, 5) oraz macierzy kowarianci, 0,9. Zbiór zawiera 0% obserwaci odstaących, ale nie l zawiera zmiennych zakłócaących. Modele I, II, III oraz IV wygenerowano z wykorzystaniem funkci cluster.gen z pakietu clustersim w programie R. Dla każdego ze zbiorów zastosowano metodę bagging dla metody k-nabliższych sąsiadów dla danych symbolicznych, przymuąc liczbę modeli bazowych od eden do stu, a liczbę k sąsiadów na poziomie trzy razy pierwiastek z liczby obserwaci w zbiorze uczącym. Wyniki symulaci dla modelu I i II przedstawia rysunek 2. a) model I b) model II Rys 2. Wyniki symulaci dla modelu I i II Źródło: obliczenia własne w programie R. Namnieszy błąd klasyfikaci, równy 4,5% w przypadku modelu I, otrzymano dla 59 modeli bazowych. W przypadku modelu II namnieszy błąd klasyfikaci, równy zero, otrzymano dla 60 modeli bazowych. Dla modelu III, który zawierał edną zmienną zakłócaącą, błąd klasyfikaci wyniósł aż 62,5% (dla 4 modeli bazowych). W przypadku modelu IV, którego zbiór zawierał obiekty 6
7 odstaące, błąd klasyfikaci wyniósł 0% (klasyfikacę obiektów ze zbioru uczącego dla 50 modeli bazowych zawarto w tabeli ). Tabela. lasyfikaca obiektów dla modelu IV Faktyczna przynależność do klas Źródło: obliczenia własne w programie R. Predykca przynależności do klas lasa lasa 2 lasa 56 0 lasa Obserwace odstaące 7 5 W przypadku modelu IV obiekty z klasy pierwsze i drugie są klasyfikowane poprawnie. Błędna klasyfikaca obiektów poawia się natomiast w przypadku obserwaci odstaących. 6. Podsumowanie Metoda bagging dla metody k-nabliższych sąsiadów może znaleźć zastosowanie w klasyfikaci różnych zbiorów danych symbolicznych. Podeście wielomodelowe połączone z NN dla danych symbolicznych pozwala na precyzyne zidentyfikowanie klas słabo separowalnych oraz klas o wydłużonym kształcie. W przypadku podeścia wielomodelowego w klasyfikaci obiektów symbolicznych z zastosowaniem metody bagging dla metody k-nabliższych sąsiadów nalepsze wyniki otrzymano dla zbiorów danych niezawieraących zmiennych zakłócaących. Gdy mieliśmy do czynienia ze zmiennymi zakłócaącymi, błąd klasyfikaci wyniósł aż 62,5%, co może wynikać z faktu, że zmienne te wpływaą znacząco na pomiar odległości, a to z kolei przenosi się na prawdopodobieństwa a posteriori przydzielenia obiektów do klas. Etapem dalszych prac będzie próba zaadaptowania innych metod podeścia wielomodelowego dla danych symbolicznych. Literatura: Bock H.-H., Diday E. (red.), Analysis of Symbolic Data. Exploratory Methods for Extracting Statistical Information From Complex Data, Springer Berlin Breiman L., Bagging predictors, Machine Learning 996, vol. 24, s Fix E., Hodges J.L., Discriminatory Analysis. Nonparametric Discrimination: Consistency Properties. Report 4. Proect No , USAF School of Aviation Medicine, Randolph Field, Texas 95. Gatnar E., Podeście wielomodelowe w zagadnieniach dyskryminaci i regresi, Wydawnictwo Naukowe PWN, Warszawa
8 uncheva L.I., Combining Pattern Classifiers. Methods and Algorithms, Wiley, New Jersey Malerba D., D Amato C., Esposito F., Monopoli M., Extending the -Nearest Neighbour classification algorithm to symbolic obects, Atti del Convegno Intermedio della Società Italiana di Statistica Analisi Statistica Multivariata per le scienze economico-sociali, le scienze naturali e la tecnologia, Napoli Malerba D., Esposito F., D Amato C., Appice A., -nearest neighbor classification for symbolic obects [w:] P. Brito, M. Noirhomme-Fraiture (Ed.), Symbolic and spatial data analysis: mining complex data structures, University of Pisa, Pisa 2004, s Malerba D., Esposito F., D Amato C., Appice A., Classification of symbolic obects: A lazy learning approach, Intelligent Data Analysis 2006, vol. 0, no. 4, s Polikar R., Ensemble based systems in decision making, IEEE Circuits and Systems Magazine 2006, vol. 6, no. 3, s Polikar R., Bootstrap inspired techniques in computational intelligence, IEEE Signal Processing Magazine 2007, vol. 24, no. 4, s Ensemble learning for symbolic data with application of bagging Summary The paper presents the most important basic terms of bagging and k-nearest neighbour (NN) for symbolic data. The article also presents an application of bagging ensemble for k-nearest neighbour for symbolic data. In the empirical part the application of ensemble learning for symbolic data is presented for some data sets generated by function cluster.gen from clustersim package of R software. 8
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 507 2018 Taksonomia 30 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania e-issn
Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów
METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH
Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
EKONOMETRIA ECONOMETRICS 4(46) 2014
EKONOMERIA ECONOMERICS 4(46) 014 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 014 Redaktor Wydawnictwa: Aleksandra Śliwka Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU
EKONOMETRIA ECONOMETRICS 2(40) 2013 ISSN 1507-3866 Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU Streszczenie:
Multiklasyfikatory z funkcją kompetencji
3 stycznia 2011 Problem klasyfikacji Polega na przewidzeniu dyskretnej klasy na podstawie cech obiektu. Obiekt jest reprezentowany przez wektor cech Zbiór etykiet jest skończony x X Ω = {ω 1, ω 2,...,
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu SIECI NEURONOWE DLA DANYCH SYMBOLICZNYCH: PERCEPTRON WIELOWARSTWOWY
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu SIECI NEURONOWE DLA DANYCH SYMBOLICZNYCH: PERCEPTRON WIELOWARSTWOWY 1. Wstęp Jedną z najczęściej stosowanych struktur sieci neuropodobnych jest wielowarstwowa
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych
Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską
Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 384 Taksonomia 24 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych
Andrzej Dudek, Marcin Pełka Akademia Ekonomiczna we Wrocławiu Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych 1. Wprowadzenie Ideą skalowania wielowymiarowego obiektów symbolicznych
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
5. Analiza dyskryminacyjna: FLD, LDA, QDA
Algorytmy rozpoznawania obrazów 5. Analiza dyskryminacyjna: FLD, LDA, QDA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Liniowe funkcje dyskryminacyjne Liniowe funkcje dyskryminacyjne mają ogólną
Adrian Horzyk
Metody Inteligencji Obliczeniowej Metoda K Najbliższych Sąsiadów (KNN) Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Zastosowania statystyki i matematyki w ekonomii. Marek Walesiak. Akademia Ekonomiczna we Wrocławiu. 1. Wstęp
PRACE NAUKOWE AKADEMII EKONOMICZNEJ WE WROCŁAWIU Nr 1006 2003 Zastosowania statystyki i matematyki w ekonomii Marek Walesiak Akademia Ekonomiczna we Wrocławiu MIARA ODLEGŁOŚCI OBIEKTÓW OPISANYCH ZMIENNYMI
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
Wykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Metody Sztucznej Inteligencji II
17 marca 2013 Neuron biologiczny Neuron Jest podstawowym budulcem układu nerwowego. Jest komórką, która jest w stanie odbierać i przekazywać sygnały elektryczne. Neuron działanie Jeżeli wartość sygnału
ANALIZA WIELOPOZIOMOWA Z WYKORZYSTANIEM DANYCH SYMBOLICZNYCH MULTILEVEL ANALYSIS WITH APPLICATION OF SYMBOLIC DATA
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 07 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 46 016 Taksonomia 6 ISSN 1899-319 Klasyfikacja i analiza danych teoria i zastosowania e-issn
(Dantzig G. B. (1963))
(Dantzig G.. (1963)) Uniwersalna metoda numeryczna dla rozwiązywania zadań PL. Ideą metody est uporządkowany przegląd skończone ilości rozwiązań bazowych układu ograniczeń, które możemy utożsamiać, w przypadku
Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec
Wybrane zagadnienia uczenia maszynowego Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec Przygotowane na podstawie T. Mitchell, Machine Learning S.J. Russel, P. Norvig, Artificial Intelligence
EKONOMETRIA ECONOMETRICS 2(40) 2013
EKONOMETRIA ECONOMETRICS 2(40) 2013 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2013 Redaktor Wydawnictwa: Aleksandra Śliwka Redakcja techniczna i korekta: Barbara Łopusiewicz Łamanie:
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego
6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego Analiza wrażliwości est studium analizy wpływu zmian wartości różnych parametrów modelu PL na rozwiązanie optymalne. Na optymalne
Interwałowe zbiory rozmyte
Interwałowe zbiory rozmyte 1. Wprowadzenie. Od momentu przedstawienia koncepcji klasycznych zbiorów rozmytych (typu 1), były one krytykowane za postać jaką przybiera funkcja przynależności. W przypadku
Maszyny wektorów podpierajacych w regresji rangowej
Maszyny wektorów podpierajacych w regresji rangowej Uniwersytet Mikołaja Kopernika Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie X X R d, Y R Z = (X, Y ), Z = (X, Y ) - niezależne
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
1 Wyznaczyć zastępczą impedancję zespoloną dwójnika przedstawionego na rys.1 dla trzech wartości pulsacji: a) = 0, b) = 1 krad/s, c) = 2 krad/s.
EUOEEKTA Ogólnopolska Olimpiada Wiedzy Elektryczne i Elektroniczne ok szkolny 0/0 Odpowiedzi do zadań dla grupy elektroniczne na zawody III stopnia (centralne) Wyznaczyć zastępczą impedancę zespoloną dwónika
Prawdopodobieństwo czerwonych = = 0.33
Temat zajęć: Naiwny klasyfikator Bayesa a algorytm KNN Część I: Naiwny klasyfikator Bayesa Naiwny klasyfikator bayerowski jest prostym probabilistycznym klasyfikatorem. Naiwne klasyfikatory bayesowskie
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych
inż. Marek Duczkowski Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych słowa kluczowe: algorytm gradientowy, optymalizacja, określanie wodnicy W artykule
Poszukiwanie optymalnego wyrównania harmonogramu zatrudnienia metodą analityczną
Mieczysław POŁOŃSKI Wydział Budownictwa i Inżynierii Środowiska, Szkoła Główna Gospodarstwa Wieskiego, Warszawa, ul. Nowoursynowska 159 e-mail: mieczyslaw_polonski@sggw.pl Poszukiwanie optymalnego wyrównania
Wstęp do sieci neuronowych, wykład 8 Uczenie nienadzorowane.
Wstęp do sieci neuronowych, wykład 8. M. Czoków, J. Piersa, A. Rutkowski Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika w Toruniu 1-811-6 Projekt pn. Wzmocnienie potencjału dydaktycznego
FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1
Tomasz Bartłomowicz Uniwersytet Ekonomiczny we Wrocławiu FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1 Streszczenie. Punktem wyjścia artykułu jest spostrzeżenie,
Sztuczna inteligencja : Algorytm KNN
Instytut Informatyki Uniwersytetu Śląskiego 23 kwietnia 2012 1 Algorytm 1 NN 2 Algorytm knn 3 Zadania Klasyfikacja obiektów w oparciu o najbliższe obiekty: Algorytm 1-NN - najbliższego sąsiada. Parametr
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Wprowadzenie. Data Science Uczenie się pod nadzorem
Wprowadzenie Wprowadzenie Wprowadzenie Wprowadzenie Machine Learning Mind Map Historia Wstęp lub uczenie się z przykładów jest procesem budowy, na bazie dostępnych danych wejściowych X i oraz wyjściowych
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 50 2012 ANALIZA WŁASNOŚCI OPCJI SUPERSHARE
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 5 212 EWA DZIAWGO ANALIZA WŁASNOŚCI OPCJI SUPERSHARE Wprowadzenie Proces globalizacji rynków finansowych stwarza
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
BADANIE WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO
BADANIE WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO Lis Anna Lis Marcin Kowalik Stanisław 2 Streszczenie. W pracy przedstawiono rozważania dotyczące określenia zależności pomiędzy wydobyciem
9. Praktyczna ocena jakości klasyfikacji
Algorytmy rozpoznawania obrazów 9. Praktyczna ocena jakości klasyfikacji dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Zbiór uczacy i zbiór testowy 1. Zbiór uczacy służy do konstrukcji (treningu)
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Mail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk
Akademia Morska w Szczecinie. Wydział Mechaniczny
Akademia Morska w Szczecinie Wydział Mechaniczny ROZPRAWA DOKTORSKA mgr inż. Marcin Kołodziejski Analiza metody obsługiwania zarządzanego niezawodnością pędników azymutalnych platformy pływającej Promotor:
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH Dobrze przygotowane sprawozdanie powinno zawierać następujące elementy: 1. Krótki wstęp - maksymalnie pół strony. W krótki i zwięzły
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
PORZĄDKOWANIE LINIOWE BŁĘDY PRZY INTERPRETACJI WYNIKÓW ORAZ SPOSÓB ICH ELIMINACJI
METODY ILOŚCIOWE W BADANIACH EKONOMICZNYCH Tom XVI/3, 2015, str. 118 128 PORZĄDKOWANIE LINIOWE BŁĘDY PRZY INTERPRETACJI WYNIKÓW ORAZ SPOSÓB ICH ELIMINACJI Marta Jarocka Katedra Informatyki Gospodarczej
7. Maszyny wektorów podpierajacych SVMs
Algorytmy rozpoznawania obrazów 7. Maszyny wektorów podpierajacych SVMs dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Maszyny wektorów podpierajacych - SVMs Maszyny wektorów podpierających (ang.
ANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 31 Ewa Dziawgo Uniwersytet Mikołaja Kopernika w Toruniu ANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII Streszczenie W artykule przedstawiono
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
Rozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba, J. Kaczmar Cel zadania Celem zadania jest implementacja klasyfikatorów
1 Klasyfikator bayesowski
Klasyfikator bayesowski Załóżmy, że dane są prawdopodobieństwa przynależności do klasp( ),P( 2 ),...,P( L ) przykładów z pewnego zadania klasyfikacji, jak również gęstości rozkładów prawdopodobieństw wystąpienia
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
ZASTOSOWANIE ODCINKOWO-LINIOWEGO MINIMODELU DO MODELOWANIA PRODUKCJI SPRZEDANEJ PRZEMYSŁU
ZASTOSOWANIE ODCINKOWO-LINIOWEGO MINIMODELU DO MODELOWANIA PRODUKCJI SPRZEDANEJ PRZEMYSŁU W artykule przedstawiono now metod modelowania zjawisk ekonomicznych. Metoda odcinkowo-liniowego minimodelu szczególnie
WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska
Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Jacek Szcześniak Jerzy Błaszczyński Roman Słowiński Poznań, 5.XI.2013r. Konspekt Wstęp Wprowadzenie Metody typu wrapper Nowe metody
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Matematyka ubezpieczeń majątkowych r.
Zadanie. Niech łączna wartość szkód: Ma złożony rozkład Poissona. Momenty rozkładu wartości poedyncze szkody wynoszą:, [ ]. Wiemy także, że momenty nadwyżki wartości poedyncze szkody ponad udział własny
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
WYZNACZANIE KOSZTÓW TRANSPORTU Z WYKORZYSTANIEM OCTAVE 3.4.3
PRACE NAUKOWE POLITECHNIKI WARSZAWSKIEJ z. 111 Transport 2016 Joanna Szkutnik-, Wojskowa Akademia Techniczna, W WYZNACZANIE KOSZTÓW TRANSPORTU Z WYKORZYSTANIEM OCTAVE 3.4.3 : maj 2016 Streszczenie: samochodowej.
Inteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
SYSTEMY UCZĄCE SIĘ WYKŁAD 9. GRUPOWANIE DANYCH. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 9. GRUPOWANIE DANYCH Częstochowa 014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Grupowanie danych zwane inacze grupowaniem poęciowym,
Metody Obliczeniowe w Nauce i Technice
Metody Obliczeniowe w Nauce i Technice 15. Obliczanie całek metodami Monte Carlo Marian Bubak Department of Computer Science AGH University of Science and Technology Krakow, Poland bubak@agh.edu.pl dice.cyfronet.pl
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych aproksymacja LABORKA Piotr Ciskowski zadanie 1. aproksymacja funkcji odległość punktów źródło: Żurada i in. Sztuczne sieci neuronowe, przykład 4.4, str. 137 Naucz sieć taką
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Pozyskiwanie wiedzy z danych
Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization
Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba Cel zadania Celem zadania jest implementacja klasyfikatorów
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z