PORÓWNANIE STABILNOŚCI ZAGREGOWANYCH ALGORYTMÓW TAKSONOMICZNYCH OPARTYCH NA IDEI METODY BAGGING
|
|
- Fabian Marcinkowski
- 7 lat temu
- Przeglądów:
Transkrypt
1 Dorota Rozmus Uniwersytet Ekonomiczny w Katowicach PORÓWNANIE STABILNOŚCI ZAGREGOWANYCH ALGORYTMÓW TAKSONOMICZNYCH OPARTYCH NA IDEI METODY BAGGING Wprowadzenie Pierwotnie podejście zagregowane (wielomodelowe) z dużym powodzeniem yło stosowane w dyskryminacji i regresji w celu podniesienia dokładności predykcji. Zasadnicza idea tego podejścia polega na tym, że w pierwszym kroku są udowane liczne różniące się między soą pojedyncze modele, które następnie za pomocą różnych operatorów są łączone w model zagregowany. W dyskryminacji najczęściej stosowanym operatorem jest głosowanie majoryzacyjne, co oznacza, że jest wyierana ta klasa, która najczęściej yła wskazywana przez pojedyncze modele; natomiast w regresji najczęściej stosuje się uśrednianie wartości teoretycznych zmiennej y. Wśród najardziej znanych metod agregacji należy wymienić: agging [Breiman 996], który jest oparty na losowaniu kolejnych pró oostrapowych oraz oosting [Freund 999] polegający na nadawaniu wyższych wartości wag łędnie sklasyfikowanym oiektom. W ostatnich latach analogiczne propozycje pojawiły się także w taksonomii, ay zapewnić większą poprawność i stailność wyników grupowania [Fern i Brodley 23; Fred 22; Fred i Jain 22; Strehl i Gosh 22]. Zagadnienie agregacji w taksonomii może zostać sformułowane następująco: mając wyniki wielokrotnie przeprowadzonej klasyfikacji, znajdź zagregowany podział ostateczny o lepszej jakości. Liczne adania w tej dziedzinie ustanowiły już nowy oszar w tradycyjnej taksonomii. Istnieje wiele możliwości zastosowania idei podejścia zagregowanego w dziedzinie uczenia ez nauczyciela, wśród których jako najpopularniejsze należy wymienić:
2 2 Dorota Rozmus. Łączenie wyników grupowania uzyskanych za pomocą różnych metod. 2. Uzyskanie różniących się między soą klasyfikacji z zastosowaniem różnych podziorów danych, np. poprzez losowanie ootstrapowe. 3. Stosowanie różnych podziorów zmiennych. 4. Wielokrotne zastosowanie tego samego algorytmu z różnymi wartościami parametrów lu punktami startowymi (np. losowo wyranymi zalążkami skupień w metodzie k-średnich). Algorytm taksonomiczny powinien charaktryzować się stailnością, a więc powinien yć odporny na niewielkie zmiany w ziorze danych, czy też wartości parametrów tego algorytmu. Wiadomo jednakże również, że kluczem do sukcesu podejścia zagregowanego jest zróżnicowanie klasyfikacji składowych. Klasyfikacja zagregowana, która została zudowana na różniących się między soą elementach składowych jest ardziej dokładna i stailna niż pojedyncze metody taksonomiczne. W niniejszym adaniu uwaga zostanie skupiona na stailności metod taksonomicznych. Głównym celem tego artykułu jest porównanie stailności zagregowanych algorytmów taksonomicznych, a także relacji między stailnością i dokładnością; przy czym pod uwagę zostanie wzięta tylko specyficzna klasa metod agregacji, które są oparte na idei metody agging.. Metoda agging w taksonomii Metoda agging jest pewną ogólną koncepcją, w ramach której narodziły się szczegółowe rozwiązania zaproponowane m.in. przez Hornika [25], Dudoid i Fridlyand [23] oraz Leischa [999]. Pierwszy krok we wszystkich tych metodach jest taki sam: polega na konstrukcji B pró ootstrapowych i zastosowaniu do nich pojedynczego algorytmu taksonomiczego w celu uzyskania klasyfikacji składowych wchodzących w skład klasyfikacji ostatecznej. Poszczególne warianty tej metody różnią się natomiast w kroku drugim, czyli w kroku agregacji wyników. Propozycja Leischa Leisch [999] zaproponował, y w pierwszym kroku na podstawie każdej podpróy ootstrapowej dokonać grupowania przy zastosowaniu tzw. azowej metody taksonomicznej, którą jest jedna z metod iteracyjno-optymalizacyjnych, np. algorytm k-średnich. W kolejnym etapie ostateczne centra skupień są prze-
3 Porównanie stailności zagregowanych algorytmów taksonomicznych 2 kształcane w nowy ziór danych oejmujący B K oserwacji (K to licza skupień w metodzie azowej), który jest poddawany podziałowi za pomocą metod hierarchicznych. Uzyskany dendrogram jest podstawą ostatecznego podziału oserwacje z pierwotnego zioru są przydzielane do tej grupy, której środek ciężkości znajduje się w minimalnej odległości Euklidesowej. Algorytm zaproponowany przez Leischa przeiega w następujących krokach:. Z pierwotnego N-elementowego zioru G należy wylosować B pró ootstrapowch G n, Gn,..., Gn, losując n oserwacji przy wykorzystaniu schema- 2 B tu losowania ze zwracaniem. 2. Na podstawie każdego zioru za pomocą metod iteracyjno-optymalizacyjnych (np. k-średnich) dokonuje się podziału na grupy oserwacji podonych do sieie, uzyskując w ten sposó B K zalążków skupień c, c2,..., ck, c2,..., c BK, gdzie K oznacza liczę skupień w metodzie azowej, a c k jest k-tym zalążkiem znalezionym na podstawie podpróy G n. 3. Niech zalążki skupień uzyskane na podstawie kolejnych pró ootstrapowych utworzą nowy ziór danych C = C ( K) = { c,..., cbk }. 4. Do tak skonstruowanego zioru należy zastosować hierarchiczną metodę B B taksonomiczną, uzyskując w ten sposó dendrogram. 5. Niech c( x i ) oznacza zalążek znajdujący się najliżej oserwacji x i, i =,, n. Podział na grupy pierwotnego zioru danych jest określany w ten sposó, że dendrogram uzyskany na podstawie zioru C jest cięty na określo- B nym przez adacza poziomie, co prowadzi do uzyskania grup oiektów B B podonych C,..., C m, gdzie m BK. Każda oserwacja x i z pierwotnego zioru danych G jest przydzielana do tej grupy, w której znajduje się najliżej leżący zalążek c x ). ( i Propozycja Duidoid i Fridlyand Metoda agging w wersji zaproponowanej przez Dudoid i Fridlyand [23] stosuje algorytmy iteracyjno-optymalizacyjne do oryginalnego zioru danych i poszczególnych pró ootstrapowych, a po dokonaniu permutacji etykiet klas w wynikach grupowania uzyskanych na podstawie każdej podpróy tak, y zachodziła jak największa zieżność z klasyfikacją oiektów z oryginalnego zioru danych, stosuje głosowanie majoryzacyjne w celu określenia ostatecznej klasyfikacji zagregowanej.
4 22 Dorota Rozmus Kroki zaproponowanego przez nich algorytmu można ująć według następującego schematu. Dla założonej liczy klas K:. Zastosuj iteracyjno-optymalizacyjny algorytm taksonomiczny T do pierwotnego zioru danych G, uzyskując w ten sposó etykiety klas T ( xi, G) = yˆ i dla każdej oserwacji x i, i =,, n. 2. Skonstruuj -tą próę ootstrapową G n = ( x,..., xn ). 3. Zastosuj algorytm taksonomiczny T do skonstruowanej próy ootstrapowej G n, uzyskując podział na klasy: T ( x i, Gn ) dla każdej oserwacji w ziorze G n. 4. Dokonaj permutacji etykiet klas przyznanych oserwacjom w próie ootstrapowej G n tak, y zachodziła jak największa zieżność z klasyfikacją oiektów z oryginalnego zioru danych G. Niech PR K oznacza ziór wszystkich permutacji zioru licz całkowitych,, K. Znajdź permutację τ PR maksymalizującą: K n i= I (τ ( T ( x, G )) = T ( x, G)), () i n gdzie I( ) to funkcja wskaźnikowa, równa, gdy zachodzi prawda, w przypadku przeciwnym. 5. Powtórz kroki 2-4 B razy. Ostatecznie zaklasyfikuj i-tą oserwację, stosując głosowanie majoryzacyjne, zatem przydzielając ją do tej klasy, dla której zachodzi: k K : x i G n i arg max I( τ ( T ( x, G )) = k). (2) i n Propozycja Hornika W metodzie tej po skonstruowaniu B pró ootstrapowych i zastosowaniu do nich pojedynczego algorytmu taksonomicznego uzyskuje się klasyfikacje składowe. Klasyfikacja zagregowana natomiast jest uzyskiwana za pomocą tzw. podejścia optymalizacyjnego, które ma za zadanie zminimalizować funkcję o postaci:
5 Porównanie stailności zagregowanych algorytmów taksonomicznych 23 B = 2 dist( c, ) min, (3) c gdzie: C ziór wszystkich możliwych klasyfikacji zagregowanych, dist odległość Euklidesowa, c,..., c ) klasyfikacje wchodzące w skład klasyfikacji zagregowanej. ( B c C 2. Miary stailności i dokładności W celu zadania stailności i dokładności zastosowano koncepcję miar zaproponowanych przez Kunchevę i Vetrova [26]. Mierniki te są oparte na skorygowanym indeksie Randa (AR), którego definicja jest następująca [Huert i Araie 985]: niech A i B ędą wynikami dwóch różnych klasyfikacji zioru Z posiadającego N elementów. Przez l A oznaczmy liczę klas w klasyfikacji A, natomiast przez l B liczę klas w klasyfikacji B; N ij to licza oiektów znajdujących się w klasie i w grupowaniu A i w klasie j w klasyfikacji B; N i to licza oserwacji w klasie i w klasyfikacji A, natomiast N j to licza oserwacji w klasie j w klasyfikacji B. Skorygowany indeks Randa jest dany wzorem: AR( A, B) = l A l B i= j= 2 N 2 ij t ( t + t2 ) t3 3, (4) gdzie: t l = A i= N i, (5) 2 t 2 l = B j= N 2 j, (6)
6 24 Dorota Rozmus 2t t t 2 3 =. (7) N( N ). STABILNOŚĆ DLA PAR KLASYFIKACJI ZAGREGOWANYCH (ang. pairwise ensemle staility): Z S 2 agr agr agr = AR(Pz, Pl ) Z ( Z ), (8) z, l Z z< l gdzie: Z licza klasyfikacji zagregowanych, AR skorygowany indeks Randa, agr P klasyfikacja na podstawie z-tej klasyfikacji zagregowanej, z agr l P klasyfikacja na podstawie l-tej klasyfikacji zagregowanej. Miara ta ocenia stailność klasyfikacji zagregowanych poprzez ocenę podoieństwa wyników grupowania, które na ich podstawie zostały uzyskane. 2. PRZECIĘTNA DOKŁADNOŚĆ KLASYFIKACJI ZAGREGOWANEJ (ang. average ensemle accuracy): A agr = Z Z z= AR( P agr z, P T ), (9) T gdzie: P rzeczywiste etykiety klas. Miara ta jest uśrednioną po wszystkich klasyfikacjach zagregowanych miarą dokładności i mierzy podoieństwo między ostateczną klasyfikacją zagregowaną a prawdziwymi etykietami klas. 3. Badania empiryczne W adaniach zastosowano sztucznie generowane ziory danych, które standardowo są wykorzystywane w adaniach porównawczych w taksonomii. Są to takie ziory, w których przynależność oiektów do klas jest znana. Ich krótka Ziory zaczerpnięte zostały z pakietu mlench z programu R.
7 Porównanie stailności zagregowanych algorytmów taksonomicznych 25 charakterystyka znajduje się w taeli, natomiast struktura jest pokazana na rys. -8. Ziory Cassini, Cuoids, Shapes, Smiley oraz Spirals należą do ziorów o wyraźnie separowalnych klasach, natomiast 2dnormals, Ringnorm i Threenorm posiadają nakładające się na sieie, trudno separowalne klasy. Charakterystyka zastosowanych ziorów danych Taela Ziór danych Licza oiektów Licza cech Licza klas Cassini Cuoids dnormals Ringnorm Shapes Smiley Spirals Threenorm Rys.. Zastosowane ziory danych ziór Cassini
8 26 Dorota Rozmus var var 2 var Rys. 2. Zastosowane ziory danych ziór Cuoids Rys. 3. Zastosowane ziory danych ziór 2dnormals
9 Porównanie stailności zagregowanych algorytmów taksonomicznych Rys. 4. Zastosowane ziory danych ziór Ringnorm Rys. 5. Zastosowane ziory danych ziór Shapes
10 28 Dorota Rozmus Rys. 6. Zastosowane ziory danych ziór Smiley Rys. 7. Zastosowane ziory danych ziór Spirals
11 Porównanie stailności zagregowanych algorytmów taksonomicznych Rys. 8. Zastosowane ziory danych ziór Threenorm W adaniach empirycznych zastosowano 5 klasyfikacji zagregowanych, a wszystkie oliczenia zostały powtórzone 5 razy, y uzyskać ardziej dokładne i wiarygodne rezultaty. W metodzie agging zaproponowanej przez Leischa po skonstruowaniu pró ootstrapowych jako azowy iteracyjno-optymalizacyjny algorytm taksonomiczny zastosowano metodę k-średnich z wartością parametru k = 5 2, a po przekształceniu ostatecznych zalążków skupień do postaci zioru danych oejmującego 5 oserwacji dokonano podziału za pomocą następujących hierarchicznych metod taksonomicznych 3 : najliższego sąsiedztwa (clust_single), najdalszego sąsiedztwa (clust_complete), centroidy (clust_centroid), mediany (clust_median), średniej odległości (clust_mean), warda (clust_ward). Oliczenia zostały wykonane w programie R z zastosowaniem funkcji clust z pakietu e7. W metodzie agging w wersji zaproponowanej przez Dudoid i Fridlyand oraz przez Hornika po skonstruowaniu 25 pró ootstrapowych zastosowano dwa algorytmy, a mianowicie metodę k-średnich oraz c-średnich, która jest rozmytą wersją metody k-średnich opracowaną przez Bezdeka [98]. Metoda Dudoid i Fridlyand jest oprogramowana w programie R pod nazwą funkcji cl_ag w pakiecie clue (na rysunkach zastosowano nazwy cl_ag_kmeans oraz cl_ag_cmeans), natomiast metodę Hornika można znaleźć w tym samym pakiecie pod nazwą cl_consensus (na rysunkach oznaczenie odnosi się do metody agregacji, gdzie na poszczególnych próach ootstrapowych yła stosowana metoda k-średnich, a metoda c-średnich). 2 Autor metody zaleca, y wartość tego parametru yła większa niż rzeczywista licza skupień. 3 W nawiasach zostały podane skróty nazw stosowane na rysunkach.
12 3 Dorota Rozmus Rezultaty oliczeń widoczne na rys. 9 pozwalają stwierdzić, że w prawie wszystkich przypadkach najmniej stailną okazała się metoda clust_complete oraz clust_median. Najwyższą stailnością w przypadku większości ziorów danych charakteryzują się metody: clust_single, clust_average oraz clust_centroid (z wyjątkiem metod clust_average oraz clust_centroid dla zioru Spirals oraz metody clust_average dla zioru Threenorm i 2dnormals). Całkiem stailne rezultaty można także zaoserwować dla reszty adanych metod z wyjątkiem metody clust_ward dla ziorów Ringnorm, Threenorm oraz Spirals. Cassini Smiley,2,2 BgC_cmeans BgC_kmeans BgC_kmeans BgC_cmeans Cuoids Spirals,2,2 BgC_kmeans BgC_cmeans BgC_kmeans BgC_cmeans Ringnorm Threenorm,2,2 BgC_kmeans BgC_cmeans BgC_kmeans BgC_cmeans Shapes 2dnormals,2,2 BgC_kmeans BgC_cmeans BgC_kmeans BgC_cmeans Rys. 9. Stailność poszczególnych metod opartych na idei agging dla różnych ziorów danych
13 Porównanie stailności zagregowanych algorytmów taksonomicznych 3 Cassini Smiley cl_ag_kmeans cl_ag_cmeans Stailność Dokładność cl_ag_kmeans cl_ag_cmeans Stailność Dokładność Cuoids Spirals cl_ag_kmeans cl_ag_cmeans Stailność Dokładność cl_ag_kmeans cl_ag_cmeans Stailność Dokładność Ringnorm Threenorm cl_ag_kmeans cl_ag_cmeans Stailność Dokładność cl_ag_kmeans cl_ag_cmeans Stailność Dokładność Shapes 2dnormals cl_ag_kmeans cl_ag_cmeans Stailność Dokładność cl_ag_kmeans cl_ag_cmeans Stailność Dokładność Rys.. Relacje między stailnością a dokładnością dla poszczególnych metod opartych na idei agging dla różnych ziorów danych Wykresy na rys. pokazujące relacje zachodzące między miarami stailności i dokładności pozwalają stwierdzić rak generalnie oowiązującej zależności. Na przykład dla zioru Cassini oraz Cuoids miary stailności i dokładności osiągają niemalże ten sam poziom (z wyjątkiem metody ). Podonie miary te kształtują się także dla ziorów Shapes oraz Smiley (z wyjąt-
14 32 Dorota Rozmus kiem metod clust_complete i clust_median dla zioru Shapes oraz metody clust_median dla zioru Smiley). Już dla zioru Ringnorm, Threenorm oraz Spirals można jednak zaoserwować, że miary dokładności kształtują się na niemalże tym samym poziomie, natomiast miary stailności zachowują się różnie dla różnych metod 4. Na przykład dla cl_ag_cmeans, cl_ag_kmeans, means i means przyjmują dosyć duże wartości, a dla clust_ward stosunkowo niskie. Podsumowanie Przechodząc do sformułowania uwag końcowych, należy na wstępie zauważyć, że wyór dorego algorytmu taksonomicznego jest znacznie trudniejszy niż wyór dorego algorytmu dyskryminacyjnego. Wynika to przede wszystkim z faktu, że w klasyfikacji wzorcowej mamy do czynienia z zagadnieniem uczenia z nauczycielem. W taksonomii natomiast nie znamy klas, do których należą oiekty, a tym samym rak jest określonej z góry struktury, która powinna zostać rozpoznana przez algorytm. W związku z tym, y ominąć ryzyko wyoru niewłaściwego algorytmu taksonomicznego, można zastosować podejście zagregowane celem połączenia wyników klasyfikacji różnych algorytmów. Każdy z nich ma swoje mocne i słae strony, ale wydaje się, że ich łączne zastosowanie przyniesie efekt kompensacji. Drugą zaletą podejścia zagregowanego jest uniezależnienie wyników od wyranej metody, czy też wartości pewnych parametrów tych metod (np. początkowo wyranych zalążków skupień w metodzie k-średnich), a także zwiększenie odporności algorytmów taksonomicznych na szum i oserwacje oddalone. Agregacja wyników pozwala zatem na stailizację rezultatów grupowania. Wspomniane zalety powodują, że podejście to jest warte uwagi i tego, y spróować zadać relacje zachodzące między stailnością i dokładnością zagregowanych algorytmów taksonomicznych. W przypadku gdyy między nimi zachodził wyraźny związek, mierniki stailności mogłyy posłużyć jako wskazówka pomagająca wyrać najlepszą metodę podziału. Z przeprowadzonych adań nad stailnością zagregowanych metod taksonomicznych opartych na metodzie agging wynika, że najardziej stailne okazały się metody: clust_single, clust_average, clust_centroid, cl_ag_cmeans, cl_ag_kmeans, means oraz means. Najmniej 4 Głównym punktem zainteresowania adań jest stailność zagregowanych algorytmów taksonomicznych, dlatego przedstawiono wyniki nawet wtedy, gdy dokładność klasyfikacji nie osiągała wysokich wartości.
15 Porównanie stailności zagregowanych algorytmów taksonomicznych 33 stailne okazały się natomiast metody clust_centroid oraz clust_median; podczas gdy metoda clust_ward dla niektórych ziorów yła ardzo stailna (np. dla ziorów Cassini, Cuoids, Shapes i Smiley), a dla niektórych stailność yła stosunkowo niska. Z adań nad relacją między stailnością i dokładnością w algorytmach opartych na metodzie agging wynika, że nie da się sformułować jasnej i ogólnie oowiązującej zasady. Dla niektórych ziorów danych stailność i dokładność kształtuje się na zliżonym do sieie poziomie, a dla niektórych stwierdza się rak jakiegokolwiek związku między nimi. Literatura Bezdek J.C. (98): Pattern Recognition with Fuzzy Ojective Function Algorithms. Plenum, New York. Breiman L. (996): Bagging Predictors. Machine Learning, No. 26(2). Dudoit S., Fridlyand J. (23): Bagging to Improve the Accuracy of a Clustering Procedure. Bioinformatics, Vol. 9, No. 9. Fern X.Z., Brodley C.E. (23): Random Projection for High Dimensional Data Clustering: A Cluster Ensemle Approach. Proceedings of the 2 th International Conference of Machine Learning. Fred A. (22): Finding Consistent Clusters in Data Partitions. Proceedings of the International Workshop on Multiple Classifier Systems. Fred N.L., Jain A.K. (22): Comining Multiple Clusterings Using Evidence Accumulation. IEEE Transactions on PAMI, No. 27(6). Freund Y. (999): An Adaptive Version of the Boost y Majority Algorithm. Proceedings of the 2 th Annual Conference on Computational Learning Theory. Hornik K. (25): A CLUE for CLUster Ensemles. Journal of Statistical Software, No. 4. Huert L.., Araie P. (985): Evaluating Oject Set Partitions: Free Sort Analysis and Some Generalizations. Journal of Veral Learning and Veral Behaviour, No. 5. Kuncheva L., Vetrov D. (26): Evaluation of Staility of k-means Cluster Ensemles with Respect to Random Initialization. IEEE Transactions On Pattern Analysis And Machine Intelligence, Vol. 28, No.. Leisch F. (999): Bagged Clustering. Adaptive Information Systems and Modeling in Economics and Management Science, Working Paper 5. Strehl A., Ghosh J. (22): Cluster Ensemles A Knowledge Reuse Framework for Comining Multiple Partitions. Journal of Machine Learning Research, No. 3.
16 34 Dorota Rozmus COMPARISON OF STABILITY OF CLUSTER ENSEMBLES BASED ON BAGGING IDEA Summary Ensemle approach has een successfully applied in the context of supervised learning to increase the accuracy and staility of classification. One of the most popular method is agging ased on ootstrap samples. Recently, analogous techniques for cluster analysis have een suggested in order to increase classification accuracy, roustness and staility of the clustering solutions. Research has proved that, y comining a collection of different clusterings, an improved solution can e otained. A desirale quality of the method is the staility of a clustering algorithm with respect to small perturations of data (e.g., data susampling or resampling, small variations in the feature values) or the parameters of the algorithm (e.g., random initialization). Here, we look at the staility of the ensemle and carry out an experimental study to compare staility of cluster ensemles ased on agging idea.
Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska
Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja
PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU
EKONOMETRIA ECONOMETRICS 2(40) 2013 ISSN 1507-3866 Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu PODEJŚCIE WIELOMODELOWE ANALIZY DANYCH SYMBOLICZNYCH W OCENIE POZYCJI PRODUKTÓW NA RYNKU Streszczenie:
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Czym jest analiza skupień?
Statystyczna analiza danych z pakietem SAS Analiza skupień metody hierarchiczne Czym jest analiza skupień? wielowymiarowa technika pozwalająca wykrywać współzależności między obiektami; ściśle związana
Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych
Jacek Batóg Uniwersytet Szczeciński Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych Agregacja wyników uzyskiwanych w odrębnych badaniach, często również przy pomocy
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM
Mostefa Mohamed-Seghir Akademia Morska w Gdyni PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM W artykule przedstawiono propozycję zastosowania programowania dynamicznego do rozwiązywania
4.3 Grupowanie według podobieństwa
4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633
Grupowanie Grupowanie 7 6 5 4 y 3 2 1 0-3 -2-1 0 1 2 3 4 5-1 -2-3 -4 x Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633 Wprowadzenie Celem procesu grupowania jest podział zbioru
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Jacek Szcześniak Jerzy Błaszczyński Roman Słowiński Poznań, 5.XI.2013r. Konspekt Wstęp Wprowadzenie Metody typu wrapper Nowe metody
EKONOMETRIA ECONOMETRICS 2(40) 2013
EKONOMETRIA ECONOMETRICS 2(40) 2013 Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2013 Redaktor Wydawnictwa: Aleksandra Śliwka Redakcja techniczna i korekta: Barbara Łopusiewicz Łamanie:
Supervised Hierarchical Clustering with Exponential Linkage. Nishant Yadav
Supervised Hierarchical Clustering with Exponential Linage Nishant Yadav Ari Kobren Nicholas Monath Andrew McCallum At train time, learn A :2 X! Y Supervised Clustering aaab8nicbvdlssnafl2pr1pfvzdugvwvrirdfl147kcfuabymq6aydozslmjvbcp8onc0xc+jxu/bsnbrbaemdgcm69zlntaq36hnftmltfwnzq7xd2dnd2z+ohh61juo1zs2qhnldbgmugqt5chyn9gmxkfgnxbyl/udj6ynv/irpwlyjkspokuojv6/zjgmbkr3cwg1zpx9+zwv4lfbouaa6qx/2homnmjfjbjon5xojbrjryktis08nswidbhrwspjzeyqzspp3dordn1iafsunp190zgymomcwgn84hm2cvf/7xeitf1hgzpmgxxwupcjf5eb3u0ouguuxtyrqzw1wl46jjhrtsxvbgr988ippx9r9yx8ua43boo4ynmapnimpv9cae2hccygoeizxehpqexheny/fampdo7hd5zph3bqvc=
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
Maszyny wektorów podpierajacych w regresji rangowej
Maszyny wektorów podpierajacych w regresji rangowej Uniwersytet Mikołaja Kopernika Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie X X R d, Y R Z = (X, Y ), Z = (X, Y ) - niezależne
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Metody analizy skupień Wprowadzenie Charakterystyka obiektów Metody grupowania Ocena poprawności grupowania
Wielowymiarowe metody segmentacji CHAID Metoda Automatycznej Detekcji Interakcji CHAID Cele CHAID Dane CHAID Przebieg analizy CHAID Parametry CHAID Wyniki Metody analizy skupień Wprowadzenie Charakterystyka
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji
Multiklasyfikatory z funkcją kompetencji
3 stycznia 2011 Problem klasyfikacji Polega na przewidzeniu dyskretnej klasy na podstawie cech obiektu. Obiekt jest reprezentowany przez wektor cech Zbiór etykiet jest skończony x X Ω = {ω 1, ω 2,...,
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Ćwiczenia z teoria liczb, ciąg dalszy (pt 15 maja) Matematyka Dyskretna
Ćwiczenia z teoria licz, ciąg dalszy (pt 15 maja) Matematyka Dyskretna Przypomnienie: Mówimy a (a jest względnie pierwsze z ) jeśli NW D(a, ) = 1. (Zero jest podzielne przez każdą liczę naturalną, więc
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 384 Taksonomia 24 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ DLA DANYCH PORZĄDKOWYCH. 1. Wstęp
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU Nr 47 009 TAKSONOMIA 16 Klasyfikacja i analiza danych teoria i zastosowania Uniwersytet Ekonomiczny we Wrocławiu OCENA WYBRANYCH PROCEDUR ANALIZY SKUPIEŃ
MATLAB Neural Network Toolbox przegląd
MATLAB Neural Network Toolbox przegląd WYKŁAD Piotr Ciskowski Neural Network Toolbox: Neural Network Toolbox - zastosowania: przykłady zastosowań sieci neuronowych: The 1988 DARPA Neural Network Study
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 10. WNIOSKOWANIE W LOGICE ROZMYTEJ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WNIOSKOWANIE W LOGICE DWUWARTOŚCIOWEJ W logice
A Zadanie
where a, b, and c are binary (boolean) attributes. A Zadanie 1 2 3 4 5 6 7 8 9 10 Punkty a (maks) (2) (2) (2) (2) (4) F(6) (8) T (8) (12) (12) (40) Nazwisko i Imiȩ: c Uwaga: ta część zostanie wypełniona
Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III
1 Niniejszy dokument zawiera materiały do wykładu z przedmiotu Cyfrowe Przetwarzanie Obrazów i Sygnałów. Jest on udostępniony pod warunkiem wykorzystania wyłącznie do własnych, prywatnych potrzeb i może
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change
Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych
Algorytmy graficzne. Nieliniowa filtracja obrazów monochromatycznych
Algorytmy graficzne Nieliniowa filtracja orazów monochromatycznych Metody oceny efektywności filtracji Analizując filtry redukujące zakłócenia w orazie cyfrowym konieczne jest określenie ścisłych miar
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
PODOBIEŃSTWA RYNKÓW PRACY W GRUPIE KRAJÓW UE-28
Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN 2083-8611 Nr 289 2016 Uniwersytet Ekonomiczny w Katowicach Wydział Ekonomii Katedra Analiz i Prognozowania Rynku Pracy jaroslaw.wasowicz@ue.katowice.pl
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych
Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych WMIM, Uniwersytet Warszawski ul. Banacha 2, 02-097 Warszawa, Polska andrzejanusz@gmail.com 13.06.2013 Dlaczego
Lekcja 5: Sieć Kohonena i sieć ART
Lekcja 5: Sieć Kohonena i sieć ART S. Hoa Nguyen 1 Materiał Sieci Kohonena (Sieć samo-organizująca) Rysunek 1: Sieć Kohonena Charakterystyka sieci: Jednowarstwowa jednokierunkowa sieć. Na ogół neurony
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2011-10-11 1 Modelowanie funkcji logicznych
Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec
Systemy agentowe Uwagi organizacyjne i wprowadzenie Jędrzej Potoniec Kontakt mgr inż. Jędrzej Potoniec Jedrzej.Potoniec@cs.put.poznan.pl http://www.cs.put.poznan.pl/jpotoniec https://github.com/jpotoniec/sa
Podstawy grupowania danych w programie RapidMiner Michał Bereta
Podstawy grupowania danych w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Grupowanie hierarchiczne Grupowanie (analiza skupieo, ang. clustering) ma na celu automatyczne wykrycie grup istniejących
OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA
Tomasz Bąk Uniwersytet Ekonomiczny w Katowicach OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA Wprowadzenie Losowanie warstwowe jest często wykorzystywaną w praktyce metodą doboru próby w przypadku estymacji
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 507 2018 Taksonomia 30 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania e-issn
Metody klasyfikacji dla nielicznej próbki wektorów o wielkim wymiarze
Metody klasyfikacji dla nielicznej próbki wektorów o wielkim wymiarze Small n large p problem Problem w analizie wielu zbiorów danych biologicznych: bardzo mała liczba obserwacji (rekordów, próbek) rzędu
7. Maszyny wektorów podpierajacych SVMs
Algorytmy rozpoznawania obrazów 7. Maszyny wektorów podpierajacych SVMs dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Maszyny wektorów podpierajacych - SVMs Maszyny wektorów podpierających (ang.
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Wykorzystanie metody TOPSIS w procesie klasyfikacji dobowych obciążeń stacji transformatorowych
Wykorzystanie metody TOPSIS w procesie klasyfikacji dobowych obciążeń stacji transformatorowych Wojciech Zalewski Politechnika Białostocka, Wydział Zarządzania, Katedra Informatyki Gospodarczej i Logistyki
Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis
Machine Learning for Data Science (CS4786) Lecture11 5 Random Projections & Canonical Correlation Analysis The Tall, THE FAT AND THE UGLY n X d The Tall, THE FAT AND THE UGLY d X > n X d n = n d d The
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Analiza stanów gry na potrzeby UCT w DVRP
Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza
Analiza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Zagadnienie klasyfikacji (dyskryminacji)
Zagadnienie klasyfikacji (dyskryminacji) Przykład Bank chce klasyfikować klientów starających się o pożyczkę do jednej z dwóch grup: niskiego ryzyka (spłacających pożyczki terminowo) lub wysokiego ryzyka
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning
Warszawa, 30.01.2017 Prof. Dr hab. Henryk Rybinski Instytut Informatyki Politechniki Warszawskiej hrb@ii.pw.edu.pl Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach
Spacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Matematyka dyskretna - wykład - część Podstawowe algorytmy kombinatoryczne
A. Permutacja losowa Matematyka dyskretna - wykład - część 2 9. Podstawowe algorytmy kombinatoryczne Załóżmy, że mamy tablice p złożoną z n liczb (ponumerowanych od 0 do n 1). Aby wygenerować losową permutację
Dariusz Brzeziński. Politechnika Poznańska
Dariusz Brzeziński Politechnika Poznańska Klasyfikacja strumieni danych Algorytm AUE Adaptacja klasyfikatorów blokowych do przetwarzania przyrostowego Algorytm OAUE Dlasze prace badawcze Blokowa i przyrostowa
Komitety sieci konwolucyjnych w zagadnieniu klasyfikacji przy jednoczesnym zaszumieniu danych wejściowych oraz etykiet klas. Stanisław Kaźmierczak
Komitety sieci konwolucyjnych w zagadnieniu klasyfikacji przy jednoczesnym zaszumieniu danych wejściowych oraz etykiet klas Stanisław Kaźmierczak Szum i jego rodzaje Źródła szumu Model Architektura sieci
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Ścieżka rozwoju polskiej gospodarki w latach gospodarki w latach W tym celu wykorzystana zostanie metoda diagramowa,
Barbara Batóg, Jacek Batóg Uniwersytet Szczeciński Ścieżka rozwoju polskiej gospodarki w latach - W artykule podjęta zostanie próba analizy, diagnozy i prognozy rozwoju polskiej gospodarki w latach -.
WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską
Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 6 SYSTEMY ROZMYTE TYPU MAMDANIEGO
Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni
Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni Paweł Teisseyre Instytut Podstaw Informatyki, Polska Akademia Nauk Paweł Teisseyre Selekcja modelu liniowego i predykcja 1 / 29 Plan
FUNKCJA LINIOWA. Poziom podstawowy
FUNKCJA LINIOWA Poziom podstawowy Zadanie ( pkt) Funkcja f przechodzi przez punkty A = (, ) oraz = (,) a) Wyznacz wzór funkcji f ) Podaj miejsce zerowe funkcji f c) Dla jakich x funkcja f przyjmuje wartości
1. Grupowanie Algorytmy grupowania:
1. 1.1. 2. 3. 3.1. 3.2. Grupowanie...1 Algorytmy grupowania:...1 Grupowanie metodą k-średnich...3 Grupowanie z wykorzystaniem Oracle Data Miner i Rapid Miner...3 Grupowanie z wykorzystaniem algorytmu K-Means
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
KARTA PRZEDMIOTU. 17. Efekty kształcenia:
Z1-PU7 WYDANIE N1 Strona 1 z 4 (pieczęć wydziału) KARTA PRZEDMIOTU 1. Nazwa przedmiotu: CYBERNETYKA 2. Kod przedmiotu: CYB 3. Karta przedmiotu ważna od roku akademickiego: 2012/2013 4. Forma kształcenia:
Klasyfikator liniowy Wstęp Klasyfikator liniowy jest najprostszym możliwym klasyfikatorem. Zakłada on liniową separację liniowy podział dwóch klas między sobą. Przedstawia to poniższy rysunek: 5 4 3 2
MODELOWANIE I SYMULACJA Kościelisko, 19-23 czerwca 2006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE
ODELOWANIE I SYULACJA Kościelisko, 9-3 czerwca 006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE SYSTE DO KOPUTEROWEGO ODELOWANIA I SYULACJI UKŁADÓW DYNAICZNYCH
Prawdopodobieństwo czerwonych = = 0.33
Temat zajęć: Naiwny klasyfikator Bayesa a algorytm KNN Część I: Naiwny klasyfikator Bayesa Naiwny klasyfikator bayerowski jest prostym probabilistycznym klasyfikatorem. Naiwne klasyfikatory bayesowskie
Algorytm genetyczny (genetic algorithm)-
Optymalizacja W praktyce inżynierskiej często zachodzi potrzeba znalezienia parametrów, dla których system/urządzenie będzie działać w sposób optymalny. Klasyczne podejście do optymalizacji: sformułowanie
Wprowadzenie. Data Science Uczenie się pod nadzorem
Wprowadzenie Wprowadzenie Wprowadzenie Wprowadzenie Machine Learning Mind Map Historia Wstęp lub uczenie się z przykładów jest procesem budowy, na bazie dostępnych danych wejściowych X i oraz wyjściowych
Definicja testu psychologicznego
Definicja testu psychologicznego Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena. Jest to sytuacja tworzona specjalnie dla celów diagnostycznych,
Interwałowe zbiory rozmyte
Interwałowe zbiory rozmyte 1. Wprowadzenie. Od momentu przedstawienia koncepcji klasycznych zbiorów rozmytych (typu 1), były one krytykowane za postać jaką przybiera funkcja przynależności. W przypadku
Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych
Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Streszczenie rozprawy doktorskiej Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Deep Learning na przykładzie Deep Belief Networks
Deep Learning na przykładzie Deep Belief Networks Jan Karwowski Zakład Sztucznej Inteligencji i Metod Obliczeniowych Wydział Matematyki i Nauk Informacyjnych PW 20 V 2014 Jan Karwowski (MiNI) Deep Learning
Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Analiza skupień. Idea
Idea Analiza skupień Analiza skupień jest narzędziem analizy danych służącym do grupowania n obiektów, opisanych za pomocą wektora p-cech, w K niepustych, rozłącznych i możliwie jednorodnych grup skupień.
Zachowania odbiorców. Grupa taryfowa G
Zachowania odbiorców. Grupa taryfowa G Autor: Jarosław Tomczykowski Biuro PTPiREE ( Energia elektryczna luty 2013) Jednym z założeń wprowadzania smart meteringu jest optymalizacja zużycia energii elektrycznej,
Przestrzeń algorytmów klastrowania
20 listopada 2008 Plan prezentacji 1 Podstawowe pojęcia Przykłady algorytmów klastrowania 2 Odległość algorytmów klastrowania Odległość podziałów 3 Dane wejściowe Eksperymenty Praca źródłowa Podstawowe
TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ
UNIWERSYTET EKONOMICZNY W KATOWICACH NAZWA WYDZIAŁU NAZWA KIERUNKU IMIĘ I NAZWISKO AUTORA TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ (W JĘZYKU POLSKIM) TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ (W JĘZYKU ANGIELSKIM)
ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH
Małgorzata Szerszunowicz Uniwersytet Ekonomiczny w Katowicach ANALIZA ZDOLNOŚCI PROCESU O ZALEŻNYCH CHARAKTERYSTYKACH Wprowadzenie Statystyczna kontrola jakości ma na celu doskonalenie procesu produkcyjnego