do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT dr Piotr Duda

Wielkość: px
Rozpocząć pokaz od strony:

Download "do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT dr Piotr Duda"

Transkrypt

1 Załącznik 2A do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT dr Piotr Duda Politechnika Częstochowska Wydział Inżynierii Mechanicznej i Informatyki Instytut Inteligentnych Systemów Informatycznych Częstochowa, 2018

2

3 1. Dane Osobowe Imię i Nazwisko: Piotr Duda Adres: Politechnika Częstochowska, Wydział Inżynierii Mechanicznej i Informatyki, Instytut Inteligentnych Systemów Informatycznych, ul. Armii Krajowej 36, Częstochowa piotr.duda@iisi.pcz.pl nr tel.: Posiadane dyplomy i stopnie naukowe Stopień doktora nauk technicznych w dyscyplinie informatyka (obroniony z wyróżnieniem), Politechnika Częstochowska, Wydział Inżynierii Mechanicznej i Informatyki, Tytuł rozprawy: Data stream classification algorithms ( Algorytmy klasyfikacji danych strumieniowych ) Tytuł zawodowy magistra nauk matematycznych, Uniwersytet Śląski, Wydział Matematyki, Fizyki i Chemii 3. Informacje o dotychczasowym zatrudnieniu w jednostkach naukowych/ artystycznych obecnie: adiunkt naukowy, Politechnika Częstochowska, Wydział Inżynierii Mechanicznej i Informatyki, Instytut Inteligentnych Systemów Informatycznych : doktorant, Politechnika Częstochowska, Wydział Inżynierii Mechanicznej i Informatyki, Katedra Inżynierii Komputerowej (od 2012 Instytut Inteligentnych Systemów Informatycznych). 4. Wskazanie osiągnięcia* wynikającego z art. 16 ust. 2 ustawy z dnia 14 marca 2003 r. o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki (Dz. U r. poz. 882 ze zm. w Dz. U. z 2016 r. poz ): 4.1 Tytuł osiągnięcia naukowego Problemy klasyfikacji i regresji w analizie niestacjonarnych strumieni danych. 4.2 Publikacje wchodzące w skład osiągnięcia naukowego 1) Piotr Duda, Maciej Jaworski, Leszek Rutkowski, 2018, Convergent Time-Varying Regression Models for Data Streams: Tracking Concept Drift by the Recursive Parzen-

4 Based Generalized Regression Neural Networks, International Journal of Neural Systems, Vol. 28, Issue 02, , IF=4,58, udział: 80% 2) Piotr Duda, Maciej Jaworski, Leszek Rutkowski, 2018, Knowledge discovery in data streams with the orthogonal series-based generalized regression neural networks, Information Sciences, Vol , pp , IF=4,305, udział=80% 3) Lena Pietruczuk, Leszek Rutkowski, Maciej Jaworski, Piotr Duda, 2016, A method for automatic adjustment of ensemble size in stream data mining, Neural Networks (IJCNN), 2016 International Joint Conference on, IEEE, pp. 9-15, udział=10% 4) Lena Pietruczuk, Leszek Rutkowski, Maciej Jaworski, Piotr Duda, 2017, How to adjust an ensemble size in stream data mining?, Information Sciences, Vol. 381, pp , IF=4,305, udział=10% 5) Piotr Duda, Maciej Jaworski, Leszek Rutkowski, 2017, On ensemble components selection in data streams scenario with reoccurring concept-drift, in prc. of 2017 IEEE Symposium Series on Computational Intelligence (SSCI), IEEE, pp , udział=80% 6) Piotr Duda, 2018, On Ensemble Components Selection in Data Streams Scenario with Gradual Concept-Drift, Lecture Notes in Computer Science, Springer, Vol , pp , udział=100% 7) Piotr Duda, Lena Pietruczuk, Maciej Jaworski, Adam Krzyzak, 2016, On the Cesàro- Means-Based Orthogonal Series Approach to Learning Time-Varying Regression Functions, Lecture Notes in Computer Science, Springer, Vol. 9693, pp , udział=70% 8) Piotr Duda, Maciej Jaworski, Leszek Rutkowski, 2018, Online GRNN-Based Ensembles for Regression on Evolving Data Streams. In: Huang T., Lv J., Sun C., Tuzikov A. (eds) Advances in Neural Networks ISNN ISNN Lecture Notes in Computer Science, vol , pp , Springer, udział=80% Tabela 1: Podsumowanie cyklu publikacji wchodzących w skład osiągnięcia naukowego Publikacja Udział Udział pozostałych Impact Punkty habilitanta współautorów Factor [1] 80% 10%, 10% 4,58 40 [2] 80% 10%, 10% 4, [3] 10% 70%,10%, 10% - 15 [4] 10% 70%,10%, 10% 4, [5] 80% 10%, 10% - 15 [6] 100% [7] 70% 10%, 10%, 10% - 15 [8] 80% 10%, 10% Omówienie celu naukowego ww. prac i osiągniętych wyników wraz z omówieniem ich ewentualnego wykorzystania. Wraz ze wzrostem liczby wytwarzanych danych, zwiększa się zapotrzebowanie na coraz sprawniejsze algorytmy umożliwiające ich analizę. Jednym z problemów, którym zajmują się

5 współcześnie badacze jest analiza tzw. strumieni danych. W podejściu tym zakładamy, że dane są generowane i odczytywane na bieżąco. Oznacza to, że nie jesteśmy w stanie przewidzieć jakie dane zostaną przesłane do sytemu nawet w najbliższej przyszłości. Pociąga to za sobą szereg konsekwencji, takich jak np. niemożliwość ustalenia wielkości zbioru uczącego. W efekcie projektant systemu analizującego ten typ danych musi wziąć pod uwagę pewne ograniczania, nie uwzględniane w przypadku klasycznych metod uczenia maszynowego. Można wskazać trzy najistotniejsze ograniczenia kładzione na algorytmy przetwarzające strumienie danych, tj.: - dane nie mogą być stale przechowywane. Wobec nieznanej wielkości strumienia należy założyć, że jest on dowolnie duży. Algorytm musi być w stanie w jak najkrótszym czasie zagregować informacje zawartą w bieżącej danej włączając ją w uczony model. Optymalnie dana powinna zostać przetworzona tylko raz, przed pojawieniem się kolejnej; - algorytm musi w być w stanie udzielić odpowiedzi w dowolnym momencie. W przypadku systemów, w których dane mogą być produkowane nieustannie, nie możemy założyć a priori tempa przychodzenia danych. Z tego powodu należy minimalizować czas jaki algorytm potrzebuje do przetworzenia danych. Należy unikać czasochłonnych technik uczenia jak np. uczenie epokowe czy techniki ewolucyjne; - rozkład przychodzących danych może zmieniać się w czasie analizowania strumienia. Różnice te mogą dotyczyć zarówno zmiennych objaśniających, jaki i zmiennej objaśnianej. Zjawisko niestacjonarności danych w kontekście strumieni danych nazywa się conceptdriftem. Problem zaprojektowania systemu cechującego się odpowiednio szybką i dokładną reakcją na zaistniałą niestacjonarność jest szczególnym wyzwaniem dla badaczy. Wymaga on, aby algorytm był w stanie przebudować estymowany model w dowolnym momencie i dostosować się do zaistniałych zmian. Główny nacisk w przedstawianych pracach został położony na techniki uczenia nadzorowanego, tj. klasyfikację i regresję. Cechą wspólną wszystkich prac zaliczonych do osiągnięcia jest rozważanie systemów działających w niestacjonarnym środowisku. 1) Convergent Time-Varying Regression Models for Data Streams: Tracking Concept Drift by the Recursive Parzen-Based Generalized Regression Neural Networks Główny nacisk w omawianej pracy został położony na teoretyczną analizę nieparametrycznych metod regresji z wykorzystaniem probabilistycznych sieci neuronowych opartych o tzw. jądra Parzena. Metody nieparametryczne pozwalają na estymację szerszego spektrum typu funkcji niż metody parametryczne. Jest to szczególnie istotne w analizie strumieni danych wobec dowolności zmian jakie mogą zachodzić w strumieniu. Zastosowano tu metodę regresji opartej na jądrach Parzena. Pozwala ona na przyrostowe uczenie estymatora. Oznacza to, że stosowana metoda nie wymaga przechowywania uprzednio zgromadzonych danych. Zamiast tego, w każdym ustalonym wcześniej punkcie w którym

6 chcemy badać wartość regresji, wartość estymatora jest obliczana jedynie na podstawie nowo przybyłej danej oraz poprzednio ustalonej wartości. W pracy rozważane są dwa rodzaje niestacjonarności. - W pierwszym przypadku zadaniem jest estymacja stacjonarnej funkcji regresji, wobec występowania niestacjonarnego szumu w danych przychodzących do systemu. Niestacjonarność szumu jest wyrażona poprzez zmiany w rozkładzie prawdopodobieństwa z jakiego szum jest generowany. W szczególności zakładamy, że zmianom może ulec wariancja rozkładu (dopuszczamy, że może ona dążyć do nieskończoności). W omawianej pracy, kolejno w twierdzeniach 1 i 2, przedstawione są warunki jakie muszą być spełnione, aby zapewnić zbieżność prezentowanego estymatora według prawdopodobieństwa oraz z prawdopodobieństwem 1. - W drugim przypadku rozważanym zadaniem jest estymacja niestacjonarnej funkcji regresji, wobec występowania niestacjonarnego szumu w danych przychodzących do systemu. W omawianej pracy, kolejno w twierdzeniach 3 i 4, przedstawione są warunki jakie muszą być spełnione, aby zapewnić zbieżność prezentowanego estymatora według prawdopodobieństwa oraz z prawdopodobieństwem 1. Praca zawiera również szereg przykładów (przykłady od 1 do 6) prezentujących kryteria wyborów parametrów w przypadku wystąpienia różnych rodzajów niestacjonarności (przyrostowej, powtarzającej się, mieszanej). W ramach oceny działania proponowanych algorytmów przeprowadzono szereg symulacji w oparciu o dane syntetyczne, demonstrujących zgodność otrzymywanych rezultatów z przedstawioną analizą teoretyczną. Dodatkowo porównano omawiane algorytmy z klasycznym estymatorem regresji dostosowanym do niestacjonarnego środowisko poprzez zastosowanie mechanizmu okien przesuwnych oraz metody zapominania. Praca przedstawia również możliwość zastosowania omawianych metod do rzeczywistych zadań takich jak, śledzenia zależności pomiędzy zmieniającymi się kursami wymiany walut. 2) Knowledge discovery in data streams with the orthogonal series-based generalized regression neural networks Ta praca dotyczy zastosowania szeregów ortogonalnych jako narzędzia do estymacji funkcji regresji w niestacjonarnym środowisku. Stosując estymator oparty na jądrach Parzena, użytkownik jest w zmuszony badać wartość w każdym interesującym go punkcie z osobna. W przypadku zastosowania szeregów ortogonalnych możliwe jest przyrostowe aktualizowanie jedynie pewnych parametrów, które umożliwiają wyliczenie wartości estymowanej funkcji w dowolnym punkcie dziedziny. W artykule analizowane są dwa typy niestacjonarności: niestacjonarność zaszumienia danych oraz zmieniająca się funkcja regresji. Kolejno w twierdzeniach 1 i 2 wykazana jest zbieżność

7 (według prawdopodobieństwa oraz z prawdopodobieństwem jeden) estymatora w przypadku zmiennego zaszumienia, a w twierdzeniach 3 i 4 zbieżność (według prawdopodobieństwa oraz z prawdopodobieństwem jeden) do zmieniającej się funkcji. Praca zawiera również przykłady pokazujące jak w przypadku konkretnych typów zmian dobierać parametry modelu. Poza analizą teoretyczną znaczenie każdego z tych parametrów zostało również sprawdzone eksperymentalnie. 3) A method for automatic adjustment of ensemble size in stream data mining Praca porusza problem tworzenia klasyfikatorów w kontekście strumieni danych. Jedną z najpopularniejszych w literaturze oraz skutecznie działającą w praktyce metod jest tworzenie zespołów klasyfikatorów. Ogólny schemat działania takich metod przebiega w następujących krokach: - na podstawie próbki, ostatnio przybyłych ze strumienia danych, uczony jest klasyczny klasyfikator (zwany słabym klasyfikatorem), - nowo utworzony słaby klasyfikator może zostać włączony do modelu, - dla każdej nowo przybyłej danej klasa nadawana jest jako zagregowana odpowiedź wszystkich komponentów zespołu. Dla badaczy ciągle otwartym problem pozostaje ustalenie odpowiedniego kryterium decydującego kiedy nowo utworzony słaby klasyfikator powinien zostać włączony do zespołu, a kiedy z niego usunięty. W omawianej pracy zaproponowana algorytm ASE (The Automatically Adjusting Size of Ensemble Algorithm), który decyzję o włączeniu lub nie włączaniu nowego komponentu do zespołu podejmuje na podstawie zaproponowanego testu statystycznego. Przyjęte kryterium zapewnia, że nowy komponent wniesie istotny wkład w działanie zespołu nie tylko dla bieżącej paczki danych, ale również dla całego strumienia. W celu umożliwienia algorytmowi dostosowywania się do zachodzącego concept-driftu zaproponowano również test decydujący kiedy dany komponent zespołu powinien być usunięty. Test wskazuje na usunięcie słabego klasyfikatora jeżeli jego pozostawienie w zespole pogarsza w sposób znaczący działanie zespołu dla całego strumienia. Omawiane testy zostały przedstawione w pracy w postaci twierdzeń 1 i 2. Działanie algorytmu ASE zostało sprawdzone eksperymentalnie dla różnych typów conceptdriftu (nagły oraz stopniowy) w różnym stopniu nasilenia. Otrzymane wyniki zostały porównane z innymi popularnymi algorytmami klasyfikacji danych strumieniowych. 4) How to adjust an ensemble size in stream data mining? Praca ta jest rozszerzeniem pracy A method for automatic adjustment of ensemble size in stream data mining. Ponownie poruszany jest temat doboru komponentów do zespołu w celu klasyfikacji danych strumieniowych. Zaproponowano algorytm DEEA (The Dynamically

8 Expanded Ensemble Algorithm ) w którym kolejno tworzone komponenty to drzewa decyzyjne. Przedstawione jest kryterium pozwalające określić użytkownikowi w jakim stopniu nowo utworzony słaby klasyfikator ma wpłynąć na dokładność całego zespołu. Zaproponowano również nowe kryterium ważenia odpowiedzi uzyskanych z każdego komponentu. Zamiast utrzymywać jedną wagę dla całego komponentu zaproponowano, aby każdy liść posiadał własną. Działanie algorytmu zostało potwierdzone poprzez przeprowadzenie licznych eksperymentów na danych rzeczywistych, a otrzymane wyniki zostały porównane z najpopularniejszymi algorytmami przetwarzania danych strumieniowych. 5) On ensemble components selection in data streams scenario with reoccurring concept-drift Szczególnym typem niestacjonarności rozważanym w pracach dotyczących analizy danych strumieniowych jest występowanie powtarzającego się concept-driftu. Mówimy o tym typie niestacjonarności w przypadku gdy wiemy, że dane będą generowane z kilku rozkładów danych zmieniających się między sobą co jakiś, nieokreślony czas. Przykładem takiego zjawisko może być sezonowość w danych. Omawiany artykuł dostosowuje algorytm ASE do działania w takim środowisku. Jednym z kluczowych mechanizmów każdego algorytmu zespołowego, jest sposób podejmowania decyzji o usunięciu komponentu z zespołu. W algorytmie ASE, każdy jeden komponent zespołu jest usuwany, jeżeli jego udział w podejmowaniu decyzji ma negatywny wpływ na działanie całego zespołu. W przypadku powtarzających się zmian rozkładów danych może to spowodować trwałe usunięcie z zespołu wiedzy, którą chcielibyśmy przechować w celu wykorzystania jej w przyszłości. W celu rozwiązania tego problemu zaproponowano algorytm ASE-TC (Automatically Adjusting Size of Ensemble Algorithm with Temporal Changes), który modyfikuje kryterium usunięcia komponentu z zespołu. W omawianej pracy zaproponowano dodanie dodatkowego testu. W szczególności, porównywany jest rozkład odpowiedzi zespołu oraz pojedynczego komponentu. W tym celu wykorzystywana jest dywergencja Kullbacka- Leiblera (KLD). Jeżeli otrzymana wielkość KLD jest większa niż założony przez użytkownika próg (oznaczony λ) wówczas, badany komponent nie zostanie usunięty z zespołu. Działanie algorytmu zostało przebadane eksperymentalnie pod względem wielkości wykorzystywanych paczek danych do uczenia komponentów, wielkość założonego progu λ oraz głębokości drzew wykorzystywanych jako słabe klasyfikatory. Otrzymana dokładność klasyfikacji została również porównana z innymi popularnymi metodami zespołowymi. 6) On ensemble components selection in data streams scenario with gradual conceptdrift

9 Jednym z czterech najpopularniejszych typów niestacjonarności omawianych w kontekście danych strumieniowych jest stopniowy concept-drift. Mówimy o tym typie niestacjonarności jeżeli częstotliwość pojawiania się danych generowanych z danego rozkładu zmniejsza się stopniowo, natomiast dane pochodzące z nowego rozkładu pojawiają się coraz częściej. Celem opisywanej pracy była próba usprawnienia działania algorytmu ASE, w przypadku występowania stopniowego concept-driftu Algorytm ASE dopuszcza włączenie nowego słabego klasyfikatora jedynie, jeżeli polepsza on w znaczącym stopniu działanie całego zespołu. Ocena skuteczności działania zespołu odbywa się na tzw. zasadzie prequential evaluation. Oznacza to, że nowo utworzony klasyfikator będzie oceniany dopiero na podstawie kolejnej (względem tej na której był uczony) paczki danych. Możliwa jest zatem sytuacja w której jedna paczka danych będzie zawierała w większości dane pochodzące z nowego rozkładu, a w kolejnej paczce danych będą przeważały dane ze starego rozkładu. W takiej sytuacji algorytm ASE nie pozwoli na zachowanie wiedzy, która może okazać się użyteczna w przyszłości. W celu rozwiązania tego problemu zmodyfikowano kryterium dodawania komponentów do zespołu, poprzez dodanie nowego testu. Porównywany jest w nim rozkład odpowiedzi zespołu oraz pojedynczego komponentu na podstawie odległości Hellingera. Otrzymana wielkość porównywana jest z wartością progową wskazaną przez użytkownika. Działanie algorytmu zostało przebadane eksperymentalnie pod względem wielkości wykorzystywanych paczek danych do uczenia komponentów, wysokości założonego progu oraz głębokości drzew wykorzystywanych jako słabe klasyfikatory. 7) On the Cesàro-Means-Based Orthogonal Series Approach to Learning Time-Varying Regression Functions W tym artykule została zaproponowana nieparametryczna metoda śledzenie niestacjonarnej funkcji regresji oparta o metodę tzw. średnich Cesaro. Metoda ta pozwala na badanie zbieżności szerszego spektrum szeregów ortogonalnych niż klasyczne metody. W artykule przedstawiona jest zbieżność proponowanego algorytmu według prawdopodobieństwa. Przeprowadzono również symulacje numeryczne z wykorzystaniem szeregów Furiera, w szczególności, z użyciem tzw. jąder Fejera. Przeprowadzone symulacje potwierdziły zgodność analizy teoretycznej z oczekiwanymi rezultatami. 8) Online GRNN-Based Ensembles for Regression on Evolving Data Streams Analizowane w poprzednich pracach metody śledzenia niestacjonarnej funkcji regresji umożliwiają śledzenie szerokiego spektrum zmian, nie są jednak w stanie skutecznie zareagować na natychmiastową zmianę rozkładu danych. W celu usprawnienia ich działania zaproponowano stworzenia zespołu uogólnionych regresyjnych sieci neuronowych. Zaproponowany algorytm E-GRNN (Online GRNN-Based Ensembles) inicjuje po otrzymaniu określonej liczby danych nowy estymator regresji. Wraz z napływem danych uaktualniane są wszystkie komponenty zespołu. Po zebraniu całej paczki danych komponenty zespołu

10 podlegają ocenie. Odpowiedź zespołu zostaje ustalona jako średnia ważona wszystkich estymatorów zgromadzonych w zespole. Wagi dla poszczególnych składowych zespołu ustalane są jako odwrotność miary zwanej częścią niewyjaśnionej wariancji. Przeprowadzone symulacje wykazały, że zastosowanie metody zespołowej polepsza uzyskiwane wyniki. 5. Omówienie pozostałych osiągnięć naukowo - badawczych. Łączny dorobek publikacyjny habilitanta, z okresów przed i po uzyskania stopnia doktora, stanowi 35 publikacji. W Tabeli 1 przedstawiono rozkład liczby publikacji na publikacje poszczególnych typów. Tabela 2: Wszystkie opublikowane publikacje Rodzaj publikacji Liczba publikacji Publikacje zamieszczone w czasopismach Journal Citation Reports 8 Pozostałe publikacje z bazy Web of Sience 19 Pozostałe publikacje 7 Razem 34 Dane bibliograficzne: Liczba cytowani: 398 ( 325 bez autocytowań) h-index: Dorobek naukowo badawczy przed uzyskaniem stopnia naukowego doktora. W mojej pracy badawczej przed uzyskaniem stopnia naukowego doktora zajmowałem się przede wszystkim zagadnieniem klasyfikacji statycznych danych strumieniowych (bez występowania concept-driftu). Wraz z zespołem wykryliśmy błąd w jednym z najpopularniejszych algorytmów analizy takich danych nazwanym drzewami Hoeffdinga. Metoda ta pozwalała na tworzenie drzew decyzyjnych z statycznych strumieni danych. Autorzy oryginalnej pracy, która posiadała setki cytowani, pokazują jak konstruować drzewa decyzyjne bez konieczności wielokrotnego przetwarzania tych samych elementów. Kluczowym elementem algorytmu było kryterium doboru atrybutu do dokonania podziału w węźle drzewa decyzyjnego. Zaproponowano tam tzw. kryterium Hoeffdinga, które było matematycznie uzasadniane z wykorzystaniem nierówności Hoeffdinga. Wykazaliśmy, jako pierwsi na świecie, że zaproponowana metoda nie może być łączona z najpopularniejszymi miarami jakości podziału, jak przyrost informacji, czy indeks Giniego. W cyklu prac opublikowanych w czołowych czasopismach, takich jak IEEE Transaction on Knowledge and Data Engineering i Information Sciences przedstawiliśmy własne kryteria, które mogą z powodzeniem zastąpić kryterium Hoeffdinga. Tematyka ta była następnie przedmiotem mojej rozprawy doktorskiej pt. Data stream classification algoritms (pol. Algorytmy klasyfikacji danych strumieniowych ). W rozprawie doktorskiej badano problem uzasadnionego wyboru atrybutów do dokonywania podziałów w kolejnych węzłach drzewa

11 decyzyjnego przy potencjalnie nieskończonym zbiorze uczącym. Zaproponowane metody pozwalają na sprawdzenie, czy atrybut najlepszy dla dostępnej próbki danych jest również najlepszy dla całego strumienia danych. Decyzja jest podejmowana na poziomie istotności ustalonym przez użytkownika. Stwierdzenie, że atrybut jest najlepszy do dokonania podziału oznacza, że wartość miary jakości podziału jest najwyższa spośród wszystkich atrybutów. W pracy analizowane są trzy miary jakości podziału: przyrost informacji, zysk indeksu Giniego oraz zmniejszenie błędu klasyfikacji. Tematyka rozprawy jest silnie związana z algorytmem drzew Hoeffdinga, który jest jednym z najpopularniejszych narzędzi analizy danych strumieniowych. Metody przedstawione w pracy pozwalają uzupełnić lukę, powstałą po wykryciu niepoprawności uzasadnienia oryginalnego algorytmu drzew Hoeffdinga. W pracy przedstawione zostały trzy nowe metody uzasadniające dobór odpowiedniego atrybutu do dokonania podziału w węźle. Pierwsza metoda pozwala porównywać wartości miar jakości podziału dla dwóch atrybutów w oparciu o nierówność McDiarmida. W drugiej metodzie decyzja jest podejmowana na podstawie rozkładów wartości miar jakości podziałów dla dwóch atrybutów, przybliżanych rozkładami normalnymi. Trzecia metoda pozwala na wyznaczenie przedziałów ufności dla miar jakości podziału wszystkich atrybutów oraz wskazuje optymalny atrybut, gdy te przedziały stają się rozłączne. Zaproponowane metody, połączone z ideą drzew Hoeffdinga, pozwoliły na stworzenie algorytmów generujących drzewa decyzyjne ze strumieni danych. W zależności od zastosowanej metody są to, odpowiednio, drzewa McDiarmida, drzewa Gaussa oraz drzewa przedziałowe. Wszystkie algorytmy zostały ze sobą porównane zarówno teoretycznie, jak i eksperymentalnie. Jak wykazały przeprowadzone symulacje, zaproponowane rozwiązania mogą być z powodzeniem stosowane do analizy danych strumieniowych. 5.2 Dorobek naukowo badawczy po uzyskaniu stopnia naukowego doktora Na dorobek publikacyjny habilitanta po uzyskaniu stopnia doktora składa się 13 prac, z czego 8 z nich wchodzi w skład przedstawianego osiągnięcia naukowego Tabela 3: Publikacje opublikowane po uzyskaniu stopnia doktora Rodzaj publikacji Liczba publikacji Publikacje zamieszczone w czasopismach Journal Citation Reports 4 Pozostałe publikacje z bazy Web of Sience 6 Pozostałe publikacje 3 Razem 13 Do najistotniejszych osiągnięć, które współtworzyłem po uzyskaniu stopnia naukowego doktora, a nie są częścią przedkładanego osiągnięcia, zaliczam następujące artykuły

12 Maciej Jaworski, Piotr Duda, Leszek Rutkowski, New Splitting Criteria for Decision Trees in Stationary Data Streams, IEEE transactions on neural networks and learning systems 29.6 (2018): Praca ta kontynuuje zganienia poruszane w mojej rozprawie doktorskiej. W artykule poruszany jest problem uczenia drzew decyzyjnych na podstawie strumieni danych. Praca zawiera głęboką analizę znaczenia wyboru konkretnej miary jakości podziału. Rozróżnione są w niej dwa typy kryteriów wyboru najlepszego atrybutu do dokonania podziału w węźle drzewa decyzyjnego. Pierwszy typ to kryteria zapewniające, z określonym prawdopodobieństwem, że atrybut wybrany przez te kryteria maksymalizuje miarę jakości podziału. Kryteria drugiego typu zapewniają, że wskazany atrybut będzie również najlepszy dla całego strumienia. Praca wprowadza trzy nowe kryteria (dwa pierwszego typu oraz jedno drugiego typu), oraz dodatkowo tzw. kryteria hybrydowe (wykorzystujące równocześnie różne miary jakości podziału). W szczególności, przedstawiona jest w niej miara jakości podziału oparta o błąd klasyfikacji. W literaturze miara ta jest stosunkowo rzadko przytaczana w kontekście drzew decyzyjnych. Zauważyliśmy jednak, że posiada ona cechy szczególnie korzystne w analizie strumieni danych. Kluczowym problemem w konstrukcji drzew decyzyjnych ze strumieni danych jest minimalizacja liczby danych koniecznych do podjęcia decyzji o wyborze najlepszego atrybutu. Drzewa tworzone przy pomocy miary opartej na błędzie klasyfikacji posiadają tą własność, że na początku rozrost drzewa jest bardzo szybki, po czym zostaje on zablokowany. Dzieje się tak ponieważ zastosowanie tej miary nie daje możliwości dokonania podziału, który jedynie porządkowałby dane, a nie zwiększał w sposób znaczący dokładności klasyfikatora. Wobec tego zaproponowaliśmy połączenie kryterium porównującego przydatność atrybutu na podstawie miary opartej na błędzie klasyfikacji z kryterium wykorzystującym zysk indeksu Giniego. Wykazano eksperymentalnie, że ciągle najpopularniejsze kryterium Hoeffdinga, nie ma uzasadnienia nawet jako kryterium heurystyczne. W tym celu porównano dokładności osiągane przez drzewa Hoeffdinga oraz drzewa uzyskane poprzez arbitralne zmniejszenie stałej w kryterium Hoeffdinga. Maciej Jaworski, Piotr Duda, Leszek Rutkowski, Patryk Najgebauer, Miroslaw Pawlak, Heuristic Regression Function Estimation Methods for Data Streams with Concept Drift, Lecture Notes in Computer Science, Springer, Cham, Vol , pp Praca dotyczy śledzenia funkcji regresji w niestacjonarnym środowisku. W szczególności przedmiotem pracy była analiza heurystycznych metod umożliwiających zastosowanie probabilistycznych sieci neuronowych w celu estymacji regresji wobec występowania concept-driftu. W tym celu przebadano dwie metody, tj. okna przesuwne i mechanizm zapominania. Metoda okien przesuwnych jest powszechnie stosowana w analizie strumieni danych. Polega ona na przechowywaniu w pamięci jedynie pewnej liczby ostatnio przybyłych danych. Oznacza to, że wraz z napływem nowej danej jest ona zachowywana w pamięci

13 kosztem najstarszej danej w obecnym oknie. Probabilistyczne sieci neuronowe posiadają własności umożliwiającą aktualizowanie ich dana po danej, wobec tego nie wymagają one ciągłego przeuczania modelu. Zmiany ograniczone są jedynie do wprowadzenia usunięcia informacji związanej z najstarszą daną i dodania nowej. Mechanizm zapominania polega na wymnażaniu, wraz z każdą kolejną daną, wcześniejszych wartość przez pewną stałą z przedziału od 0 do 1. W konsekwencji znaczenie starych danych jest stale zmniejszane, a dominującą rolę zachowują aktualne dane. Niewielka modyfikacja klasycznych probabilistycznych sieci neuronowych umożliwia wprowadzenie do nich mechanizmu zapominania. Maciej Jaworski, Piotr Duda, Leszek Rutkowski, On applying the Restricted Boltzmann Machine to active concept drift detection, in proc. of 2017 IEEE Symposium Series on Computational Intelligence (SSCI), IEEE, pp W tym artykule badaliśmy możliwości zastosowania restrykcyjnej maszyny Boltzmanna jako detektora concept-driftu. Zadanie wykrywania concep-dryftu jest jednym z częściej poruszanych problemów analizy danych strumieniowych. Dobrze działający detektor musi optymalizować dwa kryteria. Po pierwsze musi być w stanie zaalarmować system w jak najkrótszym czasie od wystąpienia niestacjonarności w strumieniu. Po drugie musi minimalizować liczbę fałszywych alarmów, czyli sytuacji w których detektor informuje system o zaistniałej zmianie pomimo, że w rzeczywistości ona nie nastąpiła. Restrykcyjne maszyny Boltzmanna zawierają wiedzę o rozkładzie danych treningowych, wobec czego mogą one być wykorzystane do sprawdzenia, czy nowo przybyła dane pochodzą z poprzednio nauczonego rozkładu, czy też nie. W celu porównania rozkładu nowych danych z wyuczonym rozkładem zastosowano dwie miary, tj. energię swobodną oraz błąd rekonstrukcji. Wyniki symulacji wykazały przydatność proponowanej metody zarówno w przypadku występowania nagłych zmian, jak i stopniowych. Maciej Jaworski, Piotr Duda, Leszek Rutkowski, 2018, Concept Drift Detection in Streams of Labelled Data Using the Restricted Boltzmann Machine, in proc. of IEEE International Joint Conference on Neural Networks (IJCNN), Rio de Janeiro, Brazylia Celem pracy jest ulepszenie działania ograniczonej maszyny Boltzmana w celu detekcji concept-driftu. W tym celu do klasycznego schematu ograniczonej maszyny Boltzmana dodano trzecią wartą typu softmax, która jest połączona jedynie z warstwą ukrytą. Zauważono również, że sieć pozwala na przechowywanie informacji o klasie elementów (nie jest konieczne tworzenie osobnej sieci dla każdej z klas). Sieć jest uczona poprzez zmodyfikowaną metodę Contrastive Divergence, umożliwiającą nauczenie wag pomiędzy warstwą ukrytą, a warstwą softmax. W celu śledzenia zmian zastosowano dwie miary energię swobodną oraz błąd rekonstrukcji, które połączono z metodę okien przesuwnych. Piotr Duda, et al., 2016, On the Application of Orthogonal Series Density Estimation for Image Classification Based on Feature Description, Knowledge, Information and Creativity

14 Support Systems: Recent Trends, Advances and Solutions. Advances in Intelligent Systems and Computing, Springer, Cham, vol 364, pp Praca ta dotyczyła wykorzystania nieparametrycznych metod estymacji gęstości do selekcji punktów kluczowych obrazów w celu ich klasyfikacji. Tematyka klasyfikacji obrazów, bazując na treści w nich zawartej, jest ciągle gorącym tematem w literaturze naukowej. Jednym z podejść pozwalających analizować treści zawarte na obrazie była detekcja punktów kluczowych obrazu oraz ich deskryptorów. W pracy uwzględniono punkty kluczowe generowane przez jedne z najpopularniejszych dedykowanych do tego algorytmów SIFT i SURF. W zależności od parametrów tych algorytmów generowana jest pewna liczba punktów kluczowych. Dla każdego obrazu liczba ta może być inna. Obraz zawiera zarówno punkty kluczowe obiektu charakterystycznego dla klasy, jak i punkty kluczowe innych obiektów stanowiących zaszumienie. Idea proponowanego algorytmu polegała na porównywaniu rozkładów wartości deskryptorów punktów kluczowych obrazów danej klasy z deskryptorami punktów kluczowych rozważanego obrazu. Dla każdej klasy ustalany jest, w sposób automatyczny, próg determinujący jaka część wartości wygenerowanych deskryptorów musi się zgadzać z deskryptorami danej klasy w zbiorze uczącym. 5.3 Inne osiągnięcia naukowo badawcze po uzyskaniu stopnia doktora Recenzje W czasie od obrony doktoratu wykonywałem recenzje do różnych czasopism. IEEE Transaction on Knowledge and Data Engineering, : 2 recenzje, Expert Systems with Applications, : 3 recenzje, Entropy, 2018: 1 recenzja, IEEE Transaction on Neural Networks and Learning Systems, : 2 recenzje, Pattern Recognition Letters, : 1 recenzja Information System, 2017: 1 recenzja Udział w projektach a) Nowe podejście do modelowania w niestacjonarnym środowisku, 2015, Opus, Narodowe Centrum Nauki, wykonawca Udział w konferencjach naukowych a) IEEE International Joint Conference on Neural Networks (IJCNN), Vancouver, Kanada, 2016 b) The 15 th International Conference on Artificial Intelligence and Soft Computing, Zakopane, Polska, 2016; c) The 16 th International Conference on Artificial Intelligence and Soft Computing Zakopane, Polska, 2017; d) The 2017 IEEE Symposium Series on Computational Intelligence, Honolulu, Stany Zjednoczone Ameryki Północnej, 2017; e) The 17 th International Conference on Artificial Intelligence and Soft Computing, Zakopane, Polska, 2018; f) 15 th International Symposium on Neural Networks, Mińsk, 2018

15 g) IEEE International Joint Conference on Neural Networks (IJCNN), Rio de Janeiro, Brazylia, Wykaz dorobku dydaktycznego Inteligencja obliczeniowa, wykład; Podstawy sieci komputerowych Programowanie stron internetowych Pozostałe a) Pomoc przy organizacji konferencji International Conference on Artificial Intelligence and Soft Computing w latach 2012, 2013, 2014, 2015, 2016, 2017, 2018; b) Współorganizacja sesji specjalnej Workshop: Stream Data Mining" w ramach konferencji The 16th International Conference on Artificial Intelligence and Soft Computing ICAISC 2017; c) Udział w spotkaniach "Polskiej grupy badawczej systemów uczących się" (SIG-ML) od 2013 roku; d) Współorganizacja VI spotkania grupy SIG-ML, Częstochowa, 14 kwietnia 2016 e) Członek Polskiego towarzystwa sieci neuronowych od 2018; f) Udział w komisji rekrutacyjnej na Wydziale Inżynierii Mechanicznej i Informatyki, Politechniki Częstochowskiej ; g) Promotor pomocniczy doktoranta Piotra Woldana, który otworzył przewód 21 czerwca 2018 roku na Wydziale Inżynierii Mechanicznej i Informatyki, tytuł rozprawy: Hybrydowe struktury uczenia głębokiego, wsparte technologią NLP w zastosowaniu do systemów rekomendacyjnych.

do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT

do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT Załącznik 2A do Wniosku o przeprowadzenie postępowania habilitacyjnego w dziedzinie nauk technicznych w dyscyplinie informatyka AUTOREFERAT dr inż. Maciej Jaworski Politechnika Częstochowska Wydział Inżynierii

Bardziej szczegółowo

Dariusz Brzeziński. Politechnika Poznańska

Dariusz Brzeziński. Politechnika Poznańska Dariusz Brzeziński Politechnika Poznańska Klasyfikacja strumieni danych Algorytm AUE Adaptacja klasyfikatorów blokowych do przetwarzania przyrostowego Algorytm OAUE Dlasze prace badawcze Blokowa i przyrostowa

Bardziej szczegółowo

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych. mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni

Bardziej szczegółowo

Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning

Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach to Feature Selection and Machine Learning Warszawa, 30.01.2017 Prof. Dr hab. Henryk Rybinski Instytut Informatyki Politechniki Warszawskiej hrb@ii.pw.edu.pl Recenzja rozprawy doktorskiej mgr Mirona Bartosza Kursy p/t. Robust and Efficient Approach

Bardziej szczegółowo

mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas. mgr inż. Magdalena Deckert Poznań, 01.06.2010r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas. Plan prezentacji Wstęp Concept drift Typy zmian Podział algorytmów stosowanych w uczeniu

Bardziej szczegółowo

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja

Bardziej szczegółowo

Opinia o dorobku naukowym dr inż. Ireneusz Dominik w związku z wystąpieniem o nadanie stopnia naukowego doktora habilitowanego.

Opinia o dorobku naukowym dr inż. Ireneusz Dominik w związku z wystąpieniem o nadanie stopnia naukowego doktora habilitowanego. Prof. dr hab. inż. Tadeusz Uhl Katedra Robotyki i Mechatroniki Wydział Inżynierii Mechanicznej i Robotyki Akademia Górniczo Hutnicza w Krakowie Kraków 01.07.2018 Opinia o dorobku naukowym dr inż. Ireneusz

Bardziej szczegółowo

RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk

RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk Wprowadzenie RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk Magdalena Deckert Politechnika Poznańska, Instytut Informatyki Seminarium ISWD, 21.05.2013 M. Deckert Przyrostowy

Bardziej szczegółowo

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania

Bardziej szczegółowo

UCHWAŁA. Wniosek o wszczęcie przewodu doktorskiego

UCHWAŁA. Wniosek o wszczęcie przewodu doktorskiego UCHWAŁA 30 czerwiec 2011 r. Uchwała określa minimalne wymagania do wszczęcia przewodu doktorskiego i przewodu habilitacyjnego jakimi powinny kierować się Komisje Rady Naukowej IPPT PAN przy ocenie składanych

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Recenzja rozprawy doktorskiej mgr Łukasza Gadomera pt. Rozmyte lasy losowe oparte na modelach klastrowych drzew decyzyjnych w zadaniach klasyfikacji

Recenzja rozprawy doktorskiej mgr Łukasza Gadomera pt. Rozmyte lasy losowe oparte na modelach klastrowych drzew decyzyjnych w zadaniach klasyfikacji Prof. dr hab. inż. Eulalia Szmidt Instytut Badań Systemowych Polskiej Akademii Nauk ul. Newelska 6 01-447 Warszawa E-mail: szmidt@ibspan.waw.pl Warszawa, 30.04.2019r. Recenzja rozprawy doktorskiej mgr

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie

Bardziej szczegółowo

Metody selekcji cech

Metody selekcji cech Metody selekcji cech A po co to Często mamy do dyspozycji dane w postaci zbioru cech lecz nie wiemy które z tych cech będą dla nas istotne. W zbiorze cech mogą wystąpić cechy redundantne niosące identyczną

Bardziej szczegółowo

Dr inż. Marcin Zalasiński

Dr inż. Marcin Zalasiński Autoreferat podsumowujący dorobek i osiągnięcia naukowe kandydata do uzyskania stopnia doktora habilitowanego w dziedzinie nauk technicznych i dyscyplinie informatyka Dr inż. Marcin Zalasiński Politechnika

Bardziej szczegółowo

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0 Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia

Bardziej szczegółowo

Badania w sieciach złożonych

Badania w sieciach złożonych Badania w sieciach złożonych Grant WCSS nr 177, sprawozdanie za rok 2012 Kierownik grantu dr. hab. inż. Przemysław Kazienko mgr inż. Radosław Michalski Instytut Informatyki Politechniki Wrocławskiej Obszar

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA Zał. nr 4 do ZW WYDZIAŁ ELEKTRONIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA MATEMATYCZNA Nazwa w języku angielskim Mathematical Statistics Kierunek studiów (jeśli dotyczy): Specjalność (jeśli

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne) Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu ID1SII4 Nazwa modułu Systemy inteligentne 1 Nazwa modułu w języku angielskim Intelligent

Bardziej szczegółowo

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja

Bardziej szczegółowo

Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych

Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Politechnika Łódzka Streszczenie rozprawy doktorskiej Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania

Bardziej szczegółowo

II - EFEKTY KSZTAŁCENIA

II - EFEKTY KSZTAŁCENIA II - EFEKTY KSZTAŁCENIA 1. Opis zakładanych efektów kształcenia Nazwa wydziału Nazwa studiów Określenie obszaru wiedzy, dziedziny nauki i dyscypliny naukowej Wydział Matematyczno-Fizyczny studia III stopnia

Bardziej szczegółowo

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561

Bardziej szczegółowo

REGULAMIN postępowania konkursowego przy zatrudnianiu na stanowiska naukowe w Instytucie Genetyki i Hodowli Zwierząt PAN asystenta adiunkta

REGULAMIN postępowania konkursowego przy zatrudnianiu na stanowiska naukowe w Instytucie Genetyki i Hodowli Zwierząt PAN asystenta adiunkta REGULAMIN postępowania konkursowego przy zatrudnianiu na stanowiska naukowe w Instytucie Genetyki i Hodowli Zwierząt PAN na podstawie art. 91 p. 5 Ustawy o polskiej Akademii Nauk z dnia 30 kwietnia 2010

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina

Bardziej szczegółowo

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing MAGICIAN czyli General Game Playing w praktyce General Game Playing 1 General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej w ramach AAAI National Conference

Bardziej szczegółowo

efekty kształcenia dla kierunku Elektronika studia stacjonarne drugiego stopnia, profil ogólnoakademicki

efekty kształcenia dla kierunku Elektronika studia stacjonarne drugiego stopnia, profil ogólnoakademicki Opis efektów dla kierunku Elektronika Studia stacjonarne drugiego stopnia, profil ogólnoakademicki Objaśnienie oznaczeń: K kierunkowe efekty W kategoria wiedzy U kategoria umiejętności K (po podkreślniku)

Bardziej szczegółowo

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18 Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)

Bardziej szczegółowo

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Algorytmy metaheurystyczne Wykład 11. Piotr Syga Algorytmy metaheurystyczne Wykład 11 Piotr Syga 22.05.2017 Drzewa decyzyjne Idea Cel Na podstawie przesłanek (typowo zbiory rozmyte) oraz zbioru wartości w danych testowych, w oparciu o wybrane miary,

Bardziej szczegółowo

Ocena osiągnięć Dr. Adama Sieradzana w związku z ubieganiem się o nadanie stopnia naukowego doktora habilitowanego.

Ocena osiągnięć Dr. Adama Sieradzana w związku z ubieganiem się o nadanie stopnia naukowego doktora habilitowanego. Prof. dr hab. Szczepan Roszak Katedra Inżynierii i Modelowania Materiałów Zaawansowanych Wydział Chemiczny Politechniki Wrocławskiej e-mail: szczepan.roszak@pwr.edu.pl Wrocław, 12. 12. 2018 r. Ocena osiągnięć

Bardziej szczegółowo

Matryca weryfikacji efektów kształcenia - studia III stopnia

Matryca weryfikacji efektów kształcenia - studia III stopnia Ocena publicznej obrony pracy doktorskiej Ocena rozprawy doktorskiej Ocena opublikowanych prac naukowych Ocena uzyskanych projektów badawczych Ocena przygotowania referatu na konferencję Ocena wystąpienia

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

2. Empiryczna wersja klasyfikatora bayesowskiego

2. Empiryczna wersja klasyfikatora bayesowskiego Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski

Bardziej szczegółowo

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI Zał. nr 4 do ZW WYDZIAŁ ELEKTRONIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA MATEMATYCZNA (EiT stopień) Nazwa w języku angielskim Mathematical Statistics Kierunek studiów (jeśli dotyczy): Specjalność

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Krzysztof Jajuga Katedra Inwestycji Finansowych i Zarządzania Ryzykiem Uniwersytet Ekonomiczny we Wrocławiu NAUKI EKONOMICZNE - HABILITACJA

Krzysztof Jajuga Katedra Inwestycji Finansowych i Zarządzania Ryzykiem Uniwersytet Ekonomiczny we Wrocławiu NAUKI EKONOMICZNE - HABILITACJA Krzysztof Jajuga Katedra Inwestycji Finansowych i Zarządzania Ryzykiem Uniwersytet Ekonomiczny we Wrocławiu NAUKI EKONOMICZNE - HABILITACJA UWAGA!!!! Przedstawiane poglądy są prywatnymi poglądami autora

Bardziej szczegółowo

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka Uniwersytet Śląski Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA Studia III stopnia (doktoranckie) kierunek Informatyka (przyjęty przez Radę Wydziału Informatyki i Nauki o Materiałach w

Bardziej szczegółowo

. Wykaz dorobku habilitacyjnego nauki społeczne OBSZAR NAUK SPOŁECZNYCH

. Wykaz dorobku habilitacyjnego nauki społeczne OBSZAR NAUK SPOŁECZNYCH . Wykaz dorobku habilitacyjnego nauki społeczne OBSZAR NAUK SPOŁECZNYCH Wykaz opublikowanych prac naukowych lub twórczych prac zawodowych oraz informacja o osiągnięciach dydaktycznych, współpracy naukowej

Bardziej szczegółowo

Algorytmy klasyfikacji

Algorytmy klasyfikacji Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA Załącznik do Uchwały Senatu Politechniki Krakowskiej z dnia 28 czerwca 2017 r. nr 58/d/06/2017 Politechnika Krakowska im. Tadeusza Kościuszki w Krakowie Nazwa wydziału Wydział Inżynierii Środowiska Dziedzina

Bardziej szczegółowo

Rozmyte drzewa decyzyjne. Łukasz Ryniewicz Metody inteligencji obliczeniowej

Rozmyte drzewa decyzyjne. Łukasz Ryniewicz Metody inteligencji obliczeniowej µ(x) x µ(x) µ(x) x x µ(x) µ(x) x x µ(x) x µ(x) x Rozmyte drzewa decyzyjne Łukasz Ryniewicz Metody inteligencji obliczeniowej 21.05.2007 AGENDA 1 Drzewa decyzyjne kontra rozmyte drzewa decyzyjne, problemy

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych (pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia

Bardziej szczegółowo

Recenzja rozprawy doktorskiej mgr inż. Joanny Wróbel

Recenzja rozprawy doktorskiej mgr inż. Joanny Wróbel Prof. dr hab. inż. Tadeusz BURCZYŃSKI, czł. koresp. PAN Instytut Podstawowych Problemów Techniki PAN ul. A. Pawińskiego 5B 02-106 Warszawa e-mail: tburczynski@ippt.pan.pl Warszawa, 15.09.2017 Recenzja

Bardziej szczegółowo

Prof. dr hab. Krzysztof Dems Łódź, dn. 28 grudnia 2014 r. ul. Dywizjonu 303 nr Łódź

Prof. dr hab. Krzysztof Dems Łódź, dn. 28 grudnia 2014 r. ul. Dywizjonu 303 nr Łódź Prof. dr hab. Krzysztof Dems Łódź, dn. 28 grudnia 2014 r. ul. Dywizjonu 303 nr 9 94-237 Łódź R E C E N Z J A osiągnięć naukowo-badawczych, dorobku dydaktycznego i popularyzatorskiego oraz współpracy międzynarodowej

Bardziej szczegółowo

Uniwersytet Rolniczy w Krakowie Wydział Inżynierii Produkcji i Energetyki

Uniwersytet Rolniczy w Krakowie Wydział Inżynierii Produkcji i Energetyki Uniwersytet Rolniczy w Krakowie Wydział Inżynierii Produkcji i Energetyki Efekty dla programu : Kierunek: Zarządzanie i inżynieria produkcji Specjalności: Inżynieria produkcji surowcowej, Infrastruktura

Bardziej szczegółowo

Systemy uczące się wykład 2

Systemy uczące się wykład 2 Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania

Bardziej szczegółowo

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

komputery? Andrzej Skowron, Hung Son Nguyen  Instytut Matematyki, Wydział MIM, UW Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,

Bardziej szczegółowo

Instytut Kultury Fizycznej

Instytut Kultury Fizycznej FORMULARZ DLA OGŁOSZENIODAWCÓW INSTYTUCJA: Uniwersytet Kazimierza Wielkiego, Wydział Kultury Fizycznej, Zdrowia i Turystyki, Instytut Kultury Fizycznej MIASTO: Bydgoszcz STANOWISKO: profesor zwyczajny

Bardziej szczegółowo

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU

Bardziej szczegółowo

Ustawa z dnia 14 marca 2003 roku o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki

Ustawa z dnia 14 marca 2003 roku o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki Ustawa z dnia 14 marca 2003 roku o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki Rozporządzenie Ministra Nauki i Szkolnictwa Wyższego z dnia 1 września 2011 roku w sprawie

Bardziej szczegółowo

Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska

Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości

Bardziej szczegółowo

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

DRZEWA REGRESYJNE I LASY LOSOWE JAKO DRZEWA REGRESYJNE I LASY LOSOWE JAKO NARZĘDZIA PREDYKCJI SZEREGÓW CZASOWYCH Z WAHANIAMI SEZONOWYMI Grzegorz Dudek Instytut Informatyki Wydział Elektryczny Politechnika Częstochowska www.gdudek.el.pcz.pl

Bardziej szczegółowo

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI WYDZIAŁ GEOINŻYNIERII, GÓRNICTWA I GEOLOGII KARTA PRZEDMIOTU Nazwa w języku polskim: Statystyka matematyczna Nazwa w języku angielskim: Mathematical Statistics Kierunek studiów (jeśli dotyczy): Górnictwo

Bardziej szczegółowo

Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej

Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej 1 Zastosowania Metod Inteligencji Obliczeniowej Tomasz Pawlak 2 Plan prezentacji Sprawy organizacyjne Wprowadzenie do metod inteligencji obliczeniowej Studium wybranych przypadków zastosowań IO 3 Dane

Bardziej szczegółowo

IMiIP - Informatyka Stosowana - opis kierunku 1 / 5

IMiIP - Informatyka Stosowana - opis kierunku 1 / 5 IMiIP Informatyka Stosowana opis kierunku 1 / 5 Warunki rekrutacji na studia Wymagania wstępne i dodatkowe: Kandydat na studia I stopnia na kierunku Informatyka Stosowana powinien posiadać kompetencje

Bardziej szczegółowo

Odniesienie symbol II/III [1] [2] [3] [4] [5] Efekt kształcenia. Wiedza

Odniesienie symbol II/III [1] [2] [3] [4] [5] Efekt kształcenia. Wiedza Efekty dla studiów drugiego stopnia profil ogólnoakademicki na kierunku Inżynieria i Analiza Danych prowadzonym przez Wydział Matematyki i Nauk Informacyjnych Użyte w poniższej tabeli: 1) w kolumnie 4

Bardziej szczegółowo

UCHWAŁA nr 03/2015/2016 Rady Wydziału Informatyki Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 20 października 2015 r.

UCHWAŁA nr 03/2015/2016 Rady Wydziału Informatyki Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 20 października 2015 r. UCHWAŁA nr 03/2015/2016 Rady Wydziału Informatyki Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie z dnia 20 października 2015 r. w sprawie zatwierdzenia zasad procesu dyplomowania realizowanego

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

Ocena osiągnięć naukowych dra inż. Wojciecha Sumelki w związku z postępowaniem habilitacyjnym w dziedzinie nauk technicznych w dyscyplinie budownictwo

Ocena osiągnięć naukowych dra inż. Wojciecha Sumelki w związku z postępowaniem habilitacyjnym w dziedzinie nauk technicznych w dyscyplinie budownictwo Prof. dr hab. Tadeusz Burczyński, czł. koresp. PAN Instytut Podstawowych Problemów Techniki PAN ul. A. Pawińskiego 5 B 02-106 Warszawa E-mail: tburczynski@ippt.pan.pl Warszawa, 25.10.2014 Ocena osiągnięć

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną

Bardziej szczegółowo

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność

Bardziej szczegółowo

kierunkowy (podstawowy / kierunkowy / inny HES) nieobowiązkowy (obowiązkowy / nieobowiązkowy) polski drugi semestr letni (semestr zimowy / letni)

kierunkowy (podstawowy / kierunkowy / inny HES) nieobowiązkowy (obowiązkowy / nieobowiązkowy) polski drugi semestr letni (semestr zimowy / letni) Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania

Bardziej szczegółowo

Drzewa decyzyjne i lasy losowe

Drzewa decyzyjne i lasy losowe Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM

Bardziej szczegółowo

TRYB PRZEPROWADZANIA POSTĘPOWANIA HABILITACYJNEGO W WOJSKOWYM INSTYTUCIE MEDYCZNYM

TRYB PRZEPROWADZANIA POSTĘPOWANIA HABILITACYJNEGO W WOJSKOWYM INSTYTUCIE MEDYCZNYM TRYB PRZEPROWADZANIA POSTĘPOWANIA HABILITACYJNEGO W WOJSKOWYM INSTYTUCIE MEDYCZNYM 1. Rada Naukowa posiada uprawnienia do nadawania stopnia naukowego doktora habilitowanego w dziedzinie: nauk medycznych

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział: Matematyki Kierunek studiów: Matematyka i Statystyka (MiS) Studia w j. polskim Stopień studiów: Pierwszy (1) Profil: Ogólnoakademicki (A) Umiejscowienie kierunku

Bardziej szczegółowo

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych (pieczęć wydziału) KARTA PRZEDMIOTU Z1-PU7 WYDANIE N1 Strona 1 z 5 1. Nazwa przedmiotu: Rachunek prawdopodobieństwa i statystyka matematyczna 2. Kod przedmiotu: RPiS 3. Karta przedmiotu ważna od roku akademickiego:

Bardziej szczegółowo

tel. (+4861) fax. (+4861)

tel. (+4861) fax. (+4861) dr hab. inż. Michał Nowak prof. PP Politechnika Poznańska, Instytut Silników Spalinowych i Transportu Zakład Inżynierii Wirtualnej ul. Piotrowo 3 60-965 Poznań tel. (+4861) 665-2041 fax. (+4861) 665-2618

Bardziej szczegółowo

2. Autor/autorzy, data wydania, tytuł, wydawca lub czasopismo, tom, strony. Mój wkład w powstanie tej pracy polegał na Mój udział procentowy szacuję

2. Autor/autorzy, data wydania, tytuł, wydawca lub czasopismo, tom, strony. Mój wkład w powstanie tej pracy polegał na Mój udział procentowy szacuję WZÓR OBSZAR NAUK SPOŁECZNYCH Wykaz opublikowanych prac naukowych lub twórczych prac zawodowych oraz informacja o osiągnięciach dydaktycznych, współpracy naukowej i popularyzacji nauki I. Wykaz publikacji

Bardziej szczegółowo

Prawdopodobieństwo i rozkład normalny cd.

Prawdopodobieństwo i rozkład normalny cd. # # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl

Bardziej szczegółowo

Podsumowanie wyników ankiety

Podsumowanie wyników ankiety SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku

Bardziej szczegółowo

Programowanie celowe #1

Programowanie celowe #1 Programowanie celowe #1 Problem programowania celowego (PC) jest przykładem problemu programowania matematycznego nieliniowego, który można skutecznie zlinearyzować, tzn. zapisać (i rozwiązać) jako problem

Bardziej szczegółowo

Uchwała Nr 000-2/6/2013 Senatu Uniwersytetu Technologiczno-Humanistycznego im. Kazimierza Pułaskiego w Radomiu z dnia 21 marca 2013 r.

Uchwała Nr 000-2/6/2013 Senatu Uniwersytetu Technologiczno-Humanistycznego im. Kazimierza Pułaskiego w Radomiu z dnia 21 marca 2013 r. Uchwała Nr 000-2/6/2013 Senatu Uniwersytetu Technologiczno-Humanistycznego im. Kazimierza Pułaskiego w Radomiu z dnia 21 marca 2013 r. w sprawie: 1) określenia przez Senat efektów kształcenia dla programu

Bardziej szczegółowo

Systemy uczące się Lab 4

Systemy uczące się Lab 4 Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego

Bardziej szczegółowo

a) Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów

a) Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów 1. PROGRAM KSZTAŁCENIA 1) OPIS EFEKTÓW KSZTAŁCENIA a) Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów kształcenia dla obszaru nauk społecznych i technicznych Objaśnienie oznaczeń: I efekty

Bardziej szczegółowo

Wymagania stawiane pracom dyplomowym na Wydziale Elektroniki i Informatyki Politechniki Koszalińskiej

Wymagania stawiane pracom dyplomowym na Wydziale Elektroniki i Informatyki Politechniki Koszalińskiej Wymagania stawiane pracom dyplomowym na Wydziale Elektroniki i Informatyki Politechniki Koszalińskiej Uchwała Nr 356/96 Rady Głównej Szkolnictwa Wyższego z 28 listopada 1996 r. dotycząca nadawania tytułów

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA

Bardziej szczegółowo

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe Trening jednokierunkowych sieci neuronowych wykład 2. dr inż. PawełŻwan Katedra Systemów Multimedialnych Politechnika Gdańska

Bardziej szczegółowo

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru

Bardziej szczegółowo

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności: Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Autoreferat do rozprawy doktorskiej OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Michał Mazur Gliwice 2016 1 2 Montaż samochodów na linii w

Bardziej szczegółowo

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych - Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,

Bardziej szczegółowo

Regulamin Wydziałowej Komisji ds. Doktoratów

Regulamin Wydziałowej Komisji ds. Doktoratów Wydziałowa Komisja ds. Doktoratów Wydział Inżynierii Zarządzania Politechnika Poznańska Regulamin Wydziałowej Komisji ds. Doktoratów Na podstawie Statutu Politechniki Poznańskiej (Załącznik nr 5, punkt

Bardziej szczegółowo

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych Mateusz Kobos, 25.11.2009 Seminarium Metody Inteligencji Obliczeniowej 1/25 Spis treści Dolne ograniczenie na wsp.

Bardziej szczegółowo

HARMONOGRAM GODZINOWY ORAZ PUNKTACJA ECTS CZTEROLETNICH STUDIÓW DOKTORANCKICH

HARMONOGRAM GODZINOWY ORAZ PUNKTACJA ECTS CZTEROLETNICH STUDIÓW DOKTORANCKICH P O L I T E C H N I K A Ś L Ą S K A WYDZIAŁ AUTOMATYKI, ELEKTRONIKI I INFORMATYKI DZIEKAN UL. AKADEMICKA 16 44-100 GLIWICE T: +48 32 237 13 10 T: +48 32 237 24 13 F: +48 32 237 24 13 Dziekan_aei@polsl.pl

Bardziej szczegółowo