Kompletny Gradientowy Algorytm Klasteryzacji: możliwości aplikacyjne w zagadnieniach analizy systemowej
|
|
- Stanisława Olejniczak
- 8 lat temu
- Przeglądów:
Transkrypt
1 Kompletny Gradientowy Algorytm Klasteryzacji: możliwości aplikacyjne w zagadnieniach analizy systemowej Piotr Kulczycki,2, Małgorzata Charytanowicz,3, Piotr A. Kowalski,2, Szymon Łukasik,2 Polska Akademia Nauk, Instytut Badań Systemowych, Centrum Informatycznych Metod Analizy Danych 2 Politechnika Krakowska, Katedra Automatyki i Technik Informacyjnych 3 Katolicki Uniwersytet Lubelski, Katedra Analizy Numerycznej i Programowania Streszczenie Celem niniejszej publikacji jest zaprezentowanie aplikacyjnych aspektów i własności kompletnej postaci gradientowego algorytmu klasteryzacji, a także ich ilustracja dla konkretnych praktycznych zadań z zakresu analizy systemowej. Podstawową cechą powyższego algorytmu jest brak wymagań dotyczących arbitralnego ustalenia liczby klastrów, co umożliwia lepsze ich dopasowanie do rzeczywistej struktury danych. Możliwe jest wszakże wskazanie parametrów, których ewentualna zmiana wpływa na rząd wielkości liczby klastrów oraz proporcję między ich liczbą w obszarach zagęszczenia elementów zbioru danych oraz obszarach gdzie są one rzadkie. Ponadto prezentowany algorytm może być wykorzystany do wykrywania i ewentualnej eliminacji elementów nietypowych (odstających). Powyższe cechy okazały się bardzo cenne w prezentowanych zastosowaniach z zakresu bioinformatyki (kategoryzacja ziaren zbóż), zarządzania i marketingu (określenie strategii marketingowej operatora telefonii komórkowej) oraz inżynierii (synteza rozmytego regulatora PID), i mogą być równie użyteczne w wielu różnorodnych praktycznych zadaniach. Słowa kluczowe: eksploracyjna analiza danych, klasteryzacja, metody nieparametryczne, estymatory jądrowe, kategoryzacja ziaren zbóż, strategia operatora telefonii komórkowej, rozmyty regulator PID.
2 . WSTĘP Klasteryzacja [Krzyśko et al; 2008] stanowi obecnie podstawową procedurę eksploracyjnej analizy danych. Brak jest tu jednak naturalnego aparatu matematycznego, jakim na przykład przy badaniu ekstremów jest rachunek różniczkowy. W tej sytuacji wieloznaczność zarówno interpretacji jak i poszczególnych ścisłych elementów definicyjnych (np. co oznacza podobieństwo elementów, czy też jak mierzyć jakość uzyskanego podziału) implikuje olbrzymią różnorodność koncepcji i w konsekwencji procedur klasteryzacji. Z jednej strony istotnie utrudnia to fazę badawczą, ale z drugiej pozwala lepiej dopasować stosowaną metodykę do specyfiki i wymagań konkretnego rozważanego zadania. Celem niniejszego artykułu jest przedstawienie własności kompletnej postaci gradientowego algorytmu klasteryzacji w aspekcie jego aplikacyjnych możliwości, zilustrowanych na przykładzie praktycznych zadań z zakresu bioinformatyki, zarządzania i marketingu oraz inżynierii, dotyczących odpowiednio kategoryzacji ziaren zbóż dla potrzeb produkcji materiału siewnego, określenia strategii marketingowej operatora telefonii komórkowej, a także syntezy rozmytego regulatora PID w zakresie redukcji zbioru jego reguł. Niech zatem dany będzie m elementowy zbiór danych składający się z n-wymiarowych wektorów x, x 2,..., x m n R, () traktowany tu jako próba otrzymana z n-wymiarowej zmiennej losowej. W swym klasycznym już dziś artykule [Fukunaga, Hostetler; 975], Fukunaga i Hostetler sformułowali naturalną i efektywną koncepcję klasteryzacji, wykorzystującą znaczne możliwości wchodzących wówczas do coraz szerszego użytku statystycznych estymatorów jądrowych [Kulczycki; 2005]. Podstawą powyższej koncepcji jest uznanie zbioru danych () za próbę losową pozyskaną z pewnej n-wymiarowej zmiennej losowej, wyznaczenie estymatora jądrowego gęstości jej rozkładu i przyjęcie naturalnego założenia, iż poszczególne klastry odpowiadają modom (lokalnym maksimom) uzyskanego estymatora, a w konsekwencji doliny funkcji gęstości stanowią rozgraniczenie tak powstałych klastrów. Przedstawiona metoda została sformułowana jedynie w zakresie ogólnej idei, pozostawiając detale zgodnie z powszechnie obowiązującym wówczas zwyczajem do szczegółowej analizy użytkownika. Algorytm Fukunagi oraz Hostetlera został w ramach pracy [Kulczycki, Charytanowicz; 200] uzupełniony i ostatecznie podany w wersji kompletnej, dogodnej do stosowania bez konieczności posiadania dogłębnej wiedzy statystycznej oraz prowadzenia żmudnych badań przedmiotowych. Charakteryzuje się on następującymi cechami:. wartości wszystkich parametrów mogą być efektywnie wyznaczone z użyciem numerycznych procedur opartych na kryteriach optymalizacyjnych; 2. algorytm nie wymaga ścisłego ustalenia liczby klastrów, co pozwala lepiej dopasować ich liczbę do rzeczywistej struktury danych; 3. wyodrębniony został pojedynczy parametr odpowiadający za liczbę klastrów; pokazano jak ewentualne zmiany jego wartości np. względem obliczonej z użyciem kryterium
3 optymalizacyjnego (por. punkt ) wpływają na zmniejszenie lub zwiększenie ilości klastrów, aczkolwiek nadal bez wskazania konkretnej ich liczby; 4. wskazany został kolejny parametr, którego wartość ma wpływ na proporcję pomiędzy liczbą klastrów w regionach zagęszczenia elementów zbioru danych oraz obszarach gdzie są one rzadkie; także tu określona została jego wartość oparta na kryterium optymalizacyjnym (por. punkt ), ewentualnie poddawana modyfikacjom w celu zwiększenia ich ilości w regionach zagęszczenia danych kosztem redukcji w obszarach rzadszego ich występowania lub odwrotnie; 5. odpowiednia relacja pomiędzy powyższymi parametrami pozwala na redukcję lub nawet eliminację klastrów w rejonach rzadkiej lokalizacji danych, praktycznie bez wpływu na obszary gęste; 6. prezentowany algorytm kreuje również mało liczne lub nawet jednoelementowe klastry, których elementy mogą być traktowane jako elementy nietypowe (odosobnione) [Barnett, Lewis; 994], co umożliwia ich usunięcie lub przypisanie do najbliższych liczniejszych klastrów, osiągane przykładowo przez opisane wcześniej zmiany wartości odpowiednich parametrów. Własności zapisane w punkcie 4, i w konsekwencji 5, są szczególnie warte podkreślenia jako praktycznie niewystępujące w innych procedurach klasteryzacyjnych. W praktycznych zastosowaniach warta podkreślenia są implikacje połączenia punktów i 2 oraz ewentualnie dodatkowo 3. Nietypowe możliwości otwiera także własność zapisana w punkcie 6. Szerszy opis przedstawionego tu materiału dostępny będzie w ramach publikacji [Kulczycki et al; 202]. 2. KOMPLETNY GRADIENTOWY ALGORYTM KLASTERYZACJI Pełny opis rozważanego tu Kompletnego Gradientowego Algorytmu Klasteryzacji, opartego na nieparametrycznej metodyce estymatorów jądrowych [Kulczycki; 2005], został zawarty w artykule [Kulczycki, Charytanowicz; 200] oraz skrótowo w jego wcześniejszej konferencyjnej publikacji [Kulczycki, Charytanowicz; 2008]. Warto ponowić spostrzeżenie, że prezentowany algorytm klasteryzacji nie wymagał wstępnego, w praktyce często arbitralnego i nieuzasadnionego, ustalenia liczby klastrów ich ilość zależy jedynie od wewnętrznej struktury danych, określonej w postaci zbioru (). Poprzez odpowiedni dobór wartości parametrów estymatora jądrowego możliwy jest jednak wpływ na sam rząd wielkości liczby klastrów, a także na proporcje ich występowania w regionach zagęszczenia elementów tego zbioru względem obszarów gdzie są one rzadkie. I tak, wprowadzony w definicji estymatora jądrowego parametr wygładzania h bezpośrednio wpływa na liczbę klastrów. Jego zmniejszenie względem wartości podstawowej, uzyskiwanej zwykle w oparciu o kryterium średniokwadratowe, powoduje powiększenie rzędu ilości klastrów. Analogicznie, zwiększenie wartości parametru wygładzania skutkuje zmniejszeniem tego rzędu. Należy podkreślić, iż w obu przypadkach, pomimo wpływania na rząd ilości klastrów, ich ścisła liczba nadal zależeć będzie jedynie od wewnętrznej struktury danych (). 2
4 Podobnie, wprowadzony w definicji procedury modyfikacji parametru wygładzania parametr c wpływa na proporcję ilości klastrów w obszarach zagęszczenia elementów zbioru danych () i rejonach gdzie są one rzadkie. Zwiększenie jego wartości względem otrzymanego na podstawie kryterium średniokwadratowego implikuje zmniejszenie ilość klastrów w obszarach rzadkiego występowania danych i jednocześnie zwiększa w obszarach ich zagęszczenia. Przeciwne efekty wystąpią w przypadku zmniejszenia wartości tego parametru. W praktyce często pojawia się jednak żądanie pozostawienia bez zmian klastrów w obszarach zagęszczenia danych najważniejszych z praktycznego punktu widzenia i jednoczesnego zredukowania lub wręcz zlikwidowania klastrów w obszarach gdzie elementy występują rzadko, gdyż są one głównie związane z elementami nietypowymi, powstałymi nierzadko przez różnego rodzaju błędy. Łącząc powyższe rozważania można zaproponować jednoczesne zwiększenie standardowej intensywności modyfikacji parametru wygładzania c oraz odpowiednie określone konkretnym wzorem powiększenie wartości parametru wygładzania h. Warto jeszcze wspomnieć o możliwości, a w niektórych zagadnieniach praktycznych wręcz konieczności redukcji wymiaru n oraz ewentualnie liczności próby m. Dogodny algorytm desygnowany do zagadnień analizy danych ukaże się niebawem w ramach publikacji [Kulczycki, Łukasik; 202]. 3. ZASTOSOWANIA Kompletny Gradientowy Algorytm Klasteryzacji został wszechstronnie przebadany zarówno na pseudolosowych danych statystycznych jak i ogólnie dostępnych benchmarkowych. Jego cechy predestynują go do szerokiego zakresu zastosowań. Poniżej, w kolejnych sekcjach, przedstawione zostaną wyniki uzyskane w trzech przedsięwzięciach badawczych z zakresu bioinformatyki, zarządzania i marketingu oraz inżynierii. 3.. Kategoryzacja ziaren dla potrzeb produkcji materiału siewnego Bioinformatyka dyscyplina zajmująca się stosowaniem narzędzi matematycznych oraz informatycznych do rozwiązywania problemów nauk biologicznych rozwija się obecnie wyjątkowo dynamicznie i w zróżnicowany sposób. Możliwości powstałe dzięki rozwojowi oraz powszechności techniki komputerowej spowodowały wyraźne zbliżenie i współdziałanie w ramach odmiennych dotychczas metod badawczych nauk ścisłych i przyrodniczych. Poniżej zostaną przedstawione wyniki badań prowadzonych w ramach szerszego projektu nad kategoryzacją ziaren, na podstawie geometrycznych cech nasion, uzyskanych ze zdjęcia rentgenowskiego ich ziarniaków. W celu przedstawienia ilustracyjnej i porównawczej prezentacji aspektu badań, w którym stosowano Kompletny Gradientowy Algorytm Klasteryzacji, analizie poddana została próba ziaren pszenicy zebranych z eksperymentalnych poletek Instytutu Agrofizyki Polskiej Akademii Nauk w 3
5 Lublinie. Testowany zbiór składał się z ziaren trzech odmian pszenicy, Kama, Rosa oraz Canadian, po 70 losowo wybranych sztuk. Wysokiej jakości wizualizację ich wewnętrznej struktury uzyskano z wykorzystaniem miękkiej techniki rentgenowskiej, nie niszczącej testowanego materiału. Po zeskanowaniu uzyskanych zdjęć, otrzymano przy zastosowaniu specjalnie do tego celu stworzonego oprogramowania ZIARNA następujących siedem geometrycznych wielkości ziarniaków : jego powierzchnia A, obwód P, zwartość 2 C = 4πA P, długość, szerokość, współczynnik asymetrii, i wreszcie długość bruzdy ziarniaka. Każde testowane ziarno było zatem reprezentowane przez 7- wymiarowy wektor ( n = 7 ), a ich zbiór tworzył 20-elementową próbę (). We wstępnej fazie, wymiar został zredukowany do n = 2 z użyciem klasycznej analizy składowych głównych PCA. W wyniku użycia Kompletnego Gradientowego Algorytmu Klasteryzacji ze standardowymi wartościami parametrów h oraz c, uzyskanymi za pomocą kryterium średniokwadratowego, otrzymano 7 klastrów o licznościach 76, 64, 57, 7, 3, 2,. Można wnioskować, że 3 pierwsze reprezentują trzy użyte do niniejszej analizy odmiany pszenicy, natomiast mało liczne pozostałe 4 klastry zawierają elementy nietypowe, niewykluczone iż uszkodzone mechanicznie. Jeśli pominąć 3 sztuk zawartych w owych 4 mało licznych klastrach (6% całej populacji), to liczba poprawnych klasyfikacji ziaren wynosiła kolejno 9%, 97%, 88% odpowiednio dla odmian pszenicy Kama, Rosa and Canadian. Warto zwrócić uwagę, iż uzyskanie powyższego wyniku nie wymagało założenia a priori ilości wymaganych klastrów, co w praktycznych problemach z zakresu biologii może być informacją trudno dostępną lub wręcz niemożliwą do uzyskania. W przypadku konieczności przypisania każdego elementu do któregoś z odpowiednio licznych klastrów, efekt ten można uzyskać stosownie zmieniając wartości parametrów h and c względem standardowych wartości otrzymanych z kryteriów optymalizacyjnych. Jak wspomniano, zwiększając sukcesywnie wartość pierwszego z nich, potencjalnie zmniejsza się ilość klastrów, a z kolei zmniejszanie drugiego uniemożliwia rozbicie tworzonych w ten sposób dużych klastrów. Postępując w ten sposób, trzy liczne klastry uzyskano dla h zwiększonego o 75% oraz pięciokrotnie pomniejszonego parametru c. Liczba poprawnych klasyfikacji była w tym przypadku nieznacznie mniejsza od otrzymanej poprzednio i wynosiła dla poszczególnych odmian odpowiednio 9%, 96%, 88%. Powyższe wyniki były porównywalne z uzyskanymi innymi metodami, między innymi klasycznej procedury k-średnich, aczkolwiek w tym przypadku wymagało to dodatkowego podania prawidłowej informacji o ilości klasyfikowanych odmian, co w praktyce nie zawsze jest informacją dostępną. Podsumowując, zastosowanie Kompletnego Gradientowego Algorytmu Klasteryzacji, umożliwiło poprawną klasyfikację ziaren trzech odmian pszenicy bez apriorycznej informacji o ich liczbie. Co więcej, ze standardowymi wartościami parametrów powyższy algorytm umożliwiał również identyfikację nietypowych elementów testowanej próby, przykładowo uszkodzonych mechanicznie. Powyższy ilustracyjny przykład dotyczący trzech odmian pszenicy może być uogólniony na inne zagadnienia kategoryzacji materiału siewnego o podobnych uwarunkowaniach. 4
6 Szczegółowe rozważania znaleźć można w pracy [Charytanowicz et al; 200] Strategia marketingowa operatora telefonii komórkowej Notowany w ostatnich latach gwałtowny rozwój telefonii komórkowej w naturalny sposób wymusza na operatorach ciągłe dostosowywanie swojej strategii marketingowej do zróżnicowanych i zmieniających się wymagań klientów, przy jednoczesnej maksymalizacji spodziewanego zysku. Jednak brak spójnej koncepcji postępowania może skutkować niejednorodnością traktowania poszczególnych klientów, a w konsekwencji ich niezadowoleniem i przejściem do firm konkurencyjnych. W celu uniknięcia tych zagrożeń konieczne jest wypracowanie jednolitej strategii marketingowej, zwłaszcza wobec klientów kluczowych, z którymi prowadzone są indywidualne negocjacje ustalające warunki kontraktu. Poniżej zostaną przedstawione badania przeprowadzone dla jednego z polskich operatorów sieci komórkowej, dotyczących klientów biznesowych o dłuższym stażu, czyli takich którzy posiadają więcej niż 30 kart SIM przez co najmniej 2 lata. W praktyce istnieje szerokie spektrum wielkości określających cechy poszczególnych abonentów. Po szczegółowej analizie ekonomicznych aspektów rozważanego zagadnienia przyjęto, że poszczególni klienci biznesowi mogą być skutecznie scharakteryzowani przez trzy z nich : średni miesięczny przychód z karty SIM, staż w sieci oraz liczbę aktywnych kart SIM. I tak, każdy z m-elementowej bazy danych x, x 2,..., x m jest opisywany za pomocą 3-wymiarowego wektora: xi, x i = xi,2 dla i =, 2,..., m, (2) xi,3 gdzie x i, oznacza średni miesięczny przychód z karty SIM i-tego klienta, x i, 2 jego staż w sieci, natomiast x i, 3 liczbę aktywnych kart SIM. We wstępnej fazie, ze zbioru x, x,..., x 2 m zostały wyeliminowane elementy nietypowe (odosobnione), zgodnie z procedurą zawartą w pracy [Kulczycki, Prochot; 2004], podobnie jak Kompletny Gradientowy Algorytm Klasteryzacji opartą na metodyce estymatorów jądrowych. Dzięki temu zwiększona została homogeniczność (jednorodność) zbioru danych, poprzez usunięcie mało wartościowej informacji, nie mającej pozytywnego wpływu na kolejne etapy badawcze. Następnie, poprzez zastosowanie wobec tak zredukowanego zbioru Kompletnego Gradientowego Algorytm Klasteryzacji, uzyskany został podział danych reprezentujących zróżnicowanych klientów na grupy o podobnej charakterystyce. Wyniki uzyskane dla standardowej wartości parametru c, wskazywały na zbytnią ilość klastrów o niedużej liczności ulokowanych w obszarach małego zagęszczenia elementów próby, zawierających najczęściej mało istotnych acz specyficznych klientów, a także zbyt liczne główne skupienie zawierające ponad połowę elementów. Zgodnie z przedstawionymi 5
7 własnościami stosowanego algorytmu, wartość tego parametru została powiększona dwukrotnie. Uzyskano dzięki temu żądany efekt : liczba peryferyjnych klastrów istotnie zmniejszyła się, a główne skupienie uległo rozbiciu. Otrzymana liczba klastrów była zadowalająca, co spowodowało, iż ewentualna zmiana wartości parametru h okazała się zbędna. Ostatecznie uzyskano podział rozważanej w tej fazie 639-elementowej próby na 26 klastrów o następujących licznościach : 488, 43, 247, 28, 54, 4, 34, 34, 33, 28, 26, 2, 20, 4, 3, 2, 0, dwa klastry 4-elementowe, trzy 3-elementowe, dwa 2-elementowe i dwa klastry -elementowe. Warto zwrócić uwagę na wyraźnie zarysowane cztery grupy : pierwsza z nich to dwa duże klastry o licznościach 488 i 43, następnie dwa średnie 247- i 28-elementowe, po czym małe dziewięć liczących od 20 do 54 oraz wreszcie 3 klastrów zawierających mniej niż 20 elementów. Następnie przystąpiono do eliminacji klastrów o licznościach mniejszych od 20, ale z wyłączeniem tych, które zawierały klientów kluczowych (klastry 4-, 3- i 0-elementowe) i składających się co najmniej w połowie z klientów prestiżowych (klaster 2-elementowe). Ostatecznie do dalszej analizy pozostało 7 klastrów. Następnie, dla każdego z tak określonych klastrów, wyznaczane były optymalne z punktu widzenia oczekiwanych zysków operatora reguły postępowania wobec należących do niego abonentów. Ze względu na fakt, iż wykorzystywana do tego celu ocena ekspertów jest ze swej natury nieprecyzyjna, użyte zostały elementy logiki rozmytej [Kacprzyk, 986] oraz teorii preferencji [Fodor, Rubens; 994] szczegóły tej fazy wykraczają jednak poza zakres badawczy prezentowany w niniejszej publikacji i z tego powodu zostaną pominięte. Warto zaznaczyć, iż powyższe operacje nie są przeprowadzane w czasie rzeczywistym podczas negocjacji z klientem, lecz powinny być jedynie uaktualniane co pewien okres czasu, rzędu -6 miesięcy. Klient, z którym prowadzone są negocjacje scharakteryzowany jest w nawiązaniu do wzoru (2) podobnie jak pozostali, przez 3-wymiarowy wektor. Dane te nawiązują do historii abonenta w sieci, w przypadku prowadzenia renegocjacji warunków kontraktu, lub mogą pochodzić z innej sieci, jeśli podejmuje się próbę przejęcia. Rzeczony klient zostaje przyporządkowany do odpowiedniej grupy podobnych mu abonentów (w ramach podziału otrzymanego uprzednio w wyniku klasteryzacji) z zastosowaniem algorytmu klasyfikacji bayesowskiej także przy użyciu metodyki estymatorów jądrowych (literaturę przedmiotową można znaleźć w artykule [Kulczycki, Kowalski; 200] ). Biorąc pod uwagę, że reguły postępowania dla poszczególnych klastrów zostały już wcześniej określone, ostatecznie kompletuje to prezentowaną tu procedurę wspomagania strategii marketingowej operatora telefonii komórkowej wobec klienta biznesowego. Szczegółowe rozważania znaleźć można w artykule [Kulczycki, Daniel; 2009] Synteza rozmytego regulatora PID Rozmyte regulatory typu PID stanowią cenne z aplikacyjnego punktu widzenia uogólnienie powszechnie stosowanych, dokładnie przebadanych i poznanych przez praktyków klasycznych regulatorów PID. Wersja rozmyta jest szczególnie użyteczna dla układów nietrywialnych, przykładowo 6
8 silnie nieliniowych i/lub nieokreślonych, gdyż dzięki większej liczbie stopni swobody, regulatory takie potrafią lepiej dopasować się do specyfiki takiego obiektu. Z drugiej jednak strony, zbyt duża liczba owych stopni swobody może spowodować trudności w prawidłowym ustaleniu funkcji i parametrów regulatora, implikując nieprawidłową pracę systemu, a w skrajnym przypadku nadmierne rozbudowanie jego struktury i w konsekwencji wręcz jego praktyczną nierealizowalność. Zagadnienie możliwie dużego, lecz nie pogarszającego jakości, uproszczenia struktury rozmytych regulatorów PID ma zatem podstawowe aplikacyjne znaczenie. Poniżej rozważane będą regulatory rozmyte PID typu Takagi-Sugeno [Yager, Filev; 994]. Ich koncepcja opiera się na zbiorze (bazie) k rozmytych reguł postaci IF ( x is A ) THEN ( y = f (x) ) dla j =,2,..., k. (3) j j Jeżeli zgodnie z charakterem ujęcia rozmytego element x należy do wielu zbiorów w stopniu określanym wartościami ich funkcji przynależności, czyli poprzez (x), to ostatecznie y przyjmuje postać unormowanej średniej µ A j y = k µ A j j= k j= ( x) f µ A j j ( x) ( x). (4) W przypadku rozmytych regulatorów typu PID, współrzędne wektora x związane są z uchybem oraz jego całką i pochodną, a zmienna y stanowi wygenerowane sterowanie. Nawet jeżeli zakłada się proste trójkątne lub trapezowe funkcje przynależności µ A j, a funkcje f j w postaci liniowej, to duża liczba występujących w takim zagadnieniu parametrów może grozić brakiem możliwości efektywnego ustalenia ich wartości. Odpowiednia redukcja liczności zbioru rozmytych reguł (3) staje się zatem podstawowym problemem, zwłaszcza w przypadku złożonych aplikacyjnych przypadków. Do rozwiązania zadania redukcji rozmytych reguł używa sie wielu metod współczesnych technik informacyjnych [Kulczycki et al; 2007], przede wszystkim algorytmów ewolucyjnych [Arabas; 200], systemów neuronowo-rozmytych [Rutkowski; 2005], czy też ujęcia statystycznego [Hryniewicz; 2004]. Przedstawiony w niniejszej publikacji Kompletny Gradientowy Algorytm Klasteryzacji, został z powodzeniem zastosowany do tego celu. x Niech zatem dany będzie wektor oraz m pomiarów jego wartości uzyskanych podczas y działania systemu sterowania z użyciem rozmytego regulatora PID w pierwotnej postaci, czyli bez redukcji zbioru reguł: x y x2, y2 xm,..., ym. (5) 7
9 Traktując powyższy zbiór jako próbę losową () dokonać można klasteryzacji z użyciem Kompletnego Gradientowego Algorytmu Klasteryzacji. Niech ~ x ~ y ~ x2, ~ y2 ~ xc~,..., ~ yc ~ (6) reprezentują centra otrzymanych w wyniku jego działania c ~ klastrów. Każdy element x~ i dla i =,2,..., c~ może stanowić podstawę i -tej rozmytej reguły z odpowiadającą mu funkcją przynależności 2 x ~ xi µ ( ) = exp i x, (7) d gdzie parametr d > 0 charakteryzuje zdolność uogólniania wynikłą z wnioskowania rozmytego w ramach projektowanego systemu sterowania. Przeprowadzone badania eksperymentalne wskazują, iż jako standardową można użyć wartość d = ~c / 2. W konsekwencji wzór (4) przyjmuje postać c ~ i i= y = c~ µ ( x) f ( x) i= i i µ ( x), (8) przy czym f i są funkcjami liniowymi, których parametry mogą być wyznaczone na podstawie klasycznego średniokwadratowego zadania estymacji. Powyższa metoda została pozytywnie zweryfikowana w kilku praktycznych zagadnieniach. Poniżej zostaną podane porównawcze wyniki otrzymane dla układu sterowania serwomotorem dysku twardego, przedstawionego w artykule [Tan et al; 2007]. Użyto tam następującego jego modelu: s& ( t) = v( t) & s( t).384 u( t) + v( t).664, (9) gdzie u stanowi wejście elementu wykonawczego (w woltach), natomiast s oraz v oznaczają pozycję (w ścieżkach) i prędkość głowicy twardego dysku. Analizowany był problem precyzyjnego pozycjonowania, przy czym wyjście stanowiła wielkość s (t). Jako typowy w takich zastosowaniach, rozważany był regulator typu PD [Mudi, Pal; 999]. Najpierw określony został standardowy regulator rozmyty PD z 49 regułami uwarunkowanymi na szybką odpowiedź na skok jednostkowy. Otrzymany w ten sposób 2-elementowy zbiór (5) : e e&, u e2 e& 2,..., u2 e2 e& 2, (0) u2 gdzie e reprezentuje uchyb, został potraktowany jako próba losowa () i poddany działaniu 8
10 Kompletnego Gradientowego Algorytmu Klasteryzacji. W wyniku otrzymano rozmyty regulator PD z bazą zredukowaną do 38 reguł. W celu porównania przebiegów generowanych przez klasyczny regulator PD, rozmyty regulator PD z niezredukowaną 49-elementową bazą reguł [Mudi, Pal; 999] oraz otrzymany z użyciem Kompletnego Gradientowego Algorytmu Klasteryzacji regulator rozmyty z bazą zredukowaną do 38 reguł, otrzymano w odpowiedzi na skok jednostkowy wartość pierwiastka z kwadratowego wskaźnika jakości, odpowiednio, 0,29, 0,98, 0, oraz procentową wartość przeregulowania 78%, 92%, 5%. W obu przypadkach zdecydowanie najlepsze wyniki otrzymano z zastosowaniem rozmytego regulatora PD ze zredukowaną bazą reguł. Podobne rezultaty uzyskiwano dla innych uwarunkowań i wskaźników jakości. Dodatkowe badania wykonano dla systemu poddanego działaniu regulatora rozmytego z bazą reguł redukowaną przy zastosowaniu Kompletnego Gradientowego Algorytmu Klasteryzacji, dla różnych odmiennych od otrzymanych z użyciem kryteriów optymalizacyjnych wartości parametrów h oraz c. Otóż, najkorzystniejsze wyniki uzyskiwano przy wartości drugiego z nich dwukrotnie zmniejszonej względem optymalnej. Efekt taki można zinterpretować powiększeniem liczby klastrów peryferyjnych charakteryzujących stany nietypowe, niebezpieczne z punktu widzenia poprawności działania systemu. Co więcej, główny klaster zawierał przeważnie nawet 80% elementów zbioru (5), reprezentujących bezpieczne stany typowe i jego ewentualne rozdzielenie nie skutkowało pozytywnymi zmianami. Podobnie jak w zagadnieniu przedstawionym w poprzedniej sekcji nie było zatem potrzeby zmieniać względem optymalnej wartości parametru wygładzania h. Wskazuje to ponownie na dobre samoistne dopasowywanie się Kompletnego Gradientowego Algorytmu Klasteryzacji do rzeczywistej struktury danych. Szczegółowe rozważania w tym zakresie znaleźć można w publikacjach [Kowalski et al; 2008; Łukasik et al; 2008]. 4. PODSUMOWANIE Przedstawione w niniejszej publikacji wyniki uzyskane w trakcie stosowania Kompletnego Gradientowego Algorytmu Klasteryzacji [Kulczycki, Charytanowicz; 200] potwierdziły jego praktyczną użyteczność, w szczególności wymienione we wstępie 6 podstawowych cech. Zwraca uwagę brak zasadności istotnych zmian wartości parametru h, stanowiącego bezpośrednio o liczbie uzyskiwanych klastrów, co wskazuje na prawidłowe dostosowywane się procedury do rzeczywistej struktury danych. Bardzo cenna w praktyce okazała się możliwość zmiany wartości parametru c, stanowiącego o relacji ilości klastrów w obszarach zagęszczenia elementów próby wobec rejonów rzadkiego ich występowania. We wszystkich trzech przeprowadzonych badaniach zmiana taka umożliwiła uzyskanie istotnie korzystniejszych z aplikacyjnego punktu widzenia wyników. Jest to szczególnie warte podkreślenia, gdyż możliwość kształtowania powyższej relacji nie występuje w innych znanych algorytmach 9
11 klasteryzacji. LITERATURA Arabas J. (200) Wykłady z algorytmów ewolucyjnych, WNT, Warszawa. Barnett V., Lewis T. (994). Outliers in Statistical Data, Wiley, Chichester. Charytanowicz M., Niewczas J., Kulczycki P., Kowalski P.A., Łukasik S., Żak S.. (200). Gradient Clustering Algorithm for Features Analysis of X-Ray Images; w: E. Pietka, J. Kawa (red.) Information Technologies in Biomedicine, vol. 2, ss. 5-24, Springer-Verlag, Berlin. Fodor J., Roubens M. (994). Fuzzy Preference Modelling and Multicriteria Decision Support, Kluwer, Dordrecht. Fukunaga K., Hostetler L.D. (975). The estimation of the gradient of a density function, with applications in Pattern Recognition, IEEE Transactions on Information Theory, vol. 2, ss Hryniewicz O. (2004). Wykłady ze statystyki dla studentów informatycznych technik zarządzania, Wydawnictwo WSISiZ, Warszawa. Kacprzyk J. (986). Zbiory rozmyte w analizie systemowej, PWN, Warszawa. Kowalski P.A., Łukasik S., Charytanowicz M., Kulczycki P. (2008). Data-Driven Fuzzy Modeling and Control with Kernel Density Based Clustering Technique, Polish Journal of Environmental Studies, vol. 7, ss Krzyśko M., Wołyński W., Górecki T., Skorzybut M. (2008). Systemy uczące się rozpoznawanie wzorców, analiza skupień i redukcja wymiarowości, WNT, Warszawa. Kulczycki P. (2005). Estymatory jądrowe w analizie systemowej, WNT, Warszawa. Kulczycki P., Hryniewicz O., Kacprzyk J. (red.) (2007). Techniki informacyjne w badaniach systemowych, WNT, Warszawa. Kulczycki P., Charytanowicz M. (2008). Kompletny algorytm gradientowej klasteryzacji, XVI Krajowa Konferencja Automatyki, Szczyrk, -5 maja Post-proceedings: Sterowanie i automatyzacja: aktualne problemy i ich rozwiązania, Malinowski K., Rutkowski L. (red.), ss , EXIT, Warszawa, Kulczycki P., Charytanowicz M. (200). A Complete Gradient Clustering Algorithm Formed with Kernel Estimators, International Journal of Applied Mathematics and Computer Science, vol. 20, ss Kulczycki P., Charytanowicz M., Kowalski P.A., Łukasik S. (202). The Complete Gradient Clustering Algorithm: Properties in Practical Applications, Journal of Applied Statistics, w trakcie publikowania. Kulczycki P., Daniel K. (2009). Metoda wspomagania strategii marketingowej operatora telefonii komorkowej, Przegląd Statystyczny, vol. 56, ss Kulczycki P., Kowalski P.A. (20). Bayes Classification of Imprecise Information of Interval Type, 0
12 Control and Cybernetics, vol. 40, ss Kulczycki P., Łukasik S. (202) An Algorithm for Reducing Dimension and Size of Sample for Data Exploration Procedures, w trakcie publikowania. Kulczycki P., Prochot C. (2004). Wykrywanie elementów odosobnionych za pomocą metod estymacji nieparametrycznej; w: Kulikowski R., Kacprzyk J., Słowinski R. (red.) Badania operacyjne i systemowe: podejmowanie decyzji podstawy teoretyczne i zastosowania, EXIT, Warszawa, ss Łukasik S., Kowalski P.A., Charytanowicz M., Kulczycki P. (2008). Fuzzy Models Synthesis with Kernel-Density Based Clustering Algorithm, Fifth International Conference on Fuzzy Systems and Knowledge Discovery, Ma J., Yin Y., Yu J., Zhou S. (red.), Jinan (Chiny), 8-20 października 2008, vol. 3, ss Mudi R., Pal N. R. (999). A Robust Self-Tuning Scheme for PI and PD Type Fuzzy Controllers, IEEE Transactions on Fuzzy Systems, vol. 7, ss Rutkowski L. (2005) Metody i techniki sztucznej inteligencji, PWN, Warszawa. Tan K.C., Sathikannan R., Tan W.W., Loh A.P. (2007). Evolutionary Design and Implementation of a Hard Disk Drive Servo Control System, Soft Computing, vol., ss Yager R.R., Filev D.P. (995). Podstawy modelowania i sterowania rozmytego, WNT, Warszawa.
Rok akademicki: 2017/2018 Kod: JIS AD-s Punkty ECTS: 5. Kierunek: Informatyka Stosowana Specjalność: Modelowanie i analiza danych
Nazwa modułu: Eksploracja danych Rok akademicki: 2017/2018 Kod: JIS-2-202-AD-s Punkty ECTS: 5 Wydział: Fizyki i Informatyki Stosowanej Kierunek: Informatyka Stosowana Specjalność: Modelowanie i analiza
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 6 SYSTEMY ROZMYTE TYPU MAMDANIEGO
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium
ALGORYTM PROJEKTOWANIA ROZMYTYCH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO
Szybkobieżne Pojazdy Gąsienicowe (2) Nr 2, 24 Mirosław ADAMSKI Norbert GRZESIK ALGORYTM PROJEKTOWANIA CH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO. WSTĘP
PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM
Mostefa Mohamed-Seghir Akademia Morska w Gdyni PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM W artykule przedstawiono propozycję zastosowania programowania dynamicznego do rozwiązywania
KARTA PRZEDMIOTU. 17. Efekty kształcenia:
Z1-PU7 WYDANIE N1 Strona 1 z 4 (pieczęć wydziału) KARTA PRZEDMIOTU 1. Nazwa przedmiotu: CYBERNETYKA 2. Kod przedmiotu: CYB 3. Karta przedmiotu ważna od roku akademickiego: 2012/2013 4. Forma kształcenia:
Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
METODA WSPOMAGANIA STRATEGII MARKETINGOWEJ OPERATORA TELEFONII KOMÓRKOWEJ
PRZEGLĄD STATYSTYCZNY R. LVI ZESZYT 2 2009 PIOTR KULCZYCKI, KARINA DANIEL METODA WSPOMAGANIA STRATEGII MARKETINGOWEJ OPERATORA TELEFONII KOMÓRKOWEJ 1. WSTĘP Rynek telefonii komórkowej jest nieustannie
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Wnioskowanie rozmyte. Krzysztof Patan
Wnioskowanie rozmyte Krzysztof Patan Wprowadzenie Informacja precyzyjna jest to jedyna postać informacji akceptowanej przez konwencjonalne metody matematyczne, najczęściej dostarczana jest przez precyzyjne
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
7. Maszyny wektorów podpierajacych SVMs
Algorytmy rozpoznawania obrazów 7. Maszyny wektorów podpierajacych SVMs dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Maszyny wektorów podpierajacych - SVMs Maszyny wektorów podpierających (ang.
INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Podstawowe pojęcia z logiki rozmytej Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie Sterowanie
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: przedmiot obowiązkowy w ramach treści kierunkowych, moduł kierunkowy ogólny Rodzaj zajęć: wykład, ćwiczenia I KARTA PRZEDMIOTU CEL PRZEDMIOTU
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Egzamin / zaliczenie na ocenę*
Zał. nr do ZW /01 WYDZIAŁ / STUDIUM KARTA PRZEDMIOTU Nazwa w języku polskim Identyfikacja systemów Nazwa w języku angielskim System identification Kierunek studiów (jeśli dotyczy): Inżynieria Systemów
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 10. WNIOSKOWANIE W LOGICE ROZMYTEJ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WNIOSKOWANIE W LOGICE DWUWARTOŚCIOWEJ W logice
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel
ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA dr inż. Aleksander Astel Gdańsk, 22.12.2004 CHEMOMETRIA dziedzina nauki i techniki zajmująca się wydobywaniem użytecznej informacji z wielowymiarowych
Reprezentacja rozmyta - zastosowania logiki rozmytej
17.06.2009 Wrocław Bartosz Chabasinski 148384 Reprezentacja rozmyta - zastosowania logiki rozmytej 1. Wstęp Celem wprowadzenia pojęcia teorii zbiorów rozmytych była potrzeba matematycznego opisania tych
Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L
Nazwa przedmiotu: Kierunek: Metody komputerowe statystyki Computer Methods in Statistics Matematyka Rodzaj przedmiotu: przedmiot obowiązkowy dla specjalności matematyka przemysłowa Rodzaj zajęć: wykład,
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3
Algorytmy wspomagania decyzji Czyli co i jak 2018 andrzej.rusiecki@pwr.edu.pl andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3 O co chodzi? Celem przedmiotu jest ogólne zapoznanie się z podstawowymi
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska
Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja
Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.
Algorytmy wspomagania decyzji Czyli co i jak 2013 andrzej.rusiecki@pwr.wroc.pl andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 911/D-20 O co chodzi? Celem przedmiotu jest ogólne zapoznanie się z podstawowymi
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Metody Sztucznej Inteligencji Methods of Artificial Intelligence. Elektrotechnika II stopień ogólno akademicki. niestacjonarne. przedmiot kierunkowy
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
PODSTAWY INŻYNIERI WIEDZY
Z1-PU7 WYDANIE N1 Strona 1 z 4 (pieczęć wydziału) KARTA PRZEDMIOTU 1. Nazwa przedmiotu: PODSTAWY INŻYNIERI WIEDZY 2. Kod przedmiotu: PIW 3. Karta przedmiotu ważna od roku akademickiego: 2012/2013 4. Forma
Interwałowe zbiory rozmyte
Interwałowe zbiory rozmyte 1. Wprowadzenie. Od momentu przedstawienia koncepcji klasycznych zbiorów rozmytych (typu 1), były one krytykowane za postać jaką przybiera funkcja przynależności. W przypadku
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: ENERGETYKA Rodzaj przedmiotu: kierunkowy ogólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Zapoznanie studentów z własnościami
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: INTELIGENTNE SYSTEMY OBLICZENIOWE Systems Based on Computational Intelligence Kierunek: Inżynieria Biomedyczna Rodzaj przedmiotu: obowiązkowy moduł specjalności informatyka medyczna Rodzaj
Temat: Projektowanie sterownika rozmytego. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Projektowanie sterownika rozmytego Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie System
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium Automatyka Automatics Forma studiów: studia stacjonarne Poziom kwalifikacji: I stopnia Liczba
5. Analiza dyskryminacyjna: FLD, LDA, QDA
Algorytmy rozpoznawania obrazów 5. Analiza dyskryminacyjna: FLD, LDA, QDA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Liniowe funkcje dyskryminacyjne Liniowe funkcje dyskryminacyjne mają ogólną
Automatyka i Robotyka II stopień ogólno akademicki studia niestacjonarne. wszystkie Katedra Automatyki i Robotyki Dr inż.
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2013/2014 Identyfikacja obiektów sterowania Identification of Control Systems A.
Implementacja rozmytych systemów wnioskujących w zdaniach regulacji
Metody Sztucznej Inteligencji w Sterowaniu Ćwiczenie 5 Implementacja rozmytych systemów wnioskujących w zdaniach regulacji Przygotował: mgr inż. Marcin Pelic Instytut Technologii Mechanicznej Politechnika
ZASTOSOWANIE METOD OPTYMALIZACJI W DOBORZE CECH GEOMETRYCZNYCH KARBU ODCIĄŻAJĄCEGO
MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 40, s. 43-48, Gliwice 2010 ZASTOSOWANIE METOD OPTYMALIZACJI W DOBORZE CECH GEOMETRYCZNYCH KARBU ODCIĄŻAJĄCEGO TOMASZ CZAPLA, MARIUSZ PAWLAK Katedra Mechaniki Stosowanej,
Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka
Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Temat: Projektowanie sterownika rozmytego. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Projektowanie sterownika rozmytego Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie Sterowanie
2. Empiryczna wersja klasyfikatora bayesowskiego
Algorytmy rozpoznawania obrazów 2. Empiryczna wersja klasyfikatora bayesowskiego dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Brak pełnej informacji probabilistycznej Klasyfikator bayesowski
Jeśli X jest przestrzenią o nieskończonej liczbie elementów:
Logika rozmyta 2 Zbiór rozmyty może być formalnie zapisany na dwa sposoby w zależności od tego z jakim typem przestrzeni elementów mamy do czynienia: Jeśli X jest przestrzenią o skończonej liczbie elementów
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: MODELOWANIE I SYMULACJA UKŁADÓW STEROWANIA Kierunek: Mechatronika Rodzaj przedmiotu: Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1.
TOZ -Techniki optymalizacji w zarządzaniu
TOZ -Techniki optymalizacji w zarządzaniu Wykład dla studentów II roku studiów II stopnia na kierunku Zarządzanie Semestr zimowy 2009/2010 Wykładowca: prof. dr hab. inż. Michał Inkielman Literatura Literatura
KIERUNKOWE EFEKTY KSZTAŁCENIA
KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział: Matematyki Kierunek studiów: Matematyka i Statystyka (MiS) Studia w j. polskim Stopień studiów: Pierwszy (1) Profil: Ogólnoakademicki (A) Umiejscowienie kierunku
Temat: Model SUGENO. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Model SUGENO Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie Pierwszym rodzajem modelowania
KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol)
KARTA PRZEDMIOTU 1. NAZWA PRZEDMIOTU: Ekonometria 2. KIERUNEK: MATEMATYKA 3. POZIOM STUDIÓW: I stopnia 4. ROK/ SEMESTR STUDIÓW: III/6 5. LICZBA PUNKTÓW ECTS: 5 6. LICZBA GODZIN: 30 / 30 7. TYP PRZEDMIOTU
Spis treści 377 379 WSTĘP... 9
Spis treści 377 379 Spis treści WSTĘP... 9 ZADANIE OPTYMALIZACJI... 9 PRZYKŁAD 1... 9 Założenia... 10 Model matematyczny zadania... 10 PRZYKŁAD 2... 10 PRZYKŁAD 3... 11 OPTYMALIZACJA A POLIOPTYMALIZACJA...
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA
ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA DYNAMICZNYCH LOKAT KAPITAŁOWYCH Krzysztof Gąsior Uniwersytet Rzeszowski Streszczenie Celem referatu jest zaprezentowanie praktycznego zastosowania
Opinia o pracy doktorskiej pt. On active disturbance rejection in robotic motion control autorstwa mgr inż. Rafała Madońskiego
Prof. dr hab. inż. Tadeusz Uhl Katedra Robotyki i Mechatroniki Akademia Górniczo Hutnicza Al. Mickiewicza 30 30-059 Kraków Kraków 09.06.2016 Opinia o pracy doktorskiej pt. On active disturbance rejection
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 4. UCZENIE SIĘ INDUKCYJNE Częstochowa 24 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska WSTĘP Wiedza pozyskana przez ucznia ma charakter odwzorowania
Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08
Spis treści Wstęp.............................................................. 7 Część I Podstawy analizy i modelowania systemów 1. Charakterystyka systemów informacyjnych....................... 13 1.1.
6. Zagadnienie parkowania ciężarówki.
6. Zagadnienie parkowania ciężarówki. Sterowniki rozmyte Aby móc sterować przebiegiem pewnych procesów lub też pracą urządzeń niezbędne jest stworzenie odpowiedniego modelu, na podstawie którego można
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Zapoznanie studentów z inteligentnymi
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
MATEMATYCZNE METODY WSPOMAGANIA PROCESÓW DECYZYJNYCH
MATEMATYCZNE METODY WSPOMAGANIA PROCESÓW DECYZYJNYCH 1. Przedmiot nie wymaga przedmiotów poprzedzających 2. Treść przedmiotu Proces i cykl decyzyjny. Rola modelowania matematycznego w procesach decyzyjnych.
1.1 Wstęp Literatura... 1
Spis treści Spis treści 1 Wstęp 1 1.1 Wstęp................................ 1 1.2 Literatura.............................. 1 2 Elementy rachunku prawdopodobieństwa 2 2.1 Podstawy..............................
Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta
KARTA MODUŁU / KARTA PRZEDMIOTU Z-ZIPN-004 Statystyka Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Statistics Obowiązuje od roku akademickiego 0/04 A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW
Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach
Adam Stawowy Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach Summary: We present a meta-heuristic to combine Monte Carlo simulation with genetic algorithm for Capital
Wykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC. Jarosław Świerczek
Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC Jarosław Świerczek Punkty funkcyjne Punkt funkcyjny to metryka złożoności oprogramowania wyznaczana w oparciu o określające to oprogramowanie
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania KOMPUTEROWE SYSTEMY STEROWANIA I WSPOMAGANIA DECYZJI Rozproszone programowanie produkcji z wykorzystaniem
Inżynieria Wiedzy i Systemy Ekspertowe. Logika rozmyta. dr inż. Michał Bereta Politechnika Krakowska
Inżynieria Wiedzy i Systemy Ekspertowe Logika rozmyta dr inż. Michał Bereta Politechnika Krakowska http://torus.uck.pk.edu.pl/~beretam/ beretam@torus.uck.pk.edu.pl 1 Wyostrzanie Ostateczna, ostra wartość
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
STANDARDOWE FUNKCJE PRZYNALEŻNOŚCI. METODY HEURYSTYCZNE wykład 6. (alternatywa dla s) (zdef. poprzez klasę s) GAUSSOWSKA F.
METODY HEURYSTYCZNE wykład 6 STANDARDOWE FUNKCJE PRZYNALEŻNOŚCI 2 GAUSSOWSKA F. PRZYNALEŻNOŚCI F. PRZYNALEŻNOŚCI KLASY s środek; a określa szerokość krzywej 3 4 F. PRZYNALEŻNOŚCI KLASY π F. PRZYNALEŻNOŚCI
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Diagnostyka procesów przemysłowych Kod przedmiotu
Diagnostyka procesów przemysłowych - opis przedmiotu Informacje ogólne Nazwa przedmiotu Diagnostyka procesów przemysłowych Kod przedmiotu 06.0-WE-AiRP-DPP Wydział Kierunek Wydział Informatyki, Elektrotechniki
AUTOMATYZACJA PROCESÓW CIĄGŁYCH I WSADOWYCH
AUTOMATYZACJA PROCESÓW CIĄGŁYCH I WSADOWYCH kierunek Automatyka i Robotyka Studia II stopnia specjalności Automatyka Dr inż. Zbigniew Ogonowski Instytut Automatyki, Politechnika Śląska Plan wykładu pojęcia
Lingwistyczne podsumowania baz danych.inteligentne generowanie s
Lingwistyczne podsumowania baz danych. Inteligentne generowanie streszczeń Instytut Informatyki, Politechnika Łódzka Katowice, 29 stycznia 2010 r. Problematyka Bazy i hurtownie danych olbrzymia ilość liczb......
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski
Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu
ZASTOSOWANIE ZBIORÓW ROZMYTYCH W OCENIE OSIĄGNIĘCIA EFEKTÓW KSZTAŁCENIA
IZABELA JÓZEFCZYK ROMUALD MAŁECKI ROMAN RUMIANOWSKI Politechnika Warszawska, Filia Płock ZASTOSOWANIE ZBIORÓW ROZMYTYCH W OCENIE OSIĄGNIĘCIA EFEKTÓW KSZTAŁCENIA Streszczenie. Praca przedstawia propozycję
dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych
- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,
MODELOWANIE OBCIĄŻEŃ ZIAREN AKTYWNYCH I SIŁ W PROCESIE SZLIFOWANIA
Modelowanie obciążeń ziaren ściernych prof. dr hab. inż. Wojciech Kacalak, mgr inż. Filip Szafraniec Politechnika Koszalińska MODELOWANIE OBCIĄŻEŃ ZIAREN AKTYWNYCH I SIŁ W PROCESIE SZLIFOWANIA XXXVI NAUKOWA
Porównanie wyników symulacji wpływu kształtu i amplitudy zakłóceń na jakość sterowania piecem oporowym w układzie z regulatorem PID lub rozmytym
ARCHIVES of FOUNDRY ENGINEERING Published quarterly as the organ of the Foundry Commission of the Polish Academy of Sciences ISSN (1897-3310) Volume 15 Special Issue 4/2015 133 138 28/4 Porównanie wyników
Relacja: III Seminarium Naukowe "Inżynierskie zastosowania technologii informatycznych"
Relacja: III Seminarium Naukowe "Inżynierskie zastosowania technologii informatycznych" W dniu 18.04.2015 odbyło się III Seminarium Naukowe Inżynierskie zastosowania technologii informatycznych. Organizatorzy
dr inż. SZYMON ŁUKASIK
dr inż. SZYMON ŁUKASIK Data i miejsce urodzenia: E-mail: 22 kwietnia 1981, Szczawnica slukasik@agh.edu.pl, slukasik@ibspan.waw.pl WYKSZTAŁCENIE 04.2013-07.2013 szkolenie z zakresu zarządzania w nauce,
WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO
Zał. nr 4 do ZW WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYKA STOSOWANA Nazwa w języku angielskim APPLIED STATISTICS Kierunek studiów (jeśli dotyczy): Specjalność
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 24 maja 2017 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja
zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych
Grupa efektów kierunkowych: Matematyka stosowana I stopnia - profil praktyczny (od 17 października 2014) Matematyka Stosowana I stopień spec. Matematyka nowoczesnych technologii stacjonarne 2015/2016Z