ALGORYTM ZACHŁANNY DLA KONSTRUOWANIA CZĘŚCIOWYCH REGUŁ ASOCJACYJNYCH
|
|
- Jacek Zieliński
- 6 lat temu
- Przeglądów:
Transkrypt
1 STUDIA INFORMATICA 2010 Volume 31 Number 2A (89) Beata ZIELOSKO Uniwersytet Śląski, Instytut Informatyki ALGORYTM ZACHŁANNY DLA KONSTRUOWANIA CZĘŚCIOWYCH REGUŁ ASOCJACYJNYCH Streszczenie. W artykule przedstawiono sposób konstruowania częściowych reguł asocjacyjnych z wykorzystaniem algorytmu zachłannego. Podejście to jest odmienne od znanego algorytmu A priori i jego modyfikacji, wykorzystujących zbiory częste. Przedstawione wyniki badań oraz rezultaty z przeprowadzonych eksperymentów pokazują, że algorytm zachłanny pozwala konstruować stosunkowo małą liczbę krótkich, częściowych reguł asocjacyjnych o dobrej jakości, które pokrywają wszystkie obiekty danego systemu informacyjnego. Słowa kluczowe: reguły asocjacyjne, częściowe reguły asocjacyjne, algorytm zachłanny GREEDY ALGORITHM FOR PARTIAL ASSOCIATION RULE CONSTRUCTION Summary. The paper presents greedy algorithm for partial association rule construction. This approach is different from the known algorithm Apriori and its modifications based on frequent itemsets. Theoretical and experimental results show, that the greedy algorithm constructs relatively small number of short partial association rules which have good accuracy and cover all objects from given information system. Keywords: association rules, partial association rules, greedy algorithm 1. Wprowadzenie W artykule przedstawiono algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych. Podejście to jest odmienne od znanego, opartego na algorytmie A priori i jego licznych modyfikacji, wykorzystujących zbiory częste [1].
2 226 B. Zielosko Częściowe reguły asocjacyjne są szczególnym przypadkiem reguł asocjacyjnych. Opierając się na wynikach badań dotyczących częściowego pokrycia zbioru oraz wynikach badań dotyczących konstruowania częściowych reguł decyzyjnych [4] i wykorzystując zalety regułowej reprezentacji wiedzy, zaproponowano podejście wykorzystujące algorytm zachłanny, zaprezentowane w pracy [5]. Problem minimalizacji długości częściowych reguł asocjacyjnych jest problemem NP-trudnym, dlatego został wykorzystany algorytm aproksymacyjny o złożoności wielomianowej (algorytm zachłanny) dla konstruowania częściowych reguł asocjacyjnych. Reguły asocjacyjne to jedna z metod eksploracji danych. Reguły asocjacyjne stanowią model reprezentacji wiedzy o związkach i korelacjach występujących między danymi. W literaturze można znaleźć wiele przykładów potwierdzających, iż często zamiast dokładnych reguł z wieloma atrybutami, stosowane są częściowe (przybliżone) reguły, zawierające mniejszą liczbę atrybutów i pozwalające uzyskać lepsze wyniki, np. w procesie klasyfikacji [4, 9, 11]. Dokładne reguły mogą być zbyt mocno dopasowane do istniejących przykładów, poza tym opierając się na zasadzie minimalnego opisu (ang. minimal length principle) należy dążyć do optymalizacji opisu pojęć [8]. Kryteria optymalizacji jakości opisu wypracowane w różnych dziedzinach nie są jednoznaczne, a wybór właściwego uzależniony jest od specyfiki konkretnych zbiorów danych. Istotne jest utrzymanie właściwej równowagi pomiędzy ogólnością opisu a jego poprawnością. Artykuł składa się z 5 rozdziałów. W rozdziale 2 zostały przedstawione podstawowe pojęcia dotyczące częściowych reguł asocjacyjnych. Rozdział 3 prezentuje algorytm zachłanny oraz twierdzenia dotyczące oszacowania dokładności wyników uzyskiwanych za pomocą algorytmu zachłannego. Rozdział 4 zawiera wyniki eksperymentów przeprowadzonych na danych umieszczonych w UCI machine learning repository [2]. Rozdział 5 stanowi krótkie podsumowanie. 2. Podstawowe pojęcia W rozdziale tym zostaną przedstawione podstawowe pojęcia dotyczące częściowych reguł asocjacyjnych. System informacyjny I=(U,A) jest parą, gdzie U={u 1,,u n } oznacza skończony zbiór obiektów, A={a 1, a m } oznacza skończony zbiór atrybutów [7]. System informacyjny przedstawiany jest w formie tabeli zawierającej n wierszy (odpowiadających obiektom u 1,,u n ) oraz m kolumn (odpowiadających atrybutom a 1,,a m ). Tabela ta wypełniona jest przez wartości atrybutów ze zbioru A, odpowiadające obiektom ze zbioru U.
3 Algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych 227 Niech r=(b 1, b m ) będzie wierszem tablicy I opisanym przez wartości atrybutów b 1,,b m, a p jest atrybutem ze zbioru A. Przez U(I,r,a p ) jest oznaczany zbiór wierszy systemu informacyjnego I, które są różne od wiersza r na przecięciu z kolumną a p i są różne na przecięciu z przynajmniej jedną kolumną a j taką, że j {1,,m} \ {p}. Powiemy, że atrybut a i separuje (oddziela) wiersz r U(I,r,a p ) od wiersza r, jeśli wiersze te posiadają różne wartości na przecięciu z kolumną a i. Rys.1 System informacyjny I. Fig.1. The information system I Niech α będzie liczbą rzeczywistą taką, że 0 α < 1. Reguła (a i1 = b i1 ) (a it = b it ) a p = b p jest nazywana α-regułą asocjacyjną (częściową regułą asocjacyjną) dla (I,r,a p ), jeśli atrybuty występujące w części warunkowej reguły (atrybuty a 1,,a t ) oddzielają od wiersza r przynajmniej (1-α) U(I,r,a p ) wierszy ze zbioru U(I,r,a p ). Na przykład 0.1-reguła asocjacyjna oznacza, że należy oddzielić od wiersza r przynajmniej 90% wierszy dotychczas nie oddzielonych ze zbioru U(I,r,a p ). Częściowe reguły asocjacyjne są szczególnym rodzajem reguł asocjacyjnych. Przedstawione w pracy wyniki badań dotyczą m.in. długości częściowych reguł asocjacyjnych. Ponieważ częściowe reguły asocjacyjne są konstruowane dla każdego wiersza systemu informacyjnego I, liczbę tych reguł można ograniczyć wykorzystując standardowe parametry dotyczące reguł asocjacyjnych, np. wsparcie (ang. support). Zatem dla częściowej reguły asocjacyjnej w postaci implikacji X Y stosowane są następujące miary: długość - liczba atrybutów występujących w części warunkowej reguły, wsparcie (supp) - liczba wierszy systemu informacyjnego I, które spełniają warunek X Y, podzielona przez liczbę wszystkich wierszy systemu informacyjnego I. Zatem jest to prawdopodobieństwo zajścia zdarzenia X Y. 3. Algorytm zachłanny W rozdziale tym zostanie przedstawiony algorytm zachłanny z parametrem α, stosowany do konstruowania częściowej reguły asocjacyjnej dla trójki (I,r,a p ) oraz twierdzenia z pracy
4 228 B. Zielosko [5], dotyczące oszacowania dokładności wyników uzyskiwanych przy zastosowaniu tego algorytmu (podrozdział 3.1). Poniżej został przedstawiony pseudokod algorytmu zachłannego, który konstruuje częściowe reguły asocjacyjne dla każdego wiersza r i każdego atrybutu a p systemu informacyjnego I. Dane wejściowe: system informacyjny I zawierający atrybuty a 1,,a m, wiersze r 1,,r n oraz liczba rzeczywista α taka, że 0 α < 1. Q - zbiór atrybutów na podstawie których tworzona jest częściowa reguła asocjacyjna Dane wyjściowe: α-reguła asocjacyjna dla trójki (I,r,a p ). BEGIN FOR j=1 to n //dla każdego wiersza FOR i=1 to m//dla każdego atrybutu r=r j ; //r będzie wierszem dla którego zostanie wygenerowana reguła a p =a i ; //a p będzie stanowić konkluzję reguły Q ; WHILE atrybuty ze zbioru Q oddzielają od wiersza r mniej niż (1-α) U(I,r,a p ) wierszy ze zbioru U(I,r,a p ) DO wybierz taki atrybut a i {a 1,,a m }\{a p } o minimalnym indeksie i, który oddziela największą liczbę wierszy ze zbioru U(I,r,a p ) dotychczas nie oddzielonych przez atrybuty ze zbioru Q; Q Q {a i }; Atrybuty zawarte w zbiorze Q tworzą cześć przesłankową α-reguły asocjacyjnej. END END END 3.1. Dokładność algorytmu zachłannego W rozdziale tym zostaną przedstawione twierdzenia z pracy [5] dotyczące oszacowania dokładności wyników uzyskiwanych za pomocą algorytmu zachłannego, na podstawie wyników badań P. Slavika [10], dotyczących częściowego pokrycia zbioru oraz wyników badań zawartych w [4]. Wyniki te pozwalają lepiej zrozumieć wybór algorytmu zachłannego, spośród aproksymacyjnych algorytmów o złożoności wielomianowej, dla minimalizacji długości częściowych reguł asocjacyjnych. Niech I będzie systemem informacyjnym zawierającym m kolumn oznaczonych przez atrybuty a 1,, a m, r = (b 1, b m ) będzie wierszem systemu I i atrybut a p {a 1,,a m }. Przez L min (α) = L min (α,i,r,a p ) jest oznaczana minimalna długość częściowej reguły asocjacyjnej dla trójki (I,r,a p ). Przez L greedy (α) = L greedy (α,i,r,a p ) jest oznaczana długość częściowej reguły asocjacyjnej konstruowanej przez algorytm zachłanny dla trójki (I,r,a p ).
5 Algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych 229 Twierdzenie 1. [5] Niech 0 α < 1 i (1-α) U(I,r,a p ) 2. Wówczas L greedy (α) < L min (α)(ln (1-α) U(I,r,a p ) - ln ln (1-α) U(I,r,a p ) +0.78). Twierdzenie 2. [5] Niech 0 α < 1. Wówczas dla każdej liczby naturalnej t 2 istnieje problem częściowej reguły asocjacyjnej (I, r, ap) taki, że (1-α) U(I,r,a p ) = t i Lgreedy(α) > Lmin(α)(ln (1-α) U(I,r,a p ) - ln ln (1-α) U(I,r,a p ) ). Twierdzenie 3. [5] Niech 0 α < 1 i U(I,r,a p ). Wówczas Lgreedy(α) Lmin(α)(1+ln (max j {1,,m}\{p} U(I,r,a p,a j ) )). Poniżej zostaną przedstawione twierdzenia dotyczące aproksymacyjnych algorytmów o złożoności wielomianowej. Twierdzenia te bazują na wynikach badań D. Ślęzaka [11], U.Feigego [3] oraz wynikach badań przedstawionych w [6]. Twierdzenie 4. [5] Niech 0 α < 1. Wówczas problem konstruowania α-reguły asocjacyjnej o minimalnej długości jest NP-trudny. Twierdzenie 5. [5] Niech α R i 0 α < 1. Jeśli NP DTIME (n O(log log n) ), wówczas dla każdej liczby ε, 0 < ε < 1 nie istnieje algorytm o złożoności wielomianowej, który dla danego problemu reguły asocjacyjnej (I,r,a p ) z U(I,r,a p ), konstruuje α-regułę asocjacyjną dla (I,r,a p ), której długość wynosi najwyżej (1-ε) Lmin (α,i,r,a p ) ln U(I,r,a p ). Z twierdzenia 3 wynika, że L greedy (α) L min (α)(1 + ln U(I,r,a p ) ). Z tej nierówności i z twierdzenia 5 wynika, że przyjmując założenie NP DTIME (n O(loglogn) ), algorytm zachłanny pozwala uzyskać wyniki, bliskie wynikom uzyskiwanym przez najlepsze algorytmy aproksymacyjne o złożoności wielomianowej dla minimalizacji długości częściowej reguły asocjacyjnej. 4. Wyniki eksperymentów Rozdział ten przedstawia wyniki eksperymentów, które miały na celu zbadanie zależności pomiędzy: długością częściowych reguł asocjacyjnych a wartością parametru α;
6 230 B. Zielosko W tym celu dla analizowanych zbiorów danych została wyznaczona minimalna, średnia i maksymalna długość częściowych reguł asocjacyjnych; liczbą reguł asocjacyjnych a wartością parametru minimalnego wsparcia; liczbą reguł wyznaczonych dla określonej wartości parametru α, z uwzględnieniem zadanego współczynnika minimalnego wsparcia. Eksperymenty zostały przeprowadzone na zbiorach danych umieszczonych w repozytorium UCI repository of machine learning [2]: car (7 atrybutów, 1728 wierszy); flags (27 atrybutów, 194 wiersze); ze zbioru tego zostały usunięte atrybuty: area, population i name of the country, ich pozostawienie wymagałoby przeprowadzenia dyskretyzacji; kr-vs-kp (37 atrybutów, 3196 wierszy); lenses (5 atrybutów, 24 wiersze); lymphography (19 atrybutów, 148 wierszy); spect (23 atrybuty, 267 wierszy); zoo (17 atrybutów, 101 wierszy). Ze zbioru został usunięty atrybut animal name. Tabela 1 przedstawia minimalne (min), średnie (avg) i maksymalne (max) długości częściowych reguł asocjacyjnych, w zależności od wartości parametru α, α={0.0, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5} Tabela 1 Długości reguł asocjacyjnych w zależności od wartości α Nazwa zbioru Długość Parametr α log 2 (1/α) min Car avg max min Flags avg max Lenses min Lenses avg max Lympho- min graphy avg max min Zoo avg max
7 Algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych 231 W pracy [5] została sformułowana nieformalnie tzw. 0.5-hipoteza: dla większej części systemów informacyjnych I, dla każdego wiersza r i każdego atrybutu a p, podczas konstruowania częściowej reguły asocjacyjnej dla trójki (I,r,a p ) algorytm zachłanny w każdym kroku wybiera atrybut, który oddziela od wiersza r przynajmniej połowę wierszy dotychczas nie oddzielonych ze zbioru U(I, r, a p ). Można pokazać, że jeśli 0.5-hipoteza jest prawdziwa dla danego systemu informacyjnego, wówczas długość reguły konstruowanej przez algorytm zachłanny wynosi najwyżej log 2 (1/α). Wyniki eksperymentów przedstawione w tabeli 1 pokazują, że rozważana właściwość nie zachodzi tylko dla zbioru zoo. Wyniki te stanowią pośrednie potwierdzenie 0.5-hipotezy. Na podstawie wyników w tabeli 1 można zauważyć, że wraz ze wzrostem wartości parametru α zmniejsza się średnia i maksymalna długość częściowych reguł asocjacyjnych. Na przykład dla α=0.5 wartości te wynoszą 1 dla przedstawionych pięciu zbiorów danych. Minimalne długości częściowych reguł asocjacyjnych także wynoszą 1. Średnia długość częściowych reguł asocjacyjnych od wartości α=0.25, z wyjątkiem zbioru lenses, również wynosi 1. Wyniki eksperymentów z tabeli 1 zostały także zaprezentowane w formie graficznej (rys. 2 i rys. 3). Rysunek 2 przedstawia minimalną, średnią i maksymalną długość częściowych reguł asocjacyjnych dla pliku zoo. Rys. 2. Minimalna, średnia i maksymalna długość częściowych reguł asocjacyjnych dla zbioru danych zoo Fig. 2. The minimal, average and maximal length of partial association rules for the dataset zoo Rysunek 3 przedstawia minimalną, średnią i maksymalną długość częściowych reguł asocjacyjnych dla pliku lenses. Jednym z problemów związanych z algorytmem A priori jest duża liczba konstruowanych reguł. Podejście zaproponowane w artykule nie posiada tej wady, tzn. liczba konstruowanych reguł wynosi najwyżej mn, gdzie m jest liczbą atrybutów, a n liczbą obiektów dla danego systemu informacyjnego. Poniżej zostanie pokazane, że liczba różnych reguł konstruowanych
8 232 B. Zielosko przez algorytm zachłanny może być znacznie mniejsza niż mn. Liczbę tych reguł można ograniczyć, jeśli zostaną uwzględnione dodatkowe parametry, np. wsparcie (support). Rys. 3. Minimalna, średnia i maksymalna długość częściowych reguł asocjacyjnych dla zbioru danych lenses Fig. 3. The minimal, average and maximal length of partial association rules for the dataset lenses Tabela 2 przedstawia liczbę wygenerowanych częściowych reguł asocjacyjnych, w zależności od minimalnej wartości parametru wsparcia. Dla zbiorów danych kr-vs-kp, lymphography, zoo i spect, stosując algorytm zachłanny zostały skonstruowane częściowe reguły asocjacyjne dla każdego wiersza i każdego atrybutu ze zbioru {a 1,,a m } oznaczonego jako a p oraz wartości α={0.0} i minimalnej wartości wsparcia supp={0, 10%, 20%, 30%, 40%, 50%}. W przypadku powtarzających się reguł uwzględniana była tylko jedna. Tabela 2 Liczba reguł w zależności od wartości minimalnego wsparcia Nazwa zbioru Minimalne wsparcie (supp) 0 10% 20% 30% 40% 50% Kr-vs-kp Lymphography Spect Zoo Można dokonać porównania teoretycznej górnej granicy mn liczby reguł konstruowanych przez algorytm zachłanny i rzeczywistej liczby różnych reguł konstruowanych przez przedstawiony algorytm. Dla zbioru kr-vs-kp, mn = , a rzeczywista liczba skonstruowanych reguł wynosi Dla zbioru lymphography, mn = 2812, a rzeczywista liczba skonstruowanych reguł wynosi Dla zbioru spect, mn = 6141, a rzeczywista liczba skonstruowanych reguł wynosi Dla zbioru zoo, mn = 1717, a rzeczywista liczba skonstruowanych reguł wynosi 287.
9 Algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych 233 Zatem można zauważyć, że rzeczywista liczba różnych reguł skonstruowanych przez algorytm zachłanny często jest znacznie mniejsza niż teoretyczna górna granica mn. Rysunek 4 przedstawia liczbę skonstruowanych przez algorytm zachłanny częściowych reguł asocjacyjnych, w zależności od wartości minimalnego wsparcia, dla pliku zoo. Rys. 4. Liczba reguł w zależności od minimalnego wsparcia dla zbioru danych zoo Fig. 4. The number of rules dependent on minimal support for dataset zoo Na podstawie wyników z tabeli 2 oraz rys. 4 można zauważyć, że wraz ze wzrostem minimalnej wartości wsparcia liczba skonstruowanych częściowych reguł asocjacyjnych zmniejsza się. Zatem parametr ten ma znaczenie w sytuacji, kiedy użytkownik chce ograniczyć liczbę konstruowanych częściowych reguł asocjacyjnych. Na przykład, dla zbioru zoo liczba skonstruowanych częściowych reguł asocjacyjnych (z pominięciem reguł powtarzających się), przy wartości minimalnego wsparcia supp = 10%, wynosi 81, natomiast przy wartości supp = 30% wynosi 29. Wyniki w tabeli 2 dotyczyły sytuacji, kiedy α = 0. Poniżej zostanie rozważony przypadek, kiedy parametr α wzrasta. Tabela 3 przedstawia liczbę wygenerowanych częściowych reguł asocjacyjnych, w zależności od wartości parametru α i minimalnej wartości parametru wsparcia. Dla zbiorów danych lymphography, spect i zoo zostały skonstruowane częściowe reguły asocjacyjne dla każdego wiersza i każdego atrybutu ze zbioru {a 1,,a m } oznaczonego jako a p oraz wartości α={0.0, 0.05, 0.1} i minimalnej wartości wsparcia supp={10%, 20%, 30%, 40%, 50%}. W przypadku powtarzających się reguł uwzględniana była tylko jedna. Na podstawie wyników z tabeli 3 można zauważyć zależność pomiędzy parametrem minimalnego wsparcia i długością reguł, która związana jest z wartością α. Wraz ze wzrostem wartości α, częściowa reguła asocjacyjna staje się krótsza, co należy rozumieć, że jest bardziej ogólna. W związku z tym wraz ze wzrostem wartości α, przy stałym zadanym współczynniku minimalnego wsparcia, liczba reguł (postaci X Y) spełniających
10 234 B. Zielosko prawdopodobieństwo zajścia zdarzenia X Y zwiększa się. Na przykład, dla zbioru lymphography, przy wartości minimalnego wsparcia supp = 10%, liczba skonstruowanych częściowych reguł asocjacyjnych dla α = 0.0 wynosi 75, dla α = 0.05 wynosi 106, natomiast dla α = 0.1 wynosi 114. Tabela 3 Liczba reguł w zależności od parametru α i minimalnej wartości wsparcia Nazwa Minimalne wsparcie (supp) zbioru alfa 10% 20% 30% 40% 50% Lympho graphy Spect Zoo Zatem dla większych wartości α należałoby rozważyć silniejsze ograniczenia związane z parametrem minimalnego wsparcia w celu uzyskania stosunkowo małej liczby reguł. 5. Podsumowanie W pracy przedstawiono wyniki badań teoretycznych, na podstawie [5] i eksperymenttalnych dotyczących algorytmu zachłannego dla konstruowania częściowych reguł asocjacyjnych. Pokazują one, że przyjmując pewne założenia dotyczące klasy NP, algorytm zachłanny pozwala uzyskać wyniki bliskie wynikom uzyskiwanym przez najlepsze algorytmy aproksymacyjne o złożoności wielomianowej, dla minimalizacji długości częściowej reguły asocjacyjnej. Algorytm ten pozwala konstruować stosunkowo małą liczbę krótkich częściowych reguł asocjacyjnych o dobrej jakości, które pokrywają wszystkie obiekty danego systemu informacyjnego. Stosując parametr minimalnego wsparcia można zmniejszyć liczbę generowanych reguł. Kolejnym etapem badań będzie przeprowadzenie większej liczby eksperymentów oraz wykorzystanie innych miar dotyczących reguł asocjacyjnych, np. parametru ufności oraz wsparcia i ufności łącznie i zbadanie zależności liczby reguł od wartości tych parametrów, oraz porównanie wyników np. z wynikami dotyczącymi reguł generowanych za pomocą algorytmu A priori. W następnym etapie zostaną przeprowadzone eksperymenty pozwalające
11 Algorytm zachłanny dla konstruowania częściowych reguł asocjacyjnych 235 określić jakość klasyfikatorów konstruowanych z wykorzystaniem częściowych reguł asocjacyjnych. BIBLIOGRAFIA 1. Agrawal R., Srikant, R.: Fast algorithms for mining association rules in large databases, Proc. 20th International Conference on Very Large Data Bases (Bocca J.B., Jarke M., Zaniolo C., Eds.), Morgan Kaufmann, Asuncion A., Newman D.: UCI machine learning repository, ~mlearn/mlrepository.html, University of California, Irvine, School of Information and Computer Sciences, Feige U.: A threshold of lnn for approximating set cover (preliminary version). Proc. 28th Annual ACM Symposium on the Theory of Computing, ACM Press, New York, Moshkov M.Ju., Piliszczuk M., Zielosko B.: Partial Covers, Reducts and Decision Rules in Rough Sets: Theory and Applications. Studies in Computational Intelligence, Vol. 145, Springer, Heidelberg, Moshkov M.Ju., Piliszczuk M., Zielosko B.: Greedy algorithm for construction of partial association rules. Fundamenta Informaticae, 92, Vol. 3, 2009, s Nguyen H.S., Ślęzak D.: Approximate reducts and association rules correspondence and complexity results, Proc. Rough Sets, Fuzzy Sets, Data Mining and Granular Computing (Zhong N., Skowron A., Ohsuga S.), LNCS (LNAI) 1711, Springer, Heidelberg, Pawlak Z.: Rough Sets Theoretical Aspects of Reasoning about Data. Kluwer Academic Publishers, Dordrecht, Rissanen J.: Modeling by shortest data description. Automatica, 14, 1978, s Skowron A.: Rough sets in KDD. Proc. 16th IFIP World Computer Congress (Shi Z., Faltings B., Musen M., Eds.), Publishing House of Electronic Industry, Slavik P.: Approximation algorithms for set cover and related problems, Ph.D. Thesis, University of New York at Buffalo, Ślęzak D.: Approximate entropy reducts. Fundamenta Informaticae, 53, 2002, s Recenzenci: Dr inż. Henryk Josiński, Dr inż. Marek Sikora Wpłynęło do Redakcji 31 stycznia 2010 r.
12 236 B. Zielosko Abstract In the paper, greedy algorithm for partial association rules construction is considered. This algorithm is different from the Apriori algorithm and its modifications based on frequent itemsets. Partial association rules are a special kind of association rules. Association rules are used in data mining and can be considered as a way of knowledge representation. Exact rules can be overfitted, i.e., dependent essentially on the noise or adjusted too much to the existing examples. Then instead of exact rules with many attributes, it is more appropriate to work with partial (approximate) rules with smaller number of attributes. The problem of minimization of association rule length is NP-hard, so we use approximate algorithm (greedy algorithm), which allows us to construct shorter rules in reasonable time. Theoretical results show, that under some natural assumptions on the class NP, the greedy algorithm is close to the best polynomial approximate algorithms for the minimization of the length of partial association rules. Experimental results (Table 1) show that greedy algorithm allows us to construct relatively small number of short partial association rules with good accuracy which cover all objects from given information system. These results can be considered also as a confirmation of 0.5-hypothesis from [5]: for the most part of information systems I, for each row r and each attribute a p, under the construction of partial association rule for (I,r,a p ), during each step the greedy algorithm chooses an attribute which separates from the row r at least one-half of unseparated rows from U(I,r,a p ). One of the problems connected with the use of Apriori algorithm is the large number of constructed rules. The approach considered in this paper has no this deficiency: the number of constructed rules is at most mn, where m is the number of attributes and n is the number of objects in considered information system. Experimental results show that the number of different rules constructed by greedy algorithm can be essentially less than the theoretical bound mn. Also we can decrease the number of rules essentially if we consider additional parameters, for example, support (see Table 2 and 3). In future work author would like to do more experiments and use another parameter confidence, or confidence and support together. The next step will be to create classifiers based on partial association rules and evaluate accuracy of classification. Adres Beata ZIELOSKO: Uniwersytet Śląski, Instytut Informatyki, ul. Będzińska 39, Sosnowiec, Polska, beata.zielosko@us.edu.pl.
OPTYMALIZACJA CZĘŚCIOWYCH REGUŁ ASOCJACYJNYCH WZGLĘDEM LICZBY POMYŁEK
STUDIA INFORMATICA 2016 Volume 37 Number 1 (123) Beata ZIELOSKO Uniwersytet Śląski, Instytut Informatyki Marek ROBASZKIEWICZ EL-PLUS Sp. z o.o. OPTYMALIZACJA CZĘŚCIOWYCH REGUŁ ASOCJACYJNYCH WZGLĘDEM LICZBY
Optymalizacja reguł decyzyjnych względem pokrycia
Zakład Systemów Informatycznych Instytut Informatyki, Uniwersytet Śląski Chorzów, 9 grudzień 2014 Wprowadzenie Wprowadzenie problem skalowalności dla optymalizacji reguł decyzjnych na podstawie podejścia
Hard-Margin Support Vector Machines
Hard-Margin Support Vector Machines aaacaxicbzdlssnafiyn9vbjlepk3ay2gicupasvu4iblxuaw2hjmuwn7ddjjmxm1bkcg1/fjqsvt76fo9/gazqfvn8y+pjpozw5vx8zkpvtfxmlhcwl5zxyqrm2vrg5zw3vxmsoezi4ogkr6phieky5crvvjhriqvdom9l2xxftevuwcekj3lktmhghgniauiyutvrwxtvme34a77kbvg73gtygpjsrfati1+xc8c84bvraowbf+uwnipyehcvmkjrdx46vlykhkgykm3ujjdhcyzqkxy0chur6ax5cbg+1m4bbjptjcubuz4kuhvjoql93hkin5hxtav5x6yyqopnsyuneey5ni4keqrxbar5wqaxbik00icyo/iveiyqqvjo1u4fgzj/8f9x67bzmxnurjzmijtlybwfgcdjgfdtajwgcf2dwaj7ac3g1ho1n4814n7wwjgjmf/ys8fenfycuzq==
Sztuczna Inteligencja Projekt
Sztuczna Inteligencja Projekt Temat: Algorytm LEM2 Liczba osób realizujących projekt: 2 1. Zaimplementować algorytm LEM 2. 2. Zaimplementować klasyfikator Classif ier. 3. Za pomocą algorytmu LEM 2 wygenerować
Ćwiczenie 5. Metody eksploracji danych
Ćwiczenie 5. Metody eksploracji danych Reguły asocjacyjne (association rules) Badaniem atrybutów lub cech, które są powiązane ze sobą, zajmuje się analiza podobieństw (ang. affinity analysis). Metody analizy
Linear Classification and Logistic Regression. Pascal Fua IC-CVLab
Linear Classification and Logistic Regression Pascal Fua IC-CVLab 1 aaagcxicbdtdbtmwfafwdgxlhk8orha31ibqycvkdgpshdqxtwotng2pxtvqujmok1qlky5xllzrnobbediegwcap4votk2kqkf+/y/tnphdschtadu/giv3vtea99cfma8fpx7ytlxx7ckns4sylo3doom7jguhj1hxchmy/irhrlgh67lxb5x3blis8jjqynmedqujiu5zsqqagrx+yjcfpcrydusshmzeluzsg7tttiew5khhcuzm5rv0gn1unw6zl3gbzlpr3liwncyr6aaqinx4wnc/rpg6ix5szd86agoftuu0g/krjxdarph62enthdey3zn/+mi5zknou2ap+tclvhob9sxhwvhaqketnde7geqjp21zvjsfrcnkfhtejoz23vq97elxjlpbtmxpl6qxtl1sgfv1ptpy/yq9mgacrzkgje0hjj2rq7vtywnishnnkzsqekucnlblrarlh8x8szxolrrxkb8n6o4kmo/e7siisnozcfvsedlol60a/j8nmul/gby8mmssrfr2it8lkyxr9dirxxngzthtbaejv
Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science
Proposal of thesis topic for mgr in (MSE) programme 1 Topic: Monte Carlo Method used for a prognosis of a selected technological process 2 Supervisor: Dr in Małgorzata Langer 3 Auxiliary supervisor: 4
Reguły asocjacyjne w programie RapidMiner Michał Bereta
Reguły asocjacyjne w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Reguły asocjacyjne mają na celu odkrycie związków współwystępowania pomiędzy atrybutami. Stosuje się je często do danych
A Zadanie
where a, b, and c are binary (boolean) attributes. A Zadanie 1 2 3 4 5 6 7 8 9 10 Punkty a (maks) (2) (2) (2) (2) (4) F(6) (8) T (8) (12) (12) (40) Nazwisko i Imiȩ: c Uwaga: ta część zostanie wypełniona
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Metody eksploracji danych. Reguły asocjacyjne
Metody eksploracji danych Reguły asocjacyjne Analiza podobieństw i koszyka sklepowego Analiza podobieństw jest badaniem atrybutów lub cech, które są powiązane ze sobą. Metody analizy podobieństw, znane
Budowa modeli klasyfikacyjnych o skośnych warunkach
Budowa modeli klasyfikacyjnych o skośnych warunkach Marcin Michalak (Marcin.Michalak@polsl.pl) III spotkanie Polskiej Grupy Badawczej Systemów Uczących Się Wrocław, 17 18.03.2014 Outline 1 Dwa podejścia
B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ;
Algorytm LEM1 Oznaczenia i definicje: U - uniwersum, tj. zbiór obiektów; A - zbiór atrybutów warunkowych; d - atrybut decyzyjny; IND(B) = {(x, y) U U : a B a(x) = a(y)} - relacja nierozróżnialności, tj.
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
Tychy, plan miasta: Skala 1: (Polish Edition)
Tychy, plan miasta: Skala 1:20 000 (Polish Edition) Poland) Przedsiebiorstwo Geodezyjno-Kartograficzne (Katowice Click here if your download doesn"t start automatically Tychy, plan miasta: Skala 1:20 000
Teorioinformacyjne twierdzenie Gödla,
Teorioinformacyjne twierdzenie Gödla, czyli co ma logika do statystyki? Łukasz Dębowski ldebowsk@ipipan.waw.pl Instytut Podstaw Informatyki PAN Temat referatu Twierdzenie, o którym opowiem, jest pomysłem
Maszyny wektorów podpierajacych w regresji rangowej
Maszyny wektorów podpierajacych w regresji rangowej Uniwersytet Mikołaja Kopernika Z = (X, Y ), Z = (X, Y ) - niezależne wektory losowe o tym samym rozkładzie X X R d, Y R Z = (X, Y ), Z = (X, Y ) - niezależne
TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction
TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 9: Inference in Structured Prediction 1 intro (1 lecture) Roadmap deep learning for NLP (5 lectures) structured prediction
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza
METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING EKSPLORACJA DANYCH Ćwiczenia Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2
Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2 aaaklnictzzjb9tgfmcnadpg7oy0lxa9edva9kkapdarhyk2k7gourinlwsweyzikuyiigvyleiv/cv767fpf/5crc1xt9va5mx7w3m/ecuqw1kuztpx/rl3/70h73/w4cog9dhhn3z62d6jzy+yzj766txpoir9nzszisjynetqr+rvlfvyoozu5xbybpsxb1wahul8phczdt2v4zgchb7uecwphlyigrgkjcyiflfyci0kxnmr4z6kw0jsokvot8isntpa3gbknlcufiv/h+hh+eur4fomd417rvtfjoit5pfju6yxiab2fmwk0y/feuybobqk+axnke8xzjjhfyd8kkpl9zdoddkazd5j6bzpemjb64smjb6vb4xmehysu08lsrszopxftlzee130jcb0zjxy7r5wa2f1s2off2+dyatrughnrtpkuprlcpu55zlxpss/yqe2eamjkcf0jye8w8yas0paf6t0t2i9stmcua+inbi2rt01tz22tubbqwidypvgz6piynkpobirkxgu54ibzoti4pkw2i5ow9lnuaoabhuxfxqhvnrj6w15tb3furnbm+scyxobjhr5pmj5j/w5ix9wsa2tlwx9alpshlunzjgnrwvqbpwzjl9wes+ptyn+ypy/jgskavtl8j0hz1djdhzwtpjbbvpr1zj7jpg6ve7zxfngj75zee0vmp9qm2uvgu/9zdofq6r+g8l4xctvo+v+xdrfr8oxiwutycu0qgyf8icuyvp/sixfi9zxe11vp6mrjjovpmxm6acrtbia+wjr9bevlgjwlz5xd3rfna9g06qytaoofk8olxbxc7xby2evqjmmk6pjvvzxmpbnct6+036xp5vdbrnbdqph8brlfn/n/khnfumhf6z1v7h/80yieukkd5j0un82t9mynxzmk0s/bzn4tacdziszdhwrl8x5ako8qp1n1zn0k6w2em0km9zj1i4yt1pt3xiprw85jmc2m1ut2geum6y6es2fwx6c+wlrpykblopbuj5nnr2byygfy5opllv4+jmm7s6u+tvhywbnb0kv2lt5th4xipmiij+y1toiyo7bo0d+vzvovjkp6aoejsubhj3qrp3fjd/m23pay8h218ibvx3nicofvd1xi86+kh6nb/b+hgsjp5+qwpurzlir15np66vmdehh6tyazdm1k/5ejtuvurgcqux6yc+qw/sbsaj7lkt4x9qmtp7euk6zbdedyuzu6ptsu2eeu3rxcz06uf6g8wyuveznhkbzynajbb7r7cbmla+jbtrst0ow2v6ntkwv8svnwqnu5pa3oxfeexf93739p93chq/fv+jr8r0d9brhpcxr2w88bvqbr41j6wvrb+u5dzjpvx+veoaxwptzp/8cen+xbg==
ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.
ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS. Strona 1 1. Please give one answer. I am: Students involved in project 69% 18 Student not involved in
Generowanie zbioru reguł asocjacyjnych i decyzyjnych ze statystycznie reprezentatywnym wsparciem i anty-wsparciem
Generowanie zbioru reguł asocjacyjnych i decyzyjnych ze statystycznie reprezentatywnym wsparciem i anty-wsparciem Opiekun naukowy: prof. dr hab. inż. Roman Słowiński Poznań, 30 października 2012 Spis treści
y = The Chain Rule Show all work. No calculator unless otherwise stated. If asked to Explain your answer, write in complete sentences.
The Chain Rule Show all work. No calculator unless otherwise stated. If asked to Eplain your answer, write in complete sentences. 1. Find the derivative of the functions y 7 (b) (a) ( ) y t 1 + t 1 (c)
Numeryczna symulacja rozpływu płynu w węźle
231 Prace Instytutu Mechaniki Górotworu PAN Tom 7, nr 3-4, (2005), s. 231-236 Instytut Mechaniki Górotworu PAN Numeryczna symulacja rozpływu płynu w węźle JERZY CYGAN Instytut Mechaniki Górotworu PAN,
Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering
Machine Learning for Data Science (CS4786) Lecture 11 Spectral Embedding + Clustering MOTIVATING EXAMPLE What can you say from this network? MOTIVATING EXAMPLE How about now? THOUGHT EXPERIMENT For each
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania
Zastosowanie sztucznej inteligencji w testowaniu oprogramowania Problem NP Problem NP (niedeterministycznie wielomianowy, ang. nondeterministic polynomial) to problem decyzyjny, dla którego rozwiązanie
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
Systemy uczące się wykład 2
Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania
Stargard Szczecinski i okolice (Polish Edition)
Stargard Szczecinski i okolice (Polish Edition) Janusz Leszek Jurkiewicz Click here if your download doesn"t start automatically Stargard Szczecinski i okolice (Polish Edition) Janusz Leszek Jurkiewicz
Algorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
tum.de/fall2018/ in2357
https://piazza.com/ tum.de/fall2018/ in2357 Prof. Daniel Cremers From to Classification Categories of Learning (Rep.) Learning Unsupervised Learning clustering, density estimation Supervised Learning learning
Metody probabilistyczne klasyfikatory bayesowskie
Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych First Prev Next Last Go Back Full Screen Close Quit Metody probabilistyczne klasyfikatory bayesowskie Wykład 8 Marcin
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
WYKŁAD 6. Reguły decyzyjne
Wrocław University of Technology WYKŁAD 6 Reguły decyzyjne autor: Maciej Zięba Politechnika Wrocławska Reprezentacje wiedzy Wiedza w postaci reguł decyzyjnych Wiedza reprezentowania jest w postaci reguł
Ewelina Dziura Krzysztof Maryański
Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład
Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska
Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości
Wyk lad 8: Leniwe metody klasyfikacji
Wyk lad 8: Leniwe metody Wydzia l MIM, Uniwersytet Warszawski Outline 1 2 lazy vs. eager learning lazy vs. eager learning Kiedy stosować leniwe techniki? Eager learning: Buduje globalna hipoteze Zaleta:
Data Mining Wykład 5. Indukcja drzew decyzyjnych - Indeks Gini & Zysk informacyjny. Indeks Gini. Indeks Gini - Przykład
Data Mining Wykład 5 Indukcja drzew decyzyjnych - Indeks Gini & Zysk informacyjny Indeks Gini Popularnym kryterium podziału, stosowanym w wielu produktach komercyjnych, jest indeks Gini Algorytm SPRINT
THE PART OF FUZZY SYSTEMS ASSISTING THE DECISION IN DI- AGNOSTICS OF FUEL ENGINE SUBASSEMBLIES DEFECTS
Journal of KONES Internal Combustion Engines 2005, vol. 12, 3-4 THE PART OF FUZZY SYSTEMS ASSISTING THE DECISION IN DI- AGNOSTICS OF FUEL ENGINE SUBASSEMBLIES DEFECTS Mariusz Topolski Politechnika Wrocławska,
General Certificate of Education Ordinary Level ADDITIONAL MATHEMATICS 4037/12
UNIVERSITY OF CAMBRIDGE INTERNATIONAL EXAMINATIONS General Certificate of Education Ordinary Level www.xtremepapers.com *6378719168* ADDITIONAL MATHEMATICS 4037/12 Paper 1 May/June 2013 2 hours Candidates
Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis
Machine Learning for Data Science (CS4786) Lecture11 5 Random Projections & Canonical Correlation Analysis The Tall, THE FAT AND THE UGLY n X d The Tall, THE FAT AND THE UGLY d X > n X d n = n d d The
Revenue Maximization. Sept. 25, 2018
Revenue Maximization Sept. 25, 2018 Goal So Far: Ideal Auctions Dominant-Strategy Incentive Compatible (DSIC) b i = v i is a dominant strategy u i 0 x is welfare-maximizing x and p run in polynomial time
Analiza stanów gry na potrzeby UCT w DVRP
Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527 Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza
Liczbę 29 możemy zaprezentować na siedem różnych sposobów:
Numeryczna analiza rozkładu liczb naturalnych na określoną sumę liczb pierwszych Świerczewski Ł. Od blisko 200 lat matematycy poszukują odpowiedzi na pytanie zadane przez Christiana Goldbacha, który w
Zbiory przybliżone, cz. 1 (wersja do druku) dr. Piotr Szczuko
Zbiory przybliżone, cz. 1 (wersja do druku) dr. Piotr Szczuko Katedra Systemów Multimedialnych 2009 Plan wykładu Historia zbiorów przybliżonych System informacyjny i decyzyjny Reguły decyzyjne Tożsamość
1. Odkrywanie asocjacji
1. 2. Odkrywanie asocjacji...1 Algorytmy...1 1. A priori...1 2. Algorytm FP-Growth...2 3. Wykorzystanie narzędzi Oracle Data Miner i Rapid Miner do odkrywania reguł asocjacyjnych...2 3.1. Odkrywanie reguł
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
Extraclass. Football Men. Season 2009/10 - Autumn round
Extraclass Football Men Season 2009/10 - Autumn round Invitation Dear All, On the date of 29th July starts the new season of Polish Extraclass. There will be live coverage form all the matches on Canal+
OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA
Tomasz Bąk Uniwersytet Ekonomiczny w Katowicach OPTYMALIZACJA LICZBY WARSTW DLA ALOKACJI NEYMANA Wprowadzenie Losowanie warstwowe jest często wykorzystywaną w praktyce metodą doboru próby w przypadku estymacji
Wprowadzenie do programu RapidMiner, część 2 Michał Bereta 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów
Wprowadzenie do programu RapidMiner, część 2 Michał Bereta www.michalbereta.pl 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów Zaimportuj dane pima-indians-diabetes.csv. (Baza danych poświęcona
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji
Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Jacek Szcześniak Jerzy Błaszczyński Roman Słowiński Poznań, 5.XI.2013r. Konspekt Wstęp Wprowadzenie Metody typu wrapper Nowe metody
Laboratorium 4. Naiwny klasyfikator Bayesa.
Laboratorium 4 Naiwny klasyfikator Bayesa. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk
OpenPoland.net API Documentation
OpenPoland.net API Documentation Release 1.0 Michał Gryczka July 11, 2014 Contents 1 REST API tokens: 3 1.1 How to get a token............................................ 3 2 REST API : search for assets
Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)
Zakopane, plan miasta: Skala ok. 1:15 000 = City map (Polish Edition) Click here if your download doesn"t start automatically Zakopane, plan miasta: Skala ok. 1:15 000 = City map (Polish Edition) Zakopane,
Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów
Rozpoznawanie twarzy metodą PCA Michał Bereta www.michalbereta.pl 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów Wiemy, że możemy porównywad klasyfikatory np. za pomocą kroswalidacji.
SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like
SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1 I SSW1.1, HFW Fry #65, Zeno #67 Benchmark: Qtr.1 like SSW1.2, HFW Fry #47, Zeno #59 Benchmark: Qtr.1 do SSW1.2, HFW Fry #5, Zeno #4 Benchmark: Qtr.1 to SSW1.2,
ZASTOSOWANIE ZBIORÓW PRZYBLIŻONYCH DO ANALIZY SATYSFAKCJI KLIENTA SERWISU POJAZDÓW
Inżynieria Rolnicza 1(99)/2008 ZASTOSOWANIE ZBIORÓW PRZYBLIŻONYCH DO ANALIZY SATYSFAKCJI KLIENTA SERWISU POJAZDÓW Marek Klimkiewicz, Katarzyna Moczulska Katedra Organizacji i Inżynierii Produkcji, Szkoła
Gradient Coding using the Stochastic Block Model
Gradient Coding using the Stochastic Block Model Zachary Charles (UW-Madison) Joint work with Dimitris Papailiopoulos (UW-Madison) aaacaxicbvdlssnafj3uv62vqbvbzwarxjsqikaboelgzux7gcaeywtsdp1mwsxeaepd+ctuxcji1r9w5984bbpq1gmxdufcy733bcmjutn2t1fawl5zxsuvvzy2t7z3zn29lkwyguktjywrnqbjwigntuuvi51uebqhjlsdwfxebz8qiwnc79uwjv6mepxgfcoljd88uiox0m1hvlnzwzgowymjn7tjyzertmvpareju5aqkndwzs83thawe64wq1j2httvxo6eopirccxnjekrhqae6wrkuuykl08/gmnjryqwsoqurubu/t2ro1jkyrzozhipvpz3juj/xjdt0ywxu55mina8wxrldkoetukairuekzbubgfb9a0q95fawonqkjoez/7lrdi6trzbcm7pqvwrio4yoarh4aq44bzuwq1ogcba4be8g1fwzjwzl8a78tfrlrnfzd74a+pzb2h+lzm=
XIII International PhD Workshop OWD 2011, October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH
XIII International PhD Workshop OWD 2011, 22 25 October 2011 METODA REEINGINEERINGU ORGANIZACJI Z WYKORZYSTANIEM SYMULATORA PROCESÓW BIZNESOWYCH METHOD OF REEINGINEERING ORGANIZATION USING BUSINESS PROCESS
Sztuczna inteligencja
POLITECHNIKA KRAKOWSKA WIEiK KATEDRA AUTOMATYKI I TECHNIK INFORMACYJNYCH Sztuczna inteligencja www.pk.edu.pl/~zk/si_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 10: Zbiory przybliżone
Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2
Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł
ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL
Read Online and Download Ebook ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL DOWNLOAD EBOOK : ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA Click link bellow and free register
Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)
Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition) J Krupski Click here if your download doesn"t start automatically Karpacz, plan miasta 1:10 000: Panorama
Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)
Katowice, plan miasta: Skala 1:20 000 = City map = Stadtplan (Polish Edition) Polskie Przedsiebiorstwo Wydawnictw Kartograficznych im. Eugeniusza Romera Click here if your download doesn"t start automatically
Machine Learning for Data Science (CS4786) Lecture 24. Differential Privacy and Re-useable Holdout
Machine Learning for Data Science (CS4786) Lecture 24 Differential Privacy and Re-useable Holdout Defining Privacy Defining Privacy Dataset + Defining Privacy Dataset + Learning Algorithm Distribution
Inżynieria biomedyczna
Inżynieria biomedyczna Projekt Przygotowanie i realizacja kierunku inżynieria biomedyczna studia międzywydziałowe współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.
Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl. magda.szewczyk@slo-wroc.pl. Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to teachers
1 z 7 2015-05-14 18:32 Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl Back Twoje konto Wyloguj magda.szewczyk@slo-wroc.pl BIODIVERSITY OF RIVERS: Survey to teachers Tworzenie ankiety Udostępnianie
Fig 5 Spectrograms of the original signal (top) extracted shaft-related GAD components (middle) and
Fig 4 Measured vibration signal (top). Blue original signal. Red component related to periodic excitation of resonances and noise. Green component related. Rotational speed profile used for experiment
Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl. magda.szewczyk@slo-wroc.pl. Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to students
Ankiety Nowe funkcje! Pomoc magda.szewczyk@slo-wroc.pl Back Twoje konto Wyloguj magda.szewczyk@slo-wroc.pl BIODIVERSITY OF RIVERS: Survey to students Tworzenie ankiety Udostępnianie Analiza (55) Wyniki
TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2
TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 8: Structured PredicCon 2 1 Roadmap intro (1 lecture) deep learning for NLP (5 lectures) structured predic+on (4 lectures)
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
Krytyczne czynniki sukcesu w zarządzaniu projektami
Seweryn SPAŁEK Krytyczne czynniki sukcesu w zarządzaniu projektami MONOGRAFIA Wydawnictwo Politechniki Śląskiej Gliwice 2004 SPIS TREŚCI WPROWADZENIE 5 1. ZARZĄDZANIE PROJEKTAMI W ORGANIZACJI 13 1.1. Zarządzanie
Optymalizacja. Przeszukiwanie lokalne
dr hab. inż. Instytut Informatyki Politechnika Poznańska www.cs.put.poznan.pl/mkomosinski, Maciej Hapke Idea sąsiedztwa Definicja sąsiedztwa x S zbiór N(x) S rozwiązań, które leżą blisko rozwiązania x
Struktury danych i złożoność obliczeniowa Wykład 5. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład 5 Prof. dr hab. inż. Jan Magott DMT rozwiązuje problem decyzyjny π przy kodowaniu e w co najwyżej wielomianowym czasie, jeśli dla wszystkich łańcuchów wejściowych
Życie za granicą Studia
- Uczelnia I would like to enroll at a university. Wyrażenie chęci zapisania się na uczelnię I want to apply for course. an undergraduate a postgraduate a PhD a full-time a part-time an online I would
komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW
Czego moga się nauczyć komputery? Andrzej Skowron, Hung Son Nguyen son@mimuw.edu.pl; skowron@mimuw.edu.pl Instytut Matematyki, Wydział MIM, UW colt.tex Czego mogą się nauczyć komputery? Andrzej Skowron,
Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu
Data Mining Wykład 3 Algorytmy odkrywania binarnych reguł asocjacyjnych Plan wykładu Algorytm Apriori Funkcja apriori_gen(ck) Generacja zbiorów kandydujących Generacja reguł Efektywności działania Własności
9. Schematy aproksymacyjne
9. Schematy aproksymacyjne T.H. Cormen, C.E. Leiserson, R.L. Rivest, C. Stein Wprowadzenie do algorytmów, WNT (2004) O.H. Ibarra, C.E. Kim Fast approximation algorithms for the knapsack and sum of subset
Inverse problems - Introduction - Probabilistic approach
Inverse problems - Introduction - Probabilistic approach Wojciech Dȩbski Instytut Geofizyki PAN debski@igf.edu.pl Wydział Fizyki UW, 13.10.2004 Wydział Fizyki UW Warszawa, 13.10.2004 (1) Plan of the talk
Publikowanie w czasopismach z tzw. "listy filadelfijskiej" i korzystanie z finansowania zewnętrznego - wyzwania i możliwości rozwoju młodego naukowca
Publikowanie w czasopismach z tzw. "listy filadelfijskiej" i korzystanie z finansowania zewnętrznego - wyzwania i możliwości rozwoju młodego naukowca Katarzyna Czernek Katedra Turystyki Publikowanie w
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
Data Mining Wykład 4. Plan wykładu
Data Mining Wykład 4 Klasyfikacja danych Klasyfikacja poprzez indukcje drzew decyzyjnych Plan wykładu Sformułowanie problemu Kryteria oceny metod klasyfikacji Metody klasyfikacji Klasyfikacja poprzez indukcje
Warsztaty Ocena wiarygodności badania z randomizacją
Warsztaty Ocena wiarygodności badania z randomizacją Ocena wiarygodności badania z randomizacją Każda grupa Wspólnie omawia odpowiedź na zadane pytanie Wybiera przedstawiciela, który w imieniu grupy przedstawia
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński
PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR Wojciech Zieliński Katedra Ekonometrii i Statystyki SGGW Nowoursynowska 159, PL-02-767 Warszawa wojtek.zielinski@statystyka.info
SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS
Piotr Mikulski 2006 Subversion is a free/open-source version control system. That is, Subversion manages files and directories over time. A tree of files is placed into a central repository. The repository
Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.
Eksploracja danych KLASYFIKACJA I REGRESJA cz. 2 Wojciech Waloszek wowal@eti.pg.gda.pl Teresa Zawadzka tegra@eti.pg.gda.pl Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)
Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition) Robert Respondowski Click here if your download doesn"t start automatically Wojewodztwo Koszalinskie:
Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.
- University I would like to enroll at a university. Stating that you want to enroll I want to apply for course. Stating that you want to apply for a course an undergraduate a postgraduate a PhD a full-time
Programowanie liniowe
Programowanie liniowe Maciej Drwal maciej.drwal@pwr.wroc.pl 1 Problem programowania liniowego min x c T x (1) Ax b, (2) x 0. (3) gdzie A R m n, c R n, b R m. Oznaczmy przez x rozwiązanie optymalne, tzn.
ROUGH SET BASED DECISION SUPPORT
ROUGH SET BASED DECISION SUPPORT Roman Słowiński Laboratory of Intelligent Decision Support Systems Institute of Computing Science Poznań University of Technology Roman Słowiński Motywacje Wzrasta przepaść
Zarządzanie sieciami telekomunikacyjnymi
SNMP Protocol The Simple Network Management Protocol (SNMP) is an application layer protocol that facilitates the exchange of management information between network devices. It is part of the Transmission
XII International PhD Workshop OWD 2010, 23 26 October 2010. Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych
XII International PhD Workshop OWD 2010, 23 26 October 2010 Metodyka pozyskiwania i analizy wyników badań symulacyjnych ścieżek klinicznych Methodology of Acquiring and Analyzing Results of Simulation
BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
EXAMPLES OF CABRI GEOMETRE II APPLICATION IN GEOMETRIC SCIENTIFIC RESEARCH
Anna BŁACH Centre of Geometry and Engineering Graphics Silesian University of Technology in Gliwice EXAMPLES OF CABRI GEOMETRE II APPLICATION IN GEOMETRIC SCIENTIFIC RESEARCH Introduction Computer techniques
ALGORYTM PROJEKTOWANIA ROZMYTYCH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO
Szybkobieżne Pojazdy Gąsienicowe (2) Nr 2, 24 Mirosław ADAMSKI Norbert GRZESIK ALGORYTM PROJEKTOWANIA CH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO. WSTĘP
Laboratorium 6. Indukcja drzew decyzyjnych.
Laboratorium 6 Indukcja drzew decyzyjnych. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk
Wprowadzenie do programu RapidMiner, część 5 Michał Bereta
Wprowadzenie do programu RapidMiner, część 5 Michał Bereta www.michalbereta.pl 1. Przekształcenia atrybutów (ang. attribute reduction / transformation, feature extraction). Zamiast wybierad częśd atrybutów
Język angielski. Poziom rozszerzony Próbna Matura z OPERONEM i Gazetą Wyborczą CZĘŚĆ I KRYTERIA OCENIANIA ODPOWIEDZI POZIOM ROZSZERZONY CZĘŚĆ I
Poziom rozszerzony Język angielski Język angielski. Poziom rozszerzony KRYTERIA OCENIANIA ODPOWIEDZI POZIOM ROZSZERZONY CZĘŚĆ I W schemacie oceniania zadań otwartych są prezentowane przykładowe odpowiedzi.
MaPlan Sp. z O.O. Click here if your download doesn"t start automatically
Mierzeja Wislana, mapa turystyczna 1:50 000: Mikoszewo, Jantar, Stegna, Sztutowo, Katy Rybackie, Przebrno, Krynica Morska, Piaski, Frombork =... = Carte touristique (Polish Edition) MaPlan Sp. z O.O Click