dmq 1 =(R 1,a 2, 5 a 1 < 20,, 3%), dmq 2 =(R 1,a 2, 0 a 1 < 15,, 5%),
|
|
- Wojciech Jabłoński
- 6 lat temu
- Przeglądów:
Transkrypt
1 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych algorytmem Apriori Przemys aw Grudzi ski 1, Marek Wojciechowski 2 Streszczenie: Artyku po wi cony jest problematyce przetwarzania zbiorów zapyta eksploracyjnych dla problemu odkrywania zbiorów cz stych algorytmem Apriori. Z dotychczasowych rozwi za w tym zakresie najlepsz metod jest Common Counting, czyli wspó bie ne wykonanie zapyta algorytmem Apriori z integracj odczytów fragmentów bazy danych wspó dzielonych przez zapytania. W tej pracy proponujemy now metod przetwarzania zbiorów zapyta eksploracyjnych dla algorytmu Apriori - Common Candidate Tree, opart o ci lejsz integracj przetwarzanych zapyta poprzez wspó dzielenie struktur danych w pami ci operacyjnej. Wyniki eksperymentów pokazuj, e Common Candidate Tree jest metod bardziej wydajn ni Common Counting, a dodatkowo, ze wzgl du na oszcz dniejsze gospodarowanie pami ci operacyjn, mo e by stosowana dla liczniejszych zbiorów zapyta. S owa kluczowe: eksploracja danych, odkrywanie zbiorów cz stych, zapytania eksploracyjne. 1. Wprowadzenie Odkrywanie zbiorów cz stych (ang. frequent itemset mining) (Agrawal et al., 1993) to jedna z podstawowych technik eksploracji danych (ang. data mining). Celem jest w tym przypadku odkrycie w kolekcji zbiorów (zwanych transakcjami) wszystkich podzbiorów, których liczba wyst pie przekracza zadany przez u ytkownika próg (tzw. próg minimalnego wsparcia). Typowo, odkryte zbiory cz ste s wykorzystywane do generacji regu asocjacyjnych (ang. association rules), ale mog te stanowi docelow form reprezentacji odkrytej wiedzy. Problem odkrywania zbiorów cz stych i regu asocjacyjnych zosta pierwotnie sformu owany w kontek cie analizy koszyka zakupów w celu analizy wspó wyst powania produktów w transakcjach klientów, ale szybko znalaz wiele innych zastosowa w takich dziedzinach jak: medycyna, telekomunikacja, czy analiza zachowa u ytkowników WWW. Dotychczas w literaturze zaproponowano wiele algorytmów odkrywania zbiorów cz stych. Dwie g ówne rodziny algorytmów wyznaczaj strategie przegl dania przestrzeni poszukiwa. Klasycznym algorytmem realizuj cym przeszukiwanie wszerz jest Apriori (Agrawal et al., 1994). Z kolei najpopularniejszym algorytmem stosuj cym przeszukiwanie w g b jest FP-growth (Han et al., 2). Apriori rozpoczyna od odkrycia cz stych elementów jako jednoelementowych zbiorów cz stych, 1 Wydzia Matematyki i Informatyki, Uniwersytet im. Adama Mickiewicza w Poznaniu, Umultowska 87, Pozna 2 Wydzia Informatyki i Zarz dzania, Politechnika Pozna ska, Piotrowo 2,6-965Pozna Marek.Wojciechowski@cs.put.poznan.pl
2 2 P. Grudzi ski, M. Wojciechowski a nast pnie iteracyjnie generuje zbiory potencjalnie cz ste, okre lane mianem kandydatów, w oparciu o zbiory cz ste odkryte w poprzedniej iteracji. Ka da iteracja ko czy si pe nym odczytem bazy danych w celu zliczenia wyst pie kandydatów i wybrania spo ród nich zbiorów cz stych. Dla u atwienia testowania zawierania si kandydatów w transakcjach odczytywanych z bazy danych, kandydaci umieszczani s w drzewie haszowym w pami ci operacyjnej. FP-growth, podobnie jak Apriori, buduje wi ksze zbiory cz ste z mniejszych, ale zamiast generowania kandydatów i zliczania ich wyst pie wykorzystuje ide projekcji bazy danych. Projekcje s wyznaczane przez odkrywane zbiory cz ste, a rozrost zbiorów jest realizowany poprzez odkrywanie elementów cz stych w projekcjach. Aby u atwi wielokrotne projekcje, baza danych jest reprezentowana w pami ci operacyjnej w postaci zwi z ej struktury o nazwie FP-tree, do której zbudowania wymagane s dok adnie dwa odczyty ród owej bazy danych. Algorytm FP-growth jest bardziej efektywny ni Apriori dla niskich progów minimalnego wsparcia oraz w przypadku g stych zbiorów danych, czyli takich, które zawieraj wiele du ych zbiorów cz stych. W rzeczywisto ci jednak analizowane s dane o ró nym charakterze i dlatego nie mo na wskaza algorytmu, który by by najlepszym rozwi zaniem w ka dym przypadku (Zheng et al., 21). Odkrywanie zbiorów cz stych jest cz sto postrzegane jako przetwarzanie zaawansowanychzapyta do bazy danych, za pomoc których u ytkownik specyfikuje dane ród owe do eksploracji, próg minimalnego wsparcia oraz opcjonalnie dodatkowe kryteria selekcji zbiorów (tzw. ograniczenia) (Imielinski i Mannila, 1996). Efektywne przetwarzanie zapyta eksploracyjnych w kontek cie problemu odkrywania zbiorów cz stych by o przedmiotem wielu prac naukowych, skupiaj cych si g ównie na uwzgl dnianiu ogranicze w procesie odkrywania (np. Pei i Han, 2) i wykorzystywaniu wyników poprzednich zapyta (Baralis i Psaila, 1999, Cheung et al., 1996, Meo, 23, Morzy et al., 2). Niniejszy artyku po wi cony jest optymalizacji wykonania zbiorów zapyta eksploracyjnych dla problemu odkrywania zbiorów cz stych. Ogólna idea polega na zast pieniu sekwencyjnego wykonania zapyta wykonaniem wspó bie nym, z wykorzystaniem faktu nak adania si danych ród owych poszczególnych zapyta. Zbiory zapyta eksploracyjnychdowykonania mog pojawia si w systemacheksploracji danych pracuj cych w trybie wsadowym. Mo liwe jest równie grupowanie zapyta w zbiory do wspó bie nego wykonania w interaktywnych, wielodost pnych rodowiskach eksploracji danych, na zasadzie zbierania zapyta przychodz cychdo systemu w ustalonym oknie czasowym. Motywacj dla rozwa anych technik mo e by np. scenariusz w którym wielu u ytkowników prowadz cych analizy koszyka zakupów poszukuje zbiorów cz stych w ró nych, nak adaj cych si,przedzia ach czasowych zgromadzonej historii transakcji klientów. Najlepsz z dotychczas zaproponowanychmetod wykonania zbioru zapyta eksploracyjnych odkrywaj cych zbiory cz ste jest Common Counting, czyli wspó bie ne wykonanie zapyta z integracj odczytów fragmentów bazy danych wspó dzielonych przez zapytania. Metoda ta zosta a pierwotnie zaproponowana dla algorytmu Apriori, gdzie integracji podlega y odczyty bazy danych do zliczania wyst pie kandydatów (Wojciechowski i Zakrzewicz, 23). Ze wzgl du na jej uniwer-
3 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych... 3 salny charakter, zosta a szybko zaadaptowana dla algorytmu FP-growth, redukuj c liczb odczytanych bloków dyskowych na etapie budowy struktur FP-tree dla wspó bie nie wykonywanych zapyta (Wojciechowski et al., 25). Metoda Common Counting, jako sprowadzaj ca si do integracji odczytów danych z dysku, z pewno ci nie wyczerpuje mo liwo ci optymalizacji wykonania zbioru zapyta eksploracyjnych. Dalsza integracja operacji realizowanych przez poszczególne zapytania wymaga technik dedykowanych dla poszczególnych algorytmów (lub przynajmniej klas algorytmów). W tej pracy proponujemy now metod przetwarzania zbiorów zapyta eksploracyjnych dla algorytmu Apriori - Common Candidate Tree, realizuj c ci lejsz integracj przetwarzanych zapyta poprzez wspó dzielenie struktur danych w pami ci operacyjnej. Wyniki eksperymentów pokazuj, e Common Candidate Tree jest metod bardziej wydajn ni Common Counting, a dodatkowo, ze wzgl du na oszcz dniejsze gospodarowanie pami ci operacyjn, mo e by stosowana dla liczniejszych zbiorówzapyta. 2. Optymalizacja wykonania zbioru zapyta eksploracyjnych 2.1. Podstawowe definicje i sformu owanie problemu Definicja 1. Zapytanie eksploracyjne w kontek cie problemu odkrywania zbiorów cz stych to uporz dkowana pi tka dmq =(R, a,σ, Φ, minsup), gdzie R jest relacj bazy danych, a jest atrybutem relacji R, którego warto ciami s zbiory elementów, Σ jest wyra eniem warunkowym dotycz cym atrybutów relacji R okre lanym mianem predykatu selekcji danych, Φ jest wyra eniem warunkowym dotycz cym odkrywanych zbiorów cz stych okre lanym mianem predykatu selekcji wzorców, a minsup to próg minimalnego wsparcia. Wynikiem zapytania dmq jest kolekcja zbiorów cz stych odkrytych w π a σ Σ R, spe niaj cych predykat Φ, o wsparciu minsup (π i σ oznaczaj relacyjne operacje projekcji i selekcji). Przyk ad 1. Za ó my, e dana jest relacja R 1 (a 1,a 2 ),której atrybut a 2 przyjmuje jako warto ci zbiory elementów, a atrybut a 1 jest typu ca kowitoliczbowego. Zapytanie eksploracyjne dmq 1 =(R 1,a 2,a 1 > 5, itemset < 4, 3%) reprezentuje zadanie odkrywania zbiorów cz stych w kolekcji zbiorów stanowi cych warto ci atrybutu a 2 z wierszy relacji R 1 spe niaj cych warunek a 1 >5. Zapytanie zwróci zbiory o wsparciu co najmniej 3% i jednocze nie zawieraj ce mniej ni 4 elementy. Definicja 2. Zbiór elementarnych predykatów selekcji danych dla zbioru zapyta eksploracyjnych DMQ = {dmq 1,dmq 2,..., dmq n } to najmniejszy pod wzgl dem liczebno ci zbiór S = {s 1,s 2,..., s k } predykatów selekcji danych z relacji R taki, e dla ka dej pary u, v (u v) zachodzi σ su R σ sv R = i dla ka dego zapytania dmq i istniej takie liczby ca kowite a, b,..., m, eσ Σi R = σ sa R σ sb R.. σ sm R. Zbiór elementarnych predykatów selekcji danych reprezentuje podzia bazy danych na partycje wyznaczone przez nak adanie si ród owych zbiorów danych zapyta. Przyk ad 2. Za ó my, e dana jest relacja R 1 (a 1,a 2 ) i trzy zapytania eksploracyjne: dmq 1 =(R 1,a 2, 5 a 1 < 2,, 3%), dmq 2 =(R 1,a 2, a 1 < 15,, 5%),
4 4 P. Grudzi ski, M. Wojciechowski dmq 3 =(R 1,a 2, 5 a 1 < 15 or 3 a 1 < 4,, 4%). Zbiór elementarnych predykatów selekcji danych w tym wypadku to: S = { a 1 < 5, 5 a 1 < 15, 15 a 1 < 2, 3 a 1 <4}. Problem. Dla danego zbioru zapyta eksploracyjnych DMQ = {dmq 1,dmq 2,..., dmq n },problem optymalizacji wykonania zbioru zapyta eksploracyjnych polega na wygenerowaniu algorytmu minimalizuj cego ca kowity czas wykonania DMQ. W dalszych rozwa aniach b dziemy przyjmowali, e zbiór zapyta DMQ nie zawiera zapyta identycznych. W praktyce, po zebraniu zbioru zapyta do wspólnego wykonania system powinien usun powtarzaj ce si zapytania we wst pnym kroku przetwarzania. Ponadto, w wietle wynikówwcze niejszych bada (Morzy et al., 2), sensowne jest równie zast pienie ka dego podzbioru zapyta operuj cych na identycznym fragmencie bazy danych przez jedno zapytanie, którego wyniki b d mog y by wykorzystane do wygenerowania odpowiedzi na oryginalne zapytania poprzez prost weryfikacj predykatu selekcji wzorców i/lub progu minimalnego wsparcia. Takie nowe zapytanie powinno mie próg minimalnego wsparcia równy najmniejszemu z progów minimalnego wsparcia zast powanych zapyta i predykat selekcji wzorców w formie logicznej alternatywy predykatów selekcji wzorców zast powanych zapyta Common Counting Metoda Common Counting polega na wspó bie nym wykonaniu zbioru zapyta eksploracyjnych algorytmem Apriori z integracj odczytów wspó dzielonych fragmentów bazy danych. Pseudokod metody Common Counting zosta przedstawiony na Rys. 1. W zapisie algorytmu minsup jest warto ci progu minimalnego wsparcia wyra on jako bezwzgl dna liczba transakcji 1. Metoda Common Counting iteracyjnie generuje i zlicza wyst pienia kandydatów dla wszystkich zapyta eksploracyjnych. Kandydatami jednoelementowymi dla wszystkich zapyta s wszystkie mo liwe elementy (linie 1-2). Kandydaci o rozmiarze 2 k (k>1) s generowani ze zbiorów cz stych o rozmiarze k-1, oddzielnie dla ka dego z zapyta (linie 7-9). Generacja kandydatów (reprezentowana w zapisie algorytmu jako funkcja generate_candidates()) przebiega dok adnie tak jak w oryginalnym algorytmie Apriori. Kandydaci wygenerowani dla ka dego z zapyta s umieszczani w odr bnych drzewach haszowych. Iteracyjny proces generacji i zliczania wyst pie kandydatów ko czy si gdy dla adnego z zapyta nie uda si wygenerowa kandydatów (warunek w linii 3). Wyst pienia kandydatów dla wszystkich zapyta s zliczane podczas zintegrowanego odczytu bazy danych wnast puj cy sposób: Dla ka dego elementarnego predykatu selekcji danych, odpowiadaj ca mu partycja bazy danych jest odczytywana transakcja po transakcji. Dla ka dej transakcji zwi kszane s liczniki kandydatów wniej zawartych dlatych zapyta, które odwo uj si do odczytywanej 1 Typowo, u ytkownicy podaj warto progu wsparcia w procentach. W takim wypadku warto wyra ona procentowo jest przeliczana na bezwzgl dn wraz z pierwszym odczytem bazy danych realizowanym przez algorytm. 2 Liczba elementów zbioru jest okre lana jako jego rozmiar.
5 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych... 5 Dane wej ciowe: DMQ = {dmq 1,dmq 2,..., dmq n }, gdzie dmq i =(R,a,Σ i, Φ i,minsup i ) (1) for (i=1; i n; i++) do (2) C1 i = all possible 1-itemsets (3) for (k=1; Ck 1 C2 k.. Cn k ; k++) do begin (4) for each s j S do begin (5) = {Ck i : σ s j R σ Σi R} (6) if then count(,σ sj R) end (7) for (i=1; i n; i++) do begin (8) Fk i = {C Ci k : C.counter minsup i} (9) Ck+1 i = generate_candidates(f k i) end (1) end (11) for (i=1; i n; i++) do (12) Answer i = σ Φi k F k i Rysunek 1. Common Counting for Apriori partycji (linie 4-6). Sprawdzanie którzy kandydaci zawieraj si w danej transakcji odbywa si poprzez testowanie transakcji wzgl dem drzew haszowych ka dego z zapyta odwo uj cych si do tej transakcji. Zliczanie wyst pie kandydatów jest reprezentowane w zapisie algorytmu jako funkcja count(). Zauwa my, e je li dany elementarny predykat selekcji danych jest wspó dzielony przez kilka zapyta, to przy ka dorazowym zliczaniu wyst pie kandydatów odpowiadaj ca mu partycja bazy danych jest odczytywana tylko raz. Common Counting nie zajmuje si obs ug predykatów selekcji wzorców Φ, ale pozwala na wykorzystanie do tego celu zaproponowanych dla Apriori metod opartych o modyfikacj procedury generacji kandydatów oraz filtracji odkrytych wzorców dla tych ogranicze, które nie mog by efektywnie obs u one w ramach algorytmu Apriori Przegl d pokrewnych problemów Optymalizacja zbiorów zapyta (Sellis, 1988) by a przedmiotem wielu prac w dziedzinie systemów baz danych, ukierunkowanych na wspóln optymalizacj wielu zapyta poprzez wyodr bnienie i jednokrotne wykonanie powtarzaj cych si wyra e sk adowych (Alsabbagh i Raghavan, 1994, Jarke, 1985). G ówne zadania w optymalizacji zbiorów zapyta w systemach baz danych to identyfikacja wspólnych wyra e, takich jak: projekcje, selekcje, po czenia, pó po czenia i przes ania sieciowe, oraz konstrukcja globalnego planu wykonania. Na potrzeby optymalizacji wykonania zbioru zapyta w systemach baz danych zaproponowano wiele algorytmów heurystycznych (np. Roy et al., 2). Zapytania eksploracyjne wymagaj nowych metod optymalizacji wykonania ze wzgl du na specjalistyczne algorytmy wykonania zapytania. W dziedzinie eksploracji danych, poza rozwa anym w niniejszej pracy problemem, optymalizacja zbiorów zapyta by a rozwa ana jedynie w kontek cie odkry-
6 6 P. Grudzi ski, M. Wojciechowski wania wzorców cz stych w wielu zbiorach danych (Jin et al., 25). Celem w tym wypadku by a redukcja wspólnych oblicze pojawiaj cych si w wielu ró nych z o- onych zapytaniach, z których ka de porównywa o wsparcie wzorców w ró nych roz cznych zbiorach danych. Stanowi to fundamentaln ró nic w stosunku do naszego problemu, gdzie ka de zapytanie odnosi si do jednego zbioru danych i zbiory danych poszczególnych zapyta si nak adaj. Wcze niej, potrzeba optymalizacji wykonania zbioru zapyta zosta a zauwa- ona w pokrewnej do eksploracji danych dziedzinie programowania w logice, co zaowocowa o metod zbli on koncepcyjnie do Common Counting, polegaj c na czeniu podobnych zapyta w tzw. paczki zapyta (ang. query packs) (Blockeel et al., 22). W pewnym stopniu za wprowadzenie do optymalizacji wykonania zbioru zapyta eksploracyjnych w kontek cie odkrywania zbiorów cz stych mo emy uzna techniki wykorzystywania po rednich lub ko cowych wyników poprzednich zapyta. Metody nale ce do tej kategorii to: inkrementalne odkrywanie zbiorów cz stych (Cheung et al., 1996), przechowywanie w pami ci podr cznej po rednich wyników poprzednich zapyta (Nag et al., 1999) oraz wykorzystywanie zmaterializowanych kompletnych (Baralis i Psaila, 1999, Meo, 23, Morzy et al., 2) lub skondensowanych (Jeudy i Boulicaut, 22) wyników poprzednich zapyta w oparciu o analiz ró nic sk adniowych mi dzy zapytaniami. 3. Common Candidate Tree: wspólne drzewo kandydatów dla zbioru przetwarzanych zapyta eksploracyjnych Metoda Common Counting optymalizuje jedynie odczyty wspó dzielonych przez zapytania fragmentów bazy danych, realizuj c pozosta e operacje algorytmu Apriori oddzielnie dla ka dego zapytania. Aby zwi kszy stopie wspó dzielenia przetwarzania mi dzy wspó bie nie wykonywanymi zapytaniami, proponujemy now metod : Common Candidate Tree, opart o wspó dzielenie pami ciowej struktury drzewa haszowego do sk adowania kandydatów. Takie rozwi zanie zachowuje integracj odczytów wspó dzielonych danych z dysku, a dodatkowo pozwala na integracj operacji testowania zawierania si kandydatów z poszczególnych zapyta w transakcji odczytanej z bazy danych. Struktura drzewa haszowego w Common Candidate Tree pozostaje niezmieniona w stosunku do Common Counting i oryginalnego Apriori. Aby mo liwe by o wspó dzielenie jednego drzewa przez wszystkie zapytania, konieczne jest jedynie rozszerzenie struktury kandydatów, tak aby z kandydatem zwi zany by nie pojedynczy licznik wyst pie, a wektor liczników (counters[]) - po jednym liczniku dla ka dego zapytania. Ponadto, ka dy kandydat b dzie posiada wektor flag logicznych (fromquery[]) do oznaczenia, które zapytania wygenerowa y danego kandydata. Flagi te b d ustawiane podczas czenia zbiorów kandydatów poszczególnych zapyta w jeden zbiór kandydatów, który nast pnie b dzie umieszczany we wspólnym drzewie haszowym. Pseudokod metody Common Candidate Tree zosta przedstawiony na Rys. 2. Ró nic w stosunku do Common Counting, jest to, e zliczaniu podlega zintegro-
7 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych... 7 Dane wej ciowe: DMQ = {dmq 1,dmq 2,..., dmq n }, gdzie dmq i =(R,a,Σ i, Φ i,minsup i ) (1) C 1 = all possible 1-itemsets (2) for (k=1; C k ; k++) do begin (3) for each s j S do begin (4) = {C C k : i C.fromQuery[i] =true σ sj R σ Σi R} (5) if then count(,σ sj R) end (6) for (i=1; i n; i++) do begin (7) F i k = {C C k : C.counters[i] minsup i } (8) C i k+1 = generate_candidates(f i k ) end (9) C k+1 = C 1 k+1 C2 k+1.. Cn k+1 (1) end (11) for (i=1; i n; i++) do (12) Answer i = σ Φi k F i k Rysunek 2. Common Candidate Tree wany zbiór kandydatów (linie 1 i 9), cho generacja kandydatów i selekcja zbiorów cz stych s w dalszym ci gu realizowane odr bnie dla poszczególnych zapyta (linie 6-8). W fazie zliczania wyst pie kandydatów, podczas odczytu danej partycji bazy danych uwzgl dniani s tylko ci kandydaci, którzy zostali wygenerowani przez które z zapyta odwo uj cych si do tej partycji i jednocze nie w przypadku zawierania si kandydata w odczytanej transakcji zwi kszane s jedynie liczniki kandydatów zwi zane z takimi zapytaniami (linie 3-5). Oceniaj c metod Common Candidate Tree nale y zwróci uwag, e ci lejsza integracja przetwarzania zapyta nie jest jej jedyn zalet w porównaniu z Common Counting. Istotn wad Common Counting, ograniczaj c jej stosowalno dla du ych zbiorów zapyta, jest konieczno jednoczesnego utrzymywania w pami ci wielu drzew haszowych. Problem ten by dotychczas rozwi zywany poprzez podzia oryginalnego zbioru zapyta na roz czne podzbiory i uruchomienie metody Common Counting oddzielnie dla ka dego z podzbiorów (Boi ski et al., 26, Wojciechowski i Zakrzewicz, 25). Common Candidate Tree wykorzystuje jedno drzewo haszowe, o niezmienionej strukturze w z ów po rednich, a jedynie rozbudowanych kandydatach, co powinno zwi kszy zakres jego stosowalno ci bez konieczno ci podzia u oryginalnego zbioru zapyta. Podobnie jak Common Counting, Common Candidate Tree nie zajmuje si obs ug predykatów selekcji wzorców Φ, ale pozwala na wykorzystanie do tego celu technik zaproponowanych dla Apriori, gdy metoda generacji kandydatów nie podlega optymalizacji przez Common Candidate Tree. 4. Wyniki eksperymentów W celu przetestowania wydajno ci i wymaga pami ciowych algorytmu Common Candidate Tree na tle dotychczas najwydajniejszego algorytmu Common Counting oraz sekwencyjnego wykonania zapyta, przeprowadzili my szereg ekspery-
8 8 P. Grudzi ski, M. Wojciechowski 2 zapytania, minsup = 2% 2 zapytania, minsup =,7% 35 3 czas wykonania [s] T SEQ czas wykonania [s] T SEQ nakładanie [%] nakładanie [%] Rysunek 3. Czasy wykonania algorytmów dla 2 zapyta i ró nych stopni nak adania mentów na syntetycznym zbiorze danych wygenerowanym za pomoc generatora GEN (Agrawal et al., 1996). Przy generacji zbioru danych zosta y wykorzystane nast puj ce warto ci parametrów generatora: liczba transakcji = 1, rednia liczba elementów w transakcji = 8, liczba ró nych elementów = 1, liczba wzorców (tj. zbiorów cz stych) = 15, rednia liczba elementów we wzorcu = 4. Zbiór danych zosta zapisany w pliku na dysku lokalnym, zajmuj c oko o 97 MB. Eksperymenty zosta y zrealizowane na komputerze klasy PC z procesorem Athlon 17+ i 512 MB pami ci RAM, pracuj cym pod kontrol systemu operacyjnego Microsoft Windows XP. W trakcie eksperymentów zmieniali my liczb wspó bie nie wykonywanych zapyta, próg minimalnego wsparcia oraz stopie nak adania si ród owych zbiorów danych dla zapyta. Zbiór danych ród owych ka dego z zapyta stanowi podzbiór 5 kolejnych transakcji z wygenerowanego zbioru danych. Cho adna z porównywanych metod tego nie wymaga, we wszystkich eksperymentach wszystkie zapytania stanowi ce zbiór zapyta do wspólnego wykonania wykorzystywa y ten sam próg minimalnego wsparcia, aby jego potencjalny wp yw na zachowanie poszczególnych metod i ró nica w wydajno ci mi dzy Common Counting i Common Candidate Tree by y atwiejsze do zaobserwowania 3. Celem pierwszej serii eksperymentów by o sprawdzenie wp ywu stopnia nak adania si ród owych zbiorów danych zapyta na czasy wykonania algorytmów Common Counting () i Common Candidate Tree (T) w porównaniu z wykonaniem sekwencyjnym (SEQ). Jednocze nie w celu porównania wymaga pami ciowych metod i T mierzony by rozmiar drzew haszowych (w z y + kandydaci). Eksperymenty zosta y wykonane dla dwóch nak adaj cych si zapyta przy dwóch ró nych warto ciach progów wsparcia: 2% i,7%. Progi te zosta y dobrane tak, aby prowadzi y do znacz co ró nej liczby iteracji Apriori (2 iteracje dla progu 2% i 7-8 iteracji dla progu,7%). Rys. 3 przedstawia wykresy ilustruj ce zale no czasów wykonania porówny- 3 Im wi ksza ró nica mi dzy warto ciami progu wsparcia dla poszczególnych zapyta, tym wi kszej ró nicy w liczbach iteracji Apriori dla zapyta mo na oczekiwa. Zarówno Common Counting jak i Common Candidate Tree redukuj czas przetwarzania tylko w tych iteracjach Apriori, w których wykonywane s co najmniej 2 zapytania.
9 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych zapytania, minsup = 2% 2 zapytania, minsup =,7% rozmiar drzew [B] nakładanie [%] T rozmiar drzew [B] nakładanie [%] T Rysunek 4. rednie sumaryczne rozmiary drzew haszowychdla2zapyta i ró nych stopni nak adania wiele zapytań, nakładanie 1%, minsup = 2% wiele zapytań, nakładanie 1%, minsup =,7% czas wykonania [s] liczba zapytań T SEQ czas wykonania [s] liczba zapytań T SEQ Rysunek 5. Czasy wykonania algorytmów dla wielu identycznych zapyta wanych algorytmów od stopnia nak adania si danych ród owych zapyta. Czasy wykonania i T malej liniowo wraz ze wzrostem stopnia nak adania, przy czym T jest zdecydowanie bardziej wydajny ni, a wzgl dne ró nice w czasach wykonania algorytmów s zbli one dla obu testowanych progów wsparcia. Na Rys. 4 przedstawione zosta y rednie sumaryczne rozmiary drzew haszowych dla i T (suma rozmiarów wszystkich drzew ze wszystkich iteracji podzielona przez liczb iteracji). T dla dwóch zapyta zredukowa wykorzystanie pami ci w porównaniu z o 33%do 4%. Zaobserwowane ró nice w wymaganiach pami ciowych obu algorytmów dla wsparcia,7% przy ró nych stopniach nak adania wynika y z ró nej charakterystyki poszczególnych fragmentów bazy danych. Druga seria eksperymentów mia a na celu przetestowanie skalowalno ci metod i T wzgl dem rosn cej liczby wspólnie wykonywanych zapyta. Ze wzgl du na wielo mo liwych konfiguracji nak adania si ród owych zbiorów danych w przypadku wi cej ni dwóch zapyta, aby uchwyci rzeczywisty wp yw liczby zapyta zdecydowali my si na przeprowadzenie testów tylko dla zbiorów identycznych zapyta (stopie nak adania si zawsze równy 1%). Rys. 5 przedstawia wykresy ilustruj ce zale no czasów wykonania porównywanych algorytmów od liczby zapyta. Czas wykonania T ro nie nieznacznie wraz ze zwi kszaniem liczby zapyta, podczas gdy czas wykonania ro nie nie-
10 1 P. Grudzi ski, M. Wojciechowski wiele zapytań, nakładanie 1%, minsup = 2% wiele zapytań, nakładanie 1%, minsup =,7% rozmiar drzew [B] T rozmiar drzew [B] T liczba zapytań liczba zapytań Rysunek 6. rednie sumaryczne rozmiary drzew haszowych dla wielu identycznych zapyta wiele wolniej ni w przypadku wykonania sekwencyjnego. Na Rys. 6 przedstawione zosta y sumaryczne rozmiary drzew haszowych dla i T przy zwi kszaj cej si liczby zapyta. Wzrost wymaga pami ciowych T wraz ze wzrostem liczby zapyta jest zdecydowanie mniejszy ni w przypadku. Oczywi cie nale y pami ta, e charakter eksperymentu (identyczne zapytania) faworyzowa T, gdy ka de dodatkowe zapytanie powodowa o dodanie nowego drzewa w przypadku, a jedynie zwi kszenie rozmiarów wektorów zwi zanych z kandydatami w przypadku T. 5. Podsumowanie W niniejszej pracy rozwa ali my przetwarzanie zbiorów zapyta eksploracyjnych dla problemu odkrywania zbiorów cz stych. Zaproponowali mynow metod wykonania zbioru zapyta eksploracyjnych algorytmem Apriori, która zosta a nazwana Common Candidate Tree z racji wykorzystywania wspólnej struktury drzewa haszowego dla wspó bie nie wykonywanych zapyta. Wyniki eksperymentów pokaza y, e Common Candidate Tree jest metod znacznie bardziej wydajn, lepiej skaluj c si wraz ze wzrostem liczby zapyta do wykonania, a ponadto oszcz dniej wykorzystuj c pami operacyjn ni dotychczas najlepsza metoda Common Counting. W przysz o ci planujemy kontynuowa prac nad coraz bardziej cis integracj operacji realizowanych podczas wykonywania zbiorów zapyta eksploracyjnych zarówno rozwa anym w niniejszej pracy algorytmem Apriori jak i konkurencyjnym wobec niego algorytmem FP-growth. Literatura Agrawal, R., Imielinski, T. i Swami, A (1993) Mining Association Rules Between Sets of Items in Large Databases. Proceedings of the 1993 ACM SIG- MOD Int'l Conf. on Management of Data,
11 Integracja drzew kandydatów w przetwarzaniu zbiorów zapyta eksploracyjnych Agrawal, R., Mehta, M., Shafer, J., Srikant, R., Arning, A. i Bollinger, T. (1996) The Quest Data Mining System. Proc. of the 2nd Int'l Conf. on Knowledge Discovery in Databases and Data Mining, Agrawal, R. i Srikant, R. (1994) Fast Algorithms for Mining Association Rules. Proc. of the 2th Int'l Conf. on Very Large Data Bases, Alsabbagh, J.R. i Raghavan, V.V. (1994) Analysis of common subexpression exploitation models in multiple-query processing. Proceedings of the 1th ICDE Conference, Baralis, E. i Psaila, G. (1999) Incremental Refinement of Mining Queries. Proceedings of the 1st DaWaK Conference, Blockeel, H., Dehaspe, L., Demoen, B., Janssens, G., Ramon, J. i Vandecasteele, H. (22) Improving the Efficiency of Inductive Logic Programming Through the Use of Query Packs. Journal of Artificial Intelligence Research 16, Boi ski, P., Wojciechowski, M. i Zakrzewicz, M. (26) A Greedy Approach to Concurrent Processing of Frequent Itemset Queries. Proc. of the 8th International Conference on Data Warehousing and Knowledge Discovery, Cheung, D.W., Han, J., Ng, V. i Wong, C.Y. (1996) Maintenance of Discovered Association Rules in Large Databases: An Incremental Updating Technique. Proceedings of the 12th ICDE Conference, Han, J., Pei, J. i Yin, Y. (2) Mining frequent patterns without candidate generation. Proceedings of the 2 ACM SIGMOD Int'l Conference on Management of Data, Imielinski, T. i Mannila, H. (1996) A Database Perspective on Knowledge Discovery. Communications of the ACM 39, 11, Jarke, M. (1985) Common subexpression isolation in multiple query optimization. Kim, W., Reiner, D.S. (Eds.), Query Processing in Database Systems, Jeudy, B. i Boulicaut, J-F. (22) Using condensed representations for interactive association rule mining. Proceedings of the 6th European Conference on Principles and Practice of Knowledge Discovery in Databases, Jin, R., Sinha, K. i Agrawal, G. (25) Simultaneous Optimization of Complex Mining Tasks with a Knowledgeable Cache. Proceedings of the 11th ACM SIGKDD International Conference onknowledge Discovery and Data Mining, Meo, R. (23) Optimization of a Language for Data Mining. Proceedingsofthe ACM Symposium on Applied Computing - Data Mining Track,
12 12 P. Grudzi ski, M. Wojciechowski Morzy, T., Wojciechowski, M. i Zakrzewicz, M. (2) Materialized Data Mining Views. Proceedings of the 4th PKDD Conference, Nag, B., Deshpande, P.M. i DeWitt, D.J. (1999) Using a Knowledge Cache for Interactive Discovery of Association Rules. Proceedings of the 5th KDD Conference, Pei, J. i Han, J. (2) Can We Push More Constraints into Frequent Pattern Mining? Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Roy, P., Seshadri, S., Sundarshan, S. i Bhobe, S. (2) Efficient and Extensible Algorithms for Multi Query Optimization. Proceedings of the 2 ACM SIGMOD Int'l Conference on Management of Data, Sellis, T. (1988) Multiple-query optimization. ACM Transactions on Database Systems 13, 1, Wojciechowski, M., Ga cki, K. i Gawronek, K. (25) Concurrent Processing of Frequent Itemset Queries Using FP-Growth Algorithm. Proceedings of the 1st ADBIS Workshop on Data Mining and Knowledge Discovery, Wojciechowski, M. i Zakrzewicz, M. (23) Evaluation of Common Counting Method for Concurrent Data Mining Queries. Proc. of the 7th ADBIS Conference, Wojciechowski, M. i Zakrzewicz, M. (25) On Multiple Query Optimization in Data Mining. Proceedings of the 9th Pacific-Asia Conference on Knowledge Discovery and Data Mining, Zheng, Z., Kohavi, R. i Mason, L. (21) Real world performance of association rule algorithms. Proceedings of the 7th ACM SIGKDD International Conference onknowledge Discovery and Data Mining, Integration of Candidate Hash Trees in Concurrent Processing of Frequent Itemset Queries Using Apriori In this paper we address the problem of processing of batches of frequent itemset queries using the Apriori algorithm. The best solution of this problem proposed so far is Common Counting, which consists in concurrent execution of the queries using Apriori with the integration of scans of the parts of the database shared among the queries. In this paper we propose a new method - Common Candidate Tree, offering a more tight integration of the concurrently processed queries by sharing memory data structures, i.e., candidate hash trees. The experiments show that Common Candidate Tree outperforms Common Counting in terms of execution time. Moreover, thanks to smaller memory consumption, Common Candidate Tree can be applied to larger batches of queries.
Bazy danych. Andrzej Łachwa, UJ, 2013 andrzej.lachwa@uj.edu.pl www.uj.edu.pl/web/zpgk/materialy 9/15
Bazy danych Andrzej Łachwa, UJ, 2013 andrzej.lachwa@uj.edu.pl www.uj.edu.pl/web/zpgk/materialy 9/15 Przechowywanie danych Wykorzystanie systemu plików, dostępu do plików za pośrednictwem systemu operacyjnego
PARTYCJONOWANIE GRAFÓW A OPTYMALIZACJA WYKONANIA ZBIORU ZAPYTAŃ EKSPLORACYJNYCH
PARTYCJONOWANIE GRAFÓW A OPTYMALIZACJA WYKONANIA ZBIORU ZAPYTAŃ EKSPLORACYJNYCH Marek Wojciechowski, Maciej Zakrzewicz Politechnika Poznańska, Wydział Informatyki i Zarządzania {marek, mzakrz}@cs.put.poznan.pl
Harmonogramowanie projektów Zarządzanie czasem
Harmonogramowanie projektów Zarządzanie czasem Zarządzanie czasem TOMASZ ŁUKASZEWSKI INSTYTUT INFORMATYKI W ZARZĄDZANIU Zarządzanie czasem w projekcie /49 Czas w zarządzaniu projektami 1. Pojęcie zarządzania
Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.
Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows. Zadaniem modułu jest wspomaganie zarządzania magazynem wg. algorytmu just in time, czyli planowanie
Projektowanie bazy danych
Projektowanie bazy danych Pierwszą fazą tworzenia projektu bazy danych jest postawienie definicji celu, założeo wstępnych i określenie podstawowych funkcji aplikacji. Każda baza danych jest projektowana
KLAUZULE ARBITRAŻOWE
KLAUZULE ARBITRAŻOWE KLAUZULE arbitrażowe ICC Zalecane jest, aby strony chcące w swych kontraktach zawrzeć odniesienie do arbitrażu ICC, skorzystały ze standardowych klauzul, wskazanych poniżej. Standardowa
Wiedza niepewna i wnioskowanie (c.d.)
Wiedza niepewna i wnioskowanie (c.d.) Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Wnioskowanie przybliżone Wnioskowanie w logice tradycyjnej (dwuwartościowej) polega na stwierdzeniu
Instalacja. Zawartość. Wyszukiwarka. Instalacja... 1. Konfiguracja... 2. Uruchomienie i praca z raportem... 4. Metody wyszukiwania...
Zawartość Instalacja... 1 Konfiguracja... 2 Uruchomienie i praca z raportem... 4 Metody wyszukiwania... 6 Prezentacja wyników... 7 Wycenianie... 9 Wstęp Narzędzie ściśle współpracujące z raportem: Moduł
API transakcyjne BitMarket.pl
API transakcyjne BitMarket.pl Wersja 20140314 1. Sposób łączenia się z API... 2 1.1. Klucze API... 2 1.2. Podpisywanie wiadomości... 2 1.3. Parametr tonce... 2 1.4. Odpowiedzi serwera... 3 1.5. Przykładowy
Architektura komputerów
Architektura komputerów Tydzień 6 RSC i CSC Znaczenie terminów CSC Complete nstruction Set Computer komputer o pełnej liście rozkazów. RSC Reduced nstruction Set Computer komputer o zredukowanej liście
ZAANGA OWANIE PRACOWNIKÓW W PROJEKTY INFORMATYCZNE
ZAANGA OWANIE PRACOWNIKÓW W PROJEKTY INFORMATYCZNE LESZEK MISZTAL Politechnika Szczeci ska Streszczenie Celem artykułu jest przedstawienie metody rozwi zania problemu dotycz cego zaanga owania pracowników
GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007
GEO-SYSTEM Sp. z o.o. 02-732 Warszawa, ul. Podbipięty 34 m. 7, tel./fax 847-35-80, 853-31-15 http:\\www.geo-system.com.pl e-mail:geo-system@geo-system.com.pl GEO-RCiWN Rejestr Cen i Wartości Nieruchomości
Edycja geometrii w Solid Edge ST
Edycja geometrii w Solid Edge ST Artykuł pt.: " Czym jest Technologia Synchroniczna a czym nie jest?" zwracał kilkukrotnie uwagę na fakt, że nie należy mylić pojęć modelowania bezpośredniego i edycji bezpośredniej.
Rozliczenia z NFZ. Ogólne założenia. Spis treści
Rozliczenia z NFZ Spis treści 1 Ogólne założenia 2 Generacja raportu statystycznego 3 Wczytywanie raportu zwrotnego 4 Szablony rachunków 4.1 Wczytanie szablonów 4.2 Wygenerowanie dokumentów rozliczenia
Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, 00-662 Warszawa
Zamawiający: Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej 00-662 Warszawa, ul. Koszykowa 75 Przedmiot zamówienia: Produkcja Interaktywnej gry matematycznej Nr postępowania: WMiNI-39/44/AM/13
PODSTAWY METROLOGII ĆWICZENIE 4 PRZETWORNIKI AC/CA Międzywydziałowa Szkoła Inżynierii Biomedycznej 2009/2010 SEMESTR 3
PODSTAWY METROLOGII ĆWICZENIE 4 PRZETWORNIKI AC/CA Międzywydziałowa Szkoła Inżynierii Biomedycznej 29/2 SEMESTR 3 Rozwiązania zadań nie były w żaden sposób konsultowane z żadnym wiarygodnym źródłem informacji!!!
Przygotowały: Magdalena Golińska Ewa Karaś
Przygotowały: Magdalena Golińska Ewa Karaś Druk: Drukarnia VIVA Copyright by Infornext.pl ISBN: 978-83-61722-03-8 Wydane przez Infornext Sp. z o.o. ul. Okopowa 58/72 01 042 Warszawa www.wieszjak.pl Od
Zamawiający potwierdza, że zapis ten należy rozumieć jako przeprowadzenie audytu z usług Inżyniera.
Pytanie nr 1 Bardzo prosimy o wyjaśnienie jak postrzegają Państwo możliwość przeliczenia walut obcych na PLN przez Oferenta, który będzie składał ofertę i chciał mieć pewność, iż spełnia warunki dopuszczające
RAPORT Z EWALUACJI WEWNĘTRZNEJ. w Poradni Psychologiczno-Pedagogicznej w Bełżycach. w roku szkolnym 2013/2014
RAPORT Z EWALUACJI WEWNĘTRZNEJ w Poradni Psychologiczno-Pedagogicznej w Bełżycach w roku szkolnym 2013/2014 WYMAGANIE PLACÓWKA REALIZUJE KONCEPCJĘ PRACY Bełżyce 2014 SPIS TREŚCI: I Cele i zakres ewaluacji
Mnożenie macierzy. Systemy z pamięcią współdzieloną Systemy z pamięcią rozproszoną Efektywność
Mnożenie macierzy Systemy z pamięcią współdzieloną Systemy z pamięcią rozproszoną Efektywność Literatura: Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; 1 Mnożenie macierzy dostęp do
Warunki Oferty PrOmOcyjnej usługi z ulgą
Warunki Oferty PrOmOcyjnej usługi z ulgą 1. 1. Opis Oferty 1.1. Oferta Usługi z ulgą (dalej Oferta ), dostępna będzie w okresie od 16.12.2015 r. do odwołania, jednak nie dłużej niż do dnia 31.03.2016 r.
Budowa systemów komputerowych
Budowa systemów komputerowych dr hab. inż. Krzysztof Patan, prof. PWSZ Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa w Głogowie k.patan@issi.uz.zgora.pl Współczesny system komputerowy System
ZP.271.1.71.2014 Obsługa bankowa budżetu Miasta Rzeszowa i jednostek organizacyjnych
Załącznik nr 3 do SIWZ Istotne postanowienia, które zostaną wprowadzone do treści Umowy Prowadzenia obsługi bankowej budżetu miasta Rzeszowa i jednostek organizacyjnych miasta zawartej z Wykonawcą 1. Umowa
Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?
Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych? 1 Podstawowe pojęcia: 2 3 4 5 Dana (ang.data) najmniejsza, elementarna jednostka informacji o obiekcie będąca przedmiotem przetwarzania
MECHANIZM PERSPEKTYW MATERIALIZOWANYCH W EKSPLORACJI DANYCH
MECHANIZM PERSPEKTYW MATERIALIZOWANYCH W EKSPLORACJI DANYCH Mikołaj MORZY, Marek WOJCIECHOWSKI Streszczenie: Eksploracja danych to proces interaktywny i iteracyjny. Użytkownik definiuje zbiór interesujących
Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej
Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej 3.1 Informacje ogólne Program WAAK 1.0 służy do wizualizacji algorytmów arytmetyki komputerowej. Oczywiście istnieje wiele narzędzi
REGULAMIN. przeprowadzania naboru nowych pracowników do korpusu służby cywilnej w Kuratorium Oświaty w Szczecinie.
Załącznik do zarządzenia Nr 96 /2009 Zachodniopomorskiego Kuratora Oświaty w Szczecinie z dnia 23 września 2009 r. REGULAMIN przeprowadzania naboru nowych pracowników do korpusu służby cywilnej w Kuratorium
2.Prawo zachowania masy
2.Prawo zachowania masy Zdefiniujmy najpierw pewne podstawowe pojęcia: Układ - obszar przestrzeni o określonych granicach Ośrodek ciągły - obszar przestrzeni którego rozmiary charakterystyczne są wystarczająco
Podstawy programowania
Podstawy programowania Elementy algorytmiki C w środowisku.e (C#) dr inŝ. Grzegorz Zych Copernicanum, pok. 104 lub 206a 1 Minimum programowe reści kształcenia: Pojęcie algorytmu. Podstawowe konstrukcje
Audyt SEO. Elementy oraz proces przygotowania audytu. strona
Audyt SEO Elementy oraz proces przygotowania audytu 1 Spis treści Kim jesteśmy? 3 Czym jest audyt SEO 4 Główne elementy audytu 5 Kwestie techniczne 6 Słowa kluczowe 7 Optymalizacja kodu strony 8 Optymalizacja
Trwałość projektu co zrobić, żeby nie stracić dotacji?
Trwałość projektu co zrobić, żeby nie stracić dotacji? 2 Osiągnięcie i utrzymanie wskaźników Wygenerowany przychód Zakaz podwójnego finansowania Trwałość projektu Kontrola po zakończeniu realizacji projektu
Zad.1 Pokazać pierwszeństwo trybu odmów przed zezwalaj.
Sprawozdanie 2 Zad.1 Pokazać pierwszeństwo trybu odmów przed zezwalaj. Ilustracja 1: Przy próbie zapisu pliku odmówiono dostępu mimo że administratorzy mają jawnie zezwalaj Zad. 2 Pokazać pierwszeństwo
Rudniki, dnia 10.02.2016 r. Zamawiający: PPHU Drewnostyl Zenon Błaszak Rudniki 5 64-330 Opalenica NIP 788-000-22-12 ZAPYTANIE OFERTOWE
Zamawiający: Rudniki, dnia 10.02.2016 r. PPHU Drewnostyl Zenon Błaszak Rudniki 5 64-330 Opalenica NIP 788-000-22-12 ZAPYTANIE OFERTOWE W związku z planowaną realizacją projektu pn. Rozwój działalności
REGULAMIN PROMOCJI: BĄDŹ GOTÓW NA VAT! WYBIERZ SYMFONIĘ
REGULAMIN PROMOCJI: BĄDŹ GOTÓW NA VAT! WYBIERZ SYMFONIĘ Postanowienia ogólne 1. Organizatorem Promocji Bądź gotów na VAT! Wybierz Symfonię (dalej: Promocja) jest firma Sage Sp. z o.o. w Warszawie, ul.
Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska
Zarządzanie projektami wykład 1 dr inż. Agata Klaus-Rosińska 1 DEFINICJA PROJEKTU Zbiór działań podejmowanych dla zrealizowania określonego celu i uzyskania konkretnego, wymiernego rezultatu produkt projektu
Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych
Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych Warszawa 2012 (nowelizacja 2014) 1 zmiana nazwy zgodnie z terminologią zawartą w ustawie Prawo pocztowe Jednostka zlecająca: Urząd Komunikacji
KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY
KOMISJA WSPÓLNOT EUROPEJSKICH Bruksela, dnia 13.12.2006 KOM(2006) 796 wersja ostateczna Wniosek DECYZJA RADY w sprawie przedłużenia okresu stosowania decyzji 2000/91/WE upoważniającej Królestwo Danii i
ZAPYTANIE OFERTOWE. Nazwa zamówienia: Wykonanie usług geodezyjnych podziały nieruchomości
Znak sprawy: GP. 271.3.2014.AK ZAPYTANIE OFERTOWE Nazwa zamówienia: Wykonanie usług geodezyjnych podziały nieruchomości 1. ZAMAWIAJĄCY Zamawiający: Gmina Lubicz Adres: ul. Toruńska 21, 87-162 Lubicz telefon:
DE-WZP.261.11.2015.JJ.3 Warszawa, 2015-06-15
DE-WZP.261.11.2015.JJ.3 Warszawa, 2015-06-15 Wykonawcy ubiegający się o udzielenie zamówienia Dotyczy: postępowania prowadzonego w trybie przetargu nieograniczonego na Usługę druku książek, nr postępowania
ASD - ćwiczenia III. Dowodzenie poprawności programów iteracyjnych. Nieformalnie o poprawności programów:
ASD - ćwiczenia III Dowodzenie poprawności programów iteracyjnych Nieformalnie o poprawności programów: poprawność częściowa jeżeli program zakończy działanie dla danych wejściowych spełniających założony
ZAPYTANIE OFERTOWE NR 1
dnia 16.03.2016 r. ZAPYTANIE OFERTOWE NR 1 W związku z realizacją w ramach Wielkopolskiego Regionalnego Programu Operacyjnego na lata 2014-2020 Tytuł projektu: Wzrost konkurencyjności przedsiębiorstwa
VLAN Ethernet. być konfigurowane w dowolnym systemie operacyjnym do ćwiczenia nr 6. Od ćwiczenia 7 należy pracować ć w systemie Linux.
VLAN Ethernet Wstęp Ćwiczenie ilustruje w kolejnych krokach coraz bardziej złożone one struktury realizowane z użyciem wirtualnych sieci lokalnych. Urządzeniami, które będą realizowały wirtualne sieci
UCHWAŁA NR VIII/43/2015 r. RADY MIASTA SULEJÓWEK z dnia 26 marca 2015 r.
UCHWAŁA NR VIII/43/2015 r. RADY MIASTA SULEJÓWEK z dnia 26 marca 2015 r. w sprawie określenia regulaminu otwartego konkursu ofert na realizację zadania publicznego z zakresu wychowania przedszkolnego oraz
RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie
RZECZPOSPOLITA POLSKA Warszawa, dnia 11 lutego 2011 r. MINISTER FINANSÓW ST4-4820/109/2011 Prezydent Miasta na Prawach Powiatu Zarząd Powiatu wszystkie Zgodnie z art. 33 ust. 1 pkt 2 ustawy z dnia 13 listopada
Automatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług
Uniwersytet Ekonomiczny w Poznaniu Wydział Informatyki i Gospodarki Elektronicznej Katedra Informatyki Ekonomicznej Streszczenie rozprawy doktorskiej Automatyczne przetwarzanie recenzji konsumenckich dla
PROJEKTOWANIE PROCESÓW PRODUKCYJNYCH
PROJEKTOWANIE PROCESÓW PRODUKCYJNYCH Do celów projektowania naleŝy ustalić model procesu wytwórczego: Zakłócenia i warunki otoczenia Wpływ na otoczenie WEJŚCIE materiały i półprodukty wyposaŝenie produkcyjne
(Tekst ujednolicony zawierający zmiany wynikające z uchwały Rady Nadzorczej nr 58/2011 z dnia 22.02.2011 r.)
(Tekst ujednolicony zawierający zmiany wynikające z uchwały Rady Nadzorczej nr 58/2011 z dnia 22.02.2011 r.) REGULAMIN REALIZACJI WYMIANY STOLARKI OKIENNEJ W SPÓŁDZIELNI MIESZKANIOWEJ RUBINKOWO W TORUNIU
Ćwiczenie: "Ruch harmoniczny i fale"
Ćwiczenie: "Ruch harmoniczny i fale" Opracowane w ramach projektu: "Wirtualne Laboratoria Fizyczne nowoczesną metodą nauczania realizowanego przez Warszawską Wyższą Szkołę Informatyki. Zakres ćwiczenia:
Komentarz do prac egzaminacyjnych w zawodzie technik administracji 343[01] ETAP PRAKTYCZNY EGZAMINU POTWIERDZAJĄCEGO KWALIFIKACJE ZAWODOWE
Komentarz do prac egzaminacyjnych w zawodzie technik administracji 343[01] ETAP PRAKTYCZNY EGZAMINU POTWIERDZAJĄCEGO KWALIFIKACJE ZAWODOWE OKE Kraków 2012 Zadanie egzaminacyjne zostało opracowane
Szczegółowe zasady obliczania wysokości. i pobierania opłat giełdowych. (tekst jednolity)
Załącznik do Uchwały Nr 1226/2015 Zarządu Giełdy Papierów Wartościowych w Warszawie S.A. z dnia 3 grudnia 2015 r. Szczegółowe zasady obliczania wysokości i pobierania opłat giełdowych (tekst jednolity)
Opracowała: Karolina Król-Komarnicka, kierownik działu kadr i płac w państwowej instytucji
OPUBLIKOWANO: 1 SIERPNIA 2013 ZAKTUALIZOWANO: 12 KWIETNIA 2016 Urlop rodzicielski aktualizacja Opracowała: Karolina Król-Komarnicka, kierownik działu kadr i płac w państwowej instytucji Ustawa z dnia 26
Nowe funkcjonalności
Nowe funkcjonalności 1 I. Aplikacja supermakler 1. Nowe notowania Dotychczasowe notowania koszykowe, z racji ograniczonej możliwości personalizacji, zostały zastąpione nowymi tabelami z notowaniami bieżącymi.
Lublin, 19.07.2013. Zapytanie ofertowe
Lublin, 19.07.2013 Zapytanie ofertowe na wyłonienie wykonawcy/dostawcy 1. Wartości niematerialne i prawne a) System zarządzania magazynem WMS Asseco SAFO, 2. usług informatycznych i technicznych związanych
Bielsko-Biała, dn. 10.02.2015 r. Numer zapytania: R36.1.089.2015. WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska 22 43-300 Bielsko-Biała ZAPYTANIE OFERTOWE
Bielsko-Biała, dn. 10.02.2015 r. Numer zapytania: R36.1.089.2015 WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska 22 43-300 Bielsko-Biała ZAPYTANIE OFERTOWE W związku realizacją projektu badawczo-rozwojowego
Umowa w sprawie przyznania grantu Marie Curie 7PR Wykaz klauzul specjalnych
WYKAZ WSZYSTKICH KLAUZUL SPECJALNYCH MAJĄCYCH ZASTOSOWANIE DO WZORU UMOWY W SPRAWIE PRZYZNANIA GRANTU MARIE CURIE W RAMACH REALIZACJI SIÓDMEGO PROGRAMU RAMOWEGO WSPÓLNOTY EUROPEJSKIEJ (2007-2013) SPIS
WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania
WYKŁAD 8 Reprezentacja obrazu Elementy edycji (tworzenia) obrazu Postacie obrazów na różnych etapach procesu przetwarzania Klasy obrazów Klasa 1: Obrazy o pełnej skali stopni jasności, typowe parametry:
Instrukcja sporządzania skonsolidowanego bilansu Miasta Konina
Załącznik Nr 1 Do zarządzenia Nr 92/2012 Prezydenta Miasta Konina z dnia 18.10.2012 r. Instrukcja sporządzania skonsolidowanego bilansu Miasta Konina Jednostką dominującą jest Miasto Konin (Gmina Miejska
InsERT GT Własne COM 1.0
InsERT GT Własne COM 1.0 Autor: Jarosław Kolasa, InsERT Wstęp... 2 Dołączanie zestawień własnych do systemu InsERT GT... 2 Sposób współpracy rozszerzeń z systemem InsERT GT... 2 Rozszerzenia standardowe
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce)
emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce) Zastosowanie Rozszerzenie to dedykowane jest sklepom internetowych zbudowanym w oparciu
Zaproszenie. Ocena efektywności projektów inwestycyjnych. Modelowanie procesów EFI. Jerzy T. Skrzypek Kraków 2013 Jerzy T.
1 1 Ocena efektywności projektów inwestycyjnych Ocena efektywności projektów inwestycyjnych Jerzy T. Skrzypek Kraków 2013 Jerzy T. Skrzypek MODEL NAJLEPSZYCH PRAKTYK SYMULACJE KOMPUTEROWE Kraków 2011 Zaproszenie
PROCEDURY UDZIELANIA ZAMÓWIEŃ PUBLICZNYCH w Powiatowym Urzędzie Pracy w Pile
Załącznik do Zarządzenia Dyrektora Powiatowego Urzędu Pracy nr 8.2015 z dnia 09.03.2015r. PROCEDURY UDZIELANIA ZAMÓWIEŃ PUBLICZNYCH w Powiatowym Urzędzie Pracy w Pile I. Procedury udzielania zamówień publicznych
Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu
Data Mining Wykład 3 Algorytmy odkrywania binarnych reguł asocjacyjnych Plan wykładu Algorytm Apriori Funkcja apriori_gen(ck) Generacja zbiorów kandydujących Generacja reguł Efektywności działania Własności
ARKUSZ OCENY OKRESOWEJ DLA STANOWISK PRACOWNICZYCH
Załącznik Nr 5 Do Regulaminu okresowych ocen pracowników Urzędu Miasta Piekary Śląskie zatrudnionych na stanowiskach urzędniczych, w tym kierowniczych stanowiskach urzędniczych oraz kierowników gminnych
Charakterystyka systemów plików
Charakterystyka systemów plików Systemy plików są rozwijane wraz z systemami operacyjnymi. Windows wspiera systemy FAT oraz system NTFS. Różnią się one sposobem przechowywania informacji o plikach, ale
Instrukcja Obsługi STRONA PODMIOTOWA BIP
Instrukcja Obsługi STRONA PODMIOTOWA BIP Elementy strony podmiotowej BIP: Strona podmiotowa Biuletynu Informacji Publicznej podzielona jest na trzy części: Nagłówek strony głównej Stopka strony podmiotowej
Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1
Temat: Funkcje. Własności ogólne A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1 Kody kolorów: pojęcie zwraca uwagę * materiał nieobowiązkowy A n n a R a
Uchwała z dnia 20 października 2011 r., III CZP 53/11
Uchwała z dnia 20 października 2011 r., III CZP 53/11 Sędzia SN Zbigniew Kwaśniewski (przewodniczący) Sędzia SN Anna Kozłowska (sprawozdawca) Sędzia SN Grzegorz Misiurek Sąd Najwyższy w sprawie ze skargi
INSTRUKCJA TESTOWANIA USŁUG NA PLATFORMIE ELA-ENT
Załącznik nr 1 Siedlce-Warszawa, dn. 16.06.2009 r. Opracowanie: Marek Faderewski (marekf@ipipan.waw.pl) Dariusz Mikułowski (darek@ii3.ap.siedlce.pl) INSTRUKCJA TESTOWANIA USŁUG NA PLATFORMIE ELA-ENT Przed
Dokonamy analizy mającej na celu pokazanie czy płeć jest istotnym czynnikiem
Analiza I Potrzebujesz pomocy? Wypełnij formularz Dokonamy analizy mającej na celu pokazanie czy płeć jest istotnym czynnikiem różnicującym oglądalność w TV meczów piłkarskich. W tym celu zastosujemy test
HAŚKO I SOLIŃSKA SPÓŁKA PARTNERSKA ADWOKATÓW ul. Nowa 2a lok. 15, 50-082 Wrocław tel. (71) 330 55 55 fax (71) 345 51 11 e-mail: kancelaria@mhbs.
HAŚKO I SOLIŃSKA SPÓŁKA PARTNERSKA ADWOKATÓW ul. Nowa 2a lok. 15, 50-082 Wrocław tel. (71) 330 55 55 fax (71) 345 51 11 e-mail: kancelaria@mhbs.pl Wrocław, dnia 22.06.2015 r. OPINIA przedmiot data Praktyczne
Możemy zapewnić pomoc z przeczytaniem lub zrozumieniem tych informacji. Numer dla telefonów tekstowych. boroughofpoole.
Informacje na temat dodatku na podatek lokalny (Council Tax Support), które mogą mieć znaczenie dla PAŃSTWA Możemy zapewnić pomoc z przeczytaniem lub zrozumieniem tych informacji 01202 265212 Numer dla
Postanowienia ogólne. Usługodawcy oraz prawa do Witryn internetowych lub Aplikacji internetowych
Wyciąg z Uchwały Rady Badania nr 455 z 21 listopada 2012 --------------------------------------------------------------------------------------------------------------- Uchwała o poszerzeniu możliwości
WZÓR SKARGI EUROPEJSKI TRYBUNAŁ PRAW CZŁOWIEKA. Rada Europy. Strasburg, Francja SKARGA. na podstawie Artykułu 34 Europejskiej Konwencji Praw Człowieka
WZÓR SKARGI EUROPEJSKI TRYBUNAŁ PRAW CZŁOWIEKA Rada Europy Strasburg, Francja SKARGA na podstawie Artykułu 34 Europejskiej Konwencji Praw Człowieka oraz Artykułu 45-47 Regulaminu Trybunału 1 Adres pocztowy
Nowości w module: BI, w wersji 9.0
Nowości w module: BI, w wersji 9.0 Copyright 1997-2009 COMARCH S.A. Spis treści Wstęp... 3 Obszary analityczne... 3 1. Nowa kostka CRM... 3 2. Zmiany w obszarze: Księgowość... 4 3. Analizy Data Mining...
Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM
Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM PROGRAM INWENTARYZACJI Poznań 2011 Spis treści 1. WSTĘP...4 2. SPIS INWENTARZA (EWIDENCJA)...5 3. STAŁE UBYTKI...7 4. INTERPRETACJA ZAŁĄCZNIKÓW
UCHWAŁ A SENATU RZECZYPOSPOLITEJ POLSKIEJ. z dnia 18 października 2012 r. w sprawie ustawy o zmianie ustawy o podatku dochodowym od osób fizycznych
UCHWAŁ A SENATU RZECZYPOSPOLITEJ POLSKIEJ z dnia 18 października 2012 r. w sprawie ustawy o zmianie ustawy o podatku dochodowym od osób fizycznych Senat, po rozpatrzeniu uchwalonej przez Sejm na posiedzeniu
Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.
Rozliczenie podatników podatku dochodowego od osób prawnych uzyskujących przychody ze źródeł, z których dochód jest wolny od podatku oraz z innych źródeł Podstawa prawna: Ustawa z dnia 15 lutego 1992 r.
XChronos Rejestracja czasu pracy
SYSTEM REJESTRACJI CZASU PRACY XChronos Rejestracja czasu pracy Najważniejsze cechy zgodność z kodeksem pracy w zakresie rejestracji czasu pracy tworzenie i drukowanie różnorodnych raportów wysyłanie bilansu
Programator pamięci EEPROM
Programator pamięci EEPROM Model M- do Dydaktycznego Systemu Mikroprocesorowego DSM-5 Instrukcja uŝytkowania Copyright 007 by MicroMade All rights reserved Wszelkie prawa zastrzeŝone MicroMade Gałka i
USTAWA. z dnia 26 czerwca 1974 r. Kodeks pracy. 1) (tekst jednolity)
Dz.U.98.21.94 1998.09.01 zm. Dz.U.98.113.717 art. 5 1999.01.01 zm. Dz.U.98.106.668 art. 31 2000.01.01 zm. Dz.U.99.99.1152 art. 1 2000.04.06 zm. Dz.U.00.19.239 art. 2 2001.01.01 zm. Dz.U.00.43.489 art.
INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW ZADANIA
INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW 1. Zawody III stopnia trwają 150 min. 2. Arkusz egzaminacyjny składa się z 2 pytań otwartych o charakterze problemowym, 1 pytania opisowego i 1 mini testu składającego
Komputer i urządzenia z nim współpracujące
Temat 1. Komputer i urządzenia z nim współpracujące Realizacja podstawy programowej 1. 1) opisuje modułową budowę komputera, jego podstawowe elementy i ich funkcje, jak również budowę i działanie urządzeń
INSTRUKCJA DO PROGRAMU LICZARKA 2000 v 2.56
INSTRUKCJA DO PROGRAMU LICZARKA 2000 v 2.56 Program Liczarka 2000 służy do archiwizowania i drukowania rozliczeń z przeprowadzonych transakcji pieniężnych. INSTALACJA PROGRAMU Program instalujemy na komputerze
Elementy i funkcjonalno
Konsola operatora Konsola operatora zapewnia dost p do najwa niejszych informacji o po czeniu i aktualnym statusie abonentów, dzi ki czemu u atwia przekazywanie po cze. Konsola przewy sza swoimi mo liwo
Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu
Rozdział 6 Pakowanie plecaka 6.1 Postawienie problemu Jak zauważyliśmy, szyfry oparte na rachunku macierzowym nie są przerażająco trudne do złamania. Zdecydowanie trudniejszy jest kryptosystem oparty na
1) BENEFICJENT (ZAMAWIAJĄCY):
Marcelów, dn. 05.06.2012 r. Zapytanie ofertowe Mając na względzie postanowienia i obowiązki wynikające ze stosowania zasady konkurencyjności oraz zasady efektywnego zarządzania finansami obowiązującej
Niezależnie od rodzaju materiału dźwiękowego ocenie podlegały następujące elementy pracy egzaminacyjnej:
W czasie przeprowadzonego w czerwcu 2012 roku etapu praktycznego egzaminu potwierdzającego kwalifikacje zawodowe w zawodzie asystent operatora dźwięku zastosowano sześć zadań. Rozwiązanie każdego z zadań
Umowa o pracę zawarta na czas nieokreślony
Umowa o pracę zawarta na czas nieokreślony Uwagi ogólne Definicja umowy Umowa o pracę stanowi dokument stwierdzający zatrudnienie w ramach stosunku pracy. Według ustawowej definicji jest to zgodne oświadczenie
Regulamin Konkursu Start up Award 9. Forum Inwestycyjne 20-21 czerwca 2016 r. Tarnów. Organizatorzy Konkursu
Regulamin Konkursu Start up Award 9. Forum Inwestycyjne 20-21 czerwca 2016 r. Tarnów 1 Organizatorzy Konkursu 1. Organizatorem Konkursu Start up Award (Konkurs) jest Fundacja Instytut Studiów Wschodnich
Techniczne nauki М.М.Zheplinska, A.S.Bessarab Narodowy uniwersytet spożywczych technologii, Кijow STOSOWANIE PARY WODNEJ SKRAPLANIA KAWITACJI
Techniczne nauki М.М.Zheplinska, A.S.Bessarab Narodowy uniwersytet spożywczych technologii, Кijow STOSOWANIE PARY WODNEJ SKRAPLANIA KAWITACJI SKLAROWANEGO SOKU JABŁKOWEGO Skutecznym sposobem leczenia soku
Niniejszy dokument obejmuje: 1. Szablon Umowy zintegrowanej o rachunek ilokata, 2. Szablon Umowy zintegrowanej o rachunek ilokata oraz o rachunek
Niniejszy dokument obejmuje: 1. Szablon Umowy zintegrowanej o rachunek ilokata, 2. Szablon Umowy zintegrowanej o rachunek ilokata oraz o rachunek oszczędnościowo-rozliczeniowy. Umowa zintegrowana o rachunek
Praca na wielu bazach danych część 2. (Wersja 8.1)
Praca na wielu bazach danych część 2 (Wersja 8.1) 1 Spis treści 1 Analizy baz danych... 3 1.1 Lista analityczna i okno szczegółów podstawowe informacje dla każdej bazy... 3 1.2 Raporty wykonywane jako
Ewaluacja projektu szkoleniowego Międzykulturowe ABC
1. Definicja obiektu 2. Cele ewaluacji 3. Zakres przedmiotowy 4.Zakres czasowy Szkolenia dla 50 urzędników zatrudnionych w różnych departamentach i wydziałach Urzędu Miasta Lublina, obecnie lub w przyszłości
Konfiguracja historii plików
Wielu producentów oprogramowania oferuje zaawansowane rozwiązania do wykonywania kopii zapasowych plików użytkownika czy to na dyskach lokalnych czy w chmurze. Warto jednak zastanowić się czy instalacja
epu do danych dla algorytmów przetwarzania zbiorów zapytań eksploracyjnych
tpd10pjmw 2010/6/1 11:04 page 1 #1 Ścieżki dost epu do danych dla algorytmów przetwarzania zbiorów zapytań eksploracyjnych Piotr J edrzejczak, Marek Wojciechowski Politechnika Poznańska, Piotrowo 2, 60-965
Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x
Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x Wersja 02 Styczeń 2016 Centrum Elektronicznych Usług Płatniczych eservice Sp. z o.o. Spis treści 1. Wstęp... 3 1.1. Przeznaczenie dokumentu...
Modele i narzędzia optymalizacji w systemach informatycznych zarządzania
Przedmiot: Modele i narzędzia optymalizacji w systemach informatycznych zarządzania Nr ćwiczenia: 2 Temat: Problem transportowy Cel ćwiczenia: Nabycie umiejętności formułowania zagadnienia transportowego
Regulamin korzystania z serwisu http://www.monitorceidg.pl
Regulamin korzystania z serwisu http://www.monitorceidg.pl 1 [POSTANOWIENIA OGÓLNE] 1. Niniejszy regulamin (dalej: Regulamin ) określa zasady korzystania z serwisu internetowego http://www.monitorceidg.pl
Sieć komputerowa grupa komputerów lub innych urządzeo połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów, na przykład:
Sieci komputerowe Sieć komputerowa grupa komputerów lub innych urządzeo połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów, na przykład: korzystania ze wspólnych urządzeo, np.
Temat: Czy świetlówki energooszczędne są oszczędne i sprzyjają ochronie środowiska? Imię i nazwisko
Temat: Czy świetlówki energooszczędne są oszczędne i sprzyjają ochronie środowiska? Karta pracy III.. Imię i nazwisko klasa Celem nauki jest stawianie hipotez, a następnie ich weryfikacja, która w efekcie