Prof. dr hab. inż. Zbigniew J. Czech Gliwice 25 lipiec 2018 r. Politechnika Śląska Instytut Informatyki
|
|
- Jacek Mateusz Wójcik
- 6 lat temu
- Przeglądów:
Transkrypt
1 Prof. dr hab. inż. Zbigniew J. Czech Gliwice 25 lipiec 2018 r. Politechnika Śląska Instytut Informatyki RECENZJA ROZPRAWY DOKTORSKIEJ DLA RADY NAUKOWEJ INSTYTUTU PODSTAW INFORMATYKI PAN Tytuł rozprawy: Opracowanie w modelu PGAS wybranych, równoległych algorytmów grafowych i ich implementacja przy użyciu języka Java Autorka rozprawy: mgr Magdalena Ryczkowska 1. Teza (cele) rozprawy We Wprowadzeniu do rozprawy Autorka nie sformułowała tezy, nie jest więc jasne co chciała w rozprawie wykazać. Stwierdziła natomiast, że celem rozprawy jest: (i) opracowanie w modelu PGAS wybranych, równoległych algorytmów grafowych, (ii) implementacja algorytmów w języku Java dla środowiska równoległego i rozproszonego, (iii) zbadanie wydajności i skalowalności zaimplementowanych algorytmów, w języku Java do przetwarzania grafów. 2. Aktualność i ważność tematyki rozprawy Nie ulega wątpliwości, że tematyka przedstawionej rozprawy jest aktualna i ważna. W obliczeniach równoległych rozważa się kilka modeli pamięci, Wśród nich można wymienić model jednolitej pamięci wspólnej (ang. shared memory) występujący w modelu obliczeń PRAM (Parallel Random Access Machine); model pamięci rozproszonej (ang. distributed memory) stosowany w obliczeniach rozproszonych; model rozproszonej pamięci wspólnej (ang. distributed shared memory, DSM). Odmianą modelu jednolitej pamięci wspólnej jest model pamięci o podzielonej, globalnej przestrzeni adresowej PGAS (Partitioned Global Address Space), użyteczny w obliczeniach wielowątkowych. Prace nad rozwijaniem modeli pamięci, w szczególności modelu PGAS, oraz implementowaniem programów w języku Java z zastosowaniem tego modelu są aktualne i wartościowe dla rozwoju dziedziny obliczeń równoległych. 3. Wiedza Autorki oraz znajomość współczesnej literatury z dyscypliny naukowej, której dotyczy rozprawa Autorka rozprawy wykazuje dobrą znajomość dorobku literaturowego dotyczącego modeli obliczeń równoległych, w szczególności modelu pamięci PGAS. Ma ugruntowaną wiedzę związaną z równoległymi obliczeniami wielowątkowymi implementowanymi w języku Java przy użyciu biblioteki PCJ (Parallel Computing in Java). Świadczą o tym treści zawarte w rozdz Wiedza Autorki dotycząca dziedzin algorytmiki i obliczeń równoległych jest niepełna. W obliczeniach sekwencyjnych używane są pojęcia złożoności obliczeniowej algorytmu, z wyróżnieniem złożoności czasowej T (n) i pamięciowej S(n), gdzie n jest rozmiarem danych wejściowych. W rozprawie Autorka mówiąc o złożoności czasowej używa określenia wydajność. Np. na rys. 3.5 wykresy złożoności czasowej (z osią rzędnych mierzoną w sekundach) opisane są jako Testy wydajności... (podobnie jest na rys. 3.12, 3.14). Trudno jest akceptować, by wydajność była mierzona w sekundach. Rozważając złożoność pamięciową, Autorka używa określenia narzut pamięciowy (s , 85). Jeśli chodzi o ocenę algorytmów równoległych, to Autorka nie podaje, że definiuje się w tym celu cztery wielkości charakterystyczne, zwane też metrykami (p oznacza liczbę procesorów lub liczbę rdzeni w procesorach wielordzeniowych): T (p, n) złożoność algorytmu równoległego, S(p, n) przyspieszenie, C(p, n) koszt równoległych obliczeń algorytmu,
2 E(p, n) efektywność wykorzystania procesorów lub rdzeni. W rozprawie nie wyznacza się także na drodze teoretycznej, a także nie bada się eksperymentalnie, wielkości przyspieszenia algorytmu równoległego (w stosunku do algorytmu sekwencyjnego), kosztu i efektywności, np. dla zaproponowanego równoległego algorytmu BFS. 4. Ocena oryginalnego dorobku Autorki, jego znaczenie poznawcze oraz przydatność praktyczna dla nauki i techniki Oryginalny dorobek Autorki zawarty jest w rozdziałach 3, 4 oraz 5 rozprawy. (a) W rozdziale 3 Autorka prezentuje szczegóły wykonanych implementacji wybranych testów wzorcowych zawartych w witrynie Graph 500 ( przy użyciu modelu PGAS, języka Java oraz biblioteki PCJ. Zestaw testów wzorcowych Graph 500 składa się z trzech testów: Test 1 (nazwa oryginalna Kernel 1) dotyczy konstruowania grafów, Test 2 (Kernel 2) dotyczy przeszukiwania grafu wszerz (ang. Breadth-First Search, BFS) oraz Test 3 (Kernel 3) dotyczy wyznaczania najkrótszych ścieżek z pojedynczego źródła (ang. Single Source Shortest Paths, SSSP). W rozprawie zaimplementowano testy wzorcowe Test 1 oraz 2, opisane, odpowiednio w podrozdz. 3.2 oraz 3.3. Test 3 został pominięty, nie jest jasne dlaczego. Autorka stwierdza jedynie (s. 101)... że wersja benchmarku Graph 500 wprowadza kilka zmian w stosunku do poprzedniej wersji... jedną z nich jest dodanie nowego kernela... znajdowania najkrótszych dróg w grafie z jednego źródła (SSSP). Dla Testu 1 (podrozdz. 3.2): (i) Zrealizowano implementacje sekwencyjnych wersji tworzenia na podstawie listy krawędzi otrzymanej z generatora grafów Kroneckera reprezentacji grafów w postaci list sąsiedztwa wierzchołków oraz w postaci spakowanych wierszy (ang. Compressed Sparse Row, CSR). Dla reprezentacji grafów w obu postaciach wykonano pomiary czasów wykonania sekwencyjnej implementacji przeszukiwania BFS, z użyciem danych SCALE 22 i SCALE 24 (rys. 3.5). (ii) Zrealizowano kilka wersji równoległych implementacji tworzenia reprezentacji grafów w postaci spakowanych wierszy (CSR) (pkty oraz 3.2.2). Przeprowadzono badania eksperymentalne wydajności wyznaczania reprezentacji CSR dla dwóch wersji implementacyjnych (wersja A i B; wersje te oznaczono także przez S1 i S2; nie jest jasne dlaczego zastosowano podwójne oznaczenia) z użyciem 32, 64 oraz 128 wątków dla danych SCALE 28 (rys. 3.18) Dla Testu 2 (podrozdz. 3.3): (iii) Przedstawiono koncepcje kilku wersji implementacji algorytmu przeszukiwania grafu wszerz (BFS). Pierwsza wersja oparta na synchronizacji wątków po zakończeniu przetwarzania wierzchołków na kolejnych poziomach przeszukiwania okazała się nieefektywna. Również druga rozpatrywana wersja równoległego algorytmu BFS, w której występowała wymiana dużej liczby krótkich wiadomości nie przyniosła zadowalających rezultatów (por. wyniki z rys uzyskane w klastrze Topola). Dopiero trzecia wersja przeszukiwania oznaczona jako Algorytm 2 BFS (str ) umożliwiła uzyskanie lepszej skalowalności i wydajności. Wersja ta została dostosowana do jednostronnej komunikacji oraz do modelu PGAS. W celu zmniejszenia kosztów komunikacji zastosowano metodę nakładania obliczeń i komunikacji, a także przyspieszono obliczenia przez użycie operacji bitowych. (b) W rozdziale 4 Autorka przedstawia wyniki testów wydajnościowych dla algorytmów opisanych w rozdziale 3. Testy zostały przeprowadzone z użyciem klastrów obliczeniowych Hydra (węzły istanbul, interlagos, magnycours), Topola (węzły haswell) i Okeanos. Szczegóły sprzętowe klastrów zostały omówione na s Jeśli chodzi o oprogramowanie, to użyto 64- bitowej Wirtualnej Maszyny Javy Oracle (Java 8) oraz biblioteki OpenMPI (wersja 1.6.5). Dla Testu 1 (pkty ): (i) Przedstawiono wykresy wydajności TEPS (Traversed Edges Per Second) dla dwóch wersji S1 i S2 tworzenia reprezentacji grafów w 2
3 postaci spakowanych wierszy CSR, w porównaniu do wersji MPI pobranej z witryny Graph 500 i zaadaptowanej do środowiska, w którym przeprowadzono testowanie (por. rys ). (ii) Przeprowadzono badania zależności czasu wykonania Algorytmu 2 (BFS) mierzony w sekundach w zależności od rozmiaru bufora ACCUMULATE- BUFFER-SEND używanego w tym algorytmie (rys ). Parametrem na wykresach na tych rysunkach były liczby wątków wykonywanych w pojedynczym węźle obliczeniowym (16, 8 i 4 wątki). W wyniku badań, rozmiar bufora ustalono na 32 kb. Dla Testu 2 (pkt ): (iii) Przedstawiono wykresy wydajności TEPS dla algorytmu BFS oraz grafów SCALE 26, 27 oraz 28 przy różnej liczbie wątków wykonywanych w węźle, tj. 64 wątki na węzeł zawierający cztery procesory po 16 rdzeni (rdzenie interlagos), oraz 4 wątki na węzeł zawierający dwa procesory zawierający po 6 rdzeni (rdzenie istanbul) (rys. 4.12). (iv) Na rys przedstawiono wykresy wydajności algorytmu BFS w porównaniu z wersją MPI dla grafu SCALE 26, przy różnych liczbach wątków na węzeł (w węzłach istabul, interlagos, magnycours). (v) Na rys przedstawiono czasy wykonania poszczególnych fragmentów algorytmu BFS. Autorka wyróżniła cztery fragmenty algorytmu, np. inicjacja struktur danych, oczekiwanie na dane i in. Wykresy wykonano dla danych SCALE 26 oraz węzłów istanbul i interlagos. Podobne wyniki, tylko na klastrze Okeanos są pokazane na rys (vi) Zaprezentowano wyniki wydajności algorytmu BFS (dla grafów SCALE 26 i 27) uzyskane na klastrze Hydra i Okeanos (rys. 4.16; należy je porównywać, jak sądzę, z wynikami z rys. 4.12). (vii) Porównano wyniki dla algorytmu BFS uzyskane na klastrze Okeanos dla implementacji PCJ oraz MPI (rys. 4.19). (viii) Opracowano wykresy pudełkowe czasów wykonania implementacji PCJ dla grafu SCALE 22 dla czerech i ośmiu wątków na węzeł w klastrze o węzłach zawierających dwa 24-rdzeniowe procesory (opis klastra jest na s. 122). Wykresy przedstawiono na rys (c) W rozdziale 5 Autorka dokonała porównania wydajności implementacji algorytmu BFS w modelu PGAS z implementacją w modelu MapReduce, korzystając z platformy Hadoop. Opracowane funkcje Map i Reduce zostały przedstawione na rys Porównanie czasów wykonania implementacji BFS-PCJ oraz MapReduce zaprezentowano na rys Oceniając dorobek rozprawy stwierdzam, że ma on głównie charakter implementacyjnoeksperymentalny, natomiast strona teoretyczna rozprawy jest słaba. Na dorobek implementacyjny oraz eksperymentalny rozprawy składają się implementacje napisane w języku Java przy użyciu biblioteki PCJ, wybranych testów wzorcowych z zestawu Graph 500. Opracowując implementacje Autorka stosowała model PGAS. Dla sporządzonych implementacji przeprowadziła dużą liczbę różnego rodzaju eksperymentów obliczeniowych, korzystając z wyposażenia sprzętowego dostępnych komputerów równoległych, oraz z ich środowisk programowych. Uzyskane wyniki eksperymentalne mają znaczenie poznawcze umożliwiające ocenę przydatności języka Java oraz modelu PGAS w projektowaniu grafowych algorytmów równoległych, a także w ich praktycznej realizacji. Wyniki rozprawy stanowią cenny materiał źródłowy przydatny w dalszych badaniach dotyczących wymienionych zagadnień. W odniesieniu do strony teoretycznej rozprawy, Autorka nie dokonała analizy złożoności czasowej sekwencyjnej wersji algorytmu przeszukiwania grafu wszerz (BFS). Jak wiadomo, złożoność tego algorytmu jest równa T (n, e) = O(n+e), gdzie n jest liczbą wierzchołków grafu, a e liczbą jego krawędzi. Jeśli zachodzi e = O(n) (dla grafów rzadkich), to algorytm ma złożoność liniową, gdy natomiast e = O(n 2 ) (dla grafów gęstych), to ma złożoność kwadratową, względem liczby wierzchołków n. Tak więc, algorytm należy do grupy algorytmów wielomianowych klasy P. Wiadomo, że algorytm BFS jest P-zupełny (ang. P-complete), co oznacza, że prawdopodobnie jest trudny do zrównoleglenia (por. Greenlaw, R., H. J. Hoover, and W. L. Ruzzo Limits to Parallel Computation: P-Completeness Theory. Oxford: Oxford University Press, Part II, pp
4 Wielomianowe algorytmy efektywnie rozwiązywane równolegle (np. sortowanie, mnożenie macierzy) należą do klasy NC (ang. Nick s Class). Dla wielomianowej liczby procesorów, p = n O(1), można je rozwiązać w czasie wielomianowo-logarytmicznym, O(log k n), dla stałych k > 0. Można udowodnić, że NC P, choć problem NC P? jest otwarty. Tak więc, P-zupełny problem przeszukiwania grafu wszerz mimo użycia dowolnej liczby procesorów do jego zrównoleglenia pozostanie problemem wielomianowym, przy wielce prawdopodobnym założeniu, że NC P. I tu rodzi się pytanie: Jak biorąc pod uwagę powyższe trudności należy rozumieć konkluzję Autorki zamieszczoną w Podsumowaniu rozprawy, że Przedstawione w pracy wyniki testów wydajnościowych pokazują, że obliczenia równoległe i rozproszone na danych grafowych wykonane w modelu PGAS w języku Java z użyciem biblioteki PCJ, pozwalają na uzyskanie dobrej wydajności i skalowalności.. 5. Wady i słabe strony rozprawy, uwagi dyskusyjne (a) Jedną z cech algorytmów badanych w rozprawie jest skalowalność. Autorka definiuje mierzalność tej cechy dwojako (s. 97): A. Skalowalność algorytmów była mierzona głównie dla stałego rozmiaru danych wejściowych (ang. strong scaling czyli badanie zmiany czasu wykonania wraz z liczbą wątków dla stałego rozmiaru problemu). Jeśli nie podano inaczej wykresy przedstawiają silną skalowalność. B. Przy słabej skalowalności (ang. weak scaling) bada się zmianę czasu wykonania wraz z liczbą wątków dla stałego rozmiaru problemu przypadającego na jeden wątek. Przy badaniu słabej skalowalności, zwiększając liczbę wątków, rozmiar wejściowego problemu również rośnie. Definicje te nie są ścisłe z dwóch powodów. Po pierwsze, mówi się w nich o czasach wykonania [algorytmów], podczas gdy w rozprawie, komentując skalowalność Autorka odnosi się do wykresów wydajności TEPS, która nie jest mierzona za pomocą jednostek czasu, tylko liczbą odwiedzonych (ang. traversed) krawędzi w ciągu sekundy (por. np. s. 88, s. 103 oraz rys , s. 110 oraz rys i in). Po drugie,... zmiana czasu wykonania wraz z liczbą wątków... określa, jak należy sądzić, szybkość narastania wykresu TEPS. Innymi słowy, Czy miarą skalowalności jest szybkość narastania wykresu? albo inaczej: Czy to oznacza, że powinniśmy oceniać szybkość narastanie wykresu i oceniać, że skalowalność jest np. zła, średnia, dobra, bardzo dobra? Gwoli uzupełnienia dodajmy co następuje. Klasyczna definicja skalowalności mówi, że system równoległy (tj. para algorytm komputer równoległy) jest skalowalny, jeśli jego efektywność może być utrzymywana na zadanym, stałym poziomie (z przedziału [0.0, 1.0]) przez jednoczesne zwiększanie liczby procesorów (lub rdzeni) i rozmiaru rozwiązywanego problemu. Skalowalność systemu równoległego ocenia się na podstawie szybkości wzrostu (w sensie rzędu) funkcji izoefektywności, która określa rozmiar problemu n jako funkcję liczby procesorów p (przykładem może być funkcja n(p) = Θ(p log p)). Jeśli rozmiar rozwiązywanego problemu będziemy zmieniać zgodnie z tą funkcją, zwiększając jednocześnie liczbę procesorów p, to zapewnimy stałą, zadaną efektywność wykorzystania procesorów. Oczywiście, dla pewnej liczby procesorów p, dalsza skalowalność systemu nie będzie możliwa (czyli nie zapewnimy stałej efektywności), ponieważ rozmiar problemu określony przez n(p) będzie większy od rozmiaru pamięci, którymi dysponują procesory/rdzenie danego komputera równoległego. (b) Istotną wadą rozprawy jest brak badań zaprojektowanych równoległych algorytmów pod względem przyspieszenia, kosztu obliczeń i efektywności wykorzystania procesorów (o czym wspomniałem w pkt 3 niniejszej recenzji). Badanie przyspieszenia dla zaproponowanego algorytmu BFS umożliwiłoby ocenę, czy algorytm równoległy wyznacza drzewo przeszukiwania wszerz szybciej niż algorytm sekwencyjny, biorąc pod uwagę P-zupełność problemu BFS. 4
5 We współczesnej algorytmice, zarówno sekwencyjnej, jak i równoległej, rozważa się nie tylko to, czy określony problem da się rozwiązać, ale także jaka jest minimalna ilość zasobów, której trzeba użyć, aby znaleźć poszukiwane rozwiązanie. W obliczeniach równoległych wyznaczamy wówczas koszt obliczeń równoległych zdefiniowany jako C(p, n) = pt (p, n) będący iloczynem liczby p użytych procesorów/rdzeni oraz złożoności algorytmu równoległego T (p, n), która określa liczbę kroków obliczeniowych (operacji elementarnych), którą wykonał każdy z tych procesorów/rdzeni. Niestety, w rozprawie analiza teoretyczna i badanie eksperymentalne kosztu obliczeń zaproponowanego algorytmu BFS zostały pominięte. Podobnie pominięte zostały badania efektywności wykorzystania procesorów/rdzeni. Jeśli efektywność jest mała, to koszt obliczeń równoległych jest duży. A to oznacza, że marnujemy możliwości zasobów w postaci procesorów/rdzeni, za pomocą których rozwiązujemy dany problem. (c) W Podsumowaniu rozprawy Autorka wyciąga następujący wniosek: Opracowane rozwiązania oraz uzyskane wyniki świadczą o możliwym wykorzystaniu modelu PGAS i języka Java do efektywnego przetwarzania danych grafowych przy analizie danych (...). Mam wątpliwości, czy wniosek jest uzasadniony, jako że efektywność implementacji Java-PCJ dla większych danych (SCALE 28, rys. 4.19) jest wyraźnie gorsza od implementacji C-MPI. Na marginesie, w rozprawie efektywność i skalowalność algorytmów jest badana dla grafów o rozmiarach SCALE 22 28, które w zestawie testów wzorcowych Graph 500 są klasyfikowane jako Toy problems. Badania dla problemów Mini (SCALE 29), Small (SCALE 32),..., Huge (SCALE 42) umożliwiłyby dokładniejszą ocenę efektywności implementacji Java-PCJ. Rozpatrując skalowalność, należy brać pod uwagę to, że Java jest językiem interpretowanym. Szybkość interpretowania kodu bajtowego przez maszynę JVM (nawet uwzględniając, że jest on kompilowany do kodu maszynowego w trakcie działania programu) jest mniejsza niż szybkość wykonywania kodu maszynowego programu w języku C tworzonego przez kompilator. Ponadto zauważmy, że w programie BFS tzw. część operacyjna polegająca jedynie na odwiedzaniu krawędzi i wierzchołków grafu jest znikoma. Sytuacja zmieni się, jeśli będziemy rozwiązywać bardziej złożone problemy, o rozbudowanej części operacyjnej, np. badanie planarności grafu, kolorowania grafu, etc. Wówczas nawet stosunkowo niewielkie spowolnienie szybkości wykonywania kodu Javy wpłynie ujemnie na skalowalność (łatwo to sprawdzić mierząc czas wykonania wybranego, nieco bardziej złożonego algorytmu grafowego zaimplementowanego w językach Java i C). (d) Jak powszechnie wiadomo, model obliczeń PRAM jest nierealizowalny technicznie, ponieważ jest nieskalowalny. Przy wzroście liczby procesorów (np. rzędu milionów) nie można bowiem zapewnić stałego czasu dostępu (ang. random access) do dowolnej komórki jednolitej pamięci wspólnej. Czytając rozprawę, szukałem odpowiedzi na pytanie, czy model PGAS jest skalowalny, ale nie znalazłem uwag na ten temat. Sądzę, że model PGAS też nie jest skalowalny, ponieważ fizycznie pamięć modelu jest rozproszona. Składają się na nią pamięci wspólne rdzeni poszczególnych procesorów wchodzące w skład węzłów obliczeniowych. A te komunikują się ze sobą za pomocą sieci połączeń o określonej konfiguracji oraz skończonej przepustowości. W rezultacie, globalna przestrzeń adresowa modelu PGAS nie składa się z komórek o swobodnym dostępie, tj. o tym samym czasie dostępu niezależnie od adresu komórki. (e) Oś rzędnych na rys. 4.8 jest opisana Przyspieszenie. O jakie przyspieszenie chodzi? W definicji słabej skalowalności (s. 97) mówi się o badaniu zmiany czasu wykonania (...). (f) Cytat na s. 13: Dziś większość procesorów działa z szybkością do 4 GHz... Obecnie jednak technologia doszła do granicy możliwości zwiększania częstotliwości taktowania procesora Oto jeden z kilku cytatów w Sieci: 10 Ghz processors already exist. It is just that they are inefficient heat spewing furnaces, so they are not used in 5
6 \ everyday applications. Watch the AMD team run a unlocked processor at 8.49 GHz ( after cooling it with liquid nitrogen, no less. With better cooling tech and changes at the drawing board, it can be made to run at even 10+ GHz)" (g) W rozprawie jest sporo błędów językowych, błędów korekty, określeń żargonowych, a także innych uchybień. Poniżej przedstawiam niektóre z nich: i. błędne pojęcia: szybkości taktowania zegara... działa z szybkością do 4 GHz - w GHz mierzymy częstotliwość taktowania zegara, a nie szybkość (s. 13); wydajność biblioteki - pytan}e: jak się mierzy wydajność biblioteki będącej zbiorem funkcji/ procedur (s. 18). ii. personifikacje: Programowanie równoległe dostarcza (s. 14), systemy oferują (s. 16), Język Java wykorzystywał (s. 17), Przedstawiony sposób zakłada (s. 78), wyniki dla PCJ zachowują się (s. 87). iii. błędy językowe: ilości wierzchołków, Graph 500 posiada, wątek 1 posiada (s. 68), oparta o przesunięcia (s. 70), ilości węzłów (s. 75), ilość przesyłanych wiadomości (s. 86), aby nie nadpisać (s. 86), zakomentowane definicje (s. 100), zedytować (s. 100), przeprocesowanie odebranych (s. 111). iv. niejednolita/ niespójna terminologia: za pomocą testu wzorcowego (ang. benchmark)... Benchmark reprezentuje (s. 16), na różnych benchmarkach (s. 17), otrzymanych z Generatora Benchmarku Graph500 (s. 18) Ueś li ma to być neologizm w j ęzyku polskim, to powinien być pisany jako benczmark], dla testu Kernela 1 (s. 20). v. niejednolita/ niespójna terminologia c.d.: nieprzerwany wzrost wydajności J VM np. garbage collector'a. automatycznego zwalniani.a pamięci. automatyczne odśmiecanie pamięci (s. 17). vi. określenia żargonow e: za pomocą w-rapperów (s. 100) dodanie nowego _ er nel.a (-. 101). vii. błędy interpunkcji: narzędzi których--+ narzędz i któr eh (s. 17) w odpo 'ednim formacie dla którego --+ w odpowiednim formacie, dla którego (s. 19). viii. błędy korekty: sklowalności (s. 18), N= 2 8 CALE (s. 64), do liczny wierzchołków, głownie (s. 68), opis algorytmy (s. 85), równica (s. 113). ix. inne: Keneth'a Appel'a --+ Kenetha Appela (s. 13). x. błędy redakcji: We Wprowadzeniu do rozprawy Autorka formułuje cztery cele (s. 18). A następnie ( ciągle we Wprowadzeniu) komentuje stopień ich realizacj i. p. w odniesieniu do celu: opracowanie w modelu PGAS..." Autorka napisała: W ramach rozprawy sporządzono równoległe wersje... w repoz orium G it.' Taki podsumowujący" komentarz powinien się znaleźć w P odsumowaniu a nie we Wprowadzeniu do rozprawy - i co ciekawe on tam jest w identycznym brzmieniu! (s. 125). Podobna uwaga dotyczy niepotrzebnego powielania tekstów, podsumowujących" cele rozprawy (por. fragmenty nas. 18, 20 z fragmentami nas. 125). Czemu mają służyć takie powielania tekstów? Ponadto, czy szczegółowy opis zrealizowanych pakietów w języku Java powinien się znaleźć we Wprowadzeniu do rozprawy (s )? 6. Wniosek końcowy Biorąc pod uwagę zalety i wady rezultatów badawczych przedstawionych w rozprawie stwierdzam, że rozprawa doktorska mgr Magdaleny Ryczkowskiej spełnia w stopniu dostatecznym wymagania obowiązujących przepisów dotyczących zawartości i formy rozpraw doktorskich. Wnoszę zatem o dopuszczenie mgr Magdaleny Ryczkowskiej do następnej fazy przewodu doktorskiego. Na podkreślenie zasługuje opublikowanie przez Autorkę części wyników rozprawy w siedmiu sprawozdaniach konferencyjnych. Brak jest publikacji w czasopismach z listy JCR. 6
Skalowalność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1
Skalowalność obliczeń równoległych Krzysztof Banaś Obliczenia Wysokiej Wydajności 1 Skalowalność Przy rozważaniu wydajności przetwarzania (obliczeń, komunikacji itp.) często pojawia się pojęcie skalowalności
RECENZJA ROZPRAWY DOKTORSKIEJ
Częstochowa, dn. 5.08.2018 Prof. dr hab. inż. Roman Wyrzykowski Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska ul. Dąbrowskiego 69 42-201 Częstochowa RECENZJA ROZPRAWY DOKTORSKIEJ
Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami
Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy
AiSD zadanie trzecie
AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania
Algorytmy Równoległe i Rozproszone Część V - Model PRAM II
Algorytmy Równoległe i Rozproszone Część V - Model PRAM II Łukasz Kuszner pokój 209, WETI http://www.sphere.pl/ kuszner/ kuszner@sphere.pl Oficjalna strona wykładu http://www.sphere.pl/ kuszner/arir/ 2005/06
Analiza ilościowa w przetwarzaniu równoległym
Komputery i Systemy Równoległe Jędrzej Ułasiewicz 1 Analiza ilościowa w przetwarzaniu równoległym 10. Analiza ilościowa w przetwarzaniu równoległym...2 10.1 Kryteria efektywności przetwarzania równoległego...2
Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące.
Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące. Łukasz Kuszner pokój 209, WETI http://www.sphere.pl/ kuszner/ kuszner@sphere.pl Oficjalna strona wykładu http://www.sphere.pl/
RECENZJA ROZPRAWY DOKTORSKIEJ DLA INSTYTUTU PODSTAW INFORMATYKI POLSKIEJ AKADEMII NAUK
dr hab. inż. Paweł Czarnul Katedra Architektury Systemów Komputerowych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Gdańsk, 17 lipca 2017 RECENZJA ROZPRAWY DOKTORSKIEJ DLA INSTYTUTU
Dariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki
Dariusz Brzeziński Politechnika Poznańska, Instytut Informatyki Język programowania prosty bezpieczny zorientowany obiektowo wielowątkowy rozproszony przenaszalny interpretowany dynamiczny wydajny Platforma
Sprawozdanie do zadania numer 2
Sprawozdanie do zadania numer 2 Michał Pawlik 29836 Temat: Badanie efektywności algorytmów grafowych w zależności od rozmiaru instancji oraz sposobu reprezentacji grafu w pamięci komputera 1 WSTĘP W ramach
Algorytmy i Struktury Danych
POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Algorytmy i Struktury Danych www.pk.edu.pl/~zk/aisd_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 12: Wstęp
Analiza efektywności przetwarzania współbieżnego. Wykład: Przetwarzanie Równoległe Politechnika Poznańska Rafał Walkowiak Grudzień 2015
Analiza efektywności przetwarzania współbieżnego Wykład: Przetwarzanie Równoległe Politechnika Poznańska Rafał Walkowiak Grudzień 2015 Źródła kosztów przetwarzania współbieżnego interakcje między procesami
CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu
CUDA Median Filter filtr medianowy wykorzystujący bibliotekę CUDA sprawozdanie z projektu inż. Daniel Solarz Wydział Fizyki i Informatyki Stosowanej AGH 1. Cel projektu. Celem projektu było napisanie wtyczki
Przygotowanie kilku wersji kodu zgodnie z wymogami wersji zadania,
Przetwarzanie równoległe PROJEKT OMP i CUDA Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego przy użyciu komputera równoległego z procesorem wielordzeniowym z pamięcią
Algorytmy dla maszyny PRAM
Instytut Informatyki 21 listopada 2015 PRAM Podstawowym modelem służącym do badań algorytmów równoległych jest maszyna typu PRAM. Jej głównymi składnikami są globalna pamięć oraz zbiór procesorów. Do rozważań
Zadania badawcze prowadzone przez Zakład Technik Programowania:
Zadania badawcze prowadzone przez Zakład Technik Programowania: - Opracowanie metod zrównoleglania programów sekwencyjnych o rozszerzonym zakresie stosowalności. - Opracowanie algorytmów obliczenia tranzytywnego
Analiza efektywności przetwarzania współbieżnego
Analiza efektywności przetwarzania współbieżnego Wykład: Przetwarzanie Równoległe Politechnika Poznańska Rafał Walkowiak 1/4/2013 Analiza efektywności 1 Źródła kosztów przetwarzania współbieżnego interakcje
Nowoczesne technologie przetwarzania informacji
Projekt Nowe metody nauczania w matematyce Nr POKL.09.04.00-14-133/11 Nowoczesne technologie przetwarzania informacji Mgr Maciej Cytowski (ICM UW) Lekcja 2: Podstawowe mechanizmy programowania równoległego
REFERAT PRACY DYPLOMOWEJ
REFERAT PRACY DYPLOMOWEJ Temat pracy: Implementacja i porównanie wydajności wybranych algorytmów grafowych w warunkach obliczeń równoległych Autor pracy: Michał Podstawski Promotor: Prof. WSTI, dr hab.
Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki
Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. Instytut Informatyki 22 listopada 2015 Algorytm DFS w głąb Algorytm przejścia/przeszukiwania w głąb (ang. Depth First
Za pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).
Algorytmy definicja, cechy, złożoność. Algorytmy napotykamy wszędzie, gdziekolwiek się zwrócimy. Rządzą one wieloma codziennymi czynnościami, jak np. wymiana przedziurawionej dętki, montowanie szafy z
Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego
Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego Mariusz Uchroński 3 grudnia 2010 Plan prezentacji 1. Wprowadzenie 2.
Programowanie współbieżne Wykład 2. Iwona Kochańska
Programowanie współbieżne Wykład 2 Iwona Kochańska Miary skalowalności algorytmu równoległego Przyspieszenie Stały rozmiar danych N T(1) - czas obliczeń dla najlepszego algorytmu sekwencyjnego T(p) - czas
Przykładem jest komputer z procesorem 4 rdzeniowym dostępny w laboratorium W skład projektu wchodzi:
Przetwarzanie równoległe PROJEKT OMP Temat projektu dotyczy analizy efektywności przetwarzania równoległego realizowanego w komputerze równoległym z procesorem wielordzeniowym z pamięcią współdzieloną.
Wydajność systemów a organizacja pamięci, czyli dlaczego jednak nie jest aż tak źle. Krzysztof Banaś, Obliczenia wysokiej wydajności.
Wydajność systemów a organizacja pamięci, czyli dlaczego jednak nie jest aż tak źle Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Organizacja pamięci Organizacja pamięci współczesnych systemów komputerowych
IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH
IMPLEMENTACJA I PORÓWNANIE WYDAJNOŚCI WYBRANYCH ALGORYTMÓW GRAFOWYCH W WARUNKACH OBLICZEŃ RÓWNOLEGŁYCH Michał Podstawski Praca dyplomowa napisana pod kierunkiem Prof. WSTI dr hab. inż. Jarosława Śmiei
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI 16/01/2017 WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Repetytorium złożoność obliczeniowa 2 Złożoność obliczeniowa Notacja wielkie 0 Notacja Ω i Θ Rozwiązywanie
Przykładowe sprawozdanie. Jan Pustelnik
Przykładowe sprawozdanie Jan Pustelnik 30 marca 2007 Rozdział 1 Sformułowanie problemu Tematem pracy jest porównanie wydajności trzech tradycyjnych metod sortowania: InsertionSort, SelectionSort i BubbleSort.
Jak ujarzmić hydrę czyli programowanie równoległe w Javie. dr hab. Piotr Bała, prof. UW ICM Uniwersytet Warszawski
Jak ujarzmić hydrę czyli programowanie równoległe w Javie dr hab. Piotr Bała, prof. UW ICM Uniwersytet Warszawski Prawo Moore a Ekonomicznie optymalna liczba tranzystorów w układzie scalonym zwiększa się
Wprowadzenie do złożoności obliczeniowej
problemów Katedra Informatyki Politechniki Świętokrzyskiej Kielce, 16 stycznia 2007 problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów
Wstęp do Sztucznej Inteligencji
Wstęp do Sztucznej Inteligencji Rozwiązywanie problemów-i Joanna Kołodziej Politechnika Krakowska Wydział Fizyki, Matematyki i Informatyki Rozwiązywanie problemów Podstawowe fazy: Sformułowanie celu -
Wydajność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1
Wydajność obliczeń równoległych Krzysztof Banaś Obliczenia Wysokiej Wydajności 1 Wydajność obliczeń równoległych Podobnie jak w obliczeniach sekwencyjnych, gdzie celem optymalizacji wydajności było maksymalne
Dr inż. hab. Siergiej Fialko, IF-PK,
Dr inż. hab. Siergiej Fialko, IF-PK, http://torus.uck.pk.edu.pl/~fialko sfialko@riad.pk.edu.pl 1 Osobliwości przedmiotu W podanym kursie główna uwaga będzie przydzielona osobliwościom symulacji komputerowych
Wykorzystanie architektury Intel MIC w obliczeniach typu stencil
Wykorzystanie architektury Intel MIC w obliczeniach typu stencil Kamil Halbiniak Wydział Inżynierii Mechanicznej i Informatyki Kierunek informatyka, Rok IV Instytut Informatyki Teoretycznej i Stosowanej
RECENZJA ROZPRAWY DOKTORSKIEJ DLA RADY WYDZIAŁU ELEKTRONIKI I TECHNIK INFORMACYJNYCH POLITECHNIKI WARSZAWSKIEJ
Prof. dr hab. inż. Franciszek Seredyński Warszawa, 30.09.2016 Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie Instytut Informatyki Wydział Matematyczno-Przyrodniczy. Szkoła Nauk Ścisłych Ul. Wóycickiego
Czym jest Java? Rozumiana jako środowisko do uruchamiania programów Platforma software owa
1 Java Wprowadzenie 2 Czym jest Java? Język programowania prosty zorientowany obiektowo rozproszony interpretowany wydajny Platforma bezpieczny wielowątkowy przenaszalny dynamiczny Rozumiana jako środowisko
Częstochowa, dn
Częstochowa, dn. 19.10.2017 Prof. dr hab. inż. Roman Wyrzykowski Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska ul. Dąbrowskiego 69 42-201 Częstochowa RECENZJA ROZPRAWY DOKTORSKIEJ
i3: internet - infrastruktury - innowacje
i3: internet - infrastruktury - innowacje Wykorzystanie procesorów graficznych do akceleracji obliczeń w modelu geofizycznym EULAG Roman Wyrzykowski Krzysztof Rojek Łukasz Szustak [roman, krojek, lszustak]@icis.pcz.pl
PROBLEMY NIEROZSTRZYGALNE
PROBLEMY NIEROZSTRZYGALNE Zestaw 1: T Przykład - problem domina T Czy podanym zestawem kafelków można pokryć dowolny płaski obszar zachowując odpowiedniość kolorów na styku kafelków? (dysponujemy nieograniczoną
Projektowanie algorytmów równoległych. Zbigniew Koza Wrocław 2012
Projektowanie algorytmów równoległych Zbigniew Koza Wrocław 2012 Spis reści Zadniowo-kanałowy (task-channel) model algorytmów równoległych Projektowanie algorytmów równoległych metodą PACM Task-channel
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Podniesienie poziomu wiedzy studentów z zagadnień dotyczących analizy i syntezy algorytmów z uwzględnieniem efektywności
Opracowanie w modelu PGAS wybranych, równoległych algorytmów grafowych
Opracowanie w modelu PGAS wybranych, równoległych algorytmów grafowych i ich implementacja przy użyciu języka Java Wydział Matematyki i Informatyki Uniwersytet Mikołaja Kopernika Chopina 12/18, 87-100
Programowanie współbieżne Wstęp do obliczeń równoległych. Rafał Skinderowicz
Programowanie współbieżne Wstęp do obliczeń równoległych Rafał Skinderowicz Plan wykładu Modele obliczeń równoległych Miary oceny wydajności algorytmów równoległych Prawo Amdahla Prawo Gustavsona Modele
Algorytmy Komunikacyjne dla Trójwymiarowych Sieci Opartych na Plastrze Miodu. Ireneusz Szcześniak. Politechnika Śląska 20 czerwca 2002 r.
Algorytmy Komunikacyjne dla Trójwymiarowych Sieci Opartych na Plastrze Miodu Ireneusz Szcześniak Politechnika Śląska 20 czerwca 2002 r. 2 Plan prezentacji Wprowadzenie Prezentacja trójwymiarowych sieci
Algorytmy równoległe: prezentacja i ocena efektywności prostych algorytmów dla systemów równoległych
Algorytmy równoległe: prezentacja i ocena efektywności prostych algorytmów dla systemów równoległych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2018/19 Problem: znajdowanie
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2014/15 Znajdowanie maksimum w zbiorze
KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Algorytmy i struktury danych, C3
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych
Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2013/14 Znajdowanie maksimum w zbiorze
Opinia o pracy doktorskiej pt. On active disturbance rejection in robotic motion control autorstwa mgr inż. Rafała Madońskiego
Prof. dr hab. inż. Tadeusz Uhl Katedra Robotyki i Mechatroniki Akademia Górniczo Hutnicza Al. Mickiewicza 30 30-059 Kraków Kraków 09.06.2016 Opinia o pracy doktorskiej pt. On active disturbance rejection
Poziom kwalifikacji: I stopnia. Liczba godzin/tydzień: 2W E, 2L PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGRAMOWANIE ROZPROSZONE I RÓWNOLEGŁE Distributed and parallel programming Kierunek: Forma studiów: Informatyka Stacjonarne Rodzaj przedmiotu: moduł specjalności obowiązkowy: Sieci komputerowe
Struktury danych i złożoność obliczeniowa Wykład 5. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład. Prof. dr hab. inż. Jan Magott Algorytmy grafowe: podstawowe pojęcia, reprezentacja grafów, metody przeszukiwania, minimalne drzewa rozpinające, problemy
PRZETWARZANIE RÓWNOLEGŁE I ROZPROSZONE. Mnożenie macierzy kwadratowych metodą klasyczną oraz blokową z wykorzystaniem OpenMP.
P O L I T E C H N I K A S Z C Z E C I Ń S K A Wydział Informatyki PRZETWARZANIE RÓWNOLEGŁE I ROZPROSZONE. Mnożenie macierzy kwadratowych metodą klasyczną oraz blokową z wykorzystaniem OpenMP. Autor: Wojciech
Podstawy Informatyki Systemy sterowane przepływem argumentów
Podstawy Informatyki alina.momot@polsl.pl http://zti.polsl.pl/amomot/pi Plan wykładu 1 Komputer i jego architektura Taksonomia Flynna 2 Komputer i jego architektura Taksonomia Flynna Komputer Komputer
operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.
Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie
Systemy wbudowane. Uproszczone metody kosyntezy. Wykład 11: Metody kosyntezy systemów wbudowanych
Systemy wbudowane Wykład 11: Metody kosyntezy systemów wbudowanych Uproszczone metody kosyntezy Założenia: Jeden procesor o znanych parametrach Znane parametry akceleratora sprzętowego Vulcan Początkowo
PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Część teoretyczna Informacje i wstępne wymagania Cel przedmiotu i zakres materiału Zasady wydajnego
Struktury danych i złozoność obliczeniowa. Prof. dr hab. inż. Jan Magott
Struktury danych i złozoność obliczeniowa Prof. dr hab. inż. Jan Magott Formy zajęć: Wykład 1 godz., Ćwiczenia 1 godz., Projekt 2 godz.. Adres strony z materiałami do wykładu: http://www.zio.iiar.pwr.wroc.pl/sdizo.html
5. Model komunikujących się procesów, komunikaty
Jędrzej Ułasiewicz str. 1 5. Model komunikujących się procesów, komunikaty Obecnie stosuje się następujące modele przetwarzania: Model procesów i komunikatów Model procesów komunikujących się poprzez pamięć
XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Algorytmy Równoległe i Rozproszone Część III - Układy kombinacyjne i P-zupełność
Algorytmy Równoległe i Rozproszone Część III - Układy kombinacyjne i P-zupełność Łukasz Kuszner pokój 209, WETI http://www.kaims.pl/ kuszner/ kuszner@eti.pg.gda.pl Oficjalna strona wykładu http://www.kaims.pl/
Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie
Więcej o sprawności algorytmów Porównanie czasów działania algorytmów sortowania przez wstawianie i scalanie Załóżmy, że możemy wykonać dane zadanie przy użyciu dwóch algorytmów: jednego o złożoności czasowej
Technologie Informacyjne
POLITECHNIKA KRAKOWSKA - WIEiK - KATEDRA AUTOMATYKI Technologie Informacyjne www.pk.edu.pl/~zk/ti_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 3: Wprowadzenie do algorytmów i ich
16. Taksonomia Flynn'a.
16. Taksonomia Flynn'a. Taksonomia systemów komputerowych według Flynna jest klasyfikacją architektur komputerowych, zaproponowaną w latach sześćdziesiątych XX wieku przez Michaela Flynna, opierająca się
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGRAMOWANIE WSPÓŁBIEŻNE I ROZPROSZONE I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE C1. Uzyskanie przez studentów wiedzy na temat architektur systemów równoległych i rozproszonych,
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH
Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH Przeszukiwanie przestrzeni rozwiązań, szukanie na ślepo, wszerz, w głąb. Spis treści: 1. Wprowadzenie 3. str. 1.1 Krótki Wstęp
Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1
Wydajność systemów a organizacja pamięci Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Motywacja - memory wall Krzysztof Banaś, Obliczenia wysokiej wydajności. 2 Organizacja pamięci Organizacja pamięci:
Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15
Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Zadanie algorytmiczne: wyszukiwanie dane wejściowe:
Algorytm. a programowanie -
Algorytm a programowanie - Program komputerowy: Program komputerowy można rozumieć jako: kod źródłowy - program komputerowy zapisany w pewnym języku programowania, zestaw poszczególnych instrukcji, plik
Sieci obliczeniowe poprawny dobór i modelowanie
Sieci obliczeniowe poprawny dobór i modelowanie 1. Wstęp. Jednym z pierwszych, a zarazem najważniejszym krokiem podczas tworzenia symulacji CFD jest poprawne określenie rozdzielczości, wymiarów oraz ilości
Złożoność obliczeniowa zadania, zestaw 2
Złożoność obliczeniowa zadania, zestaw 2 Określanie złożoności obliczeniowej algorytmów, obliczanie pesymistycznej i oczekiwanej złożoności obliczeniowej 1. Dana jest tablica jednowymiarowa A o rozmiarze
Zadanie 1: Piętnastka
Informatyka, studia dzienne, inż. I st. semestr VI Sztuczna Inteligencja i Systemy Ekspertowe 2010/2011 Prowadzący: mgr Michał Pryczek piątek, 12:00 Data oddania: Ocena: Grzegorz Graczyk 150875 Marek Rogalski
Raport Hurtownie Danych
Raport Hurtownie Danych Algorytm Apriori na indeksie bitmapowym oraz OpenCL Mikołaj Dobski, Mateusz Jarus, Piotr Jessa, Jarosław Szymczak Cel projektu: Implementacja algorytmu Apriori oraz jego optymalizacja.
Budowa komputera. Magistrala. Procesor Pamięć Układy I/O
Budowa komputera Magistrala Procesor Pamięć Układy I/O 1 Procesor to CPU (Central Processing Unit) centralny układ elektroniczny realizujący przetwarzanie informacji Zmiana stanu tranzystorów wewnątrz
R E C E N Z J A. rozprawy doktorskiej mgr Wojciecha Bury nt. Wielokryterialne, mrowiskowe algorytmy optymalizacji w nawigacji samochodowej
Prof. dr hab. inż. Franciszek Seredyński Warszawa, 25.02.2015 Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie Wydział Matematyczno Przyrodniczy Szkoła Nauk Ścisłych ul. Wóycickiego 1/3, 01-938 Warszawa
Wstęp do programowania
Wstęp do programowania Złożoność obliczeniowa, poprawność programów Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. XII Jesień 2013 1 / 20 Złożoność obliczeniowa Problem Ile czasu
Teoria obliczeń i złożoność obliczeniowa
Teoria obliczeń i złożoność obliczeniowa Kontakt: dr hab. inż. Adam Kasperski, prof. PWr. pokój 509 B4 adam.kasperski@pwr.wroc.pl materiały + informacje na stronie www. Zaliczenie: Egzamin Literatura Problemy
Algorytmy równoległe. Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2010
Algorytmy równoległe Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka Znajdowanie maksimum w zbiorze n liczb węzły - maksimum liczb głębokość = 3 praca = 4++ = 7 (operacji) n - liczność
ĆWICZENIE NR 1 WPROWADZENIE DO INFORMATYKI
J.NAWROCKI, M. ANTCZAK, H. ĆWIEK, W. FROHMBERG, A. HOFFA, M. KIERZYNKA, S.WĄSIK ĆWICZENIE NR 1 WPROWADZENIE DO INFORMATYKI ZAD. 1. Narysowad graf nieskierowany. Zmodyfikowad go w taki sposób, aby stał
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych
Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych ELEMENTY SZTUCZNEJ INTELIGENCJI Laboratorium nr 9 PRZESZUKIWANIE GRAFÓW Z
KARTA PRZEDMIOTU. Algorytmy i struktury danych, C4
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
Architektura komputerów
Architektura komputerów Wykład 7 Jan Kazimirski 1 Pamięć podręczna 2 Pamięć komputera - charakterystyka Położenie Procesor rejestry, pamięć podręczna Pamięć wewnętrzna pamięć podręczna, główna Pamięć zewnętrzna
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 14c 2 Definicje indukcyjne Twierdzenia dowodzone przez indukcje Definicje indukcyjne Definicja drzewa
Złożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to
Złożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to wprowadzili J. Hartmanis i R. Stearns. Najczęściej przez zasób rozumie się czas oraz pamięć dlatego
Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów
Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69
Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott
Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca
dr inż. Jarosław Forenc
Informatyka 2 Politechnika Białostocka - Wydział Elektryczny Elektrotechnika, semestr III, studia stacjonarne I stopnia Rok akademicki 2010/2011 Wykład nr 7 (24.01.2011) dr inż. Jarosław Forenc Rok akademicki
10/14/2013 Przetwarzanie równoległe - wstęp 1. Zakres przedmiotu
Literatura 1. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 2. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010. 3. Designing
Literatura. 11/16/2016 Przetwarzanie równoległe - wstęp 1
Literatura 1. Wprowadzenie do obliczeń równoległych, Zbigniew Czech, Wydawnictwo Naukowe PWN, 2010, 2013 2. Introduction to Parallel Computing; Grama, Gupta, Karypis, Kumar; Addison Wesley 2003 3. Designing
Podsumowanie wyników ankiety
SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku
Informatyka 1. Złożoność obliczeniowa
Informatyka 1 Wykład XI Złożoność obliczeniowa Robert Muszyński ZPCiR ICT PWr Zagadnienia: efektywność programów/algorytmów, sposoby zwiększania efektywności algorytmów, zasada 80 20, ocena efektywności
Lista 0. Kamil Matuszewski 1 marca 2016
Lista 0 Kamil Matuszewski marca 206 2 3 4 5 6 7 8 0 0 Zadanie 4 Udowodnić poprawność mnożenia po rosyjsku Zastanówmy się co robi nasz algorytm Mamy podane liczby n i m W każdym kroku liczbę n dzielimy
Numeryczna algebra liniowa
Numeryczna algebra liniowa Numeryczna algebra liniowa obejmuje szereg algorytmów dotyczących wektorów i macierzy, takich jak podstawowe operacje na wektorach i macierzach, a także rozwiązywanie układów
Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle
Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Algorytm 1. Termin algorytm jest używany w informatyce
dr hab. inż. Krzysztof Zatwarnicki, prof. PO Opole, r. Wydział Elektrotechniki, Automatyki i Informatyki Politechnika Opolska
dr hab. inż. Krzysztof Zatwarnicki, prof. PO Opole, 26.05.2018 r. Wydział Elektrotechniki, Automatyki i Informatyki Politechnika Opolska RECENZJA rozprawy doktorskiej Pana mgr inż. Adama Dudka pt. Model
PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK
1 PROGRAMOWANIE WSPÓŁCZESNYCH ARCHITEKTUR KOMPUTEROWYCH DR INŻ. KRZYSZTOF ROJEK POLITECHNIKA CZĘSTOCHOWSKA 2 Trendy rozwoju współczesnych procesorów Budowa procesora CPU na przykładzie Intel Kaby Lake
Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1
Wydajność systemów a organizacja pamięci Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Wydajność obliczeń Dla wielu programów wydajność obliczeń można traktować jako wydajność pobierania z pamięci
Budowa komputera Komputer computer computare
11. Budowa komputera Komputer (z ang. computer od łac. computare obliczać) urządzenie elektroniczne służące do przetwarzania wszelkich informacji, które da się zapisać w formie ciągu cyfr albo sygnału