mgr in. Krzysztof Siedlecki

Wielkość: px
Rozpocząć pokaz od strony:

Download "mgr in. Krzysztof Siedlecki"

Transkrypt

1 P O L I T E C H N I K A S Z C Z E C ISKA W Y D Z I A Ł I N F O R M A T Y K I K A T E D R A T E C H N I K P R O G R A M O W A N I A mgr in. Krzysztof Siedlecki A l g o r y t m y w y s z u k i w a n i a d r o b n o - i g r u b o z i a r n i s t e j r ó w n o l e g ł oci w ptlach programowych z z a l enociami afinicznymi R o z p r a w a d o k t o r s k a P R O M O T O R : prof. dr hab. in. Włodzimierz Bielecki SZCZECIN 2008

2 Podzikowania Składam serdeczne podzikowania wszystkim, którzy słuc mi swoj pomoc przyczynili si do powstania niniejszej pracy, a w szczególnoci: prof dr. hab. in. Włodzimierzowi Bieleckiemu za opiek naukow w trakcie moich studiów doktoranckich oraz cenn pomoc merytoryczn podczas realizacji pracy naukowej, mojej onie Edycie za wszelk pomoc w trakcie pisania pracy, cierpliwo i wsparcie w wielu trudnych chwilach.

3 Spis treci Spis treci SPIS TRECI... I SPIS RYSUNKÓW... IV SPIS TABEL... VII SPIS ALGORYTMÓW... VIII SPIS SYMBOLI... IX SŁOWNIK SKRÓTÓW... X 1. WSTP STAN PROBLEMU CEL I TEZA BADAWCZA PRACY STRUKTURA PRACY PRZETWARZANIE RÓWNOLEGŁE PRZEGLD ZAGADNIENIA ARCHITEKTURA MASZYN RÓWNOLEGŁYCH ZALENOCI: REPREZENTACJA I WYKRYWANIE... 16!" # $ 2.3. PRZETWARZANIE RÓWNOLEGŁE PODSTAWOWE POJ CIA # %$&' # ( $ & ) " 2.4. RODOWISKA PROGRAMOWANIA SYSTEMÓW WIELOPROCESOROWYCH * +,(# * (+-#' *# +./! # ** 0 (+# 2.5. PROGRAMOWANIE KOMPUTERÓW WIELOPROCESOROWYCH PODSUMOWANIE ALGORYTMY WYSZUKIWANIA NIEZALENYCH FRAGMENTÓW KODU PROJEKTOWANIE RÓWNOLEGŁYCH ALGORYTMÓW IDEA WYZNACZANIA NIEZALENYCH FRAGMENTÓW KODU i

4 Spis treci 3.3. POJ CIA ZWIZANE Z WYZNACZANIEM NIEZALENYCH FRAGMENTÓW KODU P TLE IDEALNIE ZAGNIEDONE #* &$! 1 #* 2 $!3) $&* #*# 2! 3) &$&4 #** 2 ) $&!3) ' 3.5. P TLE DOWOLNIE ZAGNIEDONE # 2 $!3) $&'4 # 2!!3) ) $& ## 2!3) $&)3& &$& ' #* 2!3) $& ) TWORZENIE KODU REPREZENTUJCEGO DROBNOZIARNIST RÓWNOLEGŁO PODSUMOWANIE BADANIA EKSPERYMENTALNE KRYTERIA WYBORU P TLI DO TESTÓW MODYFIKACJE P TLI TRANSFORMACJE KODU WYNIKOWEGO BADANIA EKSPERYMENTALNE WYBRANYCH P TLI ZBIÓR P TLI LIVERMORE 90 ** +64" ** +61"* **# +6"' 4.5. BADANIE EKSPERYMENTALNE WYBRANYCH P TLI ZBIÓR TESTÓW NPB * +7/8 81 * +9/8&.381* *# +:; 8< ** +;=88 * +; =833& 8# *' +; =8 8*1 * +; =8 &8'# *4 +; =83 8' *" +87/8!8" *1+8+8>8## 4.6. WNIOSKI Z PRZEPROWADZONYCH BADA ii

5 Spis treci 5. PRACE POKREWNE PODSUMOWANIE WNIOSKI KOCOWE DALSZE BADANIA PUBLIKACJE WŁASNE BIBLIOGRAFIA iii

6 Spis rysunków Spis rysunków RYSUNEK 2.1. ARCHITEKTURA KOMPUTERA RÓWNOLEGŁEGO TYPU SIMD [29] RYSUNEK 2.2. ARCHITEKTURA MASZYN RÓWNOLEGŁYCH TYPU SIMD [29] RYSUNEK 2.3. SCHEMAT BUDOWY SYSTEMÓW WIELOPROCESOROWYCH Z PAMI CI DZIELON[29] RYSUNEK 2.4. ARCHITEKTURA UMA [29] RYSUNEK 2.5. ARCHITEKTURA NUMA [29] RYSUNEK 2.6. ARCHITEKTURA COMA [29] RYSUNEK 2.7. BUDOWA SYSTEMU Z PAMI CI ROZPROSZON [29] RYSUNEK 2.8. GRAFICZNA REPREZENTACJA ZBIORÓW S 1 I S 2 [OP. WŁASNE] RYSUNEK 2.9. GRAFICZNA REPREZENTACJA MAPOWANIA ZGODNIE Z RELACJ R [OP. WŁASNE] RYSUNEK MAPOWANIE POJ Z DZIEDZINY ZALENOCI DANYCH NA PRZYJ TY SPOSÓB REPREZENTACJI ZALENOCI [OP. WŁASNE] RYSUNEK GRAF ZALENOCI [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA WIELKOCI TEORETYCZNEGO PROBLEMU (N) ORAZ LICZBY PROCESORÓW (P) [OP. WŁASNE] RYSUNEK MODEL ROZWIDLENIA WTKÓW (ANG. FORK-JOIN) [51] RYSUNEK 3.1. METODOLOGIA PROJEKTOWANIA PROGRAMÓW RÓWNOLEGŁYCH [34] RYSUNEK 3.2. SCHEMAT IDEOWY ALGORYTMÓW (PRZEPŁYW DANYCH) [OP. WŁASNE] RYSUNEK 3.3. RELACJA ZALENOCI R, TRANZYTYWNE POZYTYWNE DOMKNI CIE ORAZ TRANZYTYWNE DOMKNI CIE (W KOLEJNOCI OD LEWEJ) [OP. WŁASNE] RYSUNEK 3.4. POCZTKI SLICE ÓW, KRACOWE POCZTKI, FRAGMENTY WYMAGAJCE I POZBAWIONE SYNCHRONIZACJI [OP. WŁASNE] RYSUNEK 3.5A PRZESTRZE ITERACJI P TLI WRAZ Z ZALENOCIAMI DLA PRZYKŁADU 3.1 [OP. WŁASNE] RYSUNEK 3.5B ZALENOCI DLA PRZYKŁADU 3.1 PO WYKONANIU ALGORYTMÓW 3.1 I 3.2 [OP. WŁASNE] RYSUNEK 3.6. ZALENOCI DLA P TLI Z PRZYKŁADU 3.2, GDZIE N=8 [OP. WŁASNE] RYSUNEK 3.7. PRZESTRZE ITERACJI P TLI DLA PRZYKŁADU 3.3, GDZIE N = 4 [OP. WŁASNE] RYSUNEK 3.8A KOLEJNO PRZEBIERANIA ELEMENTÓW ZBIORÓW S I S [OP. WŁASNE].. 63 RYSUNEK 3.8B KOD PRZEBIERAJCY NIEZALENE FRAGMENTY [OP. WŁASNE] RYSUNEK 3.9A ZALENOCI OPISANE PRZEZ RELACJE R 1, R 2, R 3, R 4, R 5, N=10 [OP. WŁASNE] iv

7 Spis rysunków RYSUNEK 3.9B ZALENOCI OPISANE PRZEZ RELACJE R 1, R 2, R 3, R 4, R 5 ', N=10 [OP. WŁASNE] RYSUNEK RODZAJE ZALENOCI W GRAFIE CRDG [OP. WŁASNE] RYSUNEK NIEZALENE FRAGMENTY DLA P TLI Z PRZYKŁADU 3.5, GDZIE N=5 I M=6 [OP. WŁASNE] RYSUNEK GRAF RDG DLA P TLI PO LEWEJ [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI K8 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI K8 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI K10 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI K10 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI K22 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI K22 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI BT_ERROR_2 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI BT_ERROR_2 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI P TLA BT_ERROR_2 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI FT_AUXFNCT_2 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI FT_AUXFNCT_2 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI FT_AUXFNCT_2 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI LU_HP_L2NORM_2 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI LU_HP_L2NORM_2 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI LU_HP_L2NORM_2 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI UA_ADAPT_1 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI UA_ADAPT_1 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI UA_ADAPT_1 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI UA_DIFFUSE_3 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI UA_DIFFUSE_3 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI UA_DIFFUSE_3 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI UA_PRECOND_4 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI UA_PRECOND_4 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI UA_PRECOND_4 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI UA_SETUP_16 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI UA_SETUP_16 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI UA_SETUP_16 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI UA_TRANSFER_11 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI UA_TRANSFER_11 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI UA_TRANSFER_11 [OP. WŁASNE] v

8 Spis rysunków RYSUNEK CZAS WYKONANIA P TLI _BT_RHS_1 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI _BT_RHS_1 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI _BT_RHS_1 [OP. WŁASNE] RYSUNEK CZAS WYKONANIA P TLI _SP_NINVR_1 [OP. WŁASNE] RYSUNEK PRZYPIESZENIE DLA P TLI _SP_NINVR_1 [OP. WŁASNE] RYSUNEK EFEKTYWNO DLA P TLI _SP_NINVR_1 [OP. WŁASNE] RYSUNEK 5.1. ZALENOCI DLA P TLI Z PRZYKŁADU 5.1 [OP. WŁASNE] RYSUNEK 5.2. ZREDUKOWANY ZBIÓR ZALENOCI DLA PRZYKŁADU 5.1 [OP. WŁASNE] 145 vi

9 Spis tabel Spis tabel TABELA 2.1. PODSTAWOWE OPERACJE NA RELACJACH I ZBIORACH W ARYTMETYCE PRESSBURGERA TABELA 2.2. ZESTAWIENIE TRANSFORMACJI DO UZYSKANIA OKRELONEJ ZIARNISTOCI KODU [1], [5] TABELA 2.3. PORÓWNANIE MODELI PROGRAMOWANIA RÓWNOLEGŁEGO TABELA 4.1. PRZYKŁAD REDUKCJI ZALENOCI ODWROTNYCH ORAZ PO WYJCIU TABELA 4.2. STATYSTYKI ILOCIOWE I PROCENTOWE DLA TESTU NPB TABELA 4.3. ZESTAWIENIE ILOCIOWE P TLI ORYGINALNYCH I ZMODYFIKOWANYCH TABELA WYNIKI DZIAŁANIA ALGORYTMÓW DLA P TLI ZE ZBIORU LIVERMORE TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI K TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI K TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI K TABELA 4.5. ZESTAWIANIE TYPÓW HARMONOGRAMOWANIA TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI BT_EROR_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI FT_AUXFNCT_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI LU_HP_L2NORM_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI UA_ADAPT_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI UA_DIFFUSE_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI UA_PRECOND_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI UA_SETUP_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI UA_TRANSFER_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI _BT_RHS_ TABELA POSTA SEKWENCYJNA I RÓWNOLEGŁA P TLI _SP_NINVR_ TABELA ZESTAWIENIE WYNIKÓW Z PRZEPROWADZONYCH BADA TABELA 5.1. MOLIWE TRANSFORMACJE W ZALENOCI OD TYPU PRZEKSZTAŁCE [60] TABELA A.1. CHARAKTERYSTYKA SYSTEMU SGI ALTRIX TABELA A.2. CHARAKTERYSTYKA SYSTEMU INTEL QUAD-CORE vii

10 Spis algorytmów Spis algorytmów ALGORYTM 3.1 REDUKCJA NADMIAROWYCH ZALENOCI ALGORYTM 3.2 REDUKCJA RELACJI O RÓWNOLEGŁYCH WEKTORACH DYSTANSU ALGORYTM 3.3 WYSZUKIWANIE POCZTKÓW DLA FRAGMENTÓW KODU ALGORYTM 3.4 WYZNACZANIE PODPRZESTRZENI ZAWIERAJCYCH NIEZALENE FRAGMENTY ALGORYTM 3.5. WYZNACZANIE ITERACJI NALECYCH DO NIEZALENYCH FRAGMENTÓW ORAZ GENERACJA KODU ALGORYTM 3.6. WYSZUKIWANIE POCZTKÓW NIEZALENYCH FRAGMENTÓW W GRAFIE ZREDUKOWANYCH RELACJI (CRDG) ALGORYTM 3.7. WYZNACZANIE ORAZ GENEROWANIE KODU DLA NIEZALENYCH FRAGMENTÓW DLA GRAFU CRDG ALGORYTM 3.8. WYZNACZANIE NIEZALENYCH FRAGMENTÓW KODU DLA P TLI O DOWOLNYM GRAFIE ZALENOCI ALGORYTM 3.9. WYSZUKIWANIE NIEZALENYCH FRAGMENTÓW KODU W GNIEDZIE P TLI viii

11 Spis symboli Spis symboli symbol oznacza porzdek leksykograficzny midzy dwoma instancjami instrukcji S 1 (I) i S 2 (J), taki, e wykonanie instancji instrukcji S 1 (I) poprzedza wykonanie instrukcji S 2 (J) symbol oznacza wystpienie zalenoci prostej (ang. data-flow dependence) midzy dwoma instancjami instrukcjami -1 0 symbol oznacza wystpienie antyzalenoci (ang. antidependence) midzy dwoma instancjami instrukcjami symbol oznacza wystpienie zalenoci po wyjciu (ang. output dependence) midzy dwoma instancjami instrukcjami ang. exist, kwantyfikator szczegółowy oznacza, e istnieje takie podstawienie zmiennej, e dane twierdzenie zachodzi ang. intersection, cz wspólna dwóch zbiorów lub relacji ang. difference, rónica dwóch zbiorów lub relacji ang. union, unia (suma) dwóch zbiorów lub relacji ang. inverse, zaprzeczenie relacji, nieprawda e... ang. all, kwantyfikator ogólny oznacza, e dane twierdzenie jest prawdziwe przy dowolnej wartoci zmiennej ix

12 Spis skrótów Słownik skrótów ATF ang. Affine Transformation Framework, zbiór przekształce afinicznych pozwalajcych na wykonanie wielu transformacji w sposób jenolity UMA ang. uniform memory access, architektura o jednolitym dostpie do pamici gloalnej NUMA ang. nonuniform memory Access, architektura o niejednolitym dostpie do pamici globalnej COMA ang. cache-only memory architecture, architektura w której pami globalna składa si z pamici podrcznych procesorów SMP ang. symetric multiprocessor, system wieloprocesorowy o architekturze typu UMA OpenMP ang. Open Multi-Processing, standard programowania równoległego oparty na dyrektywach preprocesora oraz funkcjach bibliotecznych RDG ang. reduced dependence graph, zredukowany graf zalenoci CRDG ang. connected reduced dependence graphs, połczony zredukowany graf zalenoci SCC ang. strongly connected component, cile połczony graf NPB ang. NAS Parallel Benchmarks, zbiór programów pozwalajcy na zbadanie wydajnoci systemów jedno- i wieloprocesorowych SPMD ang. Single Program Multiple Data, pojedynczy program wiele danych PCAM ang. partitioning, communication, agglomeration and mapping, proces projektowania algorytmów równoległych złoony z czterech etapów: podział, komunikacja, aglomeracja i mapowanie x

13 1 1. WSTP Niniejszy rozdział stanowi wprowadzenie do problematyki poruszanej w rozprawie doktorskiej. W podrozdziale 1.1 zaprezentowano skrócony opis stanu wiedzy w zakresie poruszanego tematu oraz prowadzonych bada. Przedstawiono uzasadnienie podjtego zagadnienia, luk poznawcz, w której zawiera si praca oraz dziedzin nauk, do jakiej praca została zakwalifikowana. W kolejnym punkcie zdefiniowano cel pracy wraz z tez badawcz pracy. Przedstawiono przesłanki przemawiajce za wybranym kierunkiem bada oraz korzyci wynikajce z tego wyboru. Dodatkowo opisano dane wejciowe i wyjciowe, zakres stosowalnoci, wykorzystane narzdzia oraz metodyk bada i sposób weryfikacji zaproponowanych algorytmów. Podrozdział 1.3 obejmuje struktur pracy wraz z krótk charakterystyk poszczególnych rozdziałów Stan problemu Nieustanny postp technologiczny w dziedzinie sprztu komputerowego oraz wysiłki ze strony twórców oprogramowania w zakresie przetwarzania równoległego skutkuj popularyzacj tej dziedziny w rodowiskach akademickich i biznesowych. Zapotrzebowanie na maszyny o duej mocy obliczeniowej nieustannie wzrasta. Tendencja ta ma charakter stały i w najbliszej przyszłoci bdzie ulega nasileniu. Programy dedykowane na maszyny wieloprocesorowe znaczco róni si od programów sekwencyjnych. Zagadnienia takie jak: zarzdzanie wtkami czy wyszukiwanie fragmentów kodu do zrównoleglenia nie nale do łatwych, dlatego te uytkownicy nieposiadajcy wiedzy z dziedziny przetwarzania równoległego i rozproszonego najczciej nie wykorzystuj w pełni mocy tkwicych w maszynach wieloprocesorowych. Tworzone przez nich programy niejednokrotnie zawieraj błdy

14 Wstp i s nieefektywne. W zwizku z powyszym dla przecitnego uytkownika bardziej naturalne i mniej skomplikowane wydaje si tworzenie rozwiza sekwencyjnych w przeciwiestwie do rozwiza równoległych. Przekształcanie programów sekwencyjnych na ich odpowiedniki równoległe powinno by w jak najwikszym stopniu zautomatyzowane np. przy pomocy dedykowanych kompilatorów wykorzystujcych odpowiednie techniki analizy i transformacji kodu sekwencyjnego na jego równoległy odpowiednik. Statystycznie najwicej czasu, jaki procesor potrzebuje do realizacji zadania zajmuje wykonanie instrukcji zawartych w ptlach programowych, w szczególnoci w ptlach składajcych si z wielu iteracji. Ze wzgldu na czas wykonania, transformacja tych obszarów programu moe przynie najwiksze korzyci. Przekształcenie ptli programowych do ich równoległej postaci naley poprzedzi analiz zalenoci, której zadaniem jest okrelenie, w jaki sposób iteracje bd instrukcje ptli zale od siebie w trakcie wykonania. Informacje uzyskane w wyniku przeprowadzonej analizy pozwalaj wyeliminowa zalenoci poprzez wykonanie jednej lub sekwencji odpowiednich transformacji. Kolejnym krokiem jest podział przestrzeni iteracji ptli na wiele procesorów (dla maszyn równoległych) lub wzłów (dla systemów rozproszonych). W zwizku ze złoonoci procesu analizy zalenoci wystpujcych w ptlach jak i generacji kodu, wydaje si niezbdnym stworzenie algorytmów umoliwiajcych automatyzacj procesu transformacji ptli sekwencyjnych na ptle równoległe. Zaproponowano wiele rozwiza umoliwiajcych wykonanie automatycznej transformacji ptli [7], [89], [90], [35], [27], [31], [32], [68], [67], [69], jednak adne z nich nie pozwala na wyszukanie pełnej równoległoci pozbawionej synchronizacji. Ponisza praca prezentuje autorskie algorytmy pozwalajce na uzyskanie niezalenych fragmentów kodu dla ptli programowych w sytuacji, kiedy inne techniki zawodz. Algorytmy te mog by równie zastosowane dla ptli dowolnie zagniedonych w przypadku, kiedy górna granica ptli podana jest jako parametr. Wyszukiwanie niezalenych fragmentów kodu pozwala na uzyskanie skalowanego rozwizania dla maszyn równoległych o rónej liczbie jednostek przetwarzajcych. Dodatkowo umoliwia osignicie wzrostu wydajnoci - dziki zwikszeniu lokalnoci danych (dla komputerów jednoprocesorowych) oraz redukcj wymaganej pamici, co w systemach mobilnych i osadzonych wie si ze zmniejszeniem zapotrzebowania na pobór prdu). Wyznaczenie niezalenych fragmentów kodu pozwala na zastosowanie dowolnej techniki zwikszajcej lokalno kodu np. blokowanie [1]. W takim przypadku wynik uzyskany w jednej iteracji musi by przechowywany w buforze do 2

15 Wstp czasu ostatniego uycia przez instrukcje z innej iteracji. Naley pamita jednoczenie, i rozmiar pamici niezbdnej do przechowania wyników uzyskanych i uywanych w rónych iteracjach okrelony jest iloci iteracji, przez które musi by przechowywany. Główna idea proponowanego rozwizania bazuje na podziale przestrzeni iteracji ptli [80]. Pocztkowo przestrze ptli dzielona jest na zbiór iteracji zalenych oraz niezalenych. Nastpnie zbiór zalenych iteracji przeszukiwany jest w celu uzyskania niezalenych fragmentów kodu. Uzyskane fragmenty przestrzeni iteracji mog by wykonane niezalenie bez koniecznoci synchronizacji pomidzy nimi. Prezentowane podejcie bazuje na dokładnej analizie zalenoci opisanych przy pomocy relacji i zbiorów krotek [58]. Zgodnie z powyszym opisem, proces tworzenia wydajnego oprogramowania jest czynnoci czasochłonn i skomplikowan, wymagajc od twórcy gruntownej wiedzy z dziedziny przetwarzania równoległego. Główne czynniki, na jakie naley zwróci uwag podczas tworzenia/projektowania programu równoległego to: architektura systemu, podział problemu na mniejsze zadania (dekompozycja / partycjonowanie) - dekompozycja domeny problemu, dekompozycja funkcjonalna, komunikacja synchroniczna oraz asynchroniczna, koszt komunikacji, opónienia oraz przepustowo, synchronizacja bariera, semafor, flaga, zalenoci danych zalenoci midzy danymi, relacje zalenoci, zarzdzanie obcieniem oblicze, ziarnisto podziału drobnoziarnisto, gruboziarnisto. W niniejszej pracy główny nacisk połoony został na podział przestrzeni iteracji ptli umoliwiajcy wyszukanie jak najwikszej liczby niezalenych fragmentów kodu. Podział taki bezporednio zwizany jest z ziarnistoci kodu, która okrela liczb oraz wielko zada, na jakie problem został podzielony. Pozwala to na uzyskanie zarówno drobnoziarnistoci jak i gruboziarnistoci poprzez zastosowanie aglomeracji (łczenie niezalenych ziaren w wiksze). Wiele istniejcych transformacji dedykowanych jest dla okrelonego typu ptli programowych np. transformacje unimodularne [7], [89], [90] - ptle idealnie zagniedone, czy te transformacje oparte na rekurencji Hamiltona (ang. Hamiltonian Recurrence) [35] - ptle o stałym wektorze dystansu. Przekształcenia oparte na mapowaniu przestrzeni iteracji przy pomocy transformacji afinicznych (ang. Affine Transformation Framework) uwaane s aktualnie za transformacje 3

16 Wstp najmocniejsze pozwalajce na wyznaczenie równoległoci pozbawionej synchronizacji [27], [31], [32], [68], [67], [69]. Jednake dla ptli niejednorodnych transformacje te nie umoliwiaj wyznaczenia harmonogramowania pozwalajcego na uzyskanie maksymalnej liczby niezalenych fragmentów kodu [27]. Celem prowadzonych bada było wypełnienie luki poznawczej, poprzez opracowanie algorytmów umoliwiajcych wyszukanie maksymalnej liczby niezalenych fragmentów kodu dla ptli dowolnie zagniedonych. Niniejsza praca ley w dziedzinie nauk technicznych i dotyczy dyscypliny informatyka. Problematyka w niej poruszana mieci si w zakresie przetwarzania równoległego, analizy zalenoci, transformacji ptli programowych oraz technik kompilacji. Wyniki uzyskane w ramach prowadzonych bada dotycz przekształce ptli programowych z wykorzystaniem analizy zalenoci. Wyniki zostały przedstawione w autorskich publikacjach w czasopismach i na konferencjach polskich [19], [17], [11], [18] oraz wiatowych [15], [14], [13], [10], [16], [12]. Stworzone algorytmy stanowi rozwinicie zagadnie zwizanych z automatycznym zrównolegleniem ptli sekwencyjnych dla kompilatorów ogólnego przeznaczenia Cel i teza badawcza pracy Aktualnie dostpne algorytmy umoliwiajce transformacje ptli programowych, pozwalaj na wyznaczenie równoległoci w ograniczonym stopniu i zakresie. Najczciej ograniczenia te dotycz struktury ptli, typu wystpujcych zalenoci jak równie poziomu, na jakim rozpatrywana jest równoległo. W odniesieniu do struktury ptli dziedzina problemu moe zosta zawona do: ptli idealnie zagniedonych, ptli nie zawierajcych instrukcji sterujcych lub ptli o stałym kroku. W drugim przypadku zawenie dziedziny problemu dotyczy typu wystpowania zalenoci, np. akceptowane s tylko zalenoci jednorodne (stały wektor dystansu) lub te zalenoci okrelonego typu (proste, odwrotne lub po-wyjciu). Ostatni typ ogranicze dotyczy składowej ptli, traktowanej jako cz niepodzielna (atomowa). Wiele rozwiza ogranicza si do transformacji ptli na poziomie pojedynczej iteracji - instrukcje (instancje instrukcji) nie s rozpatrywane osobno. Nałoenie jednego lub kombinacji powyszych ogranicze umoliwia zawenie problemu do wybranej klasy ptli, a tym samym upraszcza proces analizy i transformacji ptli. Według autora niniejszej pracy prawdziwym wyzwaniem jest opracowanie rozwizania pozwalajcego na transformacj ptli dowolnie 4

17 Wstp zagniedonych zarówno na poziomie iteracji jak i instrukcji przy jednoczesnej minimalizacji dodatkowych ogranicze. Takie podejcie bdzie pierwszym krokiem do opracowania efektywnego kompilatora ogólnego przeznaczenia, umoliwiajcego w automatyczny sposób transformacj kodu sekwencyjnego na jego równoległy odpowiednik. Celem niniejszej pracy jest opracowanie oraz weryfikacja algorytmów wyszukiwania drobno- i gruboziarnistej równoległoci w ptlach programowych z zalenociami afinicznymi. Badania prowadzone w ramach pracy słu do wykazania prawdziwoci nastpujcej tezy badawczej. Moliwe jest opracowanie algorytmów do automatycznego wyszukiwania drobno- i gruboziarnistej równoległoci w ptlach programowych o złoonoci pozwalajcej na ich zastosowanie w akademickich oraz przemysłowych kompilatorach optymalizujcych. W zakresie przetwarzania równoległego ziarnisto oblicze (ang. granularity) [86] wyznacza stosunek czasu oblicze do czasu potrzebnego na synchronizacj i komunikacj. W przypadku, gdy czas oblicze jest mniejszy od czasu zarzdzania wtkami (stosunek czasów jest mniejszy lub zbliony do 1) mówimy o drobnoziarnistej równoległoci (ang. fine-grained parallelism). Drobnoziarnisto, przy prawidłowym mapowaniu zada do poszczególnych procesorów, umoliwia maksymaln redukcj bezczynnoci jednostek przetwarzajcych oraz efektywne zarzdzanie obcieniem systemu wieloprocesorowego. Jednak koszt zarzdzania wieloma wtkami moe by zbyt duy i wpłyn na obnienie wydajnoci przetwarzania. W zwizku z tym podział kodu na drobne ziarna preferowany jest w systemach, w których koszt zarzdzania wtkami jest niewielki, a balansowanie obcieniem ma zasadnicze znaczenie dla wydajnoci całego systemu. Jeeli natomiast czas oblicze jest wikszy od czasu potrzebnego na zarzdzanie wtkami to mamy do czynienia z gruboziarnist równoległoci (ang. coarse-grained parallelism). Zalet takiego podziału jest moliwo zwikszenia wydajnoci algorytmu poprzez: redukcj czasu potrzebnego na synchronizacj i komunikacj, zwikszenie lokalnoci kodu oraz zmniejszenie zapotrzebowania na pami. Ze wzgldu na due czasy przestojów i rón wielko ziaren główn niedogodnoci jest trudno w balansowaniu obcieniem na poszczególnych jednostkach przetwarzajcych. Gruboziarnisty podział preferowany jest w systemach, w których koszt komunikacji midzy jednostkami przetwarzajcymi jest znaczny (np. systemy rozproszone). 5

18 Wstp Do głównych korzyci wynikajcych z opracowania algorytmów automatycznego wyznaczania drobno- i gruboziarnistej równoległoci mona zaliczy: zwikszenie skalowalnoci kodu, minimalizacja kosztów zwizanych z zarzdzaniem wtkami, zmniejszenie zapotrzebowania na pami niezbdn do rozwizania okrelonego problemu, redukcja kosztów i błdów zwizanych z rczn transformacj kodu sekwencyjnego na równoległy odpowiednik. Za podjciem zagadnienia bdcego tematem niniejszej pracy przemawiaj przesłanki naukowe i ekonomiczne. Biorc pod uwag przesłanki naukowe wanym wydaje si udzielenie odpowiedzi na pytanie, jaka jest maksymalna liczba niezalenych fragmentów kodu dostpna w zadanej ptli programowej. Niezaleny fragment kodu jest to zbiór instrukcji powizanych ze sob poprzez odwołania do wspólnych danych, a jednoczenie nieposiadajcy zalenoci miedzy innymi fragmentami kodu. Kady z takich fragmentów (zwany niezalenym wtkiem) moe zosta wykonany niezalenie od innych fragmentów na oddzielnych jednostkach przetwarzajcych. Równoczenie zaleno poszczególnych instrukcji w pojedynczym fragmencie, pozwala na zwikszenie lokalnoci kodu. Kada kolejna instrukcja bazuje na wyniku instrukcji poprzedzajcej. Zachowujc kolejno wykonywania instrukcji moliwe jest zapisanie biecego wyniku w szybkiej pamici podrcznej procesora, na potrzeby kolejnych oblicze. Wpływa to na redukcj czasu wykonania programu. Uzupełniajc przesłanki naukowe o aspekt ekonomiczny daje si zauway fakt, i automatyzacja procesu transformacji kodu sekwencyjnego na odpowiednik równoległy pozwala na zmniejszenie kosztów oraz redukcj błdów ludzkich zwizanych z rcznym przekształcaniem kodu. Minimalizujc udział uytkownika w procesie zrównoleglenia kodu przyczyniamy si do wzrostu popularnoci i wykorzystana systemów wieloprocesorowych w rozwizaniach komercyjnych, umoliwiajc tym, samym skorzystanie z maszyn i rodowisk wieloprocesorowych szerszemu gronu uytkowników. Ze wzgldu na moliwo transformacji ptli dowolnie zagniedonych, opracowane algorytmy maj szeroki zakres stosowalnoci. Zaproponowane przekształcenia ptli znajduj swoje zastosowanie w procesie transformacji dowolnych programów naukowych jak równie komercyjnych. W zalenoci od uzyskanej ziarnistoci, wygenerowany kod moe zosta z powodzeniem wykonany na maszynach wieloprocesorowych rónego typu (systemy rozproszone lub systemy ze wspólna pamici wykorzystujce w swojej architekturze procesory jedno i wielordzeniowe). Algorytmy dedykowane dla ptli idealnie zagniedonych pozwalaj na wyznaczenie kodu o wikszym ziarnie w stosunku do algorytmów dla ptli dowolnie 6

19 Wstp zagniedonych. Rónica ziarnistoci uzyskiwanego kodu w zalenoci od zastosowanego algorytmu wynika głównie z tego, i algorytmy analizuj ptl na poziomie iteracji, natomiast w algorytmach analiza prowadzona jest na poziomie pojedynczych instrukcji. Dane wejciowe algorytmów wyszukiwania drobno i gruboziarnistej równoległoci stanowi kod ródłowy zapisany w jzyku Petit. W celu umoliwienie konwersji ptli programowych zapisanych w jzyku Fortran wykorzystany został translator Fortran-to- Petit. Wyjciem algorytmów, po uprzednim wykryciu i redukcji zalenoci oraz wyznaczeniu zbiorów zawierajcych niezalene iteracji/instancji instrukcji, jest kod ródłowy reprezentujcy równoległo. Po wybraniu docelowego rodowiska (OpenMP, Posix Threads, MPI, PVM) moe zosta przekształcony do odpowiedniej postaci. Do wyznaczenia zalenoci wykorzystano narzdzie Petit [57]. Modyfikacje na relacjach (wyjcie programu Petit) oraz generacj kodu przeprowadzono przy pomocy pakietu Omega Calculator [59]. Powysze narzdzie stanowi integraln cz projektu Omega opracowanego na Uniwersytecie Maryland (University of Maryland). Badania przeprowadzone były na maszynie wieloprocesorowej z pamici dzielon SGI Altix 3700 (Poznaskie Centrum Superkomputerowo-Sieciowe) [46], przy wykorzystaniu kompilatora C++ firmy Intel w wersji 9.0 [52], [53]. Kod równoległy zapisany został zgodnie ze standardem programowania OpenMP [75]. Zaproponowane algorytmy zweryfikowano pod wzgldem poprawnoci i jakoci uzyskiwanych wyników. Uzyskane wyniki dla wersji wielowtkowych (ilo wtków: 2, 4, 8, 16; górne granice ptli: 64, 128, 256, 512) porównano z wersja sekwencyjn, co pozwoliło na ustalenie poprawnoci oraz okrelenie jakoci uzyskanych wyników (przyspieszenie, efektywno). Ilo operacji wykonanych w pojedynczym tecie wahała si od 64 iteracji (dla niezagniedonej ptli) do iteracji (dla ptli poczwórnie zagniedonej) dla kadej instrukcji ptli Struktura pracy Praca podzielona została na sze rozdziałów. Zawarto merytoryczna kadego z nich opisana została poniej. Pierwszy rozdział stanowi wprowadzenie do tematyki pracy. Przedstawiono w nim uzasadnienie wyboru tematu, tło omawianych zagadnie, cel, tez badawcz oraz struktur pracy. 7

20 Wstp W rozdziale 2 przedstawiono zagadnienia z dziedziny przetwarzania równoległego i rozproszonego. Omówione zostały najbardziej popularne architektury systemów równoległych wraz ze rodowiskami programistycznymi umoliwiajcymi tworzenie na nich oprogramowania równoległego. Wyjaniono podstawowe pojcia zwizane z analiz zalenoci, przedstawiono wskaniki wykorzystywane do okrelania jakoci kodu jak i samej architektury systemów równoległych. Kolejny rozdział zawiera opis zaproponowanych algorytmów wraz z przykładami obrazujcymi ich działanie. Algorytmy te podzielono na dwie kategorie w zalenoci od typu ptli. Dodatkowo kady zbiór algorytmów poprzedzono niezbdn wiedz umoliwiajc zrozumienie zaproponowanego rozwizania. W rozdziale 4 zaprezentowano badania eksperymentalne przeprowadzone przy pomocy autorskiego narzdzia, opracowanego na potrzeby bada zgodnie z zaproponowanymi algorytmami opisanymi w poprzednim rozdziale. Rozdział koczy podsumowanie wraz z wnioskami wynikajcymi z pracy. Rozdział 5 zawiera prezentacj pokrewnych prac dotyczcych tematyki poruszanej w niniejszej dysertacji. Dodatkowo w rozdziale tym przedstawiono przykład ptli, dla której transformacje afiniczne (jedne z mocniejszych transformacji) zawodz, natomiast zaproponowane algorytmy powalaj na uzyskanie niezalenych fragmentów kodu, gotowych do zrównoleglenia. Ostatni rozdział zawiera wnioski kocowe dotyczce realizacji podjtych w pracy zagadnie. 8

21 2 2. PRZETWARZANIE RÓWNOLEGŁE PRZEGLD ZAGADNIENIA Nieustanny wzrost iloci danych koniecznych do przetworzenia wie si nierozerwalnie z cigłym wzrostem zapotrzebowania na moc obliczeniow systemów informatycznych. Moce obliczeniowe pojedynczej jednostki przetwarzajcej w wielu dziedzinach nauki, przemysłu, jak równie w codziennym yciu, stały si niewystarczajce. Jednym z bardziej popularnych rozwiza problemu braku mocy obliczeniowej jest udostpnienie uytkownikowi systemów posiadajcych wicej ni jedn jednostk przetwarzajc. Architektury takich systemów mog róni si od siebie w sposób zasadniczy, co skutkuje odmiennym podejciem do modelu programowania. Podstawow rónic pomidzy programami dedykowanymi na maszyny wieloprocesorowe, a programami sekwencyjnymi stanowi liczba wtków odpowiedzialna za rozwizanie okrelonego problemu. W programach sekwencyjnych obliczenia realizowane s przez pojedynczy wtek, natomiast w programach dedykowanych na maszyny równoległe problem rozwizywany jest przez wiele wtków mapowanych na wicej ni jedn jednostk przetwarzajc. Podział problemu na mniejsze zadania, przydzielane do niezalenych wtków, wie si z koniecznoci uwzgldnienia wielu dodatkowych czynników takich jak: docelowa architektura, ziarnistoci kodu, zalenoci midzy danymi, mapowanie danych. W niniejszym rozdziale przedstawiona została architektura maszyn równoległych oraz modele programowania dedykowane dla poszczególnych architektur. Dodatkowo omówione zostały podstawowe pojcia dotyczce reprezentacji i analizy zalenoci,

22 Przetwarzanie równoległe przegld zagadnienia opisano przykładowe transformacje oraz przedstawiono wskaniki wykorzystywane w systemach wieloprocesorowych (przypieszenie, efektywno, itp.) Architektura maszyn równoległych Zgodnie z klasyfikacja zaproponowan przez Flynna w 1966 r., róne architektury komputerów moemy sklasyfikowa ze wzgldu na rodzaj strumienia informacji. Strumienie informacji wpływajce do procesora to: rozkazy oraz dane. Strumie rozkazów zdefiniowany jest, jako sekwencja instrukcji wykonywanych przez jednostk przetwarzajc. Strumie danych zdefiniowany jest, jako przepływ danych wystpujcy midzy jednostk przetwarzajc a pamici. Zgodnie z klasyfikacj Flynna obydwa strumienie mog by pojedyncze lub wielorakie. Na podstawie powyszego wyrónia si cztery rozdzielne kategorie architektur komputerów [29]: - pojedyncze rozkazy pojedyncze dane (ang. single-instruction single-date streams - SISD) - pojedyncze rozkazy wiele danych (ang. single-instruction multiple-date - SIMD) - wiele rozkazów pojedyncze dane (ang. multiple-instruction single-data - MISD) - wiele rozkazów wiele danych (ang. multiple-instruction multiple-data - MIMD) Konwencjonalne jednoprocesorowe komputery von Neumanna sklasyfikowane s jako systemy SISD. Komputery równoległe sklasyfikowane s jako maszyny typu SIMD lub MIMD. W przypadku, gdy istnieje jedna jednostka zarzdzajca i wszystkie procesory wykonuj ten sam rozkaz w sposób zsynchronizowany, maszyna sklasyfikowana jest jako SIMD. W przypadku równoległej maszyny typu MIMD, kady z procesorów zawiera własn jednostk sterujc i moe wykonywa róne instrukcje na rónych danych. W architekturze MISD, ten sam strumie danych przepływa przez procesory wykonujce róne strumienie rozkazów. W praktyce nie istnieje maszyna spełniajca załoenie kategorii MISD. W modelu SIMD komputer równoległy składa si z dwóch głównych czci: z komputera zarzdzajcego (najczciej komputer w rozumieniu maszyny von Neumanna) oraz ze zbioru synchronizowanych jednostek przetwarzajcych, mogcych wykonywa te same operacje na rónych danych (rys. 2.1). Kady z procesorów posiada niewielk ilo pamici, w której rozproszone dane s przechowywane w trakcie przetwarzania równoległego. Procesory połczone s do szyny pamici komputera zarzdzajcego. W zwizku z tym komputer zarzdzajcy ma dostp do pamici lokalnej kadego procesora. Aplikacje wykonywane s sekwencyjnie przez komputer zarzdzajcy, przy jednoczesnym wysyłaniu komend do zbioru procesorów w 10

23 Przetwarzanie równoległe przegld zagadnienia celu wykonania instrukcji SIMD w sposób równoległy. W architekturze SIMD, równoległo uzyskiwana jest poprzez wykonywanie identycznych instrukcji na duym zbiorze danych. Von Neumann komputer zbiór procesorów Rysunek 2.1. Architektura komputera równoległego typu SIMD [29] Wyrónia si dwie główne konfiguracje maszyn równoległych typu SIMD. Na rys. 2.2a kady procesor posiada własn pami lokaln. Procesory mog komunikowa si ze sob poprzez sie połcze. Jeli sie połcze uniemoliwia uzyskanie bezporedniego połczenia midzy dwoma procesorami, para procesorów moe wymieni dane poprzez procesor poredniczcy. Na rys. 2.2b procesory i moduły pamici komunikuj si midzy sob poprzez sie połcze. Dwa procesory przesyłaj midzy sob dane poprzez moduły pamici. W architekturze typu MIMD system równoległy zbudowany jest z wielu procesorów i wielu modułów połczonych ze sob poprzez sie połcze. W modelu tym wyrónia si dwie podstawowe architektury: z pamici dzielon lub z pamici rozproszon (przesyłaniem komunikatów). W architekturze z pamici dzielon procesory wymieniaj si informacjami poprzez centraln pami dzielon. W systemach z pamici rozproszon procesory komunikuj si midzy sob za porednictwem sieci połcze poprzez system przesyłania komunikatów. Preferowany model ziarnistoci zaley głównie od sposobu komunikacji midzy poszczególnymi jednostki przetwarzajcymi. Dla systemów z pamici rozproszon, zarówno typu SIMD jak i MIMD, ze wzgldu na koszt komunikacji midzy procesorami, preferowana jest gruboziarnista równoległo. W przypadku architektury z pamici dzielon, gdzie koszt dostpu do dowolnej komórki pamici jest stały dla dowolnego procesora, opłacalne jest zastosowanie zarówno grubo- jak i drobnoziarnistej równoległoci. 11

24 Przetwarzanie równoległe przegld zagadnienia Jednostka sterujca P1 P2 P3 Pn-1 Pn M1 M2 M3 Mn-1 Mn Sie połcze a) kady procesor zawiera własn pami Jednostka sterujca P1 P2 P3 Pn-1 Pn Sie połcze M1 M2 M3 Mn-1 Mn b) procesory uzyskuj dostp do pamici poprzez sie połcze Rysunek 2.2. Architektura maszyn równoległych typu SIMD [29] Systemy z pamici współdzielon W systemach równoległych z pamici dzielon komunikacja midzy poszczególnymi zadaniami, wykonywanymi na rónych procesorach, odbywa si poprzez operacj odczytu i zapisu do wspólnej globalnej pamici [28], [62]. Systemy z pamici dzielon zbudowane s ze zbioru niezalenych procesorów, zbioru modułów pamici oraz sieci połcze (patrz rys. 2.3). Ze wzgldu na sposób dostpu procesorów do globalnej pamici, systemy z pamici dzielon dzielimy na trzy główne kategorie: UMA (ang. uniform memory access), NUMA (ang. nonuniform memory access), COMA (ang. cache-only memory architecture). 12

25 Przetwarzanie równoległe przegld zagadnienia Pami Sie połcze P P P P Rysunek 2.3. Schemat budowy systemów wieloprocesorowych z pamici dzielon[29] W architekturze UMA dostp do pamici dzielonej przez kady z procesorów odbywa si poprzez sie połcze w taki sam sposób jak dostp do pamici poprzez pojedynczy procesor. Ze wzgldu na to, i czas dostpu do kadej komórki pamici jest taki sam dla wszystkich procesorów, system taki nazywany jest równie symetrycznym multiprocesorem SMP (ang. symetric multiprocessor). Budowa typowego systemu o architekturze SMP przedstawiony został na rys Załadowanie instrukcji oraz danych do pamici podrcznej cache (C) umoliwia zredukowanie obcienia szyny łczcej pami z procesorami. W sprzyjajcych warunkach wykorzystanie sieci połcze bdzie bliskie zeru, jeli moliwe jest przechowanie wszystkich instrukcji oraz danych niezbdnych do wykonania oblicze w pamici podrcznej procesorów. Nieco odmienne podejcie do pamici globalnej zastosowano w systemach NUMA (patrz rys. 2.5), kady z procesorów posiada cz pamici globalnej. Podobnie jak w architekturze UMA, adresacja pamici odbywa si w tej same przestrzeni adresowej [63]. Kady z procesorów moe odwoła si do dowolnej komórki pamici przy uyciu rzeczywistego adresu. Jednake czas dostpu, w przeciwiestwie do architektury UMA, zaleny jest od odległoci midzy pamici a procesorem. W zwizku z powyszym czas odwołania si do dowolnej komórki pamici nie jest stały pomimo zachowania jednolitej przestrzeni adresowej. W architekturze COMA, podobnie do architektury NUMA, kady procesor posiada pewn cz pamici dzielonej (patrz rys. 2.6). Jednake w tym przypadku pami dzielona składa si jedynie z pamici podrcznej kadego procesora. Pami systemu nie jest zorganizowana w sposób hierarchiczny, przestrze adresowa obejmuje wszystkie dostpne moduły pamici cache w systemie. W architekturze COMA wystpuje równie słownik (na rys. 2.6 oznaczony jako D - ang. cache directory) 13

26 Przetwarzanie równoległe przegld zagadnienia poredniczcy midzy odwołaniami do fragmentów pamici znajdujcych si przy innych jednostkach obliczeniowych [29]. Pami globalna Sie połcze Sie połcze P P P P C C C C C C C C CPU CPU CPU CPU CPU CPU CPU CPU Rysunek 2.4. Architektura UMA [29] Rysunek 2.5. Architektura NUMA [29] Sie połcze D D D D C C C C CPU CPU CPU CPU Rysunek 2.6. Architektura COMA [29] W systemach z pamici dzielon, ze wzgldu na sposób dostpu do dowolnej komórki pamici przez jednostki przetwarzajce, moliwe jest zastosowanie zarówno drobno- jak i gruboziarnistej równoległoci. Jednake w architekturze UMA, gdzie czas dostpu do pamici dla dowolnego procesora jest stały, zastosowanie drobnoziarnistej równoległoci bdzie bardziej efektywne ni w architekturach NUMA lub COMA. Z drugiej strony, jeli wszystkie potrzebne instrukcje oraz dane nie przekrocz wielkoci pamici P dla systemu NUMA (rys. 2.5) to zastosowanie gruboziarnistej równoległoci przyniesie wiksze korzyci ni dla architektury UMA. W takim przypadku moliwe jest zredukowanie wykorzystania sieci połcze do niezbdnego minimum, przy jednoczesnej maksymalizacji wykorzystania pamici P. W architekturze NUMA zwikszenie wykorzystania pamici P przez procesor bezporednio z ni połczony (rys. 2.5) pozwala w znacznym stopniu zredukowa czas oczekiwania procesora na niezbdne dane. 14

27 Przetwarzanie równoległe przegld zagadnienia Systemy z pamici rozproszon Systemy z pamici rozproszon, w odrónieniu od systemów z pamici dzielon, nie posiadaj pamici globalnej. Systemy te, zwane inaczej systemami z przekazywaniem komunikatów, tworz klas multiprocesorów, gdzie poszczególne wzły obliczeniowe maj bezporedni dostp jedynie do pamici umiejscowionej na danej jednostce przetwarzajcej [29], [62]. W zwizku z tym niezbdne jest przenoszenie danych midzy pamici jednostki X, a pamici jednostki Y. Komunikacja jak i przesyłanie danych w systemie odbywa si zazwyczaj przez par instrukcji wylij (ang. send) i odbierz (ang. receive), które musz by umieszczone wewntrz aplikacji przez programist. Rysunek 2.7 przedstawia schemat systemu z przesyłaniem komunikatów. Sie połcze P P P P M M M M Rysunek 2.7. Budowa systemu z pamici rozproszon [29] System rozproszony moe składa si z dowolnej liczby wzłów, gdzie kady z nich zawiera przynajmniej jeden procesor (P) oraz pami (M) z dostpem w obrbie lokalnej przestrzeni adresowej. Procesory komunikuj si midzy sob poprzez sie połcze zazwyczaj jest to sie statyczna. W systemach z pamici rozproszon konieczne jest uwzgldnienie dwóch podstawowych wskaników: przepustowo łczy (ang. link bandwidth) oraz opónienie sieci (ang. network latency). Przepustowo łczy zdefiniowana jest jako liczba bitów jak mona wysła w jednostce czasu (np. bit/sek), natomiast opónienie sieci jest to czas potrzebny na przesłanie pełnego komunikatu. W systemach z przesyłaniem komunikatów, ze wzgldu na stosunkowo duy koszt komunikacji midzy poszczególnymi wzłami, preferowana jest gruboziarnista równoległo. Jeli wzły obliczeniowe posiadaj wicej ni jedn jednostk przetwarzajc np. budowa zgodna z architektur UMA lub NUMA, moliwe jest zastosowanie drobnoziarnistej równoległoci w obrbie pojedynczego wzła. Systemy 15

28 Przetwarzanie równoległe przegld zagadnienia z przesyłaniem komunikatów, w których pojedyncze wzły zbudowane s z systemów z pamici dzielon nazywane s systemami równoległymi hybrydowymi. Opracowane algorytmy pozwalaj na wyznaczenie drobno- lub gruboziarnistej równoległoci (ziarnisto opisana została dokładniej w rozdziale 2.3.1) w zalenoci od typu ptli oraz rodzaju zalenoci w niej wystpujcych. W zwizku z tym, moliwe jest wykonanie uzyskanego kodu na kadej z przytoczonych wczeniej architektur, w zalenoci od wielkoci uzyskanego ziarna. W trakcie wykonania kodu drobnoziarnistego stosunkowo czsto konieczna jest synchronizacja pomidzy wtkami pracujcymi nad rozwizaniem jednego problemu. Dua czstotliwo komunikacji midzy zadaniami powoduje, i efektywne wykonanie kodu moliwe jest w architekturze o niskich kosztach komunikacji midzy procesorami np. systemy z pamici dzielon. Gruboziarnisto, w odrónieniu od drobnoziarnistoci, pozwala na zminimalizowanie komunikacji midzy procesorami, gdy komunikacja midzy stosunkowo duymi ziarnami (fragmentami) kodu odbywa si rzadziej. Kod reprezentujcy gruboziarnisto dedykowany jest w szczególnoci dla systemów rozproszonych, gdzie koszt komunikacji midzy jednostkami przetwarzajcymi jest stosunkowo duy. Moliwe jest równie efektywne wykonanie kodu o duym ziarnie na systemach z pamici dzielon, jednak w tym przypadku skalowalno takich systemów moe zosta niewykorzystana. Naley równie podkreli, i ziarnisto kodu jest pojciem wzgldnym zalenym w duym stopniu od architektury (szersze wyjanienie tego zagadnienia w rozdziale 2.3.1) Zalenoci: reprezentacja i wykrywanie Ustalenie, w jaki sposób jedna instrukcja zaley od drugiej, jest jednym z waniejszych zada podczas wyznaczania poziomu równoległoci kodu jak i jego sposobu zrównoleglenia. W celu wyznaczenia równoległoci na poziomie instrukcji niezbdne jest okrelenie, które instrukcje mog zosta wykonane w sposób równoległy. Jeeli dwie instrukcje s zalene od siebie to wykonanie ich musi przebiega w sposób sekwencyjny, zgodnie z porzdkiem leksykograficznym. W przypadku braku zalenoci mog one zosta wykonane równolegle niezalenie od siebie. Kluczowym zadaniem w obu sytuacjach jest ustalenie czy istniej oraz jakiego rodzaju s to zalenoci [41]. W poniszym rozdziale przedstawione zostały rodzaje zalenoci, wraz z omówieniem warunków, w jakich dana zaleno zachodzi. W podrozdziale

29 Przetwarzanie równoległe przegld zagadnienia przedstawiono rozszerzenie definicji zalenoci midzy pojedynczymi instrukcjami na definicj zalenoci midzy instrukcjami wystpujcymi w ptli. W podrozdziale przedstawiono sposób reprezentacji zalenoci wykorzystany w niniejszej dysertacji do opisu algorytmów i przeprowadzonych bada eksperymentalnych Rodzaje zalenoci Bezporednie zrównoleglenie wybranego fragmentu kodu, moliwe jest w przypadku braku zalenoci midzy poszczególnymi instrukcjami. W przypadku wystpowania zalenoci konieczne jest zastosowanie odpowiednich transformacji (opisanych w dalszej czci pracy, podrozdziały oraz 4.1) pozwalajcych na eliminacj zalenoci lub przekształcenie kodu do postaci równoległej nienaruszajcej wykrytych zalenoci. Ze wzgldu na rodzaj wystpujcych zalenoci wyróniamy dwa typy ogranicze uniemoliwiajcych bezporednie zrównoleglenie fragmentu kodu. Pierwsze ograniczenie odnosi si do przepływu sterowania i okrelane jest zalenoci sterowania (ang. control dependence). Poniszy pseudokod przedstawia przykład zalenoci sterowania: S 1 : IF (T 0.0) GOTO S3 S 2 : A = A / T S 3 : CONTINUE Instrukcja S 2 nie moe zosta wykona przed instrukcj S 1, gdy S 2 jest warunkowo zalena od S 1. Wykonanie instrukcji S 2, jako pierwszej moe spowodowa błd dzielenia przez zero, niemoliwy do wystpienia w oryginalnej wersji programu [1]. Zaleno sterowania [71] wystpuje midzy instrukcj S i opisujc warunkowy skok do instrukcji S j (S i S j ) jeli skok w instrukcji S i kontroluje wykonanie instrukcji S j. Drugie ograniczenie odnosi si do prawidłowej kolejnoci pobierania i modyfikowania danych. Zaleno wystpujca zgodnie z tym ograniczeniem nosi nazw zalenoci danych (ang. data dependence) [1]. Poniszy pseudokod przedstawia przykład zalenoci danych: S 1 : PI = 3.14 S 2 : R = 5.0 S 3 : AREA = PI * R 2 Instrukcja S 3 musi zosta wykonana jako ostatnia. Wykonanie instrukcji S 3 przed instrukcjami S 1 lub S 2 moe prowadzi do uzyskania nieprawidłowych wyników, gdy instrukcja S 3 wykorzystuje wartoci zmiennych PI i R modyfikowanych w instrukcjach 17

30 Przetwarzanie równoległe przegld zagadnienia S 1 i S 2, odpowiednio. Instrukcje S1 i S2 mog zosta wykonane współbienie wzgldem siebie, gdy nie wystpuj midzy nimi zalenoci danych. Midzy instrukcjami S1 i S2 wystpuje zaleno danych (instrukcja S2 zaley od instrukcji S1) wtedy i tylko wtedy, gdy [1]: obydwie instrukcje odwołuj si do tej samej komórki pamici i przynajmniej jedno z odwoła jest zapisem do pamici, istnieje cieka odwoła do tej samej komórki pamici od instrukcji S1 do instrukcji S2 w trakcie wykonania. W obrbie zalenoci danych istniej trzy podstawowe typy zalenoci [1], [71]: Prosta - zwana równie zalenoci przepływu danych (ang. Data Flow Dependence), wystpuje midzy instrukcjami S1 i S2 (), gdy instrukcja S2 odczytuje dane zapisane w instrukcji S1. S1 : X =... S2 :... = X Zaleno przepływu danych wskazuje tzw. kolejno zapis-przed-odczytem (ang. write-before-read), która musi by spełniona [71]. Sposób oznaczenia zalenoci prostej przyjto zgodnie za R.Allen, K.Kennedy [1]: S1 S2 (odczyt w S2 zaley od zapisu w S1). Odwrotna - zwana równie antyzalenoci (ang. antidependence), wystpuje midzy instrukcjami S1 i S2 (), gdzie instrukcja S1 odczytuje dane z miejsca, które zapisywane jest w instrukcji S2. S1 :... = X S2 : X =... Antyzaleno wyznacza tzw. kolejno odczyt-przed-zapisem (ang. readbefore-write), która nie powinna by naruszona w trakcie wykonywania równoległych oblicze [71]. Sposób oznaczenia zalenoci odwrotnej przyjto zgodnie za R.Allen, K.Kennedy [1]: S1-1 S2. Po wyjciu (ang. output dependence) wystpuje miedzy instrukcjami S1 i S2 (), gdy instrukcje S1 i S2 zapisuj do tego samego miejsca. S1 : X =... S2 : X =... Zaleno po wyjciu wskazuje tzw. kolejno zapis-przed-zapisem (ang. write-before-write), która nie powinna by naruszona w trakcie wykonywania 18

31 Przetwarzanie równoległe przegld zagadnienia oblicze równoległych [71]. Sposób oznaczenia zalenoci po wyjciu przyjto za R.Allen, K.Kennedy [1]: S1 0 S2. Ze wzgldu na wystpowanie powyszych zalenoci, w wielu przypadkach niemoliwe jest wykonanie kodu w sposób równoległy bez uprzedniej analizy, a nastpnie redukcji zalenoci. Moliwe jest wyeliminowanie zalenoci odwrotnych oraz po wyjciu przy zastosowaniu odpowiednich technik opisanych w wielu istniejcych ju pracach np. [1], [71] Zalenoci w ptlach Wykrywanie zalenoci w ptlach programowych wymaga rozszerzenia koncepcji zalenoci przedstawionych w podrozdziale Do wyrae, dla których wyznaczane s zalenoci konieczne jest dodanie dokładnych informacji o iteracji, w której dane wyraenie wystpuje. Informacje o konkretnej iteracji zawarte s w wektorze iteracji (definicja w dalszej czci rozdziału). Ptla idealnie zagniedona (ang. perfectly nested loops) jest to ptla n krotnie zagniedona (n > 0), której wszystkie instrukcje znajduj si w ciele ptli najbardziej zagniedonej. Jeli nie wszystkie instrukcje tworz ciało najbardziej wewntrznej ptli to ptl nazywamy nieidealnie zagniedon (ang. non-perfectly nested loops). Poniszy pseudokod przedstawia struktur dwóch opisywanych typów ptli. DO i = 1, M DO i = 1, M DO j = 1, N Instrukcja 1 Instrukcja 1 DO j = 1, N Instrukcja 2 Instrukcja 2 ENDDO ENDDO ENDDO ENDDO Ptla idealnie zagniedona Ptla nieidealnie zagniedona Dla dowolnej ptli, w której indeks ptli I przechodzi z indeksu L do U zgodnie z krokiem S, numer iteracji i, wybranej iteracji, jest równa wartoci (I-L+S) / S, gdzie I jest wartoci indeksu dla tej iteracji [1]. Dla gniazda n ptli, wektor iteracji I dla najbardziej wewntrznej ptli jest wektorem liczb całkowitych zawierajcym numery iteracji dla kadej ptli zgodnie z kolejnoci zagniedenia ptli. Innymi słowy, wektor zalenoci postaci I = {i 1, i 2,..., i n }, gdzie i k, 1 k n, reprezentuje numer iteracji ptli dla poziomu zagniedenia k [1]. 19

32 Przetwarzanie równoległe przegld zagadnienia Zgodnie z powyszym, sparametryzowane wyraenie okrelone poprzez wektor iteracji, oznacza instancj wyraenia wykonanego przy zmiennych indeksowych przyjmujcych wartoci wektora iteracji. Przykładowo dla poniszej ptli: DO I = 1, 2 DO J = 1, 2 S ENDDO ENDDO wyraenie S[(2,1)] oznacza instancj wyraenia S wykonywan dla zmiennej indeksowej I = 2 (druga iteracja pierwszej ptli) oraz J = 1 (pierwsza iteracja drugiej ptli). Zbiór wszystkich wektorów iteracji dla wyrae ptli okrela przestrze iteracji. Przestrze iteracji dla wyraenia S w powyszej ptli przedstawiona została jako nastpujcy zbiór kolejnych iteracji: [(1,1), (1,2), (2,1), (2,2)]. Na podstawie wystpujcych zalenoci opisanych w rozdziale oraz powyszych definicji moliwe jest okrelenie zalenoci wystpujcych wewntrz ptli. Miedzy wyraeniami S 1 a S 2 dla wspólnego gniazda ptli wystpuje zaleno wtedy i tylko wtedy, gdy istniej dwa wektory iteracji I oraz J dla danego gniazda takie, e [1]: i < j lub i = j oraz istnieje cieka od instrukcji S 1 do S 2 w ciele ptli, wyraenia S 1, S 2 odwołuj si do lokalizacji M w iteracji i oraz j, przynajmniej jedno z tych odwoła jest zapisem. Zakładajc istnienie zalenoci midzy instrukcj S 1 oraz S 2 dla iteracji i oraz j, wektor zalenoci zdefiniowany jest jako wektor o długoci n, taki e d(i,j) k = j k i k. Instrukcje S 1 i S 2 mog odwoływa si do tej samej lokalizacji w obrbie pojedynczej iteracji ptli, jak równie w obrbie dwóch rónych iteracjach ptli. W pierwszym przypadku mamy do czynienia z zalenoci niezalen od ptli, w drugim przypadku z zalenoci przenoszon ptl. Zaleno przenoszona ptl (ang. loop-carried dependence) wystpuje midzy wyraeniami ptli S 2 i S 1 wtedy i tylko wtedy gdy wyraenie S 1 odwołuje si do lokalizacji M dla iteracji i oraz wyraenie S 2 odwołuje si do tej samej lokalizacji dla iteracji j oraz wektor dystansu d(i,j) jest leksykograficznie wikszy od zera (>0). Zaleno niezalena od ptli (ang. loop-independent dependence) wystpuje midzy wyraeniami ptli S 2 i S 1 wtedy i tylko wtedy, gdy wyraenie S 1 odwołuje si do lokalizacji M w iteracji i, wyraenie S2 odwołuje si do lokalizacji M w iteracji j, iteracja i jest równa iteracji j (i = j) oraz istnieje cieka od instrukcji S 1 do instrukcji S 2 wewntrz pojedynczej iteracji. 20

Systemy rozproszone Marcin Gorawski Rafał Malczok

Systemy rozproszone Marcin Gorawski Rafał Malczok POLITECHNIKI LSKA INSTYTUT INFORMATYKI Laboratorium Hurtowni Danych Systemy rozproszone Marcin Gorawski Rafał Malczok Gliwice 2004 Spis treci 2 Spis treci 1. Wstp... 4 2. Wprowadzenie... 6 2.1. Idea hurtowni

Bardziej szczegółowo

Programowanie obrabiarek CNC na przykładzie układu sterowania Sinumerik 810D/840D

Programowanie obrabiarek CNC na przykładzie układu sterowania Sinumerik 810D/840D Grzegorz Nikiel Akademia Techniczno-Humanistyczna w Bielsku-Białej Katedra Technologii Maszyn i Automatyzacji Programowanie obrabiarek CNC na przykładzie układu sterowania Sinumerik 810D/840D Bielsko-Biała

Bardziej szczegółowo

Tomasz Grbski. Sieci komputerowe

Tomasz Grbski. Sieci komputerowe Tomasz Grbski Sieci komputerowe Kranik 2002 Sieci komputerowe 2 Od Autora: Przedstawiony przeze mnie referat stanowi ródło wiedzy dotyczcej zagadnie zwizanych z sieciami komputerowymi. Moim zamierzeniem

Bardziej szczegółowo

Zastosowanie sieci Bayesa w wykrywaniu ataków DoS

Zastosowanie sieci Bayesa w wykrywaniu ataków DoS Zastosowanie sieci Bayesa w wykrywaniu ataków DoS Marcin urakowski, Przemysław Kazienko Zakład Systemów Informacyjnych, Wydział Informatyki i Zarzdzania, Politechnika Wrocławska mzurakowski@esolution.pl,

Bardziej szczegółowo

Praca semestralna. Podstawy systemów operacyjnych

Praca semestralna. Podstawy systemów operacyjnych 1 Spis treci Praca semestralna Podstawy systemów operacyjnych 1. Wprowadzenie 1. Architektura współczesnych komputerów - maszyna von Neumanna 2. Definicja systemu operacyjnego 3. Struktura systemu operacyjnego

Bardziej szczegółowo

Agenda zaj. dr in. Andrzej Sobczak. Informacje analogowe vs dyskretne

Agenda zaj. dr in. Andrzej Sobczak. Informacje analogowe vs dyskretne Katedra Informatyki Gospodarczej Szkoła Główna Handlowa dr in. Andrzej Sobczak W prezentacji wykorzystano fragmenty materiałów: E. Richter-Was, Teoretyczne Podstawy Informatyki J. Florek, Systemy Komputerowe

Bardziej szczegółowo

Aplikacje na urzdzenia mobilne typu smartphone

Aplikacje na urzdzenia mobilne typu smartphone Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Marcin Przekop Nr albumu: 214757 Aplikacje na urzdzenia mobilne typu smartphone Praca magisterska na kierunku INFORMATYKA Praca wykonana

Bardziej szczegółowo

ZASTOSOWANIE TECHNOLOGII INFORMATYCZNYCH W ZARZDZANIU WIEDZ Pod redakcj C. Orłowskiego, Z. Kowalczuka, E. Szczerbickiego, 2009 STRESZCZENIA

ZASTOSOWANIE TECHNOLOGII INFORMATYCZNYCH W ZARZDZANIU WIEDZ Pod redakcj C. Orłowskiego, Z. Kowalczuka, E. Szczerbickiego, 2009 STRESZCZENIA ZASTOSOWANIE TECHNOLOGII INFORMATYCZNYCH W ZARZDZANIU WIEDZ Pod redakcj C. Orłowskiego, Z. Kowalczuka, E. Szczerbickiego, 2009 PWNT Gdask STRESZCZENIA Rozdział 1. Ekonomiczne aspekty zastosowania metod

Bardziej szczegółowo

Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym

Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym Uniwersytet Warszawski Wydziaª Matematyki, Informatyki i Mechaniki Jakub Matusz Nr albumu: 201071 Optymalizacja zapyta«w ±rodowisku rozproszonym w modelu semistrukturalnym Praca magisterska na kierunku

Bardziej szczegółowo

Zastosowanie dostpu do Internetu w telefonii komórkowej

Zastosowanie dostpu do Internetu w telefonii komórkowej PASTWOWA WYSZA SZKOŁA ZAWODOWA im. ks. Bronisława Markiewicza w JAROSŁAWIU KIERUNEK: INFORMATYKA SPECJALNO: INFORMATYKA STOSOWANA Dzienne studia inynierskie Łukasz Emanuel Tatys Nr albumu 12935 Zastosowanie

Bardziej szczegółowo

BIULETYN INSTYTUTU SYSTEMÓW INFORMATYCZNYCH

BIULETYN INSTYTUTU SYSTEMÓW INFORMATYCZNYCH WOJSKOWA AKADEMIA TECHNICZNA BIULETYN INSTYTUTU SYSTEMÓW INFORMATYCZNYCH WARSZAWA NR 4/2009 BIULETYN INSTYTUTU SYSTEMÓW INFORMATYCZNYCH WYDZIA CYBERNETYKI WOJSKOWA AKADEMIA TECHNICZNA ISSN 1508-4183 00-908

Bardziej szczegółowo

Politechnika Szczeci«ska Wydziaª Informatyki. Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie

Politechnika Szczeci«ska Wydziaª Informatyki. Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie Politechnika Szczeci«ska Wydziaª Informatyki Marcin Radziewicz Opracowanie algorytmów przekªadu zda«w j zyku VHDL opisuj cych logik kombinacyjn na równania boolowskie Rozprawa doktorska Promotor: prof.

Bardziej szczegółowo

Politechnika Wrocławska. Modelowanie procesów biznesowych w ramach technologii SOA

Politechnika Wrocławska. Modelowanie procesów biznesowych w ramach technologii SOA Politechnika Wrocławska Studia podyplomowe dla kadr zarzdzajcych i pracowników przedsibiorstw Zarzdzanie projektami Praca dyplomowa: Modelowanie procesów biznesowych w ramach technologii SOA Wykorzystanie

Bardziej szczegółowo

przedsibiorstw i instytucji, s take obecne w milionach mieszka. Wykorzystywane s przy tym wszystkie moliwe sposoby przenoszenia informacji

przedsibiorstw i instytucji, s take obecne w milionach mieszka. Wykorzystywane s przy tym wszystkie moliwe sposoby przenoszenia informacji Rozdział 1 Czym jest Internet? Co mona w nim znale? Skd si wził? Jaki jest dzisiaj? Jak moe wyglda w przyszłoci? Internet w Polsce Budowa Internetu Jzyk Internetu, czyli protokół TCP/IP Czym s i jak rol

Bardziej szczegółowo

Zaawansowana inynieria oprogramowania. Zarzdzanie Ryzykiem

Zaawansowana inynieria oprogramowania. Zarzdzanie Ryzykiem Zarzdzanie Ryzykiem Witam Pastwa serdecznie na kolejnym wykładzie z cyklu Zaawansowana inynieria oprogramowania. Zarzdzanie ryzykiem wie si bezporednio z problematyk zarzdzania przedsiwziciami, a w szczególnoci,

Bardziej szczegółowo

Raport Kocowy. Zamawiajcy: Ministerstwo Gospodarki i Pracy. ECORYS Polska. Radosław Piontek, Agnieszka Kowalczyk, Iwona Burakowska

Raport Kocowy. Zamawiajcy: Ministerstwo Gospodarki i Pracy. ECORYS Polska. Radosław Piontek, Agnieszka Kowalczyk, Iwona Burakowska Ocena uzupełniajca Problemy i bariery w postpie realizacji Sektorowego Programu Operacyjnego Wzrost konkurencyjnoci przedsibiorstw, lata 2004-2006 w ocenie Ostatecznych Odbiorców Programu Projekt współfinansowany

Bardziej szczegółowo

Koncepcje budowy bezpiecznych sieci bezprzewodowych dla rodowisk przemysłowych

Koncepcje budowy bezpiecznych sieci bezprzewodowych dla rodowisk przemysłowych Koncepcje budowy bezpiecznych sieci bezprzewodowych dla rodowisk przemysłowych Rafał Cichocki rafi@am.gdynia.pl Akademia Morska w Gdyni 1. Wstp Sieci bezprzewodowe posiadaj niezaprzeczalne zalety zwizane

Bardziej szczegółowo

Planowanie złoonego wdroenia systemu IT

Planowanie złoonego wdroenia systemu IT BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR 31, 2011 Planowanie złoonego wdroenia systemu IT Łukasz LASZKO, Andrzej STASIAK Instytut Teleinformatyki i Automatyki WAT, ul. Gen. S. Kaliskiego 2, 00-908 Warszawa

Bardziej szczegółowo

Rozwój sektora e-usług na wiecie

Rozwój sektora e-usług na wiecie Rozwój sektora e-usług na wiecie Autorzy: Sebastian Komorowski Michał Koralewski Artur Komider Marcin Kraska Janusz Langer Karol Nowaczyk Jacek Pucher Korekta: Agnieszka Domagała Wydawca: Polska Agencja

Bardziej szczegółowo

INFORMATYCZNE SYSTEMY ZARZDZANIA EKSPLOATACJ OBIEKTÓW TECHNICZNYCH

INFORMATYCZNE SYSTEMY ZARZDZANIA EKSPLOATACJ OBIEKTÓW TECHNICZNYCH UNIWERSYTET WARMISKO MAZURSKI W OLSZTYNIE AKADEMIA TECHNICZNO ROLNICZA W BYDGOSZCZY NIZISKI Stanisław ÓŁTOWSKI Bogdan INFORMATYCZNE SYSTEMY ZARZDZANIA EKSPLOATACJ OBIEKTÓW TECHNICZNYCH OLSZTYN BYDGOSZCZ

Bardziej szczegółowo

WSPÓŁCZESNE NARZDZIA PROGRAMISTYCZNE NA USŁUGACH FOTOGRAMETRII I SIP

WSPÓŁCZESNE NARZDZIA PROGRAMISTYCZNE NA USŁUGACH FOTOGRAMETRII I SIP Artur Janowski Jakub Szulwic WSPÓŁCZESNE NARZDZIA PROGRAMISTYCZNE NA USŁUGACH FOTOGRAMETRII I SIP Streszczenie. Autorzy prezentuj własne dowiadczenia i wyniki bada prowadzone nad wykorzystaniem współczesnych

Bardziej szczegółowo

Budowa słownika frekwencyjnego na bazie polskojzycznych stron internetowych

Budowa słownika frekwencyjnego na bazie polskojzycznych stron internetowych Katedra Automatyki Akademii Górniczo - Hutniczej Praca Dyplomowa Budowa słownika frekwencyjnego na bazie polskojzycznych stron internetowych Bartosz Zarzyczny pod kierunkiem: dr Adriana Horzyka Kraków,

Bardziej szczegółowo

Producent: MikEL s.c., 44-217 Rybnik, skr. poczt. 28 tel/voice (32)42-22-108, tel/fax (32)42-42-449, email mikel@mikel.com.pl

Producent: MikEL s.c., 44-217 Rybnik, skr. poczt. 28 tel/voice (32)42-22-108, tel/fax (32)42-42-449, email mikel@mikel.com.pl Systemy taryfikacji rozmów dla elektronicznych central telefonicznych. Produkcja urzdze elektronicznych do przetwarzania informacji. Usługi projektowe z zakresu elektroniki. Producent: MikEL s.c., 44-217

Bardziej szczegółowo

RELACJE MIĘDZY STRATEGIĄ A STRUKTURĄORGANIZACYJNĄ W PRZEDSIĘBIORSTWACH SEKTORA WYSOKICH TECHNOLOGII

RELACJE MIĘDZY STRATEGIĄ A STRUKTURĄORGANIZACYJNĄ W PRZEDSIĘBIORSTWACH SEKTORA WYSOKICH TECHNOLOGII Politechnika Łódzka ZESZYTY NAUKOWE Nr 1095 AGNIESZKAZAKRZEWSKA-BIELAWSKA RELACJE MIĘDZY STRATEGIĄ A STRUKTURĄORGANIZACYJNĄ W PRZEDSIĘBIORSTWACH SEKTORA WYSOKICH TECHNOLOGII ŁÓDŹ 2011 ZESZYTY NAUKOWE POLITECHNIKI

Bardziej szczegółowo

Podstawy sterowania silnikami krokowymi

Podstawy sterowania silnikami krokowymi Podstawy sterowania silnikami krokowymi 1. WSTP Nowoczesne technologie w rónych gałziach narzucaj coraz wysze wymagania na urzdzenia wchodzce w skład linii technologicznych. Wymagania jakie si stawia przed

Bardziej szczegółowo

Łukasz Szkup. Implementacja abstrakcyjnego modelu oblicze - - Maszyny RAM

Łukasz Szkup. Implementacja abstrakcyjnego modelu oblicze - - Maszyny RAM Uniwersytet Wrocławski Wydział Matematyki i Informatyki Instytut Informatyki Wrocław, 2006 Łukasz Szkup Implementacja abstrakcyjnego modelu oblicze - - Maszyny RAM (Implementation of Abstract Computation

Bardziej szczegółowo

Sieciowe systemy operacyjne Active Directory

Sieciowe systemy operacyjne Active Directory Sieciowe systemy operacyjne Active Directory 2 1. Systemy sieciowe Banyan Firma Banyan, producent sztandarowego systemu VINES, twierdziła zawsze, e jej sieci s przejrzyste dla ich uytkownika. System VINES

Bardziej szczegółowo

Open Access Library Volume 1 (7) 2012

Open Access Library Volume 1 (7) 2012 Open Access Library Volume 1 (7) 2012 4. Oryginalne metody i narzdzia analityczne skadajce si na metodologi komputerowo zintegrowanego prognozowania rozwoju inynierii powierzchni materiaów Opisana w rozdziale

Bardziej szczegółowo

imart Informatyczna platforma dla handlu i dystrybucji OPIS PLATFORMY I JEJ STANDARDOWYCH MODUŁÓW

imart Informatyczna platforma dla handlu i dystrybucji OPIS PLATFORMY I JEJ STANDARDOWYCH MODUŁÓW imart Informatyczna platforma dla handlu i dystrybucji OPIS PLATFORMY I JEJ STANDARDOWYCH MODUŁÓW www.frontier.pl 2005 Spis treci 1. Ogólna charakterystyka platformy informatycznej imart... 3 1.1. Modele

Bardziej szczegółowo