METODY OPTYMALIZACJI KODU WYNIKOWEGO UWZGLĘDNIAJĄC KRYTERIUM CZASU WYKONYWANIA OBLICZEŃ, ZA POMOCĄ KOMPILATORA I TECHNIK PROGRAMISTYCZNYCH.

Wielkość: px
Rozpocząć pokaz od strony:

Download "METODY OPTYMALIZACJI KODU WYNIKOWEGO UWZGLĘDNIAJĄC KRYTERIUM CZASU WYKONYWANIA OBLICZEŃ, ZA POMOCĄ KOMPILATORA I TECHNIK PROGRAMISTYCZNYCH."

Transkrypt

1 POZNAŃSKIE CENTRUM SUPERKOMPUTEROWO SIECIOWE METODY OPTYMALIZACJI KODU WYNIKOWEGO UWZGLĘDNIAJĄC KRYTERIUM CZASU WYKONYWANIA OBLICZEŃ, ZA POMOCĄ KOMPILATORA I TECHNIK PROGRAMISTYCZNYCH. Wykorzystanie przełączników kompilatora GCC i ICC, wielowątkowości, MPI oraz OpenMP. Autor: Arkadiusz Mądrawski Prowadzący: dr inż. Marcin Lawenda Data: Miejsce: Poznań. Niniejsza praca dotyczy wykorzystywania technik programistycznych i dostępnych narzędzi do optymalizacji kodu w kryterium czasu wykonywania kompilatu. W pracy porównane zostały dwa kompilatory: GCC oraz ICC z dostępnymi przełącznikami optymalizacyjnymi. Porównano również techniki programistyczne takie jak: wielowątkowość, MPI oraz OpenMP. Wykazano zależności czasowe czasu wykonywania obliczeń od zastosowanych technik i narzędzi, dla wybranych eksperymentów.

2 1 WPROWADZENIE 4 2 ZASADY EFEKTYWNEGO PROGRAMOWANIA WSTĘP OBLICZANIE STAŁYCH DOPASOWANIE TYPÓW DO WARTOŚCI WYRZUCANIE NIEZMIENNIKÓW PĘTLI POZA CIAŁO UPRASZCZANIE WYRAŻEŃ LOGICZNYCH I ALGEBRAICZNYCH ŁĄCZENIE INSTRUKCJI ŁĄCZENIE PĘTLI PĘTLA O MALEJĄCYM ITERATORZE OPERACJE NA SZYBSZYCH OPERANDACH SPŁASZCZANIE PĘTLI ELIMINACJA ZBĘDNYCH WYRAŻEŃ WYKONANE OBLICZENIA SPRAWDZANIE WARUNKÓW ZWIĘKSZENIE SKOKU PĘTLI PRZEKAZYWANIE DUŻYCH DANYCH KONSTRUKCJA WZAJEMNEGO WYKLUCZANIA WARTOŚCI LENIWE PODSUMOWANIE ZASAD EFEKTYWNEGO PROGRAMOWANIA 13 3 PRZEŁĄCZNIKI WYBRANYCH KOMPILATORÓW KOMPILATOR GCC PRZEŁĄCZNIKI TYPU O[X] FLAGI OPTYMALIZACYJNE OBLICZENIOWE FLAGI OPTYMALIZACYJNE ARCHITEKTURALNE KOMPILATORA ICC PRZEŁĄCZNIKI TYPU O[X] FLAGI OPTYMALIZACYJNE OBLICZENIOWE FLAGI OPTYMALIZACYJNE ARCHITEKTURALNE 16 4 WIELOWĄTKOWOŚĆ PROGRAMÓW 17 5 OPENMP WSTĘP DO OPENMP PRAGMY W OPENMP PRAGMA PARALEL PRAGMA FOR KLAUZULA ORDERED KLAUZULA SCHEDULE 19 1 S trona

3 5.2.5 KONSTRUKCJA BARIER KONSTRUKCJA MASTER KONSTRUKCJA CRITICAL KONSTRUKCJA ATOMIC DYREKTYWA FLUSH 21 6 MPI WSTĘP DO MPI OPTYMALNA KOMUNIKACJA W MPI ANALIZA KOMUNIKACJI W MPI NA PODSTAWIE PROGRAMU VAMPIR ANALIZA PRZEPROWADZONEGO TESTU 25 7 EKSPERYMENTY TEST PRZEZNACZONY DLA KOMPILATORÓW GCC I ICC TEST PRZEZNACZONY DLA WIELOWĄTKOWOŚCI TEST PRZEZNACZONY DLA OPENMP TEST PRZEZNACZONY DLA MPI 31 8 ŚRODOWISKO EKSPERYMENTÓW MASZYNA NO MASZYNA NO WYNIKI TESTÓW PRZY UŻYCIU KOMPILATORÓW GCC I ICC PRZEŁĄCZNIKI PODSTAWOWE KOMPILATORÓW EKSPERYMENT PIERWSZY EKSPERYMENT DRUGI FLAGI ROZSZERZAJĄCE KOMPILATORÓW EKSPERYMENT PIERWSZY SZYBKOŚĆ VS. JAKOŚĆ PODSUMOWANIE PORÓWNANIA KOMPILATORÓW WYNIKI TESTÓW PRZY UŻYCIU WIELOWĄTKOWOŚCI OPTYMALNE ZARZĄDZANIE WĄTKAMI W EKSPERYMENCIE EKSPERYMENT PIERWSZY EKSPERYMENT DRUGI PODSUMOWANIE PROGRAMU WIELOWĄTKOWEGO PORÓWNANIE PROGRAMU WIELOWĄTKOWEGO I SEKWENCYJNEGO 55 2 S trona

4 11 WYNIKI TESTÓW PRZY UŻYCIU OPENMP ORAZ MPI OPENMP ZARZĄDZANIE PRAGMAMI EKSPERYMENT PIERWSZY EKSPERYMENT DRUGI SZYBKOŚĆ ZA JAKOŚĆ PODSUMOWANIE MPI EKSPERYMENT PIERWSZY MPI+OPENMP PODSUMOWANIE WNIOSKI SPIS 75 BIBLIOGRAFIA 75 RYSUNKÓW 75 RÓWNAŃ 75 SPIS TABEL 76 WYKRESÓW 76 FIGURE 78 3 S trona

5 1 Wprowadzenie W systemie, w którym program musi wykonać szereg obliczeń numerycznych, obok poprawności wyników, istotnym elementem jest czas pozyskania wyników. Uzyskanie większej szybkości wykonywania obliczeń, co za tym idzie, szybszego przetwarzania danych, odgrywa kluczowe znaczenie w miejscu, gdzie danych do obróbki jest dużo. Takimi danymi zazwyczaj są przekazy wizyjne. Mogą być one dynamiczne lub quasi-statyczne. Obróbka takiej liczby danych zazwyczaj zajmuje więcej czasu niż ich pozyskanie. Polepszenie szybkości działania programu, przy zachowaniu jego zgodności, co do poprawności wyznaczanych danych, jest pożądanym efektem. Również, gdy danych do przetworzenia jest niewiele, lecz na danych tych trzeba wykonać czasochłonne obliczenia numeryczne. Jest kilka możliwości, które pozwalają zwiększyć szybkość działania programu. Są to metody, począwszy od zastosowania odpowiedniego kompilatora i jego przełączników. Takie postępowanie nie wymusza pisania kodu programu od początku, czy też jakąkolwiek zmianę strukturalną kodu wykonaną przez programistę. Następne metody polegają na zmianie struktury kodu, w celu wykorzystania największej ilość mocy obliczeniowej, która może być wykorzystana przez pracujący program. Takimi technikami są np. wątki, OpenMP oraz MPI. Postępowanie optymalizacyjne zależy głównie od tego, co ma wykonywać program. Generalnie, optymalizację rozpoczyna się od programisty, który odpowiada na pytanie: Czy zmieniając tą linię kodu uzyskam szybsze wyniki działania małym nakładem sił na zmianę linii kodu?. Te pytanie odnosi się do podstawowych zasad programistycznych, których główną ideą jest: nie wykonuj obliczeń niepotrzebnie. Następnie, gdy programista stwierdził, że nie ma sobie nic do zarzucenia, można spróbować wykonać optymalizację wykorzystując podstawowe narzędzia, jakimi są kompilatory języka. Kompilatory, prócz tego, iż przetwarzają język zrozumiały dla człowieka, na język zrozumiały dla maszyny, posiadają gamę przełączników, lub też flag, które można ustawić podczas kompilacji programu. Flagi te mają za zadanie optymalizować kod w kategoriach: czas wykonywania obliczeń lub wielkość zajmowanego miejsca. Typy flag określa się, jako: ogólną optymalizację lub też na specyficzną technikę obliczeń. W pracy tej wybrano dwa kompilatory: GCC oraz ICC, wraz z kilkoma przykładowymi przełącznikami, celem pokazania, jak posługiwać się przełącznikami, aby kompilat być wydajniejszy w czasowym kryterium. Kroki powyższe posiadają niezwykła zaletę. Nie trzeba dużo manipulować przy kodzie, aby osiągnąć lepsze wyniki w wybranym kryterium. Jednak posiadają wadę, iż przy tych technikach nie uzyska się maksymalnego efektu. Efekt taki, można uzyskać, wtedy, gdy wykorzysta się całą dostępną moc obliczeniową. Jednak takie podejście, wymaga zazwyczaj pisania kodu od podstaw, z użyciem zaawansowanych technika przetwarzania danych. Taki technikami mogą być programy wielowątkowe, wielordzeniowe, rozproszone, czyli podpadające pod zasadę: im więcej mocy mogę wykorzystać, tym lepiej. Warto podkreślić, iż wybór odpowiedniego podejścia optymalizacyjnego, zależy głównie od chęci zmiany, możliwych nakładów przeznaczonymi na wykonanie optymalizacji oraz rzeczywistym zyskiem czasowym. Dlatego nie trzeba wykorzystywać wszystkich tych technik i zwyczajów. Można spróbować dowolnej gałęzi optymalizacyjnej, dopasowanej do swoich potrzeb. W celu pokazania, jakie przyspieszenia czasowe można osiągnąć wykonano po dwa eksperymenty dla każdego zestawu przełączników kompilatorów, oraz zmiany struktury kodu z sekwencyjnego na wydajniejsze, kolejno: wielkowątkowe, OpenMP oraz MPI. Przeprowadzone eksperymenty to: 4 S trona

6 1. Mnożenie dwóch macierzy kwadratowych o elementach całkowitoliczbowych. 2. Mnożenie dwóch macierzy kwadratowych o elementach zmiennoprzecinkowych. Warto zaznaczyć, że poniższa analiza nie musi mieć charakteru globalnego. Wartości poszczególnych przyspieszeń mogą zależeć od maszyny a przede wszystkim od umiejętności algorytmicznych i numerycznych programisty. 5 S trona

7 2 Zasady Efektywnego Programowania 2.1 Wstęp Zasady przedstawione w tym rozdziale mają na celu przyspieszenie wykonywania kody wynikowego, zaczynając od poprawy techniki programowania autora kodu. Zasady te zostały wybrane według reguły: kilka z wielu. Pozwalają one na efektywniejsze zagospodarowanie jednostki obliczeniowej oraz przyszykowanie kodu do lepszej optymalizacji w przyszłości. Warto zaznaczyć, że korzystanie z poniższych zasad nie przyspieszy znacząco działania programu na liczbę instrukcji optymalizowanych. Jednak optymalizacja przez te zasady może przynieść znaczący skutek, gdy operacji wykonywanych w miejscach newralgicznych, jest dużo, czyli gdy liczba iteracji jest znacząca dla miejsca optymalizacji. Poniższe zasady zostały wybrane i opisane bez technologii know-how, więc nie trzeba posiadać wiedzy informatycznej, aby jest stosować i zrozumieć. W celu polepszenia swojej techniki programowania warto zajrzeć do dodatkowej literatury, opisującej głębsze relacje między kodem pisanym a wynikowym. 2.2 Obliczanie stałych Obliczenie wartości wyrażenia, gdy jest ono długie, warto wykonać osobno i wpisać do zmiennej gotowy wynik. Nieoptymalnie: long x = 12*72+13* *( ) + 735* * *76532; Optymalnie: //12*72+13* *( )+735* *765-43*76532 long x = 55219; 2.3 Dopasowanie typów do wartości Jeżeli wiadomo, jakie wartość będą przyjmowane przez określone zmienne, warto dopasować określony typ do rozpatrywanej zmiennej tak, aby dopasowanie było jak najlepsze, w kryterium wykorzystania wszystkich liczb z zakresu typu do zakresu wartości zmiennej. Mamy kilka liczb: 17;-73;[-500,200];[0,100]; ; -9.23; Nieoptymalnie: int x1=17; int x2=-73; int x3a=-500; int x4a=0; int x5 = ; double x6 = -9.23; Optymalnie: unsigned char x1=17; signed char x2=-73; //char x2=-73 signed short x3a = -500; //short x3a = -500 // for(x3a=-500;x3a<200;x3a++) unsigned char x4a=0; // for(x4a=0;x4a<100;x4a++) signed int x5 = ; //int x5 = signed float x6 = -9.23; //float x6 = S trona

8 2.4 Wyrzucanie niezmienników pętli poza ciało Przy wykonywaniu instrukcji w pętli, warto zastanowić się, czy niektóre zmienne są stałe względem tej pętli. Jeżeli jakaś zmienna jest stała względem tej pętli, to można ją wyrzucić poza ciało pętli. Wtedy program wykona mniej przypisań, więc wykonanie będzie szybsze. Nieoptymalnie: int tab[1000]; for(int i=0;i<1000;i++) { int s=5*8+9-(3+12*5-7*127)-111*3-541; //można również wyliczyć wartość. tab[i]=s; } Optymalnie: unsigned short tab[1000]; //dopasowanie zakresu do wartości unsigned char s=1; //wyliczona wartość oraz dopasowanie zakresu do wartości for(unsigned short i=0; i<1000; i++) tab[i]=s; 2.5 Upraszczanie wyrażeń logicznych i algebraicznych Często warunki, które zamieszczane są w programie są warunkami prostymi, jednoargumentowymi. Zdarzą się niekiedy, że sprawdzany warunek jest w bardzo rozbudowanej formie. Warto wtedy zastosować upraszczanie wyrażeń arytmetycznych i logicznych, korzystając z praw logiki, algebry. Nieoptymalnie: /*przykład 1*/ float licz(int x) { return ((5*8+9-(3+12*5-7*127)-111*3-539)*x+2*5+2-(7+9*4-8*183)-215*6-121)/(3*x+11); } /*przykład 2*/ bool test(bool spr1, bool spr2, bool spr3) { if((spr1 AND (spr2 OR spr3)) OR spr1 OR (spr2 AND (spr1 OR spr3)) AND (spr3 OR (spr1 AND spr2)) OR spr2 OR spr3) return true; else return false; } Optymalnie: /*przykład 1*/ float licz(int x) { return 1+11/(3*x+11); } /*przykład 2*/ 7 S trona

9 bool test(bool spr1, bool spr2, bool spr3) { if(spr1 OR spr2 OR spr3) return true; else return false; } 2.6 Łączenie instrukcji Gdy kolejne instrukcje wykonują podobne operacje, może je połączyć w jedną. Nieoptymalnie: int tab[10]; int x=10; for(int i=0;i<10;i++) { x=x+10; x=x-i; x=3*x+5; x=x+i; x=2*x+9; tab[i]=x; } Optymalnie: int tab[10]; int x=10; for(int i=0;i<10;i++) tab[i]=-4*i+6*x+79; 2.7 Łączenie pętli Jeżeli pętle posiadają ten sam warunek iteracyjny, można je połączyć w jedną pętle. Niekiedy można połączyć kilka pętli, które nie posiadają tego samego warunku iteracyjnego. Nieoptymalnie: /*przykład 1*/ int tab1[100]; int tab2[100]; int tab3[100]; int s=10; int w=11; for(int i=0;i<100;i++) tab1[i]=1; for(int j=0;j<100;j++) tab2[j]=tab1[j]+j+w; //tab2[j]=1+j+w; for(int k=0;k<100;k++) tab3[k]=k+s; /*przykład 2*/ int tab1[100]; int tab2[200]; 8 S trona

10 int tab3[50]; int s=10; int w=11; for(int i=0;i<100;i++) tab1[i]=1; for(int j=0;j<200;j++) tab2[j]=3*j+w; for(int k=0;k<50;k++) tab3[k]=k+s; Optymalnie: /*przykład 1*/ int tab1[100]; int tab2[100]; int tab3[100]; int s=10; int w=11; for(int i=0;i<100;i++) { tab1[i]=1; tab2[j]=tab1[j]+j+w; //tab2[j]=1+j+w; tab3[k]=k+s; } /*przykład 2*/ int tab1[100]; int tab2[200]; int tab3[50]; int s=10; int w=11; for(int i=0;i<200;i++) { if(i<50) { } tab1[i]=1; tab3[i]=i+s; else if(i<100) tab1[i]=1; // zawsze wykonaj przypisanie dla tab2 } tab2[i]=3*i+w; 2.8 Pętla o malejącym iteratorze Można stosować iterator i++ (++i) lub również i--(--i). Iterator drugi jest szybszy, bowiem warunek sprawdzający komputer wykonuje w jednym rozkazie (i>0) a nie w dwóch (i- 100>0). Nieoptymalnie: 9 S trona

11 for(int i=0;i<100;i++) tab[i]=3; Optymalnie: for(int i=100;i>0;i--) tab[i]=3; 2.9 Operacje na szybszych operandach Maszynie trudniej jest wykonać potęgowanie niż mnożenie czy dzielenie. Szybciej radzi sobie z dodawaniem i odejmowaniem. Jednak najszybciej wykonuje przesuniecie bitowe. Zamiast mnożyć/dzielić dwie liczby, można wykorzystać z przesunięcia bitowego i dodawania. Nieoptymalnie: long licz(int podaj) { } Optymalnie: return podaj*199; long licz(int podaj) { } return (podaj<<0) + (podaj<<1) + (podaj<<2) + (podaj<<6) + (podaj<<7); 2.10 Spłaszczanie pętli Zastępowanie kilku zagnieżdżonych pętli w jedną dłuższą. Nieoptymalnie: int tab[100][100]; for(int i=0;i<100;i++) for(int j=0;j<100;j++) tab[i][j]=i+j; Optymalnie: unsigned char tab[10000]; //bo 100*100 unsigned short it=0; unsigned char w=0; unsigned char k=0; for(it=0;it<10000;it++) { } if(w==100) {w=0; k++;} tab[it]=w+k; w++; 2.11 Eliminacja zbędnych wyrażeń Pomijanie instrukcji, dla których ich wynik będzie miał taką samą wartość. Zazwyczaj są to instrukcje pisane przez programistę w celu odszukania błędu w programie i kontrolowaniu poszczególnych wartości na każdym etapie algorytmu. Niekiedy jednak takie instrukcje nie są pisane w określonym celu, jakim jest np. szukanie błędu. Czasami programista pisze dwie 10 S trona

12 funkcje, które mają właściwie takie same ciała i dają identyczne wyniki. Zdarza się czasami, iż używa ich naprzemiennie. Warto wtedy pozostać przy jednej Wykonane obliczenia Najlepiej widać to w rozwinięciach w szereg Taylora. Załóżmy, że trzeba policzyć kolejne wyrazy dla skończonego rozwinięcia, w zwiniętym szeregu: Ideą takiego postępowania jest, iż jeżeli obliczona została potęgę dla x^7 to aby obliczyć x^9 nie trzeba ponownie obliczyć dla x^7. Więc, aby przyspieszyć obliczenia odszukano zależność między i-tym oraz (i+1)-szym wyrazem i skorzystano z tej zależności. Warto zwrócić uwagę, iż w takim podejściu można zredukować liczbę funkcji dodatkowych potrzebnych do obliczeń. Niekiedy zredukowane funkcje są czasochłonne. Nieoptymalnie: double wyraz(int pozycja, int x) { } Optymalnie: return potega(x,2*pozycja+1)/silnia(pozycja); //nie zagłębiam się jak wyglądają funkcje: potęga( ) oraz silnia( ) double wyraz(double poprzednik, int x, int pozycja) { } return poprzednik*potega(x,2)/(pozycja+1); //nie zagłębiam się jak wygląda funkcja potega( ) 2.13 Sprawdzanie warunków Stosując instrukcje if, zdarza się czasami, iż warunek do sprawdzenia jest długi i skomplikowany. Zdarza się czasami, iż warunek zawiera odwołanie od funkcji, której obliczenia są czasochłonne. Warto wiedzieć, iż komputer sprawdza warunki od lewej strony do prawej. Można wtedy skorzystać z faktu, iż najpierw niech sprawdzi warunki, które sprawdza się szybko lub które często będą nieprawdziwe i stopniowo przechodzić do warunków bardziej czasochłonnych. Warto również spróbować najpierw uprościć wyrażenie, natomiast później zamieścić je w odpowiedniej kolejności. W tym przypadku funkcja Licz(arg) jest funkcją czasochłonną w obliczeniach. Nieoptymalnie: /*przykład 1*/ if(test1==true AND Licz(arg)==true OR test2==true) /*przykład 2*/ if(licz(arg))==true AND test2=false AND test1==true) Optymalnie: /*przykład 1*/ if(test2==true OR test1==true AND Licz(arg)==true) /*przykład 2*/ if(test2=false AND test1==true OR Licz(arg))==true)! 11 S trona

13 2.14 Zwiększenie skoku pętli Dla wielkich pętli, gdzie iterator przebiega od 0 do >10, warto zwiększyć skok pętli. Przy skoku równym 1 komputer sprawdzi 10 warunek zakończenia pętli. Warto wówczas zaoszczędzić ten czas i przeznaczyć go na coś efektywniejszego. Nieoptymalnie: for(unsigned long i=0;i< ;i++) { tab[i]=i; } Optymalnie: for(unsigned long i=0;i< ;i+=5) { tab[i]=i; tab[i+1]=i+1; tab[i+2]=i+2; tab[i+3]=i+3; tab[i+4]=i+4; } 2.15 Przekazywanie dużych danych Jeżeli jakaś funkcja posiada, jako argument strukturę, to nie opłaca się przekazywać całej struktury. Warto przekazywać argument, jako wskaźnik/referencje, która jest czasami znacznie lżejsza niż przekazanie całej struktury. struct moja { double a,b,c,d,e,f,g,h,i,j; }; Nieoptymalnie: void obliczenia(moja dane) Optymalnie: void obliczenia(moja &dane) 2.16 Konstrukcja wzajemnego wykluczania Warto zastępować konstrukcje if, konstrukcja if else if Chodzenie po tak stworzonej strukturze warunków jest znaczenie szybsze oraz nie zastają sprawdzane wielokrotnie warunki, które pośrednio zostały sprawdzone i są one nieprawdziwe. Nieoptymalnie: /*przykład 1*/ if(test1<10) {/*instrukcja1*/} if(test1>=10 AND test1<100) {/*instrukcja2*/} /*przykład 2*/ if(test1<10 AND test2<60) {/*instrukcja3*/} if(test1>=10 AND test1<100 AND test2<60) {/*instrukcja4*/} if(test1>=100 AND test1<200 AND test2>=60 AND test2<75) {/*instrukcja5*/} Optymalnie: /*przykład 1*/ if(test1<10) {/*instrukcja1*/} 12 S trona

14 else if(test1<100) {/*instrukcja2*/} /*przykład 2*/ if(test2<60){ if(test1<10) {/*instrukcja3*/} else if(test1<100) {/*instrukcja4*/} } else if(test2<75) if(test1>=100 AND test1<200) {/*instrukcja5*/} 2.17 Wartości leniwe Strategia wyznaczania wartości argumentów funkcji na żądanie. Podczas próby wykonywania obliczeń sprawdzamy czy już takie obliczenia były wykonane i czy wartości z tych obliczeń są aktualne. Jeżeli wynik obliczeń jest nieaktualny wracamy do obliczenia danych na nowo. Zazwyczaj uzyskiwanie tych informacji i przetrzymywanie wiąże się z niewielkim narzutem czasowym i pamięciowym Podsumowanie Zasad Efektywnego Programowania Zasady, które zostały przytoczone powyżej, nie wyczerpują po trosze tematu efektywnego programowania. Pokazują, w jaki sposób można rozpocząć efektywne programowanie, w kryterium czasu wykonywania kompilatu. Zasady te warto stosować i przetestować na dużych liczbach iteracji, aby całkowity uzysk czasowy był miły dla oka. Warto zwrócić szczególną uwagę na to, że programy składają się z pętli, które niekiedy z rzędem licznika milion. Warto wtedy zwrócić swoją uwagę na te pętle i skupić całą optymalizację w ich obrębie. Warto również rozważyć instrukcje warunkowe, czy warunki są w najprostszej postaci oraz czy nie następuje sprawdzanie warunku, który z góry będzie niespełniony. 13 S trona

15 3 Przełączniki wybranych kompilatorów Wybrane do testowania kompilatory posiadają 2 typy podstawowych przełączników optymalizacyjnych. Pierwszy typ odpowiada za wielkość kodu wynikowego, natomiast drugi typ odpowiada za szybkość działania kompilatu. W niniejszym rozdziale skupiono się na typem optymalizacyjnym względem czasu wykonywania kompilatu. Są cztery tego typu przełączników. Kompilatory również posiadają flagi optymalizacyjne, które można podzielić na: obliczeniowe, architektoniczne, precyzji, inne. Skupiono się na flagach obliczeniowych oraz architektonicznych, bowiem te flagi mają bezpośredni wpływ na optymalizację w wybranym kryterium. Flagi precyzji, są to flagi, które pozwalają na zmniejszenie precyzji obliczeń. Flagi te nie będą przedmiotem niniejszej pracy, bowiem praca dotyczy optymalizacji bez straty precyzji prowadzonych obliczeń. 3.1 Kompilator GCC -O0: Przełączniki typu O[x] Brak optymalizacji. Przełącznik domyślnie aktywny. -O1: Kompilator stara się zmniejszyć rozmiar kodu i czas realizacji, bez wykonywania żadnych optymalizacji, które mogą powodować problem przy uruchamianiu kompilatu na innym sprzęcie, lub mogące powodować zmianę struktury kodu. W zależności od jądra systemu, ten przełącznik włącza następujące flagi: -fauto-inc-dec, -fcprop-registers, -fdce, -fdefer-pop, -fdelayed-branch, -fdse, -fguess-branchprobability, -fif-conversion2, -fif-conversion, -fipa-pure-const, -fipa-reference, -fmergeconstants, -fshrink-wrap, -fsplit-wide-types, -ftree-builtin-call-dce, -ftree-ccp, -ftree-ch, -ftreecopyrename, -ftree-dce, -ftree-dominator-opts, -ftree-dse, -ftree-forwprop, -ftree-fre, -ftreephiprop, -ftree-sra, -ftree-pta, -ftree-ter, -funit-at-a-time. -O2: Kompilator stara się zwiększyć szybkość działania kodu wynikowego, dopasowując się do rodziny sprzętowej, jak analizując kod pod względem typowych przekształceń numerycznych i algorytmicznych. W zależności od jądra systemu, ten przełącznik włącza następujące dodatkowe względem przełącznika O1 flagi: -fthread-jumps, -falign-functions, -falign-jumps, -falign-loops, -falign-labels, -fcaller-saves crossjumping, -fcse-follow-jumps, -fcse-skip-blocks, -fdelete-null-pointer-checks, -fexpensiveoptimizations, -fgcse, -fgcse-lm, -finline-small-functions, -findirect-inlining, -fipa-sra, -foptimizesibling-calls, -fpeephole2, -fregmove -freorder-blocks, -freorder-functions, -frerun-cse-afterloop, -fsched-interblock, -fsched-spec, -fschedule-insns, -fschedule-insns2, -fstrict-aliasing, - fstrict-overflow, -ftree-if-to-switch-conversion, -ftree-switch-conversion, -ftree-pre -ftree-vrp. -O3: 14 S trona

16 Kompilator stara się zwiększyć szybkość działania kodu wynikowego, dopasowując się do konkretnej architektury system. Program taki może nie wykonać się na innej klasie jednostki obliczeniowej. W zależności od jądra systemu, ten przełącznik włącza następujące dodatkowe względem przełącznika O2 flagi: -finline-functions, -funswitch-loops, -fpredictive-commoning, -fgcse-after-reload, -ftreevectorize, -fipa-cp-clone options. Możliwości optymalizacyjnych, jakie oferuje kompilator GCC jest więcej, co za tym idzie, zaleca się przeczytanie dokumentacji kompilatora, w celu jak najlepszego dopasowania swojej optymalizacji do użytku programu Flagi optymalizacyjne Obliczeniowe Są to flagi kompilatora, które pozwalają dopasować się do konkretnych obliczeń, które wykonywane są w programie. Jeżeli wykonywane są obliczenia modulo dla pewnego pierścienia można przyspieszyć obliczenia ze względu na włączenia flagi, która przyspieszy takie obliczenia. W celu dopasowania specyficznych obliczeń do konkretnej flagi zaleca się zapoznanie z dokumentacją kompilatora. Przykładowe flagi, które zostały wybrane: -fipa-pure-const, -fipa-reference, -fmerge-constants, -fshrink-wrap, -fsplit-wide-types, -ftreebuiltin-call-dce, -ftree-copyrename, -ftree-dce, -ftree-dominator-opts, -ftree-dse, -ftreeforwprop, -ftree-fre, -ftree-phiprop, -ftree-sra, -ftree-pta, -ftree-ter, -funit-at-a-time, -fkeepinline-functions, -fkeep-static-consts, -fmerge-constants, -fmodulo-sched, -fgcse, -fdce, -fdse, - fexpensive-optimizations, -fipa-cp-clone, -fipa-matrix-reorg, -ftree-loop-linear, -floopinterchange, -floop-strip-mine, -floop-block, -ftree-loop-distribution, -ffast-math, -fassociativemath, -freciprocal-math, -funroll-all-loops, -fpeel-loops, Flagi optymalizacyjne Architekturalne Są to flagi kompilatora, które pozwalają dopasować się do kontentej maszyny liczącej, wykorzystując jej najlepsze cechy, rozkład rejestrów. Wykorzystują architekturę tak aby jak najlepiej dopasować się pod względem szybkości wykonywanych obliczeń. Przykładowe flagi, które zostały wybrane: -mmangle-cpu. -mcpu=cpu, -mcpu=name, -mtune=name, -march=name, -mfpu=name, - mfpe=number, -mfp=number, -mstructure-size-boundary=n, -mtp=name, -mcpu=cpu[- sirevision], -mmulticore. 3.2 Kompilatora ICC -O0: Przełączniki typu O[x] Wyłącza wszystkie optymalizacje. Przełącznik domyślnie aktywny. -O1: Kompilator poprzez ten przełącznik nie dopasowuje się do architektury maszyny. Kompilator próbuje optymalizować kod poprzez wykorzystanie ogólnodostępnych narzędzi komunikacji między poszczególnymi fragmentami kodu wynikowego. Przełącznik ten oferuje 15 S trona

17 najmniejszy stopień optymalizacji. W zależności od architektury maszyny, przełącznik ten może aktywować flagi, o których użytkownik może nie wiedzieć 1. -O2: Zalecany poziom optymalizacji. Przełącznik ten umożliwia lepsze dostosowanie się do rodziny sprzętowej, przez globalne zarządzanie rejestrami. Dopasowuje się również do optymalnego zarządzania wyjątkami, optymalizuje wybrany fragment kodu przez rozwinięcie pętli oraz zmianę warunków w pętli. Przełącznik ten może włącz inne flagi optymalizacyjne w celu zwiększenia prędkości działania kompilatu, jednak włączenie ich zależy od systemu i architektury, na jakiej kompilator działa. W celu zwiększenia działania swojego kodu, zalecane jest zapoznanie się z dokumentacją kompilatora z sekcją: Optymalizacja. -O3: Kompilator agresywniej podchodzi do kompilacji, stosując pewne techniki optymalizacyjne, przez co kompilat może być niestabilny. Kompilator próbuje bardziej dostosować się do architektury komputera, co może uniemożliwić działanie kodu na innej maszynie. Przełącznik ten aktywuje flaga, w zależności od parametrów technicznych maszyny, na której kompilator pracuje. Optymalizacja tym przełącznikiem jest niezalecana, w kryterium bardzo dokładnych obliczeń oraz mobilności kodu wynikowego. W celu zapoznania się z przełącznikiem, warto przeczytać dokumentacje kompilatora. Przełączników kompilatora ICC jest więcej. Głównie flagi, które są zawarte w dokumentacji kompilatora, mają za zadanie dopasowanie się do architektury firmy prowadzącej kompilator Flagi optymalizacyjne Obliczeniowe -fast, -fast-transcendentals, -fpie, -funroll-all-loops, -funsigned-bitfields, -parallel, -opt-matmul, - fmath-errno, -fp-model keyword, -fp-speculation=mode Flagi optymalizacyjne Architekturalne -auto-p32, -axcode, -fomit-frame-pointer. 1 Jeżeli kompilator odszuka sprzyjający sprzęt firmy Intel, kompilator aktywuje flagi związane z dostosowaniem się do rodziny jednostki obliczeniowej. 16 S trona

18 4 Wielowątkowość programów Wątek to jest twór systemowy, który wie, co ma zrobić i próbuje dostać od jednostki obliczeniowej trochę czasu na wykonanie powierzonego mu zadania. Wielowątkowość to cecha systemu operacyjnego, która umożliwia w ramach jednego procesu można wykonywać kilka wątków. Nowe wątki to kolejne instrukcje wykonywane oddzielnie, pochodzące z tego samego procesu, które współdzielą kod programu oraz dane. Wielowątkowość można odnieść do procesorów. W takim przypadku, wielowątkowość oznacza możliwość jednoczesnego wykonywania wielu wątków na pojedynczej jednostce obliczeniowej. W takim przypadku są to wątki sprzętowe, które zależą od liczby rdzeni procesora i wykonywane są równolegle. Cechą wielowątkowości jest to, iż wszystkie wątki wykonują się w ramach procesu głównego. Wielowątkowość została wprowadzona, w celu przetwarzania współbieżnego. Przetwarzanie współbieżne może przynieść zwiększenie wydajności programu, jednak mu istnieć ku temu odpowiednie zasoby sprzętowe. Wielowątkowość może również obniżyć wydajność, ponieważ potrzeba stworzyć wątek i go obsłużyć. Tworzenie jak i obsługa, np. synchronizacja wątków zabierają cenny czas procesora. Wszystkie wątki w obrębie jednego procesu współdzielą tę samą wirtualną przestrzeń adresową. Komunikacją między wątkami jest skonstruowana dosyć łatwo, bowiem wystarczy odwołać się do tych zmiennych współdzielonych. 17 S trona

19 5 OpenMP 5.1 Wstęp do OpenMP OpenMP jest to standard dla komputerów równoległych (SMP) dostarczony w postaci API dla programisty. Dostarcza mechanizmów korzystających w sposób jawny z wielowątkowości i pamięci współdzielonej w trybie równoległym. Standard bazuje na tworzeniu i usuwaniu wątków dla obszarów równoległych, które wykonują narzucone zadania przez programistę. Programista ma wpływ na liczbę tworzonych wątków i jakie główne zadanie ma zostać wykonanie przez grupę wątków. Programista natomiast nie ma wpływu, jakie wątki, co wykonają, tzn. programista nie przyporządkowuje konkretnemu wątkowi określonego zadania. Idea działania programu w standardzie OpenMP została ukazana na rysunku poniżej. Rysunek 1. Idea działania programu ze standardem OpenMP. Źródło: Zawsze startuje pojedynczy proces, który tworzy n wątków dla sekcji równoległej. po zakończeniu działania w tej sekcji następuje synchronizacja i porządkowanie. Wynikiem tego wątkiem, który zostaje jest wątek główny. Przechodząc do następnej sekcji równoległej, wątek główny tworzy n wątków, które wykonują zadanie w sekcji równoległej, po czym kończą działanie i wątek główny przechodzi dalej. Tworzenie sekcji równoległych opatrzone jest w kodzie źródłowym w postaci jawnej, odpowiednia dyrektywą preprocesora w postaci: #pragma omp nazwa_dyrektywy warunki nowa_linia_kodu Warto zaznaczyć, iż każda dyrektywa posiada jedną nazwę oraz każda dyrektywa dotyczy najbliższego następującego bloku kodu, czyli np. #pragma omp parallel shared(sum) private(i,arg) { //miejsce, w którym kodu nie powinno być //instrukcje sekcji równoległej } //koniec sekcji równoległej automatyczna synchronizacja i zarządzanie watkami 18 S trona

20 5.2 Pragmy w OpenMP Pragma paralel Aby potencjalnie wykorzystać równoległość obliczeń można zastosować pragme parallel. Po dyrektywnie parallell następuje bezpośrednio blok kodu z jednym wejściem i jednym wyjściem. Postać konstrukcji parallel jest następujące: #pragma omp parallel { //przetwarzanie równoległe } //przetwarzanie sekwencyjne Wykonanie konstrukcji parrallel jest następujące. Gdy wątek główny programu osiągnie miejsce określone przez dyrektywę parallel, wówczas tworzona jest grupa wątków. Grupa wątków stworzona jest pod warunkami, iż nie występuje klauzula if oraz jeśli występuje klauzula if ma ona wartość różna od zera. Gdy nie wystąpi taka sytuacja, wówczas blok kodu znajdujący się bezpośrednio pod dyrektywą parallel jest wykonywany przez wątek główny. Liczba wątków zależy od zmiennej OMP_NUM_THREADS Pragma for Warto również zapoznać się z pragmami określającymi dzielenie pracy. Najbardziej rozpoznawalną konstrukcją jest konstrukcja for. Konstrukcja for umożliwia dzielenie ciała pętli między wątki w grupie, przy czym każdy obrót pętli będzie wykonywany tylko raz. Konstrukcja ma postać: #pragma omp for for(...,...,...) { //ciało pętli for } Konstrukcja for wymaga, aby przed jej wykonaniem była znana liczba obrotów pętli Klauzula ordered Klauzula ordered umożliwia realizację wybranej części ciała pętli for w takim porządku, jakby pętla była wykonywana sekwencyjnie. #pragma omp for ordered for (i=0; i<32; i++) { // intensywne obliczenia #pragma omp ordered p r i n t f ( "Watek %d wykonuje:= %d\n",iam,i) ; } Klauzula schedule Klauzula schedule specyfikuje sposób podziału wykonań ciała pętli między wątki. Decyduje o tym parametr rodzaj, który może przybierać następujące wartości: static gdy przyjmuje postać schedule(static,rozmiar), wówczas pula obrotów jest dzielona na kawałki o wielkości rozmiar, które są cyklicznie przydzielane do wątków; gdy nie poda się rozmiaru, to pula obrotów jest dzielona na mniej więcej równe części; 19 S trona

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski Podstawy programowania w języku Java mgr inż. Piotr Kowalski 18 stycznia 2013 Spis treści 1 Podstawy architektury komputera 5 1.1 Części składowe komputera..................... 5 1.1.1 Rzecz o rejestrach......................

Bardziej szczegółowo

Dodatek A. CUDA. 1 Stosowany jest w tym kontekście skrót GPCPU (od ang. general-purpose computing on graphics processing units).

Dodatek A. CUDA. 1 Stosowany jest w tym kontekście skrót GPCPU (od ang. general-purpose computing on graphics processing units). Dodatek A. CUDA Trzy ostatnie rozdziały książki poświęcone są zagadnieniom związanym z programowaniem równoległym. Skłoniła nas do tego wszechobecność maszyn wieloprocesorowych. Nawet niektóre notebooki

Bardziej szczegółowo

Projekt i implementacja rozproszonego

Projekt i implementacja rozproszonego POLITECHNIKA KRAKOWSKA Wydział Fizyki, Matematyki i Informatyki Stosowanej Informatyka PRACA MAGISTERSKA Projekt i implementacja rozproszonego systemu czasu rzeczywistego Autor: Marcin Szelc Promotor:

Bardziej szczegółowo

Język C++ podstawy programowania

Język C++ podstawy programowania Język C++ podstawy programowania Uniwersytet Marii Curie-Skłodowskiej Wydział Matematyki, Fizyki i Informatyki Instytut Informatyki Język C++ podstawy programowania Paweł Mikołajczak Lublin 2011 Instytut

Bardziej szczegółowo

Wykład Java 07-01-31 ver3.0 1

Wykład Java 07-01-31 ver3.0 1 Wykład Java 07-01-31 ver3.0 1 Java jest językiem stosowanym w Internecie. Aby zrozumieć jego ważność, można przyjąć, że ma on tak samo duże znaczenie dla programowania w Internecie, jak C++ dla programowania

Bardziej szczegółowo

Architektury Komputerowe

Architektury Komputerowe Architektury Komputerowe zagadnień egzamin wersja 1.0 Niniejsze materiały zostały opracowane na podstawie książki prof. dr hab. inż. Jacka Kitowskiego Współczesne architektury systemów komputerowych. W

Bardziej szczegółowo

5. Podstawowe pakiety informatyczne, statystyczne i ekonometryczne

5. Podstawowe pakiety informatyczne, statystyczne i ekonometryczne Zestaw zagadnień informatycznych na egzamin magisterski 2004/2005 1. Dynamiczne struktury danych Opracowanie: Ania Zawrzykraj 2. Charakterystyka popularnych języków programowania Opracowanie: Jarosław

Bardziej szczegółowo

ZESTAW 100 PYTAŃ WRAZ Z ODPOWIEDZIAMI NA ZALICZENIE SYSTEMÓW OPERACYJNYCH

ZESTAW 100 PYTAŃ WRAZ Z ODPOWIEDZIAMI NA ZALICZENIE SYSTEMÓW OPERACYJNYCH ZESTAW 100 PYTAŃ WRAZ Z ODPOWIEDZIAMI NA ZALICZENIE SYSTEMÓW OPERACYJNYCH...gdyż jak wiadomo, najtrudniej odpowiedzieć na najprostsze pytania... 1. ADRESOWANIE W SIECI INTERNET. Jest to sposób ustalania

Bardziej szczegółowo

Technologie tworzenia internetowych aplikacji działających po stronie serwera

Technologie tworzenia internetowych aplikacji działających po stronie serwera Technologie tworzenia internetowych aplikacji działających po stronie serwera Piotr Kołaczkowski e-mail: P.Kolaczkowski@elka.pw.edu.pl Wydział Elektroniki i Technik Informacyjnych Politechniki Warszawskiej,

Bardziej szczegółowo

Systemy Operacyjne. Sem. Zimowy 2007/2008 Dr Piotr Smejda E-mail: piotr@wshe.lodz.pl. htttp://piotrsmejda.wshe.lodz.pl student

Systemy Operacyjne. Sem. Zimowy 2007/2008 Dr Piotr Smejda E-mail: piotr@wshe.lodz.pl. htttp://piotrsmejda.wshe.lodz.pl student Systemy Operacyjne Sem. Zimowy 2007/2008 Dr Piotr Smejda E-mail: piotr@wshe.lodz.pl htttp://piotrsmejda.wshe.lodz.pl student 1 Literatura: A. Silberschatz, P.B. Galvin, G. Gagne, Podstawy systemów operacyjnych,

Bardziej szczegółowo

C++ i Pascal kurs podstawowy

C++ i Pascal kurs podstawowy C++ i Pascal kurs podstawowy Wykład: program, algorytm, kompilator, interpreter, debugger, linker, zmienne, typy danych, komentarze, instrukcje wejścia, wyjścia, operatory, instrukcja warunkowa if, pętla

Bardziej szczegółowo

PROGRAMOWANIE ZORIENTOWANE BEHAWIORALNIE, JAKO RECEPTA NA PROBLEMY ZWIĄZANE Z TTD

PROGRAMOWANIE ZORIENTOWANE BEHAWIORALNIE, JAKO RECEPTA NA PROBLEMY ZWIĄZANE Z TTD Wydział Informatyki Katedra Inżynierii Oprogramowania Inżynieria Oprogramowania i Baz Danych Andrzej, Wiktor Nowak Nr albumu s10018 PROGRAMOWANIE ZORIENTOWANE BEHAWIORALNIE, JAKO RECEPTA NA PROBLEMY ZWIĄZANE

Bardziej szczegółowo

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych

Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Uniwersytet Ekonomiczny w Krakowie Praca licencjacka Wybrane estymatory parametrów prostej regresji w strumieniowym przetwarzaniu danych Zygmunt Zawadzki Kierunek: Finanse i Rachunkowość Specjalność: Rynki

Bardziej szczegółowo

Wstęp do programowania w C#

Wstęp do programowania w C# Anna Kempa Tomasz Staś Wstęp do programowania w C# Łatwy podręcznik dla początkujących Aktualna wersja podręcznika na stronie http://c-sharp.ue.katowice.pl Katowice, kwiecień 2014 Wersja 1.1 Anna Kempa,

Bardziej szczegółowo

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki. Projekt inżynierski

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki. Projekt inżynierski Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Projekt inżynierski Tomasz Pawlicki Jacek Rajda Kierunek studiów: Elektronika

Bardziej szczegółowo

POLITECHNIKA ŚLĄSKA WYDZIAŁ INŻYNIERII MATERIAŁOWEJ I METALURGII. Edukacja Techniczno Informatyczna Studia dzienne. Praca dyplomowa inżynierska

POLITECHNIKA ŚLĄSKA WYDZIAŁ INŻYNIERII MATERIAŁOWEJ I METALURGII. Edukacja Techniczno Informatyczna Studia dzienne. Praca dyplomowa inżynierska POLITECHNIKA ŚLĄSKA WYDZIAŁ INŻYNIERII MATERIAŁOWEJ I METALURGII Edukacja Techniczno Informatyczna Studia dzienne Praca dyplomowa inżynierska Tomasz Babiarz PORÓWNANIE KOMPILATORÓW DLA ŚRODOWISKA JAVA

Bardziej szczegółowo

42. Stany procesów i przejścia między nimi w wielozadaniowym systemie operacyjnym.

42. Stany procesów i przejścia między nimi w wielozadaniowym systemie operacyjnym. 42. Stany procesów i przejścia między nimi w wielozadaniowym systemie operacyjnym. Proces - to jedno z najbardziej podstawowych pojęć w informatyce. Z definicji jest to po prostu egzemplarz wykonywanego

Bardziej szczegółowo

Usługi i sieci teleinformatyczne następnej generacji aspekty techniczne, aplikacyjne i rynkowe

Usługi i sieci teleinformatyczne następnej generacji aspekty techniczne, aplikacyjne i rynkowe Numer Projektu Badawczego Zamawianego: -MNiSW-02-II/2007 Tytuł projektu: Usługi i sieci teleinformatyczne następnej generacji aspekty techniczne, aplikacyjne i rynkowe Tytuł tematu badawczego: Architektury

Bardziej szczegółowo

Przetwarzanie Rozproszone

Przetwarzanie Rozproszone Katedra Architektury Systemów Komputerowych Laboratorium Przetwarzanie Rozproszone Instrukcje wprowadzające do ćwiczeń laboratoryjnych 1. Dynamiczne struktury danych 2. Biblioteki statyczne i dynamiczne

Bardziej szczegółowo

Poznajemy język ACTIONSCRIPT 3.0

Poznajemy język ACTIONSCRIPT 3.0 Poznajemy język ACTIONSCRIPT 3.0 Informacje prawne Informacje prawne Informacje prawne można znaleźć na stronie http://help.adobe.com/pl_pl/legalnotices/index.html. iii Spis treści Rozdział 1: Wprowadzenie

Bardziej szczegółowo

Wprowadzenie do programowania

Wprowadzenie do programowania Michał Włodarczyk Wprowadzenie do programowania ITA-104 Wersja 1 Warszawa, Wrzesień 2009 Michał Włodarczyk 2009 Michał Włodarczyk. Autor udziela prawa do bezpłatnego kopiowania i dystrybuowania wśród pracowników

Bardziej szczegółowo

APLIKACJE OKIENKOWE już interfejs graficzny Graficzny interfejs użytkownika interaktywnej grafiki reakcji

APLIKACJE OKIENKOWE już interfejs graficzny Graficzny interfejs użytkownika interaktywnej grafiki reakcji 1 APLIKACJE OKIENKOWE Wyobraź sobie, że gdy w każdy czwartek zwyczajnie zawiązujesz sobie buty, one eksplodują. Coś takiego cały czas dzieje się z komputerami i jakoś nikt na to nie narzeka. Jeff Raskin,

Bardziej szczegółowo

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL)

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Katolicki Uniwersytet Lubelski Jana Pawła II Dr Krzysztof Jurek Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Kurs dla użytkowników początkujących i średniozaawansowanych Lublin SPIS TREŚCI

Bardziej szczegółowo

Program do analizy i wizualizacji danych naukowych

Program do analizy i wizualizacji danych naukowych Uniwersytet Mikołaja Kopernika Wydział Fizyki, Astronomii i Informatyki Stosowanej Instytut Fizyki UMK w Toruniu Mateusz Dudek nr albumu: 244623 Praca inżynierska na kierunku Informatyka stosowana Program

Bardziej szczegółowo

Maciej Klesiewicz. Instalacja, konfiguracja i administrowanie serwera sieciowego

Maciej Klesiewicz. Instalacja, konfiguracja i administrowanie serwera sieciowego Maciej Klesiewicz Instalacja, konfiguracja i administrowanie serwera sieciowego KRAKÓW 2003 O PRAWACH AUTORSKICH Niniejsza praca powstała w oparciu o dokumenty i opracowania, które są wymienione w Bibliografii

Bardziej szczegółowo

Politechnika Opolska. PRACA DYPLOMOWA Studia pierwszego stopnia stacjonarne REALIZACJA PARSERA WYRAŻEŃ MATEMATYCZNYCH NA PLATFORMIE ANDROID

Politechnika Opolska. PRACA DYPLOMOWA Studia pierwszego stopnia stacjonarne REALIZACJA PARSERA WYRAŻEŃ MATEMATYCZNYCH NA PLATFORMIE ANDROID Politechnika Opolska Wydział Elektrotechniki, Automatyki i Informatyki Instytut Układów Elektromechanicznych i Elektroniki Przemysłowej PRACA DYPLOMOWA Studia pierwszego stopnia stacjonarne Informatyka

Bardziej szczegółowo

Algorytmy przetwarzania obrazów

Algorytmy przetwarzania obrazów Algorytmy przetwarzania obrazów i wstȩp do pracy z bibliotek a OpenCV Pod redakcj a: Ewarysta Rafajłowicza Wojciecha Rafajłowicza Andrzeja Rusieckiego Algorytmy przetwarzania obrazów i wstȩp do pracy

Bardziej szczegółowo

Implementacja modelu FHP w technologii NVIDIA CUDA

Implementacja modelu FHP w technologii NVIDIA CUDA Uniwersytet Wrocławski Wydział Fizyki i Astronomii Instytut Fizyki Teoretycznej Sebastian Szkoda Implementacja modelu FHP w technologii NVIDIA CUDA Opiekun: dr hab. Zbigniew Koza, prof. UWr. 2 Streszczenie

Bardziej szczegółowo

Język JAVA podstawy programowania

Język JAVA podstawy programowania Język JAVA podstawy programowania [43] Na ogół łatwiej daje się człowiek przekonać racjom, do których sam doszedł, niż tym, które nastręczyły się komuś innemu. Myśli Blaise Pascal Jacek Rumiński, 1999

Bardziej szczegółowo