- saxpy (scalar α X plus Y)
|
|
- Judyta Rybak
- 9 lat temu
- Przeglądów:
Transkrypt
1 Wydjność obliczeń sekwencyjnych. Osobliwości prcy z cche - linimi. Typowe lgorytmy lgebry liniowej i oszcownie możliwości ich przyspieszeni y x y y y Ax C C AB Przypomnieć reguły lgebry liniowej: mnożeni mcierzy przez wektor i mcierzy przez mcierz Demonstrcj progrmu Multm: t sm ilość opercji różn wydjność Rozmir zgdnieni: 000 równń - sxpy (sclr α X plus Y) Chrkterystyki komputer: Procesor Intel Core Qud CPU GHz Cche - L1: KB, L:4096 KB Pmięć: DDR 800 MHz 4 GB 1
2 Wydjność różnych lgorytmów C=C+A*B, MFLOPS Wydjność, MFLOPS clssic ijk clssic ikj (HP) Block cche lb=40 Block_cche_reg lb=176 DGEMM Intel MKL Rozmir N
3 Wydjność dl metody mnożeni block_cche_reg w zleżności od rozmiru bloku C=A*B (Mflops), Nrównn = 000, Rozmir bloku Wydjność, MFLOPS 8x x x x x x x Istnieje optymlny rozmir błoku lb, przy którym osiągmy wydjność mksymlną. Jk będzie podno dlej, ten rozmir zleży od sprzętu, minowicie od rozmiru cche L1 i rozmiru TLB (Trnsltion look-side) bufor.
4 Oszcownie wydjności lgorytmów Złożeni Odczyt i zpis (cche RAM) i opercje rytmetyczne są wykonywne w czsie sekwencyjne (rezygnujemy z równoległości opercji rytmetycznych i we\wy) Pmięć podręczn (cche) jest rozdzieloną pomiędzy dnymi w njbrdziej skuteczny sposób (procesor i system opercyjny są intelektulne dne złdowne w cche tk, żeby zminimlizowć ilość przesyłek cche RAM) Komputer m tylko rejestry (njbrdziej szybką pmięć), jeden poziom cche (szybk pmięć rezygnujemy z hierrchicznej struktury pmięci podręcznej) i pmięć główną (dostęp do dresów której jest wykonny z szybkością mgistrli). 4
5 Przyjmujemy: Wszystkie tblicy dnych są umieszczone w pmięci głównej n - rozmir zgdnieni M - objętość pmięci podręcznej (cche), przy czym M << n Będziemy rozwżli tkie przypdki: M n w pmięci podręcznej możn umieścić wiersze mcierzy (młe zgdnienie) M < n dw wiersze mcierzy nie udje się umieścić w cche (duże zgdnienie) 5
6 Czs wykonni progrmu: t f trith m tbus f trith 1 m f t t bus rith f, m t rith, t bus - ilość rytmetycznych opercji i ilość przesłń dnych cche RAM - trwłość jednej opercji rytmetycznej i trwłość przesłni jednego słow Wskźnik wydjności wykorzystni pmięci szybkiej: q f m 6
7 7 W Umieszczenie dnych w pmięci: x x x : : : : 1 : : : : ,,1 1, 1,1 A Mcierze Wektory Podził mcierzy n bloki
8 SAXPY: y = y+αx //odczyt lph i umieszczenie w rejestrze for(i=1; i<=n; i++) { //odczyt y[i], x[i] y[i] = y[i] + lph*x[i]; //zpis y[i] } Ilość odczytów: α 1; x n; y n Ilość zpisów : y - n Rzem : m = n+1 Ilość mnożeń : n Ilość dodwń : n Rzem : f = n q f m n n 1 1 n 8
9 9 W Mnożenie mcierzy przez wektor: y = y+ax for(i=1; i<=n; i++) { //odczyt y i i umieszczenie w rejestr for(j=1; j<=n; j++) { //odczyt A ij, x j y i = y i + A ij *x j ; } //zpis y i } y x A i j i j
10 Ilość odczytów: y n; x n, jeśli M n, n, jeśli M < n; A n ; Ilość zpisów : y n Rzem : m = n +n (M n) m = n +n (M < n) Ilość mnożeń : n Ilość dodwń : n Rzem : f = n q q f m f m n, n n 1 n n 1, n n n M n M n 10
11 Wniosek Wydjność drugiego lgorytmu jest brdziej wysoką od pierwszego zgdnieni, le jko w pierwszym zgdnieniu, tk i w drugim wskźnik wydjności nie zleży od rozmiru pmięci podręcznej. To ozncz, że te lgorytmy są skzne n wykonnie z szybkością wolnej mgistrli, nie szybkiego procesor. Zwiększenie częstości zegr procesor, objętości pmięci podręcznej nie powoduje istotnego przyspieszeni obliczeń. Przykłd: przesłnie jednego słow trw ~40 cyklów procesor. Dl lgorytmu q = 1 ozncz, że n jedną opercje rytmetyczną przypd przesłnie jednego słow. Jeden cykl procesor wytrc n opercje rytmetyczną. A pozostłe 9 cyklów? Są puste. Tu nie są uwzględnione prefetch i ten fkt, że łdownie dnych do cche jest wykonywne nie słowo po słowie, grupmi słów, umieszczonych w cche-linie. Przecież nie zmieni to sytucji w cłości. 11
12 1 W Mnożenie mcierzy przez mcierz: C = C + A*B 1. Metod klsyczn (ijk) B A C k i i j k j Mcierze są umieszczone w pmięci głównej wiersz po wiersze Wzór mtemtyczny: n j i b c n k kj ik ij, 1,, 1
13 Algorytm: for(i=1; i<=n; i++) { for(j=1; j<=n; j++) { //odczyt C ij i umieszczenie w rejestrze for(k=1; k<=n; k++) { //odczyt A ik, B kj C ij = C ij + A ik *B kj ; } //zpis C ij } } UWAGA! Przy kżdej zminie indeksu k będzie pobrny element mcierzy B kj z nstępnego wiersz jeśli mcierz jest dość dużą, bez sensu przydzielć cche dl ej elementów wyniknie przełdownie cche przy kżdej zminie indeksu k. Intelektulny procesor i system opercyjny będą pobierli elementy mcierzy B bez buforowni. 1
14 Ilość odczytów: C n ; A n, jeśli M n, n, jeśli M < n; B n ; Ilość zpisów : C n Rzem : m = n +n (M n) m = n +n (M < n) Ilość mnożeń : n Ilość dodwń : n Rzem : f = n q q f m f m n, n n 1 n n 1 1, n n 1 1 n M n M n 14
15 Metod klsyczn (ikj) - HP for(i=1; i<=n; i++) { for(k=1; k<=n; k++) { //odczyt A ik i umieszczenie w rejestrze for(j=1; j<=n; j++) { //odczyt C ij, B kj C ij = C ij + A ik *B kj ; //zpis C ij, jk tylko bufor będzie wyczerpny } } } Model nie uwzględni pobierni dnych z pmięci: wskźnik wydjności dl mcierzy dużych (M < n) okzuje się nwet gorzej, niż w przypdku poprzednim to się nie odpowid rzeczywistości. N prktyce ten model liczy szybszej od poprzedniego dl tego, że pozostłe usunięte skoki w dnych 15
16 Ilość odczytów: C n, jeśli M n, n, jeśli M < n; A n ; B n ; Ilość zpisów : C n, jeśli M n, n, jeśli M < n; Rzem : m = n +n (M n) m = n +n (M < n) Ilość opercji rytmetycznych: f = n q q f m f m n n n n n n 1 n 1 n,, M n M n 16
17 Metod blokow Mcierz jest podzieloną n bloki o tkim rozmirze, że trzy bloki jednocześnie mogą być umieszczone w pmięć podręczną (cche) jb 1 : 4 1 : 4 1 : : : : 7 8 C11 C1 A11 A1 B11 B1... : : :... ib 9 10 : 11 1 ib 9 10 : 11 1 kb 9 10 : : : : C C A A B B C Nb kb Dl mcierzy blokowej zstosowujemy dziłni nd blokmi: C C A A B ib, ib, jb ib, jb ib, kb kb, jb, kb1, jb 1 Nb W obszrze kżdego bloku używmy zwykłe dziłni nd mcierzmi jb B 17
18 Algorytm (*) for(ib=1; ib<=n b ; ib++) { for(jb=1; jb<= N b ; jb++) { //odczyt bloku C ib,jb i umieszczenie w //cche for(kb=1; kb<= N b ; kb++) { //odczyt bloków A ib,kb, B kb, jb C ib,jb = C ib,jb + A ib,kb *B kb,jb ; } //zpis bloku C ib,jb } } Rozmir kżdego bloku wynosi l b = n/n b, gdzie n rozmir mcierzy, N b - ilość podziłów n bloki wzdłuż jednej iż stron (przypuszczmy, że n jest wielokrotne N b ) Ilość słów w kżdym bloku jest równ l b = n /N b 18
19 Ilość odczytów: C N b l b = N b n /N b = n ; A N b l b = N b n /N b = N b n ; B N b l b = N b n ; Ilość zpisów : C n ; Rzem : m = N b n + n = (N b +1) n N b n ; Ilość opercji rytmetycznych: f = n q f m n N n b n N b l b ; bloki muszą byc w cche l b M l b M l b M q M ; 19
20 Wydjność lgorytmów lgebry liniowej jest przyjęte odnosić do jednego z poziomów BLAS (Bsis Liner Algebr Subroutines) zgodnie z rzędem opercji rytmetycznych O(n k ). BLAS1 O(n 1 ), BLAS O(n ), BLAS O(n ) Algorytm sxpy Wzór mtemtyczny y y x q f m Poziom BLAS / 1 O(n) Mnożenie mcierzy przez wektor y y A x (M n) 1 (M<n) O(n ) Mnożenie mcierzy przez mcierz (Clssic) C C AB (M n) 1 (M < n) O(n ) Mnożenie mcierzy przez mcierz (HP) C C AB (M>=n) / (M<n) O(n ) Mnożenie mcierzy przez mcierz (metod blokow) C C AB M O(n ) 0
21 Wnioski Algorytmy poziomu BLAS 1, - O(n 1 ), O(n ) nie wykzują oszcowni wydjności lepiej od q =. Dl nich podstwowo nie jest możliwe podniesienie wydjności w skutek utrzymni dnych w cche ilość opercji rytmetycznych jest tego smego rzędu, jk i ilość przesłń dnych. Oni są przyrzeczone prcowć z prędkością wolnej mgistrli. Algorytmy poziomu BLAS - O(n ) mogą być zorgnizowne tk, że część dnych, jeden rz umieszczoną w cche, pozostje wykorzystn wielokrotnie (cche reuse). Powoduje to zmniejszenie rzędu ilości przesłń dnych w stosunku do rzędu opercji rytmetycznych oszcownie wydjności jest lepsze od q =. Podstwą dl tworzeni tkich lgorytmów jest podził dnych n bloki. Przy oszcowniu q~ M możn przynjmniej teoretycznie tk dobrć rozmir cche że procesor będzie mił minimlną ilość pustych cykli. Im więcej jest l b (l b <M), tym większ wydjność. 1
22 Podził n bloki n poziomie rejestrów. (Register s blocking) Przedstwion powyżej procedur podziłu n bloki w tki sposób, żeby jednocześnie w pmięci podręcznej mieścili się bloki, okzł się podstwą dl podniesieni wydjności lgorytmu mnożeni mcierzy przez mcierz rzędu ~O(n ) dziłń rytmetycznych. Procedur t zmniejsz ilość przesłń dnych pmięć główn pmięć podręczn pmięć główn i dostł nzwę cche blocking. Okzuje się że przy przesyłniu dnych pmięć podręczn rejestry pmięć podręczn zstosownie techniki blokowej zmniejsz ilość łdowń rejestrów (register s reuse) i też służy do podniesieni wydjności lgorytmu. Rozwżmy lgorytm C ib,jb = C ib,jb + A ib,kb *B kb,jb - pętl wewnętrzn lgorytmu (*)
23 Algorytm niwny (mnożenie bloków mcierzy Cib,jb = Cib,jb + Aib,kb*Bkb,jb ) for( i 0; i l { { } } for( j 0; j l r 0; for( k 0; k l { r r } c ij c ij b r; ; i ) ik b ; j ) b b kj ; k ) ; W pętle wewnętrznej: Ilość łdowń rejestrów: 1 odczyt ik + 1 odczyt b ik Ilość opercji rytmetycznych: 1 mnożenie + 1 dodwnie q = f/m = / = 1 Ilość potrzebnych rejestrów typu double: 4 r, ik, b ik, tmp ik b ik Żdnego blokowni rejestrów w tym lgorytmie nie m Tu r zmienn klsy register, któr m być przechowywn w rejestrze w ciągu wykonni cłej pętli wewnętrznej, ik, b ik elementy bloków A ib,kb, B kb,jb odpowiednio. Po zkończeniu pętli wewnętrznej wrtość zmiennej r będzie przypisn c ij - elementowi bloku C ib,jb. S. Filko Modelownie zgdnień technicznych
24 Schemt blokowni rejestrów x for( i 0; i l ; i ) { for( j 0; // B b j l for( k 0; k l ; k ) { // Łdujemy w rejestry kj b { r0 0; r1 0; r 0; r 0; 0 b ; r A B ; 0 r0 r0 r; r A B ; r r r; ; j ) b // r // r ik b i1, k A 0 kj // r0 r0 b kj // r r ik i1, k ik b ; kj b kj A 1 i1, k ; }// zkonczenie petli k c c ij // Łdujemy w rejestr r r1 r1 r; r r r r; c i1, j A B ; A B ; ij c r0; i1, j r; // r }// zkonczenie petli j }// zkonczenie petli i c // r // r1 r1 // r r i, j1 c c ik i1, j1 B b i1, k i, j1 0 b r1; c b k, j1 ik b k, j1 i1, k i1, j1 k, j1 k, j1 b ; k, j1 r; Rejestry: r0, r1, r, r służą dl przechowywni poprwek do elementów c ij, c i,j+1, c i+1,j, c i+1,j+1 w ciągu iterowni cłej pętli wewnętrznej. A 0, A 1 do przechowywni ik, i+1,k ; B 0 b kj, b k,j+1 ; r pomocniczy rejestr do przechowywni wyników mnożeni. Rzem: 8 rejestrów typu double Frgment kodu dgemm_c 4
25 W pętle wewnętrznej: Ilość łdowń w rejestry: 4 Ilość opercji rytmetycznych: 8 (4 mnożeni + 4 dodwni) q = f/m = 8/4 = To jest zncznie lepiej, niż dl poprzedniego lgorytmu, przecież potrzebuje 8 rejestrów typu double. i c c i,j i+ 1,j c i,j+ 1 c i+ 1,j+ 1 j += i i,k i+ 1,k k k b b j k,j k,j+ 1 C A B ib,jb ib,kb kb,jb Rozmieszczenie rejestrów double w schemcie blokowni x 5
26 Blokownie x Możn udowodnić, że blokownie x będzie jeszcze lepiej: w pętle wewnętrznej - 6 odczytów w rejestry, 18 opercji rytmetycznych, q = f/m = 18/6 = Przecież potrzebuje 15 rejestrów typu double: 9 rejestrów dl poprwek do elementów mcierzy C ib,kb, rejestry dl elementów mcierzy A ib,kb, 1 rejestr dl elementów mcierzy B ik,jk i rejestry pomocnicze. Wnioski Blokownie rejestrów zmniejsz ilość przesłń dnych cche-rejestr-cche w skutek utrzymni części dnych w rejestrch. To powoduje zwiększenie współczynnik ilość rytmetycznych opercji/ilość przesłń dnych n poziomie pmięć podręczn rejestr pmięć podręczn. Im więcej rejestrów double zwier procesor, tym większy rozmir bloku ud się zrelizowć, tym brdziej wysoką będzie wydjność. Dl schemtu blokowni n n: q = n /(n) = n /n, ilość potrzebnych rejestrów - n +n 6
27 Przykłd: Rozmir mcierzy N = Algorytm niwny ijk: Blokownie rejestrów x: Blokownie rejestrów x, blokownie cche i repck (BLAS 1989, J. Dongrr): 00 MFLOPS 600 MFLOPS 11 MFLOPS Frgment kodu dgemm_dong Komputer: Procesor Intel Core Qud CPU GHz Cche - L1: KB, L:4096 KB; Pmięć: DDR 800 MHz 4 GB Kompiltor: Intel C/C /O /QxT /QxT /Qunroll:10 /Qprllel 7
28 Zstosownie rejestrów wektorowych Nstępnym etpem podniesieni wydjności jest zstosownie rejestrów wektorowych. Procesory Pentium IV zwierją 8 18-bitowych rejestrów XMM (Streming SIMD Extensions SSE technologii), kżdy z których umieszcz dw słow typu double. Tkie rejestry ndją możliwość z jeden cykl procesor wykonywć dw mnożeni lub dw dodwni. W porównniu ze zwykłymi rejestrmi typu double, które mogą wykonywć tylko jedną opercje (mnożenie lub dodwnie) z jeden cykl procesor, użycie rejestrów wektorowych teoretycznie zezwl n podniesinie wydjności lgorytmów obliczeniowych, jeśli nie powstje przy tym ztrzymnie przesłń dnych RAM cche RAM, cche rejestry - cche. To jest element rchitektury SIMD (single instruction strem multiple dt strem). Wcześniej zstosownie rejestrów XMM było możliwe tylko w języku ssembler. Terz technologii SSE, SSE wspierją możliwość oprogrmowni n poziomie język C/C++. 8
29 j k j i += i k C ib,jb A B ib,kb kb,jb Rozmieszczenie rejestrów wektorowych w schemcie blokowni x4, używnego dl procesorów Pentium IV rchitektury Prescott и Opteron Przy jednej itercji pętli wewnętrznej mmy: 6 łdowń dnych w rejestry 16 opercji rytmetycznych q = 16/6 =.67 9
30 #include <emmintrin.h> #include <intrin.h> m18d c1, c, c, c4, w, w1, wt, wt1; //8 registers MMX re needed const int mr = ; const int nr = 4; for(i=0; i<lbv; i+=mr) { for(j=0; j<lbh; j+=nr) { pwt = WT+M*j; //point to block B kb,jb ; M ilość wierszy w mcierzy B kb,jb pw = W+i*M; //point to block A ib,kb ; M ilość kolumn w mcierzy A ib,kb //clening of registers for C ib,kb c1 = _mm_setzero_pd(); c = _mm_setzero_pd(); c = _mm_setzero_pd(); c4 = _mm_setzero_pd(); for(k=0; k<m; k++) { // w = _mm_lod1_pd(pw); wt = _mm_lod_pd(pwt); wt1 = _mm_lod_pd(pwt+); w1 = w; w1 = _mm_mul_pd(w1, wt); w = _mm_mul_pd(w, wt1); //lod w <- ik, i,k //lod wt <- b kj, b k,j+1 //lod wt1 <- b k,j+, b k,j+ //w1 <- w //{ ik b kj, ik,b k,j+1 }: w1<-w*wt //{ ik b k,j+, ik,b k,j+ }: w1<-w*wt1 c = _mm_dd_pd(c, w); //{c i,j+, c i,j+ } <- {c i,j+, c i,j+ }+{ ik b k,j+, ik,b k,j+ } c1 = _mm_dd_pd(c1, w1); //{c ij, c i,j+1 } <- {c ij, c i,j+1 }+{ ik b kj, ik,b k,j+1 } 0
31 w = _mm_lod1_pd(pw+1); // lod w <- i+1,k, i+1,k w1 = w; //w1 <- w w1 = _mm_mul_pd(w1, wt); w = _mm_mul_pd(w, wt1); //{ i+1,k b kj, i+1,k,b k,j+1 }: w1<-w*wt //{ i+1,k b kj, i+1,k,b k,j+1 }: w1<-w*wt c4 = _mm_dd_pd(c4, w); //{c i+1,j+, c i+1,j+ } <- {c i+1,j+, c i+1,j+ }+{ i+1,k b k,j+, i+1,k,b k,j+ } c = _mm_dd_pd(c, w1); //{c i+1,j, c i+1,j+1 } <- {c i+1,j, c i+1,j+1 }+{ i+1,k b kj, i+1,k,b k,j+1 } } pw += mr; pwt+= nr; }//j loop } //i loop pos_cw = mr*j; //unlod registers to C _mm_store_pd(cw+pos_cw, c1); _mm_store_pd(cw+pos_cw+, c); _mm_store_pd(cw+pos_cw+4, c); _mm_store_pd(cw+pos_cw+6, c4); Uwg! Dne tblic B kb,jb, C ib,jb mją być wyrównne po grnice 16 bjtów! A = (double *)_ligned_mlloc((number_of_items)*sizeof(double), 16);. _ligned_free(a); 1
32 K раз W Dl wciągnięci potokowych technologii procesor rozwijmy pętle wewnętrzne K rzy (ilość używnych rejestrów MMX nie zleży od K): j k j i += i.. K раз k.. C ib,jb A B ib,kb kb,jb W zleżności od typu procesor K może osiągnąć rzy. Npisn w tki sposób pętl wewnętrzn dostł nzwę mikrojąndr (Microkernel).
33 Pkownie dnych Dl tego, żeby zminimlizowć red miss (cche-chybienie przy odczycie), dne mją być umieszczone w pmięci głównej w kolejności ich pobrni będziemy nzywli to kolejnością optymlną. Dne, które pozostłe umieszczone w cche, mją pozostwć tm jk njdłużej. Przecież pierwotne umieszczenie dnych w kżdej z mcierzy i w blokch C ib,jb, A ib,kb, B kb,jb nie odpowid tkiej kolejności wynik konieczność przepkowni dnych. Istnieje kilk różnych schemtów przepkowni.
34 Początkowe umieszczenie dnych w mcierzy A, B, C kb=1,.,nb //Pck A *,kb jb=1,.,nb //Pck B kb,jb ib=1, Nb C ib,jb +=A ib,kb *B kb,jb end ib end jb end kb Mnożenie w blokch: i=1, lb, j=1, lb, k=1, lb C ij ib,jb+=a ik ib,kb*b kj kb,jb C i+1,j ib,jb+=a i+1,k ib,kb*b kj kb,jb. end k end j end i Pkownie BLAS, ATLAS 4
35 Pkownie BLAS, ATLAS: W cche L1 mją być umieszczone trzy bloki: A ib,kb, B kb,jb, C ib,kb. Z tego wynik: 1 l L L b 1 lb Przykłd: L1=K = *104 = 768 bjtów lbo 768/8 = słów double. l b = To jest optymlny rozmir bloku dl tkiego lgorytmu 5
36 Intel MKL kb=1,.,nb //Pck B kb ib=1,.,nb //Pck A ib,kb jb=1 C ib +=A ib,kb *B kb end ib end jb end kb Pkownie Intel MKL: gór poziom mcierzy; dół poziom bloków m r n r - schemt blokowni rejestrów; l b szerokość pneli. Z punktu widzeni wydjności obliczeń przy wykonniu pętli wewnętrznej w cche L1 mją być umieszczone bloki dnych, zkreskowne n rys, plus blok m r xn r. To jest brdziej oszczędny sposób użyci ogrniczonej pmięci podręcznej, niż przedstwiony w projektch BLAS, ATLAS 6
37 Pkownie dnych Intel MKL?gemm dl schemtu blokowni rejestrów wektorowych m r n r. Gór : mnożenie pnelu mcierzy przez blok; Dół bloki, które mją być umieszczone w TLB buforze. 7
38 Pkownie Intel MKL: W pętle wewnętrznej {k=0; k<lb; } są potrzebne: jeden blok m r l b, jeden blok n r l b i jeden blok m r n r. Z tego wynik: l b m r n r m r n r L 1 l b L1 mr n m n Z innej strony rozmir dnych, umieszczonych w cche L, nie powinien przekroczyć rozmiru TLB Trnsltion Lookside Buffer (Dodtek 1). To jest cche CPU, używny nrzędziem sterowni pmięci dl przyspieszeni trnslcji dresów wirtulnych w trkcie mpowni dresów wirtulnych n pmięć fizyczną. Wielu procesorów, również procesory x86, używją tego urządzeni. Jeśli obszr dnych przekrcz rozmir TLB, dostęp do tych dnych idzie zncznie wolniej. Więc drugi wrunek (dne, oznczone n poprzednim rys, dół): r r r (1) l b n l r b TLB l b n r TLB n r () 8
39 Z tych dwóch wrunków trzeb wybrć ten, który doprowdzi do mniejszego rozmiru l b. Przykłd: m r =, n r = 4, TLB = 56 K (Pentium IV, Core Duo), L1 = K. To ozncz: L1 = 4096 słów double, TLB = 768 słów double. Ze wzoru (1) : l b = (4 096-*4)/(+4) = 681 Ze wzoru (): l b = [ + 768] - = 179 Optymln wrtość: l b = 176 (musi być wielokrotn do n r = 4) 9
40 Technologie EM64t (system opercyjny 64 bit) dopuszczją obecność bit rejestrów XMM. Więc register s blocking, również i pkownie dnych myszą odpowidć schemtowi 4 4 (m r =n r =4) : Użycie rejestrów: 8 dl elementów mcierzy C ib,jb, 4 dl elementów mcierzy A ib,kb, 4 dl elementów mcierzy B kb, jb. 40
41 N kżdej itercji pętli wewnętrznej mmy: 8 łdowń w rejestry i opercji rytmetyczne q = /8 = 4 Advnced Vector Extension AVX Podził mcierzy n bloki i odwzorownie dnych n rejestry YMM 41
42 Łdownie elementów mcierzy w rejestry YMM 4
43 Mikrojądro wykonne w pętle wewnętrznej po indeksu k: 0 = _mm56_lod_pd(paa); b0 = _mm56_brodcst_sd(pbb); 1 = _mm56_lod_pd(paa+4); b1 = _mm56_brodcst_sd(pbb+1); b = _mm56_brodcst_sd(pbb+); b = _mm56_brodcst_sd(pbb+); mul = _mm56_mul_pd(0, b0); mul1 = _mm56_mul_pd(1, b0); c = _mm56_dd_pd(c, mul1); c1 = _mm56_dd_pd(c1, mul); mul = _mm56_mul_pd(0, b); mul1 = _mm56_mul_pd(1, b); c6 = _mm56_dd_pd(c6, mul1); c5 = _mm56_dd_pd(c5, mul); mul = _mm56_mul_pd(0, b); mul1 = _mm56_mul_pd(1, b); c8 = _mm56_dd_pd(c8, mul1); c7 = _mm56_dd_pd(c7, mul); mul = _mm56_mul_pd(0, b1); mul1 = _mm56_mul_pd(1, b1); c4 = _mm56_dd_pd(c4, mul1); c = _mm56_dd_pd(c, mul); 4
44 FMA: w jednej instrukcji są wykonne mnożenie i dodwnie. Mikrojądro wykonne w pętle wewnętrznej po indeksu k: 0 = _mm56_lod_pd(paa); 1 = _mm56_lod_pd(paa+4); b0 = _mm56_brodcst_sd(pbb); b1 = _mm56_brodcst_sd(pbb+1); b = _mm56_brodcst_sd(pbb + ); b = _mm56_brodcst_sd(pbb + ); c1 = _mm56_fmdd_pd(0, b0, c1); c = _mm56_fmdd_pd(1, b0, c); c = _mm56_fmdd_pd(0, b1, c); c4 = _mm56_fmdd_pd(1, b1, c4); c5 = _mm56_fmdd_pd(0, b, c5); c6 = _mm56_fmdd_pd(1, b, c6); c7 = _mm56_fmdd_pd(0, b, c7); c8 = _mm56_fmdd_pd(1, b, c8); //c1 = c1 + 0*b0 //c = c + 1*b0 //c = c + 0*b1 // 44
45 AVX : mnożenie + dodwnie - 8 cykli procesor FMA: _fmdd_pd 5 cykli procesor Przykłd: mnożenie mcierzy kwdrtowych o rozmirze Komputer: Procesor Intel Core i 4010U (Hswell ULT) CPU@1.7 GHz Cche: L1 = KB, L = 56 KB, L = MB RAM: DDR 4.0 GB Wydjność, MFLOPS SSE AVX AVX FMA Dl porównni. Komputer z procesorem Intel Core i7-760qm@.4/.5 GHz (Sndy Bridge) cche L1= 4 KB, L = 4 56 KB, L = 6 MB, RAM DDR 8.0 GB wspier tylko zestw instrukcji AVX i wykzuje wydjność MFLOPS. To jest nie wielu lepiej od procesor i, który n tym teście osiąg trochę mniejszej wydjności przy częstości tktowni pond rzy mniejszej od i7. 45
46 Litertur do wykłdu: 1. Demmel J. W., Applied Numericl Liner Algebr, SIAM, Phildellphi, 1997, Russin edition, Moscow, Mir, Golub G.H., vn Lon C. F., Mtrix Computtions. Third edition, The Johns Hopkins University Press, Goto K, Vn De Geijn R A (008). Antomy of High-Performnce Mtrix Multipliction. ACM Trnsctions on Mthemticl Softwre. V 4,, Yotov K., Roeder T., Pingli K., Gunnels J., Gustvson F., An Experimentl Comprison of Cche-oblivious nd Cche-conscious Progrms. SPAA 07, June 9 11, 007, Sn Diego, Cliforni, USA. 5. Filko S. Blokow wielofrontln metod podstruktur do rozwiązywni dużych ukłdów równń MES. Czsopismo techniczne, 1-NP/009, Filko S. Appliction of AVX (Advnced Vector Extensions) for Improved Performnce of the PARFES Finite Element Prllel Direct Solver. Federted Conference on Computer Science nd Informtion Systems, September 8 11, 01. Krków, Polnd. IEEE Xplore Digitl Librry, pp
47 Dodtek 1 TLB (Goto K, Vn De Geijn R A (008). Antomy of High-Performnce Mtrix Multipliction. ACM Trnsctions on Mthemticl Softwre. V 4,, 1 5) 4.. TLB considertions. A second rchitecturl considertion reltes to the pge mngement system. For our discussion it suffices to consider tht typicl modern rchitecture uses virtul memory so tht the size of usble memory is not constrined by the size of the physicl memory: Memory is prtitioned into pges of some (often fixed) prescribed size. A tble, referred to s the pge tble mps virtul ddresses to physicl ddresses nd keeps trck of whether pge is in memory or on disk. The problem is tht this tble itself is stored in memory, which dds dditionl memory ccess costs to perform virtul to physicl trnsltions. To overcome this, smller tble, the Trnsltion Look-side Buffer (TLB), tht stores informtion bout the most recently used pges, is kept. Whenever virtul ddress is found in the TLB, the trnsltion is fst. Whenever it is not found ( TLB miss occurs), the pge tble is consulted nd the resulting entry is moved from the pge tble to the TLB. In other words, the TLB is cche for the pge tble. More recently, level TLB hs been introduced into some rchitectures for resons similr to those tht motivted the introduction of n L cche. 47
48 The most significnt difference between cche miss nd TLB miss is tht cche miss does not necessrily stll the CPU. A smll number of cche misses cn be tolerted by using lgorithmic prefetching techniques s long s the dt cn be red fst enough from the memory where it does exist nd rrives t the CPU by the time it is needed for computtion. A TLB miss, by contrst, cuses the CPU to stll until the TLB hs been updted with the new ddress. In other words, prefetching cn msk cche miss but not TLB miss. S. Filko Modelownie zgdnień technicznych 48
y - saxpy (scalar α X plus Y)
Wydjność obliczeń sekwencyjnych. Osobliwości prcy z cche - linimi. Typowe lgorytmy lgebry liniowej i oszcownie możliwości ich przyspieszeni y x y - sxpy (sclr α X plus Y) y y Ax C C AB Przypomnieć reguły
Modelowanie zagadnień technicznych SKRYPT. Siergiej Fialko
Modelownie zgdnień technicznych SKRYPT Siergiej Filko Wydził Fizyki, Mtemtyki i Informtyki Politechniki Krkowskiej Krków Siergiej Filko Modelownie zgdnień technicznych. Niniejszy kurs jest poświęcony typowym
MMX i SSE. Zbigniew Koza. Wydział Fizyki i Astronomii Uniwersytet Wrocławski. Wrocław, 10 marca 2011. Zbigniew Koza (WFiA UWr) MMX i SSE 1 / 16
MMX i SSE Zbigniew Koza Wydział Fizyki i Astronomii Uniwersytet Wrocławski Wrocław, 10 marca 2011 Zbigniew Koza (WFiA UWr) MMX i SSE 1 / 16 Spis treści Spis treści 1 Wstęp Zbigniew Koza (WFiA UWr) MMX
Macierz. Wyznacznik macierzy. Układ równań liniowych
Temt wykłdu: Mcierz. Wyzncznik mcierzy. Ukłd równń liniowych Kody kolorów: żółty nowe pojęcie pomrńczowy uwg kursyw komentrz * mterił ndobowiązkowy Ann Rjfur, Mtemtyk Zgdnieni. Pojęci. Dziłni n mcierzch.
Wektor kolumnowy m wymiarowy macierz prostokątna o wymiarze n=1 Wektor wierszowy n wymiarowy macierz prostokątna o wymiarze m=1
Rchunek mcierzowy Mcierzą A nzywmy funkcję 2-zmiennych, któr prze liczb nturlnych (i,j) gdzie i = 1,2,3,4.,m; j = 1,2,3,4,n przyporządkowuje dokłdnie jeden element ij. 11 21 A = m1 12 22 m2 1n 2n mn Wymirem
Analiza matematyczna i algebra liniowa
Anliz mtemtyczn i lgebr liniow Mteriły pomocnicze dl studentów do wykłdów Mcierze liczbowe i wyznczniki. Ukłdy równń liniowych. Mcierze. Wyznczniki. Mcierz odwrotn. Równni mcierzowe. Rząd mcierzy. Ukłdy
Struktura programu. Projekty złożone składają się zwykłe z różnych plików. Zawartość każdego pliku programista wyznacza zgodnie z jego przeznaczeniem.
Struktura programu Projekty złożone składają się zwykłe z różnych plików. Zawartość każdego pliku programista wyznacza zgodnie z jego przeznaczeniem. W ostatnich latach najbardziej używanym stylem oprogramowania
Realizacje zmiennych są niezależne, co sprawia, że ciąg jest ciągiem niezależnych zmiennych losowych,
Klsyczn Metod Njmniejszych Kwdrtów (KMNK) Postć ć modelu jest liniow względem prmetrów (lbo nleży dokonć doprowdzeni postci modelu do liniowości względem prmetrów), Zmienne objśnijące są wielkościmi nielosowymi,
Badanie regularności w słowach
Przypdek sekwencyjny Mrcin Piątkowski Wydził Mtemtyki i Informtyki Uniwersytet Mikołj Kopernik Edsger Wybe Dijkstr (1930 2002) Computer science is no more bout computers thn stronomy is bout telescopes,
Macierz. Wyznacznik macierzy. Układ równań liniowych
Temt wykłdu: Mcierz. Wyzncznik mcierzy. Ukłd równń liniowych Kody kolorów: Ŝółty nowe pojęcie pomrńczowy uwg kursyw komentrz * mterił ndobowiązkowy Ann Rjfur, Mtemtyk n kierunku Biologi w SGGW Zgdnieni.
Wyrównanie sieci niwelacyjnej
1. Wstęp Co to jest sieć niwelcyjn Po co ją się wyrównje Co chcemy osiągnąć 2. Metod pośrednicząc Wyrównnie sieci niwelcyjnej Metod pośrednicząc i metod grpow Mmy sieć skłdjącą się z szereg pnktów. Niektóre
PODSTAWY ALGEBRY MACIERZY. Operacje na macierzach
PODSTWY LGEBRY MCIERZY WIERSZ i, KOLUMN (j) Mcierz m,n, gdzie m to ilość wierszy, n ilość kolumn i,j element mcierzy z itego wiersz, jtej kolumny Opercje n mcierzch Równość mcierzy m,n = B m,n. def i,j
MATeMAtyka 3 inf. Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych. Zakres podstawowy i rozszerzony. Dorota Ponczek, Karolina Wej
Dorot Ponczek, Krolin Wej MATeMAtyk 3 inf Przedmiotowy system ocenini wrz z określeniem wymgń edukcyjnych Zkres podstwowy i rozszerzony Wyróżnione zostły nstępujące wymgni progrmowe: konieczne (K), podstwowe
2. FUNKCJE WYMIERNE Poziom (K) lub (P)
Kls drug poziom podstwowy 1. SUMY ALGEBRAICZNE Uczeń otrzymuje ocenę dopuszczjącą lub dostteczną, jeśli: rozpoznje jednominy i sumy lgebriczne oblicz wrtości liczbowe wyrżeń lgebricznych redukuje wyrzy
Jest błędem odwołanie się do zmiennej, której nie przypisano wcześniej żadnej wartości.
Zmienne Po nieco intuicyjnych początkch, zjmiemy się obiektmi, n których opier się progrmownie są to zmienne. Zmienne Progrmy operują n zmiennych. Ndwnie im wrtości odbyw się poprzez instrukcję podstwieni.
Zrównoleglenie i przetwarzanie potokowe
Zrównoleglenie i przetwarzanie potokowe Zrównoleglenie wysoka wydajność pozostaje osiągnięta w efekcie jednoczesnego wykonania różnych części zagadnienia. Przetwarzanie potokowe proces jest rozdzielony
WYKŁAD 5. Typy macierzy, działania na macierzach, macierz układu równań. Podstawowe wiadomości o macierzach
Mtemtyk I WYKŁD. ypy mcierzy, dziłni n mcierzch, mcierz ukłdu równń. Podstwowe widomości o mcierzch Ogóln postć ukłdu m równń liniowych lgebricznych z n niewidomymi x x n xn b x x n xn b, niewidome: x,
Jest błędem odwołanie się do zmiennej, której nie przypisano wcześniej żadnej wartości.
Zmienne: W progrmie operuje się n zmiennych. Ndwnie im wrtości odbyw się poprzez instrukcję podstwieni. Interpretcj tej instrukcji jest nstępując: zmiennej znjdującej się z lewej strony instrukcji podstwieni
WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:
WEKTORY Wśród wielkości fizycznych występujących w fizyce możn wyróżnić sklry i wektory. Aby określić wielkość sklrną, wystrczy podć tylko jedną liczbę. Wielkościmi tkimi są ms, czs, tempertur, objętość
Wyznacznikiem macierzy kwadratowej A stopnia n nazywamy liczbę det A określoną następująco:
Def.8. Wyzncznikiem mcierzy kwdrtowej stopni n nzywmy liczbę det określoną nstępująco:.det.det dl n n det det n det n, gdzie i j ozncz mcierz, którą otrzymujemy z mcierzy przez skreślenie i- tego wiersz
Pojęcia Działania na macierzach Wyznacznik macierzy
Temt: Mcierze Pojęci Dziłni n mcierzch Wyzncznik mcierzy Symbolem gwizdki (*) oznczono zgdnieni przeznczone dl studentów wybitnie zinteresownych prezentowną temtyką. Ann Rjfur Pojęcie mcierzy Mcierz to
Wymagania edukacyjne matematyka klasa 2b, 2c, 2e zakres podstawowy rok szkolny 2015/2016. 1.Sumy algebraiczne
Wymgni edukcyjne mtemtyk kls 2b, 2c, 2e zkres podstwowy rok szkolny 2015/2016 1.Sumy lgebriczne N ocenę dopuszczjącą: 1. rozpoznje jednominy i sumy lgebriczne 2. oblicz wrtości liczbowe wyrżeń lgebricznych
Wymagania edukacyjne matematyka klasa 2 zakres podstawowy 1. SUMY ALGEBRAICZNE
Wymgni edukcyjne mtemtyk kls 2 zkres podstwowy 1. SUMY ALGEBRAICZNE Uczeń otrzymuje ocenę dopuszczjącą lub dostteczną, jeśli: rozpoznje jednominy i sumy lgebriczne oblicz wrtości liczbowe wyrżeń lgebricznych
Pochodne i całki, macierze i wyznaczniki
Cłk oznczon Cłk niewłściw Wzór Tylor Mcierze Pochodne i cłki, mcierze i wyznczniki Stnisłw Jworski Ktedr Ekonometrii i Sttystyki Zkłd Sttystyki Stnisłw Jworski Pochodne i cłki, mcierze i wyznczniki Cłk
O RELACJACH MIĘDZY GRUPĄ OBROTÓW, A GRUPĄ PERMUTACJI
ZESZYTY NAUKOWE 7-45 Zenon GNIAZDOWSKI O RELACJACH MIĘDZY GRUPĄ OBROTÓW, A GRUPĄ PERMUTACJI Streszczenie W prcy omówiono grupę permutcji osi krtezjńskiego ukłdu odniesieni reprezentowną przez mcierze permutcji,
PRÓBNY EGZAMIN MATURALNY Z INFORMATYKI
PRÓBNY EGZAMIN MATURALNY Z INFORMATYKI POZIOM PODSTAWOWY Arkusz I Instrukcj dl zdjącego 1. Sprwdź, czy rkusz egzmincyjny zwier 8 stron (zdni 1 3). Ewentulny brk zgłoś przewodniczącemu zespołu ndzorującego
4. RACHUNEK WEKTOROWY
4. RACHUNEK WEKTOROWY 4.1. Wektor zczepiony i wektor swoodny Uporządkowną prę punktów (A B) wyznczjącą skierowny odcinek o początku w punkcie A i końcu w punkcie B nzywmy wektorem zczepionym w punkcie
Wymagania kl. 2. Uczeń:
Wymgni kl. 2 Zkres podstwowy Temt lekcji Zkres treści Osiągnięci uczni. SUMY ALGEBRAICZNE. Sumy lgebriczne definicj jednominu pojęcie współczynnik jednominu porządkuje jednominy pojęcie sumy lgebricznej
Wyk lad 1 Podstawowe wiadomości o macierzach
Wyk ld 1 Podstwowe widomości o mcierzch Oznczeni: N {1 2 3 } - zbiór liczb nturlnych N 0 {0 1 2 } R - ci lo liczb rzeczywistych n i 1 + 2 + + n i1 1 Określenie mcierzy Niech m i n bed dowolnymi liczbmi
symbol dodatkowy element graficzny kolorystyka typografia
Identyfikcj wizuln Fundcji n rzecz Nuki Polskiej 1/00 Elementy podstwowe symbol dodtkowy element grficzny kolorystyk typogrfi Identyfikcj wizuln Fundcji n rzecz Nuki Polskiej 1/01 Elementy podstwowe /
Algebra Boola i podstawy systemów liczbowych. Ćwiczenia z Teorii Układów Logicznych, dr inż. Ernest Jamro. 1. System dwójkowy reprezentacja binarna
lger Bool i podstwy systemów liczowych. Ćwiczeni z Teorii Ukłdów Logicznych, dr inż. Ernest Jmro. System dwójkowy reprezentcj inrn Ukłdy logiczne operują tylko n dwóch stnch ozncznymi jko zero (stn npięci
Propozycja przedmiotowego systemu oceniania wraz z określeniem wymagań edukacyjnych (zakres podstawowy)
Propozycj przedmiotowego systemu ocenini wrz z określeniem wymgń edukcyjnych (zkres podstwowy) Proponujemy, by omwijąc dne zgdnienie progrmowe lub rozwiązując zdnie, nuczyciel określł do jkiego zkresu
WEKTORY skalary wektory W ogólnym przypadku, aby określić wektor, należy znać:
WEKTORY Wśród wielkości fizycznych występujących w fizyce możn wyróżnić sklry i wektory. Aby określić wielkość sklrną, wystrczy podć tylko jedną liczbę. Wielkościmi tkimi są ms, czs, tempertur, objętość
Rozwiązania maj 2017r. Zadania zamknięte
Rozwiązni mj 2017r. Zdni zmknięte Zd 1. 5 16 5 2 5 2 Zd 2. 5 2 27 2 23 2 2 2 2 Zd 3. 2log 3 2log 5log 3 log 5 log 9 log 25log Zd. 120% 8910 1,2 8910 2,2 8910 $%, 050 Zd 5. Njłtwiej jest zuwżyć że dl 1
MATHCAD 2000 - Obliczenia iteracyjne, macierze i wektory
MTHCD - Obliczei itercyje, mcierze i wektory Zmiee zkresowe. Tblicowie fukcji Wzór :, π.. π..8.9...88.99..8....8.98. si().9.88.89.9.9.89.88.9 -.9 -.88 -.89 -.9 - Opis, :,, przeciek, Ctrl+Shift+P, /,, ;średik,
MATLAB PODSTAWY. [ ] tworzenie tablic, argumenty wyjściowe funkcji, łączenie tablic
MTLB PODSTWY ZNKI SPECJLNE symbol przypisi [ ] tworzeie tblic, rgumety wyjściowe fukcji, łączeie tblic { } ideksy struktur i tblic komórkowych ( ) wisy do określi kolejości dziłń, do ujmowi ideksów tblic,
O pewnych zgadnieniach optymalizacyjnych O pewnych zgadnieniach optymalizacyjnych
Spis tresci 1 Spis tresci 1 W wielu zgdnienich prktycznych brdzo wżne jest znjdownie optymlnego (czyli njlepszego z jkiegoś punktu widzeni) rozwiązni dnego problemu. Dl przykłdu, gdybyśmy chcieli podróżowć
PODSTAWY BAZ DANYCH Wykład 3 2. Pojęcie Relacyjnej Bazy Danych
PODSTAWY BAZ DANYCH Wykłd 3 2. Pojęcie Relcyjnej Bzy Dnych 2005/2006 Wykłd "Podstwy z dnych" 1 Rozkłdlno dlność schemtów w relcyjnych Przykłd. Relcj EGZ(U), U := { I, N, P, O }, gdzie I 10 10 11 N f f
Temat lekcji Zakres treści Osiągnięcia ucznia
ln wynikowy kls 2c i 2e - Jolnt jąk Mtemtyk 2. dl liceum ogólnoksztłcącego, liceum profilownego i technikum. sztłcenie ogólne w zkresie podstwowym rok szkolny 2015/2016 Wymgni edukcyjne określjące oceny:
Podstawy programowania obiektowego
1/3 Podstwy progrmowni oiektowego emil: m.tedzki@p.edu.pl stron: http://rgorn.p.ilystok.pl/~tedzki/ Mrek Tędzki Wymgni wstępne: Wskzn yły znjomość podstw progrmowni strukturlnego (w dowolnym języku). Temty
Wykład 6 Dyfrakcja Fresnela i Fraunhofera
Wykłd 6 Dyfrkcj Fresnel i Frunhofer Zjwisko dyfrkcji (ugięci) świtł odkrył Grimldi (XVII w). Poleg ono n uginniu się promieni świetlnych przechodzących w pobliżu przeszkody (np. brzeg szczeliny). Wyjśnienie
STYLE. TWORZENIE SPISÓW TREŚCI
STYLE. TWORZENIE SPISÓW TREŚCI Ćwiczenie 1 Tworzenie nowego stylu n bzie istniejącego 1. Formtujemy jeden kpit tekstu i zznczmy go (stnowi on wzorzec). 2. Wybiermy Nrzędzi główne, rozwijmy okno Style (lub
ELEKTRONIKA CYFROWA. Materiały y pomocnicze do wykład sem.. 1
ELEKTRONIKA CYFROWA Mteriły y pomocnicze do wykłd dów Dl AiZ zoczne inŝynierskie, sem Wykorzystne mteriły Łub T Ukłdy logiczne, PW 26 Wenck A NOTATKI Z TECHNIKI CYFROWEJ PW 26 wwwelektronikorgpl Wprowdzenie
KONKURS MATEMATYCZNY dla uczniów gimnazjów w roku szkolnym 2012/13. Propozycja punktowania rozwiązań zadań
KONKURS MATEMATYCZNY dl uczniów gimnzjów w roku szkolnym 0/ II etp zwodów (rejonowy) 0 listopd 0 r. Propozycj punktowni rozwiązń zdń Uwg: Z kżde poprwne rozwiąznie inne niż przewidzine w propozycji punktowni
Metody, alternatywne metodzie wielofrontalnej
Metody, alternatywne metodzie wielofrontalnej Zalety. Metoda wielofrontalna oszczędnie pracuje z pamięcią główną, nadaje się do wirtualizacji jeśli rozmiar zadania przekracza możliwości pamięci głównej,
WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA
Mteriły do wykłdu MATEMATYKA DYSKRETNA dl studiów zocznych cz. Progrm wykłdu: KOMBINATORYKA:. Notcj i podstwowe pojęci. Zlicznie funkcji. Permutcje. Podziory zioru. Podziory k-elementowe. Ziory z powtórzenimi
DZIAŁ 2. Figury geometryczne
1 kl. 6, Scenriusz lekcji Pole powierzchni bryły DZAŁ 2. Figury geometryczne Temt w podręczniku: Pole powierzchni bryły Temt jest przeznczony do relizcji podczs 2 godzin lekcyjnych. Zostł zplnowny jko
Algebra macierzowa. Akademia Morska w Gdyni Katedra Automatyki Okrętowej Teoria sterowania. Mirosław Tomera 1. ELEMENTARNA TEORIA MACIERZOWA
kdemi Morsk w Gdyni Ktedr utomtyki Okrętowej Teori sterowni lger mcierzow Mirosłw Tomer. ELEMENTRN TEORI MCIERZOW W nowoczesnej teorii sterowni rdzo często istnieje potrze zstosowni notcji mcierzowej uprszczjącej
Architektury komputerów Architektury i wydajność. Tomasz Dziubich
Architektury komputerów Architektury i wydajność Tomasz Dziubich Przetwarzanie potokowe Przetwarzanie sekwencyjne Przetwarzanie potokowe Architektura superpotokowa W przetwarzaniu potokowym podczas niektórych
Modelowanie i obliczenia techniczne. Metody numeryczne w modelowaniu: Różniczkowanie i całkowanie numeryczne
Modelownie i obliczeni techniczne Metody numeryczne w modelowniu: Różniczkownie i cłkownie numeryczne Pochodn unkcji Pochodn unkcji w punkcie jest deiniown jko grnic ilorzu różnicowego (jeżeli istnieje):
Wymagania na ocenę dopuszczającą z matematyki klasa II Matematyka - Babiański, Chańko-Nowa Era nr prog. DKOS 4015-99/02
Wymgni n ocenę dopuszczjącą z mtemtyki kls II Mtemtyk - Bbiński, Chńko-Now Er nr prog. DKOS 4015-99/02 Temt lekcji Zkres treści Osiągnięci uczni WIELOMIANY 1. Stopień i współczynniki wielominu 2. Dodwnie
Oznaczenia: K wymagania konieczne; P wymagania podstawowe; R wymagania rozszerzające; D wymagania dopełniające; W wymagania wykraczające
Wymgni edukcyjne z mtemtyki ls 2 b lo Zkres podstwowy Oznczeni: wymgni konieczne; wymgni podstwowe; R wymgni rozszerzjące; D wymgni dopełnijące; W wymgni wykrczjące Temt lekcji Zkres treści Osiągnięci
Wymagania edukacyjne z matematyki
Wymgni edukcyjne z mtemtyki LICEUM OGÓLNOKSZTAŁCĄCE Kls II Poniżej przedstwiony zostł podził wymgń edukcyjnych n poszczególne oceny. Wiedz i umiejętności konieczne do opnowni (K) to zgdnieni, które są
WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY VIII w roku szkolnym 2015/2016
WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY VIII w roku szkolnym 015/016 oprcowł: Dnut Wojcieszek n ocenę dopuszczjącą rysuje wykres funkcji f ( ) i podje jej włsności sprwdz lgebricznie, czy dny punkt
Wydajność systemów a organizacja pamięci. Krzysztof Banaś, Obliczenia wysokiej wydajności. 1
Wydajność systemów a organizacja pamięci Krzysztof Banaś, Obliczenia wysokiej wydajności. 1 Motywacja - memory wall Krzysztof Banaś, Obliczenia wysokiej wydajności. 2 Organizacja pamięci Organizacja pamięci:
System pamięci. Pamięć wirtualna
System pamięci Pamięć wirtualna Pamięć wirtualna Model pamięci cache+ram nie jest jeszcze realistyczny W rzeczywistych systemach działa wiele programów jednocześnie Każdy może używać tej samej przestrzeni
Macierzowe algorytmy równoległe
Macierzowe algorytmy równoległe Zanim przedstawimy te algorytmy zapoznajmy się z metodami dekompozycji macierzy, możemy wyróżnić dwa sposoby dekompozycji macierzy: Dekompozycja paskowa - kolumnowa, wierszowa
Architektura Systemów Komputerowych. Rozwój architektury komputerów klasy PC
Architektura Systemów Komputerowych Rozwój architektury komputerów klasy PC 1 1978: Intel 8086 29tys. tranzystorów, 16-bitowy, współpracował z koprocesorem 8087, posiadał 16-bitową szynę danych (lub ośmiobitową
Komisja Egzaminacyjna dla Aktuariuszy LIX Egzamin dla Aktuariuszy z 12 marca 2012 r. Część I Matematyka finansowa
Mtemtyk finnsow 12.03.2012 r. Komisj Egzmincyjn dl Akturiuszy LIX Egzmin dl Akturiuszy z 12 mrc 2012 r. Część I Mtemtyk finnsow WERSJA TESTU A Imię i nzwisko osoby egzminownej:... Czs egzminu: 100 minut
WYZNACZANIE OGNISKOWEJ SOCZEWEK CIENKICH ZA POMOCĄ ŁAWY OPTYCZNEJ
Ćwiczenie 9 WYZNACZANIE OGNISKOWEJ SOCZEWEK CIENKICH ZA POMOCĄ ŁAWY OPTYCZNEJ 9.. Opis teoretyczny Soczewką seryczną nzywmy przezroczystą bryłę ogrniczoną dwom powierzchnimi serycznymi o promienich R i
Zestaw 11- Działania na wektorach i macierzach, wyznacznik i rząd macierzy
Zestw - Dziłni n wektorch i mcierzch, wyzncznik i rząd mcierzy PRZYKŁADOWE ZADANIA Z ROZWIAZANIAMI Dodjąc( bądź odejmując) do siebie dw wektory (lub więcej), dodjemy (bądź odejmujemy) ich odpowiednie współrzędne
Home Software Hardware Benchmarks Services Store Support Forums About Us
1 z 8 2013-03-08 11:49 Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» Intel Core i5-2310 @ 2.90GHz CPU Benchmarks Video Card Benchmarks
Konkurs dla gimnazjalistów Etap szkolny 9 grudnia 2016 roku
Konkurs dl gimnzjlistów Etp szkolny 9 grudni 016 roku Instrukcj dl uczni 1. W zdnich o numerch od 1. do 1. są podne cztery wrinty odpowiedzi: A, B, C, D. Dokłdnie jedn z nich jest poprwn. Poprwne odpowiedzi
Bardzo krótki wstęp do elektroniki cyfrowej
Brdzo krótki wstęp do elektroniki cyfrowej Słwomir Mmic http://min5.mu.edu.pl/~zfp/sm/home.html Pln ) Ukłdy logiczne b) Algebr Boole i jej relizcj sprzętow c) Brmki są dwie? d) Prosty przykłd sumtor e)
Wspomaganie obliczeń za pomocą programu MathCad
Wprowdzenie do Mthcd' Oprcowł:M. Detk P. Stąpór Wspomgnie oliczeń z pomocą progrmu MthCd Definicj zmiennych e f g h 8 Przykłd dowolnego wyrŝeni Ay zdefinowc znienną e wyierz z klwitury kolejno: e: e f
system identyfikacji wizualnej forma podstawowa karta A03 część A znak marki
krt A03 część A znk mrki form podstwow Znk mrki Portu Lotniczego Olsztyn-Mzury stnowi połączenie znku grficznego (tzw. logo) z zpisem grficznym (tzw. logotypem). Służy do projektowni elementów symboliki
ZADANIA OTWARTE. Są więc takie same. Trzeba jeszcze pokazać, że wynoszą one 2b, gdyż taka jest długość krawędzi dwudziestościanu.
ZADANIA OTWARTE ZADANIE 1 DWUDZIESTOŚCIAN FOREMNY Wiemy, że z trzech złotych prostokątów możn skonstruowć dwudziestościn foremny. Wystrczy wykzć, że długości boków trójkąt ABC n rysunku obok są równe.
INSTRUKCJA. - Jak rozwiązywać zadania wysoko punktowane?
INSTRUKCJA - Jk rozwiązywć zdni wysoko punktowne? Mturzysto! Zdni wysoko punktowne to tkie, z które możesz zdobyć 4 lub więcej punktów. Zdni z dużą ilość punktów nie zwsze są trudniejsze, często ich punktcj
Metody Obliczeniowe w Nauce i Technice
10. Numeryczna algebra liniowa wprowadzenie. Marian Bubak Department of Computer Science AGH University of Science and Technology Krakow, Poland bubak@agh.edu.pl dice.cyfronet.pl Contributors Magdalena
WYMAGANIA I KRYTERIA OCENIANIA Z MATEMATYKI W 3 LETNIM LICEUM OGÓLNOKSZTAŁCĄCYM
WYMAGANIA I KRYTERIA OCENIANIA Z MATEMATYKI W 3 LETNIM LICEUM OGÓLNOKSZTAŁCĄCYM Kls drug A, B, C, D, E, G, H zkres podstwowy 1. FUNKCJA LINIOWA rozpoznje funkcję liniową n podstwie wzoru lub wykresu rysuje
Organizacja pamięci współczesnych systemów komputerowych : pojedynczy procesor wielopoziomowa pamięć podręczna pamięć wirtualna
Pamięć Wydajność obliczeń Dla wielu programów wydajność obliczeń może być określana poprzez pobranie danych z pamięci oraz wykonanie operacji przez procesor Często istnieją algorytmy, których wydajność
Instruction Set Instruction Set Extensions Embedded Options Available. Recommended Customer Price TRAY: $999.00
Processor Number i7-3960x # of Cores 6 # of Threads 12 Clock Speed 3.3 GHz Max Turbo Frequency 3.9 GHz Intel Smart Cache 15 MB Bus/Core Ratio 33 DMI 5 GT/s Instruction Set 64-bit Instruction Set Extensions
WYMAGANIA I KRYTERIA OCENIANIA DO EGZAMINU POPRAWKOWEGO MATEMATYKA. Zakresie podstawowym i rozszerzonym. Klasa II rok szkolny 2011/2012
mgr Jolnt Chlebd mgr Mri Mślnk mgr Leszek Mślnk mgr inż. Rent itl mgr inż. Henryk Stępniowski Zespół Szkół ondgimnzjlnych Młopolsk Szkoł Gościnności w Myślenicch WYMAGANIA I RYTERIA OCENIANIA DO EGZAMINU
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych Piotr Modliński Wydział Geodezji i Kartografii PW 13 stycznia 2012 P. Modliński, GiK PW Rozw.
WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI POZIOM PODSTAWOWY KLASA 2
WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z MATEMATYKI POZIOM PODSTAWOWY KLASA 2 1. SUMY ALGEBRAICZNE rozpoznje jednominy i sumy lgebriczne
Wyznacznik macierzy. - wyznacznik macierzy A
Wzncznik mcierz Uwg Wzncznik definiujem tlko dl mcierz kwdrtowch:,,,,,, =,,,,,, n n n n nn n,,, det = n,,, n n nn - mcierz - wzncznik mcierz Wzncznik mcierz to wzncznik n wektorów, które stnowią kolumn
Szczegółowe wymagania edukacyjne z matematyki, klasa 2C, poziom podstawowy
Szczegółowe wymgni edukcyjne z mtemtyki, kls 2C, poziom podstwowy Wymgni konieczne () dotyczą zgdnieo elementrnych, stnowiących swego rodzju podstwę, ztem powinny byd opnowne przez kżdego uczni. Wymgni
Modelowanie 3 D na podstawie fotografii amatorskich
Edwrd Nowk 1, Jonn Nowk Modelownie D n podstwie fotogrfii mtorskich 1. pecyfik fotogrmetrycznego oprcowni zdjęć mtorskich wynik z fktu, że n ogół dysponujemy smymi zdjęcimi - nierzdko są to zdjęci wykonne
WENTYLACJA PRZESTRZENI POTENCJALNIE ZAGROŻONYCH WYBUCHEM MIESZANIN GAZOWYCH
Ochron przeciwwybuchow Michł Świerżewski WENTYLACJA PRZESTRZENI POTENCJALNIE ZAGROŻONYCH WYBUCHEM MIESZANIN GAZOWYCH 1. Widomości ogólne Zgodnie z postnowienimi rozporządzeni Ministr Sprw Wewnętrznych
Kodowanie liczb. Kodowanie stałopozycyjne liczb całkowitych. Niech liczba całkowita a ma w systemie dwójkowym postać: Kod prosty
Kodownie licz Kodownie stłopozycyjne licz cłkowitych Niech licz cłkowit m w systemie dwójkowym postć: nn 0 Wtedy może yć on przedstwion w postci ( n+)-itowej przy pomocy trzech niżej zdefiniownych kodów
Logo pole ochronne. 1/2 a. 1/4 a
1/2 1/4 Logo pole ochronne Obszr wokół znku, w obrębie którego nie może się pojwić żdn obc form, zrówno grficzn jk i tekstow to pole ochronne. Do wyznczeni pol ochronnego służy moduł konstrukcyjny o rozmirze
Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych klasa druga zakres podstawowy
Przedmiotowy system ocenini wrz z określeniem wymgń edukcyjnych kls drug zkres podstwowy Wymgni konieczne (K) dotyczą zgdnień elementrnych, stnowiących swego rodzju podstwę, ztem powinny być opnowne przez
Wydajność programów sekwencyjnych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1
Wydajność programów sekwencyjnych Krzysztof Banaś Obliczenia Wysokiej Wydajności 1 Wydajność obliczeń Dla wielu programów wydajność obliczeń można traktować jako wydajność pobierania z pamięci i przetwarzania
Metody określania macierzy przemieszczeń w modelowaniu przewozów pasażerskich. mgr inż. Szymon Klemba Warszawa, r.
Metody określni mcierzy przemieszczeń w modelowniu przewozów psżerskich mgr inż. Szymon Klemb Wrszw, 2.07.2013r. SPIS TREŚCI 1 Podstwy teoretyczne 2 Rol mcierzy przemieszczeń 3 Metody wyznczni mcierzy
Zastosowanie multimetrów cyfrowych do pomiaru podstawowych wielkości elektrycznych
Zstosownie multimetrów cyfrowych do pomiru podstwowych wielkości elektrycznych Cel ćwiczeni Celem ćwiczeni jest zpoznnie się z możliwościmi pomirowymi współczesnych multimetrów cyfrowych orz sposobmi wykorzystni
f(x)dx (1.7) b f(x)dx = F (x) = F (b) F (a) (1.2)
Cłk oznczon Cłkę oznczoną będziemy zpisywli jko f(x)dx (.) z fnkcji f(x), któr jest ogrniczon w przedzile domkniętym [, b]. Jk obliczyć cłkę oznczoną? Obliczmy njpierw cłkę nieoznczoną z fnkcji f(x), co
Materiały pomocnicze do ćwiczeń z przedmiotu: Ogrzewnictwo, wentylacja i klimatyzacja II. Klimatyzacja
Mteriły pomocnicze do ćwiczeń z przedmiotu: Orzewnictwo, wentylcj i klimtyzcj II. Klimtyzcj Rozdził 1 Podstwowe włsności powietrz jko nośnik ciepł mr inż. Anieszk Sdłowsk-Słę Mteriły pomocnicze do klimtyzcji.
Optymalizacja kodu. Ze wszystkich metod optymalizacji kodu programowego zwrócimy uwagę na: Usunięcie (po możliwości) skoków danych.
Optymalizacja kodu Ze wszystkich metod optymalizacji kodu programowego zwrócimy uwagę na: Usunięcie (po możliwości) skoków danych Rozwijanie pętli Opcje kompilatora 1 Usunięcie skoków danych: for(i=1;
Wykªad 1. Macierze i wyznaczniki Macierze podstawowe okre±lenia
Wykªd 1 Mcierze i wyznczniki 11 Mcierze podstwowe okre±leni Denicj 1 Mcierz (rzeczywist ) wymiru m n, gdzie m, n N, nzywmy prostok tn tblic zªo»on z m n liczb rzeczywistych ustwionych w m wierszch i n
Matematyczne Podstawy Informatyki
Mtemtyczne Podstwy Informtyki dr inż. Andrzej Grosser Instytut Informtyki Teoretycznej i Stosownej Politechnik Częstochowsk Rok kdemicki 2013/2014 Podstwowe pojęci teorii utomtów I Alfetem jest nzywny
Komisja Egzaminacyjna dla Aktuariuszy LII Egzamin dla Aktuariuszy z 15 marca 2010 r. Część I Matematyka finansowa
Mtemtyk finnsow 15.0.010 r. Komisj Egzmincyjn dl Akturiuszy LII Egzmin dl Akturiuszy z 15 mrc 010 r. Część I Mtemtyk finnsow WERSJA TESTU A Imię i nzwisko osoy egzminownej:... Czs egzminu: 100 minut 1
PassMark - CPU Benchmarks - List of Benchmarked CPUs
Pass - CPU Benchmarks - List of Benchmarked CPUs Strona 1 z 29 Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» CPU List CPU Benchmarks
WYMAGANIA EDUKACYJNE Z MATEMATYKI W KLASIE IIc ZAKRES PODSTAWOWY I ROZSZERZONY
WYMAGANIA EDUKACYJNE Z MATEMATYKI W KLASIE IIc ZAKRES PODSTAWOWY I ROZSZERZONY. JĘZYK MATEMATYKI oblicz wrtość bezwzględną liczby rzeczywistej stosuje interpretcję geometryczną wrtości bezwzględnej liczby
Algorytmy graficzne. Filtry wektorowe. Filtracja obrazów kolorowych
Algorytmy grficzne Filtry wektorowe. Filtrcj orzów kolorowych Filtrcj orzów kolorowych Metody filtrcji orzów kolorowych możn podzielić n dwie podstwowe klsy: Metody komponentowe (component-wise). Cechą
Najlepsze drukarki 3D
Pass - CPU Benchmarks - List of Benchmarked CPUs Shopping cart Search Home Software Hardware Benchmarks Services Store Support Forums About Us Home» CPU Benchmarks» CPU List CPU Benchmarks Video Card Benchmarks
Programy współbieżne
Specyfikownie i weryfikownie Progrmy współieżne Mrek A. Bednrczyk, www.ipipn.gd.pl Litertur wiele prc dostępnych w Sieci np.: http://www.wikipedi.org/ Specyfikownie i weryfikcj progrmy współieżne PJP Prosty
PODSTAWY BAZ DANYCH Wykład 2 2. Pojęcie Relacyjnej Bazy Danych
PODSTAWY BAZ DANYCH Wykłd 2 2. Pojęcie Relcyjnej Bzy Dnych 2005/2006 Wykłd "Podstwy bz dnych" 1 Pojęcie krotki - definicj Definicj. Niech dny będzie skończony zbiór U := { A 1, A 2,..., A n }, którego
LISTA02: Projektowanie układów drugiego rzędu Przygotowanie: 1. Jakie własności ma równanie 2-ego rzędu & x &+ bx&
LISTA: Projektownie ukłdów drugiego rzędu Przygotownie: 1. Jkie włsności m równnie -ego rzędu & &+ b + c u jeśli: ) c>; b) c; c) c< Określ położenie biegunów, stbilność, oscylcje Zdni 1: Wyzncz bieguny.
Wprowadzenie: Do czego służą wektory?
Wprowdzenie: Do czego służą wektory? Mp połączeń smolotowych Isiget pokzuje skąd smoloty wyltują i dokąd doltują; pokzne jest to z pomocą strzłek strzłki te pokzują przemieszczenie: skąd dokąd jest dny
WSTĘP DO INFORMATYKI
Akdemi Górniczo-Hutnicz Wydził Elektrotechniki, Automtyki, Informtyki i Inżynierii Biomedycznej WSTĘP DO INFORMATYKI SYSTEMY KODOWANIA ORAZ REPREZENTACJA I ARYTMETYKA LICZB Adrin Horzyk www.gh.edu.pl SYSTEMY