numeryczne modelowanie pola falowego, obliczenia równoległe, modelowania 3D, anizotropia



Podobne dokumenty
Harmonogramowanie projektów Zarządzanie czasem

2.Prawo zachowania masy

Edycja geometrii w Solid Edge ST

Ćwiczenie: "Ruch harmoniczny i fale"

2. Charakterystyka obliczeń współbieżnych i rozproszonych.

Bazy danych. Andrzej Łachwa, UJ, /15

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

7. REZONANS W OBWODACH ELEKTRYCZNYCH

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Wyznaczanie współczynnika sprężystości sprężyn i ich układów

Efektywne zastosowanie modelowań numerycznych w sejsmologii górniczej

Systemy mikroprocesorowe - projekt

Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.

DE-WZP JJ.3 Warszawa,

Charakterystyka systemów plików

Udoskonalona wentylacja komory suszenia

Automatyka. Etymologicznie automatyka pochodzi od grec.

Nowości w module: BI, w wersji 9.0

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Architektura komputerów

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Promocja i identyfikacja wizualna projektów współfinansowanych ze środków Europejskiego Funduszu Społecznego

UKŁAD ROZRUCHU SILNIKÓW SPALINOWYCH

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

PRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc

SERI A 93 S E RI A 93 O FLUSH GRID WITHOUT EDGE TAB

Podstawy programowania

Instalacja. Zawartość. Wyszukiwarka. Instalacja Konfiguracja Uruchomienie i praca z raportem Metody wyszukiwania...

Sieci komputerowe cel

NUMER IDENTYFIKATORA:

Zagospodarowanie magazynu

Rodzaje i metody kalkulacji

Analiza wyników egzaminu gimnazjalnego. Test matematyczno-przyrodniczy matematyka. Test GM-M1-122,

Małopolskie Centrum Przedsiębiorczości Książka znaku

Środowiskowe Laboratorium Ciężkich Jonów Uniwersytet Warszawski

MAPY RYZYKA POWODZIOWEGO

MODELOWANIE ZA POMOCĄ MES Analiza statyczna ustrojów powierzchniowych

Czy zdążyłbyś w czasie, w jakim potrzebuje światło słoneczne, aby dotrzeć do Saturna, oglądnąć polski hit kinowy: Nad życie Anny Pluteckiej-Mesjasz?

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

Współczesne nowoczesne budownictwo pozwala na wyrażenie indywidualnego stylu domu..

40. Międzynarodowa Olimpiada Fizyczna Meksyk, lipca 2009 r. ZADANIE TEORETYCZNE 2 CHŁODZENIE LASEROWE I MELASA OPTYCZNA

WZORU UŻYTKOWEGO EGZEMPLARZ ARCHIWALNY. d2)opis OCHRONNY. (19) PL (n) Centralny Instytut Ochrony Pracy, Warszawa, PL

Lekcja 173, 174. Temat: Silniki indukcyjne i pierścieniowe.

POMOC PSYCHOLOGICZNO-PEDAGOGICZNA Z OPERONEM. Vademecum doradztwa edukacyjno-zawodowego. Akademia

Warunki Oferty PrOmOcyjnej usługi z ulgą

JĘZYK UML JAKO NARZĘDZIE MODELOWANIA PROCESU PROJEKTOWO-KONSTRUKCYJNEGO

PROJEKTOWANIE PROCESÓW PRODUKCYJNYCH

KONCEPCJA NAUCZANIA PRZEDMIOTU RACHUNKOWOŚĆ SKOMPUTERYZOWANA" NA WYDZIALE ZARZĄDZANIA UNIWERSYTETU GDAŃSKIEGO

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

Zarządzanie Zasobami by CTI. Instrukcja

Powiatowy Urząd Pracy w Trzebnicy. w powiecie trzebnickim w 2008 roku Absolwenci w powiecie trzebnickim

SPRAWOZDANIE Z REALIZACJI XXXII BADAŃ BIEGŁOŚCI I BADAŃ PORÓWNAWCZYCH HAŁASU W ŚRODOWISKU Warszawa kwiecień 2012r.

II.2) CZAS TRWANIA ZAMÓWIENIA LUB TERMIN WYKONANIA: Zakończenie:

Zobacz to na własne oczy. Przyszłość już tu jest dzięki rozwiązaniu Cisco TelePresence.

Sieć komputerowa grupa komputerów lub innych urządzeo połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów, na przykład:

II.2) CZAS TRWANIA ZAMÓWIENIA LUB TERMIN WYKONANIA: Okres w miesiącach: 7.

EGZAMIN MATURALNY Z MATEMATYKI

PROCEDURA OCENY RYZYKA ZAWODOWEGO. w Urzędzie Gminy Mściwojów

Projekt MES. Wykonali: Lidia Orkowska Mateusz Wróbel Adam Wysocki WBMIZ, MIBM, IMe

PAKIET MathCad - Część III

Bielsko-Biała, dn r. Numer zapytania: R WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska Bielsko-Biała ZAPYTANIE OFERTOWE

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

USTAWA. z dnia 26 czerwca 1974 r. Kodeks pracy. 1) (tekst jednolity)

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 6, strona 1. Format JPEG

Dziękujemy za zainteresowanie

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

Efektywna strategia sprzedaży

KSIĘGA ZNAKU TOTORU S.C.

Pomiar mocy pobieranej przez napędy pamięci zewnętrznych komputera. Piotr Jacoń K-2 I PRACOWNIA FIZYCZNA

WYZNACZANIE PRZYSPIESZENIA ZIEMSKIEGO ZA POMOCĄ WAHADŁA REWERSYJNEGO I MATEMATYCZNEGO

(12) OPIS PATENTOWY (19) PL

Zamawiający potwierdza, że zapis ten należy rozumieć jako przeprowadzenie audytu z usług Inżyniera.

Waldemar Szuchta Naczelnik Urzędu Skarbowego Wrocław Fabryczna we Wrocławiu

Strategia rozwoju sieci dróg rowerowych w Łodzi w latach

Metrologia cieplna i przepływowa

Instrukcja obsługi platformy zakupowej e-osaa (klient podstawowy)

Grupa bezpieczeństwa kotła KSG / KSG mini

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

Automatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług

Elementy animacji sterowanie manipulatorem

K P K P R K P R D K P R D W

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

Zapytanie ofertowe dotyczące wyboru wykonawcy (biegłego rewidenta) usługi polegającej na przeprowadzeniu kompleksowego badania sprawozdań finansowych

PODSTAWY METROLOGII ĆWICZENIE 4 PRZETWORNIKI AC/CA Międzywydziałowa Szkoła Inżynierii Biomedycznej 2009/2010 SEMESTR 3

DOTACJE NA INNOWACJE. Zapytanie ofertowe

SUPPORTING EQUIPMENT. LoopMaster EL650 D /PL/B 1(10) PRODUCT DESCRIPTION LOOPMASTER EL650

Geomagic Design X jest najbardziej wszechstronnym oprogramowaniem, które umożliwia:

Nawiewniki wirowe do podestów i podiów

Prezentacja dotycząca sytuacji kobiet w regionie Kalabria (Włochy)

WYMAGANIA EDUKACYJNE SPOSOBY SPRAWDZANIA POSTĘPÓW UCZNIÓW WARUNKI I TRYB UZYSKANIA WYŻSZEJ NIŻ PRZEWIDYWANA OCENY ŚRÓDROCZNEJ I ROCZNEJ

KLAUZULE ARBITRAŻOWE

2.1 INFORMACJE OGÓLNE O SERII NX

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

G PROGRAMMING. Part #4

Instrukcja Laboratoryjna

Transkrypt:

WARSZTATY 2010 z cyklu: Zagrożenia naturalne w górnictwie Mat. Symp. str. 144 153 Andrzej LEŚNIAK, Tomasz DANEK, Anna PIĘTA Akademia Górniczo Hutnicza, Kraków Kierunki rozwoju modelowań numerycznych sejsmicznego pola falowego Słowa kluczowe numeryczne modelowanie pola falowego, obliczenia równoległe, modelowania 3D, anizotropia Streszczenie W artykule przedstawiono postęp, jaki dokonał się w ostatnich latach w modelowaniach pełnych, sejsmicznych obrazów falowych, głównie pod kątem ich wykorzystania w sejsmice prospekcyjnej oraz sejsmice górniczej i sejsmologii. Postęp ten miał miejsce dzięki dynamicznemu rozwojowi metod informatycznych i numerycznych. Zasadnicze znaczenie miała tu możliwość prowadzenia modelowań numerycznych w rozproszonych, heterogenicznych środowiskach obliczeniowych oraz w innych środowiskach architekturach równoległych. Dodatkowym czynnikiem stymulującym ten rozwój był także wzrost mocy obliczeniowych dokonujący się dzięki ciągłemu rozwojowi sprzętu komputerowego. Wszystkie wymienione czynniki pozwalają na prowadzenie obliczeń w wersji 3D w ośrodkach o dowolnym stopniu złożoności przy zachowaniu akceptowalnego czasu obliczeń. 1. Wstęp Modelowanie pełnego pola falowego jest nieodłącznym narzędziem interpretacji prowadzonej w sejsmice poszukiwawczej lub sejsmologii inżynierskiej. Modelowania pozwalają zobrazować sposób rozprzestrzeniania się górotworze drgań wzbudzonych w sposób sztuczny lub naturalny. Ich rezultatem są syntetyczne obrazy drgań w dowolnie wybranych punktach ośrodka. Modelowania sejsmicznego pola falowego znajdują zastosowanie praktycznie na każdym etapie badań sejsmicznych. Są one przydatne na etapie projektowania polowych pomiarów sejsmicznych uzyskane w wyniku modelowań rezultaty pozwalają między innymi na optymalne rozmieszczenie czujników drgań. Modelowania są również niezbędne w procesie odtworzenia budowy ośrodka geologicznego, w którym odbywa się propagacja a także jego wybranych parametrów geomechanicznych. Dla zmieniających się modeli ośrodka proces modelowania jest wielokrotnie powtarzany w celu otrzymania jak najlepszego dopasowania wymodelowanych rejestracji drgań do rejestracji polowych. Model ośrodka, dla którego otrzymane rejestracje są najbardziej zbliżone do zarejestrowanych jest uznawany za model najlepiej aproksymujący ośrodek rzeczywisty. Modelowania propagacji fal sejsmicznych odgrywają również kluczową rolę w sejsmologii górniczej. Umożliwiają zwiększenie dokładności lokalizacji źródeł emisji sejsmicznej, np. wstrząsów indukowanych podziemną działalnością górniczą. Podobnie jak w badaniach 144

A. LEŚNIAK, T. DANEK, A. PIĘTA - Kierunki rozwoju modelowań numerycznych... sejsmicznych modelowania numeryczne umożliwiają odtworzenie budowy górotworu w rejonie objętym wstrząsami. Szczegółowe odtworzenie rzeczywistego ośrodka geologicznego na podstawie pomiarów geofizycznych jest praktycznie niemożliwe. Składają się na to głównie przyczyny natury fizycznej, związane z rozdzielczością konkretnej metody pomiarowej oraz matematyczne ograniczenia procedur inwersji. Z reguły dąży się do odzyskania parametrów pewnych uproszczonych ośrodków typowymi przykładami mogą tu byś ośrodki płasko-równoległe. W wypadku ograniczenia się do tej klasy ośrodków modelowania mogą być prowadzone dla stosunkowo prostych modeli jednowymiarowych 1D. Nawet, jeśli modelujemy pełne pole falowe, obliczenia dla tego typu ośrodków nie są złożone numerycznie nawet dla stosunkowo dużych rozmiarów modeli. Dążenie w kierunku odtworzenia rzeczywistej budowy ośrodka geologicznego wymusza stosowanie modelowań, dla co najmniej dwuwymiarowych (2D) modeli ośrodka. Są to ośrodki, w których parametry geomechaniczne zmieniają się wzdłuż jednej z osi poziomych i wraz z głębokością. Granice poszczególnych warstw budujących tego typu ośrodki nie są, jak w poprzednim wypadku, równoległe. Modelowania numeryczne pełnego pola falowego dla ośrodków 2D są znacznie bardziej czasochłonne niż dla ośrodków 1D. Mimo dużych kosztów obliczeniowych modelowania 2D są bardzo popularne z uwagi na znacznie większe możliwości rekonstrukcji ośrodków geologicznych. Wraz z rozwoje sejsmicznych metod pomiarowych oraz z powszechnym użyciem sieci sejsmologicznych złożonych z kilkudziesięciu czujników pojawiła się konieczność prowadzenie modelowań dla ośrodków trójwymiarowych 3D. Również dopuszczenie możliwości istnienia anizotropii prędkości propagacji fal sejsmicznych wymusza zwiększenie ilości wymiarów modelowanego ośrodka tak by umożliwić przestrzenną analizę rozchodzących się fal sejsmicznych. Jak zostanie to poniżej zilustrowane przejście od modelowań 2D do 3D powoduje iż ilość operacji zmiennoprzecinkowych rośnie w sposób znaczący na tyle by praktycznie uniemożliwić realizację tego typu obliczeń na pojedynczym komputerze o architekturze szeregowej. W artykule omówiono podstawowe algorytmy numeryczne stosowane w modelowaniach pełnego pola falowego w złożonych ośrodkach geologicznych. Zestawiono szacunkową złożoność obliczeniową poszczególnych algorytmów dla modeli jedno-, dwu- i trójwymiarowych. Przedyskutowano podstawowe rozwiązania hardwarowe i softwarowe pozwalające na zwiększenie efektywności obliczeń tego typu. Szczególną uwagę poświęcono popularnym ostatnio metodom obliczeń równoległych na klastrach komputerów oraz możliwościom obliczeń prowadzonych z wykorzystaniem procesorów kart graficznych. 2. Metody numeryczne w modelowaniach sejsmicznych Modelowanie sejsmicznego pola falowego metodą różnic skończonych sprowadza się do iteracyjnego rozwiązywanie układu liniowych równań różnicowych. W zależności od stopnia złożoności modelowanego pola, wielkości modelu, skomplikowania warunków brzegowych i warunków stabilności, a także horyzontu czasowego, dla jakiego ma być przeprowadzone modelowanie, ilość koniecznych do wykonania operacji zmiennoprzecinkowych może sięgać miliardów. Czasy obliczeń w przypadku podstawowych modeli fizycznych górotworu i typów rozwiązań dla prostego modelu (rys. 2.1) przedstawia wykres 2.2. Przestawione wyniki należy traktować w sposób przybliżony z uwagi na fakt, że ilość iteracji potrzebnych do 145

WARSZTATY 2010 z cyklu: Zagrożenia naturalne w górnictwie wygenerowania pola dla zadanego czasu zależy dodatkowo od warunków stabilności. Tym nie mniej wyraźnie widoczny jest dramatyczny wzrost zapotrzebowania na moc obliczeniową wraz z wzrostem zaawansowania numerycznej metody obliczeń. Równie duży wzrost czasu obliczeń następuje przy zwiększeniu wymiarowości ośrodka, o czym wspomniano we wstępnie artykułu. Mimo iż przy przejściu z ośrodków 2D do 3D czas modelowań dramatycznie wrasta, nie to stanowi główny problem w przypadku obliczeń szeregowych. Podstawowym problem dotyczy ilości dostępnej pamięci RAM. W przypadku ośrodków anizotropowych maksymalny możliwy do wyliczenia w środowisku 32 bitowym model może mieć między 1003-2003 węzłów obliczeniowych. W architekturach 64 bitowych to ograniczenie nie istnieje, ale nawet maszyny ze stosunkowo dużą ilością pamięci RAM (kilkanaście GB) mogą być wykorzystywane do modelowań pola falowego w kostkach o długościach krawędzi liczonych raczej w setkach metrów niż w kilometrach (ze względu na warunki stabilności). Jednym rozwiązaniem problemu jest prowadzenie obliczeń w środowiskach rozproszonych. a) b) c) d) Rys. 2.1. Trójwarstwowy model ośrodka (a);.ze środkową warstwą anizotropową (γ,δ,ε stałe Thomsena). Składowe: pionowa (a), pozioma (b) i crossline (c) wektora prędkości Fig. 2.1. Three layer medium. Anisotropy in second layer. (γ,δ,ε Thomsen constants). Vertical (a), horizontal (b) and crossline (c) components of velocity vector. 1800 1600 1400 1200 1000 800 600 400 200 0 Akustyczny Elastyczny Elast. + Tłumienie Anizotropowy Aniz. + FCT Rys. 2.2. Czasy obliczeń dla kilku podstawowych rodzajów ośrodków i algorytmów (FCT flux corrected transport).(danek 2005) Fig. 2.2. Computational times for basic media and algorithms. (FCT - flux corrected transport)..(danek 2005) 146

A. LEŚNIAK, T. DANEK, A. PIĘTA - Kierunki rozwoju modelowań numerycznych... Nowoczesnym i efektywnym sposobem numerycznego rozwiązania układu równań jest zastosowanie metody siatek wzajemnie przesuniętych (ang. staggered grid). Metoda ta posiada szereg własności, które są szczególnie użyteczne dla modelowań przeprowadzanych na użytek badań sejsmicznych. Podstawową zaletą metody siatek wzajemnie przesuniętych jest jej stabilność dla wszystkich wartości współczynnika Poissona, co jest istotne z punktu widzenia poszukiwań morskich oraz przy modelowaniu równania ruchu w ośrodkach charakteryzujących się wysokimi wartościami tego współczynnika. Dodatkowym atutem metody są małe błędy związane ze zjawiskiem dyspersji obserwowanym na siatce obliczeniowej oraz brak wpływu wartości współczynnika Poissona na wyniki modelowania. Innymi równie ważnymi zaletami metody siatek wzajemnie przesuniętych jest łatwość implementacji źródła powierzchniowego i podpowierzchniowego fali sejsmicznej oraz łatwe spełnianie warunków brzegowych na powierzchniach swobodnych [Levander A, 1988]. Rozwiązanie układu równań różniczkowych otrzymuje się zastępując pochodne występujące w równaniu różniczkowym odpowiednimi ilorazami różnicowymi oraz stosując dwuwymiarową siatkę obliczeniową o węzłach wzajemnie przesuniętych w przestrzeni i czasie (rysunek 2.3). t t Rys. 2.3. Schemat siatki o węzłach wzajemnie przesuniętych. Wartość składowych wektora prędkości dla kroku czasowego (k+1/2) t liczona jest na podstawie wartości składowych wektora prędkości (kolor szary) wyznaczanych dla poprzedniego kroku czasowego oraz składowych tensora naprężeń wyznaczanych w czasie k t (kolor czarny) Fig. 2.3. Staggered grid computational grid. Velocity components for (k+1/2) t time step calculated from the same previous time step components and k t time step stress tensor components 3. Możliwości przyspieszenia obliczeń Jak wykazano w poprzednim rozdziale praktyczne wykorzystanie ogromnych możliwości jakie dają modelowaia pól falowych jest bardzo silnie ograniczane ich dużą czasochłonnością oraz wysokimi wymaganiami jakie stawiają one środowiskom obliczeniowym. Nawet bardzo znaczny wzrost mocy obliczeniowych komputerów w połączeniu z efektywnymi algorytmami nie jest wystarczający dla uzyskania rezultatów modelowań w czasie zbliżonym do tego, jaki 147

WARSZTATY 2010 z cyklu: Zagrożenia naturalne w górnictwie zapewnia metoda trasowania promienia sejsmicznego. Dlatego też podejmowane są liczne próby ograniczenia czasu obliczeń, a tym samym uczynienia tego narzędzia bardziej powszechnym w praktyce sejsmicznej. Aktualne najlepsze rezultaty uzyskiwane są poprzez zastosowanie obliczeń równoległych. Szczególnie dotyczy to obliczeń realizowanych w klastrach komputerów typu PC, które stanowią tanią i efektywną alternatywę dla superkomputerów oraz wykorzystania procesorów kart graficznych. Kluczowym zagadnieniem, wpływającym na efektywność algorytmów równoległych jest dekompozycja zadania obliczeniowego oraz dobór odpowiednich narzędzi umożliwiających realizację obliczeń w równoległym środowisku obliczeniowym. Dla równoległej implementacji algorytmu modelowania pola falowego stosuje się dwie strategie podziału: dekompozycje trywialną i dekompozycję domenową. W podziale trywialnym zadanie obliczeniowe jest podzielone na równe, co do wielkości podzadania. Każde z wydzielonych części liczone jest przez osobny proces i nie istnieje konieczność komunikowania się procesów podczas całego cyklu obliczeń. Podział domenowy dopuszcza zmienny rozmiar podzadań i wymagał implementacji mechanizmu komunikacji pomiędzy jednostkami obliczeniowymi. Schemat obliczeń równoległych dla obu typów dekompozycji przedstawiono na rysunku 3.1. a) b) program program proces1 proces2 proces3 proces4 proces1 proces2 proces3 proces4 program komunikacyjny program komunikacyjny proces4 proces3 proces2 proces1 proces4 proces3 proces2 proces1 program komunikacyjny program komunikacyjny konsola wynik konsola wynik Rys. 3.1. Schemat podziału i komunikacji przy dekompozycji trywialnej (a) i dekompozycji domenowej (b). (Pięta, 2007 ) Fig. 3.1. Communication and decomposition schemes. (a) trivial decomposition, (b) domain decomposition. (Pięta, 2007) 148

A. LEŚNIAK, T. DANEK, A. PIĘTA - Kierunki rozwoju modelowań numerycznych... W dekompozycji trywialnej współrzędne punktów wzbudzania fali sejsmicznej są podzielone pomiędzy wszystkie biorące udział w obliczeniach procesory. Każdy węzeł obliczeniowy modeluje odpowiedź całego rozważanego ośrodka na falę wzbudzaną w różnych jego punktach (rys. 3.2). Ten sposób podziału można obrazowo nazwać podziałem typu: jeden punkt strzałowy jeden procesor (1PS-1PC). W dekompozycji domenowej modelowany obszar dzielony jest na mniejsze poddomeny, których rozmiar i ilość zależy od rozmiarów środowiska obliczeniowego. Każdy z procesorów modeluje rozchodzenie się fali sejsmicznej wzbudzanej w różnych punktach strzałowych tylko we własnej poddomenie (rys. 3.2b). W odróżnieniu od dekompozycji homogenicznej, w podziale heterogenicznym rozmiar poddomen jest sobie równy tylko dla szczególnych rozmiarów ośrodka obliczeniowego. a) PS1 PS2 PS3 b) D1 D2 D3 Rys. 3.2. Dekompozycja 1PS-1PC (a) oraz dekompozycja domenowa (b). PS1, PS2, PS3 dekompozycja za pomocą kolejnych punktów strzałowych; D1, D2, D3 kolejne domeny obliczeniowe. (Danek, 2004]) Fig. 3.2. 1PS-1PC (One shoot point one PC) decomposition (a) and domain decomposition (b). PS1, PS2, PS3 shoot point based decomposition; D1, D2, D3 consecutive computational domains. (Danek, 2004) Przy określaniu wydajności równoległych algorytmów modelowania pola sejsmicznego wykorzystuje się skalowalność klastra obliczeniowego. Zakłada się stały rozmiar problemu obliczeniowego realizowanego w klastrze o zmieniającej się liczbie procesorów. Dla przykładu, gdy oba sposoby dekompozycji realizowane są dla identycznych dwuwarstwowych modeli geologicznych i dla takiego samego zestawu parametrów modelowania (Tabela 3.1), możliwe jest przedstawienie różnic pomiędzy obiema sposobami dekompozycji. 149

WARSZTATY 2010 z cyklu: Zagrożenia naturalne w górnictwie Tabela 3.1. Zestawienie parametrów modelu. Table 3.1. Modeling parameters. Parametry Wymiary ośrodka [m] Wartości 500x500 Krok obliczeń (odległość między kolejnymi węzłami obliczeniowymi) [m] 1 Głębokość granicy odbijającej [m] 250 Prędkość fali w nadkładzie v1 [m/s] 1000 Prędkość fali w warstwie dolnej v2 [m/s] 2000 Współrzędne pierwszego punktu strzałowego[m] x=200, z=20 Odległości między punktami strzałowymi [m] x=10, z=0 Ilość punktów strzałowych 20 Czas końcowy [s] 0,5 Krok próbkowania [s] 0,002 Wykres czasu obliczeń akustycznego równania falowego dla podziału 1PS-1PC i dekompozycji domenowej w zależności od ilości procesorów wchodzących w skład klastra komputerowego przedstawiono na rys. 3.3 6000 czas [s] 5000 4000 3000 2000 1000 1000 800 600 400 200 0 10 11 12 13 14 15 16 17 18 19 20 21 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 ilość procesorów domenowa 1PS -1PC Rys. 3.3. Zmiana czasu obliczeń dekompozycji domenowej i dekompozycji 1PS-1PC w zależności od ilości procesorów (Franczyk, 2004) Fig. 3.3. Computational times of 1PS-1PC and domain decompositions for different number of processors (Franczyk, 2004) Dla uwypuklenia różnic w całkowitym czasie obliczeń, powiększono część wykresu odpowiadającą zmianie czasu dla klastrów o największych rozmiarach, które brały udział w eksperymencie numerycznym. Dla obu dekompozycji, obserwuje się ciągły spadek czasu 150

A. LEŚNIAK, T. DANEK, A. PIĘTA - Kierunki rozwoju modelowań numerycznych... obliczeń. W dekompozycji domenowej spadek czasu obliczeń ma ciągły, równomierny charakter, w dekompozycji 1PS-1PC krzywa czasu maleje w sposób schodkowy, a szybkość jej spadku jest obserwowalnie większa (Danek, Franczyk 2004; Franczyk, 2004). Kolejnym składnikiem testowanym pod kontem zwiększenia efektywności obliczeń było zastosowanie różnych technik programowania równoległego: bibliotek PVM (Parallel Virtual Machine) oraz MPI (Message Passing Interface). Na rysunku 3.4 przedstawiono porównanie czasów obliczeń realizacji równoległej przy wykorzystaniu obu bibliotek. Modelowania przeprowadzono dla przypadku akustycznego i dekompozycji domenowej dla ośrodka geologicznego, którego parametry zestawiono w tabeli 3.1. 3500 3000 2500 Czas [s] 2000 1500 1000 500 0 1 2 3 4 5 6 7 8 9 10 Liczba procesorów Rys. 3.4. Relacja pomiędzy liczbą procesorów a czasem obliczeń w przypadku akustycznym i dekompozycji domenowej przy zastosowaniu PVM (białe słupki) i MPI (czarne słupki) (Danek, Franczyk 2004) Fig. 3.4. Relation between number of processors and computational times in case of acoustic modeling using PVM (white bars) and MPI (black bars) (Danek, Franczyk 2004) Analiza czasów obliczeń przedstawiona na powyższym wykresie pozwala wysnuć wniosek, że dla modelowania pola falowego, realizowanego w klastrach komputerów osobistych bardziej efektywne jest wykorzystanie biblioteki MPI (Danek, Franczyk 2004). Dotychczas najczęściej stosowanym sposobem ograniczenia czasochłonności obliczeń było stosowanie obliczeń równoległych i rozproszonych. Ostatnio pojawiła się jednak atrakcyjna alternatywa w postaci obliczeń z wykorzystaniem kart graficznych (GPU) (Danek 2009). Obliczenia takie początkowo bazowały na wykorzystaniu technologii grafiki komputerowej takich jak OpenGL i DirectX. Z czasem pojawiły się jednak dedykowane obliczeniom wysokiej wydajności technologie takie jak Nvidia CUDA. Uczyniło to oprogramowywanie tego rodzaju zagadnień znacznie prostszym i efektywniejszym. Jednocześnie ogromny wzrost wymagań sprzętowych dla gier i innych aplikacji multimedialnych spowodował dynamiczny przyrost wydajności hardware u kart graficznych. Średniej klasy karta graficzna kosztująca około 100 $ wyposażona jest obecnie w 200 i więcej rdzeni, co w porównaniu z 6 rdzeniami najnowocześniejszych i niezwykle drogich CPU jest prawdziwą przepaścią technologiczną. 151

WARSZTATY 2010 z cyklu: Zagrożenia naturalne w górnictwie Oczywiście technologia ta ma też swoje ograniczenia. W przypadku modelowań pola falowego jest nim przede wszystkim ilość pamięci (maksymalnie kilka GB). Na rysunku 3.5 przedstawiono porównanie czasów obliczeń pojedynczego rdzenia nowoczesnego procesora Intel Core2 oraz karty graficznej Qudro4 1600M (wersja mobilna) i wydajnej karty Nvidia GTX 260. Periodyczny charakter przyspieszeń dla karty Qudaro4 jest typowy dla starszych kart graficznych wyposażonych w mniejszą liczbę multiprocesorów. W chwili obecnej wydaje się, że obliczenia z wykorzystaniem wielu kart graficznych (multigpu) i heterogenicznych platform złożonych z wielu CPU i GPU stanowią przyszłość wydajnego modelowania pełnego pola falowego w złożonych ośrodkach geologicznych. 10 Qudaro4 GTX 260 CPU 1 Czas [s.] 0.1 0.01 0 100 200 300 400 500 600 Liczba wątków w bloku obliczeniowym Rys. 3.5. Czas obliczeń pojedynczego modelu z wykorzystaniem różnych platform obliczeniowych Fig. 3.5. Single model computational times for different hardware platforms. 4. Zakończenie Przedstawione powyżej przykłady prowadzą w sposób oczywisty do kilku wniosków istotnych z punktu widzenia zastosowań praktycznych. - Dalszy rozwój masowych obliczeń w sejsmice i sejsmologii górniczej i inżynierskiej nie jest możliwy, gdy obliczenia te będą prowadzone na komputerach pracujących w sposób sekwencyjny jedynym wyjściem jest użycie na szerszą skalę obliczeń równoległych. - Z uwagi na koszty jedyną realną realizacją praktyczną tego typu obliczeń jest wykorzystanie obliczeń rozproszonych w heterogenicznej sieci wieloprocesorowych komputerów połączonych siecią o wysokiej przepustowości. - W wypadku szczególnie intensywnych modelowań (np. na potrzeby inwersji pełnego pola falowego) obliczenia należy prowadzić z wykorzystaniem technologii GPGPU (obliczenia wykonywane z użyciem procesorów kart graficznych). 152

A. LEŚNIAK, T. DANEK, A. PIĘTA - Kierunki rozwoju modelowań numerycznych... Warto jeszcze raz podkreślić, że nowoczesne rozwiązania hardewareowe z upływem czasu stają się bardzo atrakcyjne z uwagi na szybko malejące koszty zakupu odpowiedniego sprzętu i jedynym problemem, jaki należy rozwiązać jest odpowiednie oprogramowanie, pozwalające realizować omawiane powyżej zadania. Obliczenia równoległe realizowane zarówno na pojedynczym, wieloprocesorowym (wielordzeniowym) komputerze jak i na klastrze komputerów jeszcze niedawno były w sferze zainteresowania specjalistów z wybranych dziedzin, głównie o profilu akademickim lub naukowym. W chwili obecnej lawinowy wzrost zapotrzebowania na prowadzenie obliczeń w czasie rzeczywistym w wielu gałęziach gospodarki i przemysłu, w tym przemysłu surowcowego i wydobywczego, wymusza szersze zainteresowanie technologią obliczeń równoległych prowadzonych w środowiskach heterogenicznych i wdrażaniem tych rozwiązań do codziennej praktyki przemysłowej. Literatura [1] Danek T., 2004: Numeryczne modelowanie sejsmicznego pola falowego z wykorzystaniem obliczeń równoległych, mat. konf. Konferencja Naukowo Techniczna GEOPETROL, Zakopane, 215-220. [2] Danek T., 2005: Modelowania sejsmicznego pola falowego w ośrodkach anizotropowych z wykorzystaniem obliczeń równoległych, KK KOWBAN, Wydawnictwo WTN, 87-92. [3] Danek T., 2009: Seismic wave field modeling with graphics processing units, Lecture Notes in Computer Science,. 5545. [4] Danek T., Franczyk A., 2004: Modelowania numeryczne sejsmicznego pola falowego z wykorzystaniem klastrów PC, XI KK KOWBAN, Wydawnictwo WTN, 199 204. [5] Danek T., Franczyk A., 2004: Parallel and distributed seismic wave field modelling, Task Quarterly 8, 4, 573-581. [6] Franczyk A., 2004: Analiza wydajności klastrów PVM w modelowaniu pola falowego., mat. konf. Konferencja Naukowo Techniczna GEOPETROL Zakopane, 299-303. [7] Levander A, 1988: Fourth-odrer finie-difference P-SV seismograms, Geophysics, 53-11, 1425-1436 [8] Pięta, A. 2007: Zastosowanie obliczeń w środowisku rozproszonym w wybranych zagadnieniach Nauk o Ziemi, AGH, Kraków (praca doktorska) [9] Virieux J. 1986: P-SV wave propagation in heterogeneous media: Velocity-stress finite-difference method. Geophysics, 51 4, 889-901. Key words Progress of seismic wave field numerical modeling. Numerical modeling of wave field, parallel computing, 3D modeling, anisotropy. Abstract In this paper recent progress in full wave form seismic modeling was presented. The main stress was put on using this technique in exploration seismic, mine seismic and seismology. The most important reasons of this progress were dynamic development of numerical algorithm and computer methods. Possibility of using parallel, distributed and heterogeneous computational environment was critical. Increased computational power and development of computer hardware were additional factors. All of this allowed modeling for real anisotropic 3D media in acceptable times. 153