PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH**

Podobne dokumenty
PRÓBA ZASTOSOWANIA SIECI NEURONOWYCH DO PROGNOZOWANIA OSIADAŃ POWIERZCHNI TERENU POWSTAŁYCH NA SKUTEK EKSPLOATACJI GÓRNICZEJ**

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Zastosowania sieci neuronowych

Sztuczne Sieci Neuronowe. Wiktor Tracz Katedra Urządzania Lasu, Geomatyki i Ekonomiki Leśnictwa, Wydział Leśny SGGW

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Sieci neuronowe jako sposób na optymalizacje podejmowanych decyzji. Tomasz Karczyoski Wydział W-08 IZ

Sztuczne sieci neuronowe

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

ZACHODNIOPOMORSKI UNIWERSYTET TECHNOLOGICZNY W SZCZECINIE

Sztuczne sieci neuronowe

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

I EKSPLORACJA DANYCH

Uczenie sieci radialnych (RBF)

Uczenie sieci typu MLP

Optymalizacja optymalizacji

SIECI RBF (RADIAL BASIS FUNCTIONS)

Rozdział 1 Sztuczne sieci neuronowe. Materiały do zajęć dydaktycznych - na podstawie dokumentacji programu Matlab opracował Dariusz Grzesiak

PRZEWODNIK PO PRZEDMIOCIE

synaptycznych wszystko to waży 1.5 kg i zajmuje objętość około 1.5 litra. A zużywa mniej energii niż lampka nocna.

8. Neuron z ciągłą funkcją aktywacji.

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

ELEMENTY SZTUCZNEJ INTELIGENCJI. Sztuczne sieci neuronowe

Literatura. Sztuczne sieci neuronowe. Przepływ informacji w systemie nerwowym. Budowa i działanie mózgu

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Wstęp do sztucznych sieci neuronowych

SIEĆ NEURONOWA JAKO NARZĘDZIE APROKSYMACJI I KLASYFIKACJI DANYCH. Jakub Karbowski Gimnazjum nr 17 w Krakowie

Sieci neuronowe w Statistica

Sztuczne sieci neuronowe (SNN)

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych.

Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, Spis treści

Emergentne właściwości. sztucznych sieci neuronowych

Metody Sztucznej Inteligencji II

Widzenie komputerowe

WYKORZYSTANIE MODELI SIECI NEURONOWYCH DO IDENTYFIKACJI SKŁADU LITOLOGICZNEGO RUDY MIEDZI**

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

METODY INŻYNIERII WIEDZY

HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Zastosowania sieci neuronowych

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010

Projekt Sieci neuronowe

Przykładowe funkcje przejścia używane przy budowie sztucznych neuronów

Inteligentne systemy przeciw atakom sieciowym

Podstawy sztucznej inteligencji

Temat: Sieci neuronowe oraz technologia CUDA

Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.

Sztuczne sieci neuronowe i sztuczna immunologia jako klasyfikatory danych. Dariusz Badura Letnia Szkoła Instytutu Matematyki 2010

PRZEWODNIK PO PRZEDMIOCIE

ZASTOSOWANIE SIECI NEURONOWYCH DO OPTYMALIZACJI WARUNKÓW OBRÓBKI CIEPLNEJ STOPÓW Mg-Al

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

wiedzy Sieci neuronowe

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

SZTUCZNE SIECI NEURONOWE W MODELOWANIU ZJAWISK ZACHODZĄCYCH NA RYNKU NIERUCHOMOŚCI

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2013/2014

tylko nieliniowe, ale wręcz wielowartościowe funkcje. Narzędzie to daje więc olbrzymie możliwości. Dotychczas sztuczne sieci neuronowe skutecznie

Sieć przesyłająca żetony CP (counter propagation)

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Wstęp do sieci neuronowych, wykład 6 Wsteczna propagacja błędu - cz. 3

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Podstawy Sztucznej Inteligencji Sztuczne Sieci Neuronowe. Krzysztof Regulski, WIMiIP, KISiM, B5, pok. 408

KARTA PRZEDMIOTU. 2. Kod przedmiotu: NIz-BPiOP/32

SIECI NEURONOWE Liniowe i nieliniowe sieci neuronowe

Inteligentne systemy informacyjne

Sztuczna inteligencja

Adrian Horzyk

Systemy uczące się Lab 4

Seminarium magisterskie. Dyskusja nad tematem pracy magisterskiej pisanej pod kierunkiem pani Dr hab. Małgorzaty Doman

Lekcja 5: Sieć Kohonena i sieć ART

Uczenie sieci neuronowych i bayesowskich

Podstawy sztucznej inteligencji

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

1. Logika, funkcje logiczne, preceptron.

Sztuczne sieci neuronowe. Uczenie, zastosowania

wiedzy Sieci neuronowe (c.d.)

1. Wstęp. 2. Sformułowanie problemu

MODELOWANIE RZECZYWISTOŚCI

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Podstawy Sztucznej Inteligencji (PSZT)

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Obliczenia Naturalne - Sztuczne sieci neuronowe

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0

SZTUCZNA INTELIGENCJA

Podstawy Sztucznej Inteligencji

Sztuczne siei neuronowe - wprowadzenie

Informatyka I stopień (I stopień / II stopień) ogólno akademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

KARTA PRZEDMIOTU. 2. Kod przedmiotu: SI-BPiOP/33

Metody klasyfikacji i rozpoznawania wzorców. Najważniejsze rodzaje klasyfikatorów

Transkrypt:

Górnictwo i Geoinżynieria Rok 31 Zeszyt 3 2007 Dorota Pawluś* PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH** 1. Wstęp Eksploatacja górnicza złóż ma niekorzystny wpływ na powierzchnię i znajdujące się na niej obiekty budowlane. Wydobycie kopalin użytecznych spod terenów zagospodarowanych, a także tendencja do minimalizacji ujemnych skutków podziemnej eksploatacji w środowisku człowieka spowodowały w Polsce, tak jak i w świecie, rozwój wiedzy dotyczącej wpływu podziemnej eksploatacji górniczej na powierzchnie i znajdujące się na niej obiekty. Powstało wiele metod obliczania deformacji, których podstawę stanowią wzory empiryczne bądź wzory będące wynikiem uogólnień i dedukcji [1, 2]. Artykuł dotyczy zastosowania sieci neuronowych do przewidywania osiadań powierzchni terenu powstałych w wyniku eksploatacji górniczej. Celem pracy było utworzenie sieci, które miały wyznaczać obniżenia terenu na podstawie danych dotyczących planowanej eksploatacji, takich jak: głębokość i grubość pokładu, położenie, wielkość oraz kształt pola eksploatacyjnego, a także kąt zasięgu wpływów głównych oraz współczynnik eksploatacji (parametry zdefiniowane w teorii Budryka Knothego). Dane do uczenia sieci uzyskano z modeli teoretycznych. Wartości osiadań obliczono na podstawie teorii Budryka Knothego. Do tworzenia sieci neuronowych wykorzystano pakiet Statistica. Do obliczenia osiadań powierzchni dla modeli teoretycznych skorzystano z programów z pakietu bk (biblioteka niecka) [4]. 2. Sieci neuronowe budowa i działanie Sieci neuronowe od wielu lat są z powodzeniem stosowane do rozwiązywania niezwykle szerokiego zakresu problemów. Znajdują zastosowanie w rozpoznawaniu i klasyfikacji * Wydział Górnictwa i Geoinżynierii, Akademia Górniczo-Hutnicza, Kraków ** Artykuł powstał na podstawie badań w ramach prac statutowych AGH na 2007 r., nr 11.11.100.588 329

wzorców (przydzielaniu wzorcom kategorii), predykcji szeregów czasowych, analizie danych statystycznych, odszumianiu i kompresji obrazu i dźwięku oraz w zagadnieniach sterownia i automatyzacji [6]. Sieć neuronowa jest uproszczonym modelem ludzkiego mózgu. Składa się ona często z dużej liczby (nawet do kilkudziesięciu tysięcy) elementów przetwarzających informacje. Elementy te nazywane są neuronami. Neurony (rys. 1) są powiązane w sieć za pomocą połączeń o parametrach (zwanych wagami) modyfikowanych w trakcie procesu uczenia. Topologia połączeń oraz ich parametry stanowią program działania sieci, zaś sygnały pojawiające się na jej wyjściach w odpowiedzi na określone sygnały wejściowe są rozwiązaniami stawianych jej zadań [3]. Neurony są elementami, z których buduje się sieci, charakteryzują się występowaniem wielu wejść i jednego wyjścia. Rys. 1. Model neuronu Najpierw sygnały wejścia są mnożone przez wagi i przekazywane do sumatora, który oblicza potencjał i-tego neuronu [5] u n = x w (1) i j ij i= 1 Często wprowadza się dodatkowy składnik, tzw. bias, który pełni rolę wartości progowej. Jest on dodawany do wartości potencjału. Potencjał u jest przetwarzany na sygnał wyjściowy y w następujący sposób: y = F(u), gdzie F(u) funkcja aktywacji. Sposoby połączeń neuronów między sobą i ich wzajemne współdziałania spowodowały powstanie różnych typów sieci. Każdy typ sieci jest z kolei ściśle powiązany z odpowiednią metodą doboru wag (uczenia). Do rozwiązania przedstawionego w artykule zadania dotyczącego prognozowania osiadań powierzchni użyto sieci wielowarstwowych, jednokierunkowych (jednokierunkowy przepływ sygnału od neuronów wejściowych do wyjściowych) uczonych metodą pod nadzorem. 330

Sieci jednokierunkowe wielowarstwowe (nazywane często perceptronem wielowarstwowym) zawierają co najmniej jedną warstwę ukrytą neuronów, która pośredniczy w przekazywaniu sygnałów między węzłami wejściowymi a warstwą wyjściową. Sygnały wejściowe przekazywane są na pierwszą warstwę ukrytą, która z kolei stanowi źródło sygnałów dla kolejnej warstwy. Przykład sieci jednokierunkowej wielowarstwowej przedstawiono na rysunku 2. Rys. 2. Sieć jednokierunkowa wielowarstwowa Najbardziej pożądaną cechą sieci neuronowej jest zdolność generalizacji nabytej w procesie uczenia wiedzy na nowe przypadki. Zastosowanie do uczenia sieci jednego zbioru danych może doprowadzić do przeuczenia sieci, tj. zbytniego dopasowania do konkretnych przypadków. W celu uniknięcia takiej sytuacji wydziela się ze zbioru uczącego zbiór sprawdzający (walidacyjny). Dane należące do tego zbioru nie są bezpośrednio używane w trakcie uczenia sieci, są natomiast wykorzystywane do przeprowadzania niezależnej kontroli postępów uczenia. Aby zwiększyć poziom zaufania do ostatecznego modelu sieci, zwykle wydziela się ze zbioru uczącego (o ile jego wielkość na to pozwala) dodatkowo trzeci zbiór zwany zbiorem testującym. Ostatecznie sieć nauczona na podstawie zbioru uczącego i sprawdzona za pomocą zbioru walidacyjnego jest dodatkowo testowana za pomocą zbioru testowego. 331

Przy tworzeniu zbiorów uczącego, walidacyjnego oraz testowego bardzo ważne jest, aby dane należące do tych zbiorów były reprezentatywne dla opisywanej zależności. Jest to istotne i często bardzo trudne zadanie, zwłaszcza w przypadku niewielkiej liczbie dostępnych danych [6]. 3. Zastosowanie sieci neuronowych do prognozowania osiadań powierzchni Rozważono następujące zadanie: należało przewidzieć osiadania powierzchni w zadanych punktach wybranego obszaru na podstawie następujących danych: głębokość i grubość pokładu, położenie pola eksploatacyjnego, kąt zasięgu wpływów głównych β, współczynnik eksploatacji a. Do utworzenia zbiorów uczącego i walidacyjnego wzięto pod uwagę dane z pól eksploatacyjnych usytuowanych w środku prostokątnego obszaru o szerokości 2000 m i długości 3000 m. Szerokości i długości pól są przedstawione w tabeli 1. Dla każdego pola przyjęto trzy wartości grubość eksploatacji: 3, 4 i 6 m, oraz trzy wartości głębokości: 300, 500 i 800 m. Przyjęto współczynnik eksploatacji a = 0,8 oraz trzy wartości kąta zasięgu wpływów głównych β 54, 60 i 70. TABELA 1 Szerokości i długości pól eksploatacyjnych wykorzystanych do utworzenia danych do uczenia i sprawdzania sieci neuronowych Szerokość pola, m 100 100 200 200 250 250 400 400 300 Długość pola, m 400 1000 400 1000 600 1500 600 1500 1500 Początkowo punkty na powierzchni, dla których znano wielkość osiadania, rozmieszczono na obszarze 2000 3000 m na równomiernej siatce o gęstości 40 60. Łączna liczba wzorców w zbiorach uczącym, walidacyjnym oraz testującym wyniosła więc 583 200 (9 3 3 3 40 60). Niestety ze względu na moc obliczeniową posiadanego komputera trzeba było znacznie zredukować ilość danych. Biorąc pod uwagę fakt, że pola eksploatacyjne leżą w środku zadanego obszaru oraz są symetryczne względem linii 1, 2 (rys. 3), do zbiorów przyjęto punkty leżące na obszarze o wymiarach 1000 1500 m (x od 0 do 1000 m, y od 0 do 1500 m). Jako wartości wejściowe do sieci przyjęto: d1, d2, d3, d4 odległości pomiędzy punktem, dla którego wyznaczamy osiadanie, a wierzchołkami wybranego pola eksploatacyjnego, S pole powierzchni wybranego obszaru, G współczynnik zdefiniowany wzorem 332

gdzie: gdzie: G = a g, a współczynnik eksploatacji, g grubość pokładu, r współczynnik zdefiniowany wzorem r = ctgβ H głębokość, β kąt zasięgu wpływów głównych. Rys. 3. Układ linii nad polem 1 W związku z ograniczeniem danych w zbiorach uczącym i walidacyjnym do jednej ćwiartki pola eksploatacyjnego wielkości d1, d2, d3, d4 zostały posortowane rosnąco. Rozwiązania zadania szukano wśród sieci liniowych, wielowarstwowych (MLP) oraz sieci o radialnych funkcjach bazowych (RBF). Sieci, dla których uzyskano zadowalające wyniki, były sprawdzane za pomocą zbioru testującego zawierającego dane, które nie były użyte w procesie uczenia i sprawdzania sieci. Dane dotyczące pól eksploatacyjnych, na pod- 333

stawie których utworzono zbiór testujący, umieszczono w tabeli 2. Dla każdego pola przyjęto współczynnik eksploatacji a = 0,8 oraz trzy wartości kąta zasięgu wpływów głównych β 54, 60 i 70. Punkty, dla których wyznaczano osiadania, rozmieszczono na obszarze 2000 m na 3000 m na równomiernej siatce o gęstości 40 60. TABELA 2 Dane dotyczące pól eksploatacyjnych wykorzystanych do utworzenia zbioru testującego sieć neuronową Numer pola Pole 1 Pole 2 Pole 3 Pole 4 Pole 5 Pole 6 Pole 7 Szerokość pola, m 250 250 250 300 300 150 150 Długość pola, m 700 700 700 1200 1200 1100 1100 Głębokość eksploatacji, m 550 350 350 600 450 350 525 Grubość pokładu, m 6 3 5 4.5 3 3.5 4 Najlepsze wyniki otrzymano dla sieci MLP o architekturze 6 34 29 1 (czyli mającej dwie warstwy ukryte zawierające odpowiednio 45 i 30 neuronów) uczonej algorytmem wstecznej propagacji błędów przez 100 epok oraz metodą gradientów sprzężonych przez 64 epoki. Na rysunkach 4 i 5 przedstawiono wybrane wyniki uzyskane przy użyciu sieci dla danych ze zbioru testowego. Wykresy zawierają osiadania wyznaczone dla punktów leżących na dwóch liniach nad polem 1. Do obliczeń przyjęto a = 0,8, β = 60. Układ linii pokazano na rysunku 3. Rys. 4. Porównanie wyników wyznaczonych za pomocą sieci neuronowej z danymi teoretycznymi dla punktów leżących na linii 1 334

Rys. 5. Porównanie wyników wyznaczonych za pomocą sieci neuronowej z danymi teoretycznymi dla punktów leżących na linii 2 4. Podsumowanie Artykuł prezentuje etap pracy nad utworzeniem sieci neuronowych prognozujących osiadania powierzchni terenu. Otrzymane wyniki są zadowalające, choć uzyskana sieć nie rozwiązuje jeszcze całkowicie zadanego problemu i posiada pewne ograniczenia. Zawężenie wzorców uczących do punktów leżących w jednej ćwiartce obszaru zawierającego pole eksploatacyjne pozwoliło wyeliminować powtarzające się dane i nie wpłynęło niekorzystnie na proces uczenia. Znacznie natomiast zmniejszył się czas uczenia sieci. Dane do uczenia sieci uzyskano z obszarów zawierających pola eksploatacyjne o kształcie prostokąta. Ogranicza to możliwość zastosowania uzyskanej sieci neuronowej do pól eksploatacyjnych o nieregularnych kształtach lub pól nie będących czworokątami. Rozwiązaniem tego problemu może być zastąpienie danego pola układem prostokątnych pól. Dlatego dalsze badania mają na celu znalezienie sieci lub zespołu sieci, które wyznaczałyby osiadania powierzchni dla obszaru zawierającego więcej niż jedno pole eksploatacyjne. LITERATURA [1] Kwiatek J.: Ochrona obiektów budowlanych na terenach górniczych. Katowice, WGIG 1997 [2] Ochrona powierzchni przed szkodami górniczymi. Katowice, Wydawnictwo Śląsk 1980 [3] Tadeusiewicz R.: Sieci neuronowe. Warszawa, Akademicka Oficyna Wydawnicza RM 1993 [4] Flisiak J.: Zastosowanie mikrokomputerów do prognozowania deformacji górotworu. Zeszyty Naukowe AGH, Górnictwo,142, 1989, 129 144 [5] Rutkowska D., Piliński M., Rutkowski L.: Sieci neuronowe, algorytmy genetyczne i systemy rozmyte. Warszawa, PWN 1997 [6] Wprowadzenie do sieci neuronowych. Kraków, StatSoft Polska Sp. z o.o. 2001 335