PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN



Podobne dokumenty
TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING

TWORZENIE I STOSOWANIE MODELU DATA MINING ZA POMOCĄ PRZEPISÓW STATISTICA DATA MINER NA PRZYKŁADZIE WYKRYWANIA NADUŻYĆ

Zastosowania sieci neuronowych

PROGNOZOWANIE Z WYKORZYSTANIEM UCZENIA MASZYN

Sieci neuronowe w Statistica

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

DATA MINING W STEROWANIU PROCESEM (QC DATA MINING)

Wprowadzenie do analizy korelacji i regresji

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING

ALGORYTM RANDOM FOREST

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Drzewa decyzyjne i lasy losowe

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Projekt Sieci neuronowe

JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI

Wykład 4: Statystyki opisowe (część 1)

PRZYKŁAD TWORZENIA KART KONTROLNYCH W STATISTICA

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Testy nieparametryczne

Zastosowania sieci neuronowych

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Regresja linearyzowalna

Maszyny wektorów podpierajacych w regresji rangowej

Sterowanie wielkością zamówienia w Excelu - cz. 3

Statystyka i Analiza Danych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

5. Model sezonowości i autoregresji zmiennej prognozowanej

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Rozdział 8. Regresja. Definiowanie modelu

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań

Wprowadzenie do analizy dyskryminacyjnej

3. Modele tendencji czasowej w prognozowaniu

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

MODELE LINIOWE. Dr Wioleta Drobik

PRZYKŁAD WDROŻENIA KART KONTROLNYCH KROK PO KROKU

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

Wykład 5: Statystyki opisowe (część 2)

Analiza regresji - weryfikacja założeń

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań

ZARZĄDZANIE DANYMI W STATISTICA

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

CO STATYSTYKA I WYKRESY MOGĄ POWIEDZIEĆ O PROCESIE?

You created this PDF from an application that is not licensed to print to novapdf printer (

Optymalizacja ciągła

Metody Sztucznej Inteligencji II

Michał Kusy, StatSoft Polska Sp. z o.o.

Podstawy Sztucznej Inteligencji (PSZT)

Analiza Statystyczna

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Straszyński Kołodziejczyk, Paweł Straszyński. Wszelkie prawa zastrzeżone. FoamPro. Instrukcja obsługi

Wstęp do sieci neuronowych, wykład 6 Wsteczna propagacja błędu - cz. 3

ZASTOSOWANIE TECHNIK DATA MINING W BADANIACH NAUKOWYCH

PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

PRZYKŁAD AUTOMATYZACJI STATYSTYCZNEJ OBRÓBKI WYNIKÓW

Rys.1. Uaktywnianie pasków narzędzi. żądanych pasków narzędziowych. a) Modelowanie części: (standardowo widoczny po prawej stronie Przeglądarki MDT)

Algorytmy sztucznej inteligencji

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Weryfikacja hipotez statystycznych

WEKA klasyfikacja z użyciem sztucznych sieci neuronowych

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Sposoby prezentacji problemów w statystyce

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza składowych głównych. Wprowadzenie

Ćwiczenie 12. Metody eksploracji danych

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

METODY STATYSTYCZNE W BIOLOGII

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

MODELOWANIE PROCESÓW PRODUKCYJNYCH

6.4. Efekty specjalne

Analiza danych. TEMATYKA PRZEDMIOTU

STATISTICA DATA MINER I STATISTICA ENTERPRISE SPOSÓB NA SZYBKĄ BUDOWĘ I WDRAŻANIE MODELI

SZYBKA ŚCIEŻKA OD BAZ DANYCH I LIMS DO RAPORTÓW, CZYLI STATISTICA ENTERPRISE W DZIAŁANIU

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

4. Średnia i autoregresja zmiennej prognozowanej

WSPIERANIE ZADAŃ ANALITYCZNYCH Z ZASTOSOWANIEM STATISTICA NA PRZYKŁADZIE BIOTON S.A.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Transkrypt:

PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN Tomasz Demski, StatSoft Polska Sp. z o.o. Przewidywanie właściwości produktu na podstawie składu surowcowego oraz parametrów przebiegu procesu wytwórczego może znaleźć bardzo wiele zastosowań: od optymalizacji receptur i ustawień procesu, po symulację i dostrajanie procesu na bieżąco. Złożoność procesów, wielka liczba parametrów i pomiarów powodują, że do budowy modeli prognostycznych szczególnie dobrze nadają się techniki uczenia maszyn. W wystąpieniu przedstawiony zostanie przykład tworzenia modelu z wykorzystaniem wybranych technik uczenia maszyn: sieci neuronowych i drzew wzmacnianych. Opis problemu i danych W celu zilustrowania wykorzystania uczenia maszyn do modelowania i przewidywania właściwości produktu stworzymy model wytrzymałości betonu wysokowartościowego (ang. high performance concrete). Skorzystamy z rzeczywistych danych udostępnionych w repozytorium [2] przez prof. I-Cheng Yeh [1]. Zagadnienie modelowania wytrzymałości betonu zostało omówione w pracy [1]. Mówiąc w skrócie, beton wysokowartościowy jest złożonym produktem i modelowanie jego wytrzymałości jest trudnym zadaniem. W szczególności zależności wiążące zawartość składników z wytrzymałością są silnie nieliniowe. Zgromadzone dane zawierają wyłącznie dane o składzie mieszanki, tymczasem na właściwości betonu wpływają również cechy składników, np. skład chemiczny cementu. Dlatego należy się spodziewać, iż model nie będzie idealny. Na potrzeby przykładu dane zostały nieco zmienione, tak aby móc pokazać pewne aspekty modelowania statystycznego oraz korzyści ze stosowania przestrzeni roboczej. Do dyspozycji mamy następujące zmienne: Cement zawartość cementu [kg/m 3 ], Slag zawartość żużla wielkopiecowego [kg/m 3 ], Fly Ash zawartość popiołu lotnego [kg/m 3 ], Water zawartość wody [kg/m 3 ], Superplasticizer ilość superplastyfikatora [kg/m 3 ], Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 55

Coarse ilość kruszywa gruboziarnistego [kg/m 3 ], Fine ilość kruszywa drobnoziarnistego [kg/m 3 ], Age liczba dni do testu [dni], Strength wytrzymałość na ściskanie [MPa], Status klasyfikacja pomiaru (zmienna dodana na potrzeby przykładu), wartość OK oznacza poprawny pomiar, a Bad niepoprawny, Próba wskaźnik próby uczącej i testowej (zmienna dodana na potrzeby przykładu). Zbiór danych zawiera 1030 prawidłowych pomiarów i 17 oznaczonych jako błędne (zmienna Status). Przed analizą oddzielimy błędne pomiary od prawidłowych. Zwróćmy uwagę, że w praktyce często mamy serie pomiarów, które wyłączamy z analiz: są to np. rozbiegówki (jednostki wytworzone przy uruchamianiu produkcji, gdy linia była dopiero ustawiana), wyniki testowych uruchomień linii produkcyjnej itp. Metody modelowania Naszym celem jest możliwie jak najdokładniejsze przewidywanie wytrzymałości betonu, natomiast model nie musi być łatwy w interpretacji. Dlatego zastosujemy dwie metody, które co prawda nie dają zrozumiałego modelu, ale są w stanie odtworzyć bardzo skomplikowane zależności: drzewa wzmacniane, sieci neuronowe. Poniżej pokrótce opisujemy metody modelowania. Więcej informacji o tych metodach można znaleźć w podręcznikach [3] i [4]. Drzewa wzmacniane (boosted trees) Bardzo ciekawą metodą są drzewa wzmacniane. Są one w stanie rozwiązywać złożone zadania, innym słowy odtwarzać bardzo skomplikowane zależności. Jednocześnie metoda ta dobrze radzi sobie z danymi kiepskiej jakości. Wzmacnianie polega na stosowaniu sekwencji prostych modeli, przy czym każdy kolejny model przykłada większą wagę do tych obserwacji, które zostały błędnie przewidziane przez poprzednie modele. Finalny model powstaje przez połączenie prognoz modeli składowych. W przypadku drzew wzmacnianych rolę składowych modeli pełnią drzewa decyzyjne złożone z kilku, co najwyżej kilkunastu węzłów. Sieci neuronowe Sieci neuronowe są bardzo popularną metodą. Inspiracją dla niej jest układ nerwowy zwierząt i ludzi. Sztuczną sieć neuronową tworzą połączone ze sobą jednostki sztuczne neurony. Poniżej widzimy schemat prostej sieci. 56 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2013

Rys. 1. Sieć neuronowa. Jeśli naszym zadaniem jest przewidywanie wartości zmiennej zależnej (wyjścia) na podstawie zmiennych niezależnych (wejść), to najczęściej stosujemy sieci złożone z warstw, a sygnał przechodzi z jednej warstwy do drugiej: są to tzw. sieci jednokierunkowe. Zazwyczaj sieć ma warstwę wejściową, jedną lub wiele warstw ukrytych oraz warstwę wyjściową. Jednostki warstwy wejściowej wstępnie przetwarzają zmienne niezależne modelu (najczęściej skalują je do przedziału [0,1]) i podają te wstępnie przetworzone wartości na wejścia jednostek warstwy ukrytej. Każda z jednostek warstwy ukrytej i wyjściowej ma wiele wejść i jedno wyjście. Na wejściach neuronu podajemy wyjścia innych neuronów. Każdemu wejściu przypisana jest waga. Uczenie sieci neuronowej polega właśnie na znalezieniu najlepszych wag. Opracowano wiele sposobów uczenia sieci, funkcji przejścia, dodatkowych przekształceń oraz technik umożliwiających uzyskania sieci. Z praktycznego punktu widzenia nie musimy się nimi zajmować, gdyż program STATISTICA sprawdza automatycznie wiele ustawień i wybiera najlepszą sieć. Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 57

Tworzenie modelu Analizę wykonamy w przestrzeni roboczej STATISTICA. Przestrzeń robocza to coś w rodzaju tablicy, na której umieszczamy ikony tzw. węzły oznaczające źródła danych, procedury analityczne i przekształcenia. Węzły łączymy strzałkami oznaczającymi przepływ danych. W ten sposób graficznie określamy wszystkie działania wymagane do wykonania kompletnej analizy. Przykładową przestrzeń widzimy na rys 2. Rys. 2. Przykładowa przestrzeń robocza. Przestrzeń roboczą zaprojektowano tak, aby zapewnić: proste i intuicyjne budowanie oraz modyfikowanie projektów analiz, możliwość szybkiego zorientowania się w działaniu nawet bardzo złożonego projektu, naturalne i bezproblemowe stosowanie uzyskanych modeli dla nowych danych. Tworzenie modelu zaczynamy od wstawienia źródła danych do przestrzeni roboczej. Następnie określimy zmienne. W naszym przypadku mamy (zob. opis zmiennych na str. 55): zmienną zależną ilościową Strength, predyktory (zmienne niezależne) ilościowe Cement, Slag, Fly Ash, Water, Superplasticizer, Coarse, Fine i Age. Ponadto mamy jeszcze zmienną Status informującą, czy dane są prawidłowe czy nie (zob. str. 56). Zmienną tę wybieramy na liście Zależne jakościowe. Wybór zmiennych widzimy na rys. 3. 58 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2013

Rys. 3. Określenie zmiennych. Aby rzetelnie ocenić uzyskane modele, podzielimy dane na próbę uczącą i testową. Na danych z próby uczącej zbudujemy model, natomiast dane z próby testowej użyjemy do sprawdzenia trafności przewidywań modelu. Podział przeprowadzimy w oparciu o zmienną Próba: jeśli przyjmuje ona wartość U, to przypadek trafi do próby uczącej, a jeśli T do testowej. Rys. 4. Wskaźnik próby testowej. Pierwszą operacją w naszej analizie będzie rozdzielenie poprawnych i błędnych danych. Wykorzystamy do tego celu węzeł Rozdziel według grup. Aby wstawić go do przestrzeni roboczej, klikamy przycisk Przeglądarka węzłów na pasku narzędzi przestrzeni roboczej. W przeglądarce przechodzimy do foldera Źródła danych i klikamy dwukrotnie węzeł Rozdziel według grup. Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 59

Rys. 5. Wstawianie węzła Rozdziel według grup. Wstawiony węzeł łączymy ze źródłem danych i uruchamiamy projekt. W wyniku program utworzy w przestrzeni roboczej dwa nowe źródła danych: beton (OK) i beton (Bad). Zauważmy, że nazwy źródeł danych zawierają etykiety klasy zmiennej Status, czyli informację, czy pomiar jest dobry, czy zły. Rys. 6. Przestrzeń robocza po utworzeniu statystyk opisowych i histogramów. Pierwszym krokiem każdej analizy jest wstępny ogląd danych. Wykonamy go za pomocą statystyk opisowych i histogramów. Do przestrzeni roboczej wstawiamy węzeł Statystyki opisowe z foldera Statystyka - Statystyki podstawowe i tabele oraz węzeł Histogramy 2W 60 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2013

z foldera Wykresy. Łączymy węzły ze źródłem danych beton (OK) i uruchamiamy projekt. Na rys. 6 widzimy wynikową przestrzeń. Rys. 7. Statystyki opisowe. Tabela statystyk opisowych widoczna jest na rys. 7. Nie ma w niej niczego niepokojącego: wszystkie przypadki są wypełnione, zakres wartości jest rozsądny, odchylenia standardowe są większe od zera (tzn. nie ma stałych zmiennych). Rozkład zmiennych można sprawdzić, korzystając z histogramów. Na rys. 8 widzimy histogramy zmiennej zależnej i predyktorów. Poza zmienną Age na wykresach nie widać nic niepokojącego, sugerującego przekłamania w danych i obserwacje odstające. Rozkład zmiennej Age może nastręczać pewne trudności: mamy niewiele obserwacji dla dużych wartości tej zmiennej, co może negatywnie wpłynąć na model w tym obszarze. Możemy przyjąć, że dane nadają się do modelowania. Zaczniemy od utworzenia źródeł danych z próbą uczącą i testową. Do źródła beton (OK) podłączamy węzeł Podział danych na próbę uczącą i testową (regresja) z foldera Modele regresji i eksploracja wielowymiarowa przeglądarki węzłów i uruchamiamy go. Program wygeneruje dwa nowe źródła danych wg zmiennej Próba wskazanej wcześniej jako identyfikator prób (zob. str. 59). Do ikon reprezentujących próby podłączamy węzeł Wzmacniane drzewa regresyjne z wdrożeniem z foldera Modele regresji i eksploracja wielowymiarowa przeglądarki węzłów. Węzeł ten dopasuje model drzew wzmacnianych do danych z próby uczącej, a następnie zastosuje go dla danych z próby testowej i utworzy arkusze z wartościami przewidywanymi i obserwowanymi dla obu prób. Po uruchomieniu węzła Wzmacniane drzewa regresyjne z wdrożeniem do wyników stosowania modelu dla próby testowej podłączamy węzeł Dobroć dopasowania dla wielu źródeł danych z foldera Data Mining Dobroć dopasowania, aby ocenić trafność przewidywania modelu. Przed uruchomieniem tego węzła klikamy go dwukrotnie i ustawiamy dla niego Wszystkie wyniki jako Zakres wyników oraz włączamy obliczanie współczynnika korelacji między wartościami przewidywanymi i obserwowanymi. Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 61

Rys. 8. Histogramy. Współczynnik korelacji wartości przewidywanych i obserwowanych wynosi 0,92, a średnia kwadratów reszt 42. Nie są to złe wartości, jednak oceniając model regresyjny warto zobaczyć, jak wygląda wykres reszt. Jak widać na rys. 9, mamy dwie reszty wyraźnie większe od innych dla obserwacji nr 863 i 382. W takiej sytuacji warto sprawdzić dane wejściowe. W naszym przypadku po sprawdzeniu dokumentacji okazało się, że obserwacja nr 382 jest poprawna, lecz w obserwacji nr 863 wystąpiło przekłamanie zmiennej Strength: zamiast faktycznej wartości 35,23 w arkuszu wpisano 65,23. Powinniśmy poprawić błędne dane i ponownie wykonać wszystkie analizy. I tu ukazuje się przewaga przestrzeni roboczych: wystarczy skorygować błąd w danych wejściowych i uruchomić projekt, nie ma konieczności ponownego określania wszystkich analiz i przekształceń. Samo skorygowanie błędnego wpisu pozwala uzyskać współczynnik korelacji 0,93 i średnią kwadratów reszt 36. 62 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2013

Rys. 9. Wykres reszt. Po poprawieniu błędnego wpisu możemy dostroić model. Kluczowe parametry drzew wzmacnianych to: Maksymalna liczba węzłów decyduje ona o złożoności drzew składających się na model, zwykle najlepsze modele uzyskujemy dla tego parametru z zakresu 3 15. Liczba drzew wzmacnianych maksymalna wielkość całego modelu. Program, tworząc model, automatycznie dobiera najlepszą wielkość, jednak nie większą niż ten parametr, należy więc ustawić taką wartość parametru, aby nie powodowała ona sztucznego zatrzymania uczenia. Poza tym warto poeksperymentować z minimalną licznością węzła i minimalną licznością węzła potomka. Wszystkie parametry dobiera się metodą prób i błędów. W naszym wypadku najlepsze wyniki dają ustawienia przedstawione na rys. 10. Uzyskujemy wtedy współczynnik korelacji wartości przewidywanych i obserwowanych 0,960, a średnią kwadratów reszt 21,2. W praktyce często okazuje się, że dla różnych zadań różne metody sprawdzają się lepiej lub gorzej. Sprawdzimy, jak będą działać sieci neuronowe. Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 63

Rys. 10. Ustawienia drzew wzmacnianych. Aby zbudować model sieci neuronowej, do przestrzeni roboczej wstawiamy węzeł SANN Regresja z Wdrożeniem z foldera Modele regresji i eksploracja wielowymiarowa przeglądarki węzłów. Węzeł podłączamy do danych tak samo jak węzeł drzew wzmacnianych, a model oceniamy, korzystając z węzła Dobroć dopasowania dla wielu źródeł danych. Rys. 11. Finalna przestrzeń robocza. 64 www.statsoft.pl/czytelnia.html Copyright StatSoft Polska 2013

Automatyczne sieci neuronowe STATISTICA (w skrócie SANN) sprawdzają wiele architektur i ustawień sieci, aby uzyskać najlepszy model. Użytkownik musi podać tylko liczbę sprawdzanych konfiguracji sieci i maksymalną liczbę neuronów w warstwie ukrytej. Rys. 12. Ustawienia Automatycznych sieci neuronowych. W naszym przypadku sprawdzimy 50 sieci MLP zawierających od 4 do 30 neuronów w warstwie ukrytej o różnych ustawieniach (rys. 12). Najlepsza sieć znaleziona przez program ma 16 neuronów w warstwie ukrytej. Współczynnik korelacji wartości przewidywanych i obserwowanych w próbie testowej dla tej sieci wynosi 0,948, a średnia kwadratów reszt 27,6. Jest to wyniki nieco groszy niż uzyskany za pomocą drzew wzmacnianych. Niemniej jednak trafność przewidywań obu metod wydaje się zadowalająca. Literatura 1. I-Cheng Yeh, Modeling of strength of high performance concrete using artificial neural networks, Cement and Concrete Research, Vol. 28, No. 12, pp. 1797-1808 (1998). 2. Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science. 3. Hastie T., Tibshirani R., Friedman J., 2002, The Elements of Statistical Learning, Springer-Verlag. 4. Koronacki J., Ćwik J., 2005, Statystyczne systemy uczące się, Wydawnictwo Naukowo-Techniczne. Copyright StatSoft Polska 2013 www.statsoft.pl/czytelnia.html 65