Informatyka Systemów Autonomicznych

Infrmatyka Systemów Autnmicznych Uczenie maszynwe: uczenie z nauczycielem i bez nauczyciela. Kamil Małysz

Spis treści I. Wstęp...3 II. Pczątki uczenia maszynweg...3 III. Zastswania w praktyce...4 IV. Metdy maszynweg uczenia...5 V. Uczenie nadzrwane i uczenie nienadzrwane...6 VI. Pdsumwanie...6 Literatura...7 ISA Strna 2

I. Wstęp Uczenie maszynwe (uczenie się maszyn, systemy uczące się) t stsunkw młda i szybk rzwijająca się dziedzina wchdząca w skład nauk zajmujących się prblematyką sztucznej inteligencji. Jest t nauka interdyscyplinarna ze szczególnym uwzględnieniem takich dziedzin jak infrmatyka, rbtyka i statystyka. Głównym celem jest praktyczne zastswanie dknań w dziedzinie sztucznej inteligencji d stwrzenia autmatyczneg systemu ptrafiąceg dsknalić się przy pmcy zgrmadzneg dświadczenia (czyli danych) i nabywania na tej pdstawie nwej wiedzy. Uczenie maszynwe jest knsekwencją rzwju idei sztucznej inteligencji i metd jej wdrażania praktyczneg. Dtyczy rzwju prgramwania stswaneg zwłaszcza w innwacyjnych technlgiach i przemyśle. Odpwiednie algrytmy mają pzwlić prgramwaniu na zautmatyzwanie prcesu pzyskiwania i analizy danych d ulepszania i rzwju własneg systemu. Uczenie się mże być rzpatrywane jak knkretyzacja algrytmu czyli dbór parametrów, nazywanych wiedzą lub umiejętnścią. Służy d teg wiele typów metd pzyskiwania wiedzy raz spsbów reprezentwania wiedzy. II. Pczątki uczenia maszynweg Pierwszym przykładem maszynweg uczenia się, mże być prjekt Arthura Samuela z firmy IBM, który w latach 1952-1962 rzwijał prgram d szklenia zawdników szachwych. Przełmem w dziedzinie sztucznej inteligencji i maszynweg uczenia się był pwstanie systemu eksperckieg Dendral na Uniwersytecie Stanfrda w 1965. System ten pwstał w celu zautmatyzwania analizy i identyfikacji mlekuł związków rganicznych, które dtychczas nie były znane chemikm. Wyniki badań trzymane dzięki systemwi Dendral były pierwszym w histrii dkryciem dknanym przez kmputer, które zstały publikwane w prasie specjalistycznej. W 1977 pwstaje prgram AM (Autmated Mathematician) napisany w języku prgramwania Lisp, któreg autrem był Dug Lenat. Służył d zautmatyzwaneg pszukiwania nwych praw matematycznych krzystając z algrytmów heurystycznych. Następcą AM zstał, również stwrzny przez Lenata, prgram Eurisk. Badania nad uczeniem maszynwym nabierają tempa d pczątku lat 90., kiedy Gerald Tesaur stwrzył prgram TD-Gammn, ptrafiący knkurwać w grze Backgammn z mistrzami świata. Aby djść d takiej perfekcji prgram ten uczył się swjej strategii grając jak przeciwnik w pnad milinie gier. Algrytm zaimplementwany w prgramie znalazł później zastswanie w neurnauce. W 1997 Garri Kasparw, mistrz świata w szachach, zstał pknany walkwerem przez kmputer Deep Blue w statniej z sześciu rzgrywek, w której zstał znacznie unwcześniny przez firmę IBM. Kasparw zarzucił firmie IBM szustw, która dmówiła mu dstępu d histrii wcześniejszych gier Deep Blue. W ten spsób Kasparw nie był w stanie analizwać strategii przeciwnika, pdczas gdy twórcy Deep Blue niezwykle dkładnie analizwali i pracwywali wszystkie wcześniejsze rzgrywki Kasparwa twrząc dpwiednie algrytmy prgramu. Pzstał mu jedynie studiwanie spsbów gry gólndstępnych prgramów szachwych. Rsyjski szachista dmagał się rewanżu, ale firma IBM nie zgdziła się i Deep Blue przeszedł na emeryturę. Krytycy wielkrtnie zarzucali firmie IBM, że zamiast sprawiedliwej rywalizacji szachwej mieli na celu wyprmwanie swych rzwiązań technlgicznych i marki. ISA Strna 3

Kniec lat 90. bfituje w pwszechne zastswanie algrytmów uczenia maszynweg w rzwju sieci internet i działania wyszukiwarek internetwych (Ggle, Yah, MSN). W 2006 gólndstępny prgram szachwy Fritz 10 pknał mistrza świata Władimira Kramnika, jedneg z szachwych arcymistrzów. III. Zastswania w praktyce Stswanie systemów uczących się jest wskazane przy rzwiązywaniu prblemów dtyczących zjawisk świata rzeczywisteg, charakteryzujących się dużym stpniem nie determinizmu raz zbyt dużą złżnścią, aby mgły być ne zadwalając reprezentwane przez inne frmalne mdele. Metdy uczenia się bez nadzru mgą znaleźć zastswania w dziedzinie eknmii, głównie d prblemów wymagających analizy pewnych danych (dtyczących np. sytuacji eknmicznej przedsiębirstw, sytuacji na rynku kreślnych wyrbów, sytuacji na giełdzie papierów wartściwych lub sytuacji gspdarczej w skali makreknmicznej) i wykrywania między nimi pdbieństw raz łączenia ich w klasy. Szczególnie zasadne wydaje się wykrzystanie mdułów uczących się bez nadzru jak kmpnentów bardziej złżnych systemów inteligentnych. Na przykład, w systemach wspmagania decyzji mże zstać za pmcą takieg kmpnentu dkryte pdbieństw aktualnej sytuacji d pewnych sytuacji z przeszłści, które mże być następnie pdstawą d wykrzystania przy pdejmwaniu aktualnej decyzji na pdstawie wiedzy i dświadczeń z tych przeszłych sytuacji. Pdstawwy bszar zastswań metd uczenia się z nadzrem wydaje się zbliżny d bszaru zastswań tradycyjnych systemów dradczych, bejmująceg różne zagadnienia wspmagania decyzji, np. w zarządzaniu Uczenie maszynwe wciąż się rzwija i znajduje nwe praktyczne zastswania. Ilść mżliwych zastswań jest niezwykle grmna i pzwala przewidzieć, że w przyszłści każdy aspekt techniki będzie zawierać jakąś implementację algrytmów maszynweg uczenia się. Przykłady zastswania uczenia maszynweg: prgramwanie d rzpznawania mwy: autmatyczne tłumaczenie rzpznawanie mwy ludzkiej dyktwanie kmputerwi interfejsy użytkwnika sterwane głsem autmatyzacja głsem czynnści dmwych interaktywne biura bsługi rzwój rbtów autmatyczna nawigacja i sterwanie: kierwanie pjazdem (ALVINN) dnajdywanie drgi w nieznanym śrdwisku kierwanie statkiem ksmicznym (NASA Remte Agent) autmatyzacja systemów prdukcji i wydbycia (przemysł, górnictw) analiza i klasyfikacja danych: systematyka biektów astrnmicznych (NASA Sky Survey) rzpznawanie chrób na pdstawie symptmów mdelwanie i rzwijanie terapii lekwych ISA Strna 4

rzpznawania pisma na pdstawie przykładów klasyfikwanie danych d grup tematycznych wg kryteriów aprksymacja nieznanej funkcji na pdstawie próbek ustalanie zależnści funkcyjnych w danych przewidywanie trendów na rynkach finanswych na pdstawie danych mikr i makr eknmicznych IV. Metdy maszynweg uczenia Uczenie maszynwe i jeg pwdzenie zależy d wybru dpwiedniej metdy frmułującej prblem, zbiru ucząceg (czyli dświadczeń) raz spsbu uczenia się nwych pjęć. Metdy uczenia: wniskwanie wartści funkcji lgicznej z przykładów uczenie drzew decyzyjnych (ang. Decisin Tree Learning) - drzew decyzyjne t graficzna metda wspmagania prcesu decyzyjneg, stswana w terii decyzji. Algrytm drzew decyzyjnych jest również stswany w uczeniu maszynwym d pzyskiwania wiedzy na pdstawie przykładów. Jest t schemat strukturze drzewa decyzji i ich mżliwych knsekwencji. Zadaniem drzew decyzyjnych mże być zarówn stwrzenie planu, jak i rzwiązanie prblemu decyzyjneg. Metda drzew decyzyjnych jest szczególnie przydatna w prblemach decyzyjnych z licznymi, rzgałęziającymi się wariantami uczenie Bayeswskie (ang. Bayesian Learning) - metdy parte na twierdzeniu sfrmułwanym przez XVIII-wieczneg matematyka Thmasa Bayesa dgrywają znaczną i statni rsnącą rlę w dziedzinie sztucznej inteligencji, zwłaszcza w uczeniu się maszyn. Mżna gólnie pwiedzieć, że wzór Bayesa stał się pdstawą d rzwju terii i algrytmów różnych frm wniskwania prbabilistyczneg. uczenie z przykładów (ang. Instance-based Learning) - w dróżnieniu d metd uczenia, które knstruują gólny, tzw. jawny pis funkcji dcelwej, kiedy dstarczane są dane uczące, uczenie teg typu p prstu zapamiętuje przykłady. Ugólnianie nad tymi przykładami jest dwlekane d czasu, aż nwy przykład (zadanie) ma być klasyfikwane. Za każdym razem, kiedy przychdzi nwe zapytanie (przykład), badane są jeg pwiązania z zapamiętanymi przykładami aby ustalić wartść dcelwej funkcji nweg przykładu. uczenie się zbiru reguł (ang. Learning Sets f Rules) - zbiór reguł w pstaci klauzul Hrnwskich mże być interpretwany jak prgram w np. języku Prlg analityczne uczenie (ang. Analytical Learning) - metdy uczenia indukcyjneg (wykrzystują sieci neurnwe, drzewa decyzyjne), wymagają pewnej liczby przykładów aby siągnąć pewien pzim ugólnienia. Analityczne uczenie stsuje wiedzę apriryczną i wniskwanie dedukcyjne d pwiększania infrmacji dstarczanej przez przykłady uczące. płączenie indukcyjneg i analityczneg uczenia (ang. Cmbining Inductive and Analytical Learning) - czyste indukcyjne uczenie frmułuje gólne hiptezy pprzez znalezienie empirycznych regularnści w przykładach uczących. Natmiast czyste analityczne uczenie stsuje apriryczną wiedzę d trzymania gólnych hiptez dedukcyjnie. Płączenie bu pdejść daje krzyści: lepszą pprawnść i trafnść ugólniania gdy dstępna jest wiedza ISA Strna 5

apriryczna raz szukanie zależnści w bserwwanych danych uczących d wypracwania szybkiej wiedzy aprirycznej. wzmcnine uczenie (ang. Reinfrcement Learning) - wzmcnine uczenie dnsi się d pytania, jak autnmiczny agent, który dbiera bdźce i działa w swim śrdwisku mże się uczyć wybierać najlepszą akcję aby siągnąć cel działania. Ten gólny prblem bejmuje takie zadania jak uczenie ptymalizacji w fabrykach i uczenie się pprzez aktywny udział w grach. V. Uczenie nadzrwane i uczenie nienadzrwane Na pdstawie kryterium rzróżniająceg metdy uczenia się na pdstawie rdzaju infrmacji dstarcznej w zbirze przykładów wyróżnia się: uczenie nadzrwane i uczenie nienadzrwane. Uczenie nadzrwane znane jest również pd pjęciem uczenia z nadzrem lub z nauczycielem. Plega na na dstarczeniu systemwi uczącemu się przykładów z których każdy składa się z dwóch elementów : infrmacji wejściwych d systemu i dpwiadających im infrmacji, które trzymujemy na wyjściu. Innymi słwy mówiąc, mamy wektr x, któreg elementy zwierają infrmacje dtyczące daneg przykładu, które pdajemy systemwi na wejście i wektr y który zawiera infrmacje pżądane na wyjściu. Zadanie systemu plega na nauczeniu się na pdstawie infrmacji zawartych w wektrze x generwania zawartści wektra y. System pwinien nauczyć się pewnej funkcji dwzrwującej wektr x na wektr y. Uczenie nienadzrwane znane również jak uczenie bez nadzru lub bez nauczyciela plega na dstarczenia d systemu zbiru przykładów pisanych jedynie za pmcą wektrów wejściwych x bez pdania pżądanych dpwiedzi, czyli bez wektra y. Celem jest zazwyczaj przekształcenie dstarczanej d systemu ucząceg się infrmacji wejściwej w pewne inne frmy, lepiej dstswane d dalszeg przetwarzania. Zasada, zgdnie z którą jest dknywane t przekształcenie, jest ustalna dla danej klasy zadań uczenia się bez nadzru i wbudwana d struktury systemu. Mżna więc pwiedzieć, że system uczący się bez nadzru ma na stałe wbudwane źródł infrmacji trenującej. Typwym przykładem zadania uczenia się bez nadzru jest zadanie wykrywania pewnych regularnści w danych wejściwych i grupwanie ich na tej pdstawie w pewne kategrie. Jest t tzw. grupwanie (klasteryzacja) raz jej "bardziej symbliczna" frma, grupwanie pjęciwe (cnceptual clustering). Algrytmy uczenia się bez nadzru stanwią ważną grupę algrytmów uczenia sieci neurnwych. VI. Pdsumwanie Uczenie maszynwe becnie dgrywa niemałą rlę w twrzeniu systemów (prgramów kmputerwych) i mżna spdziewać się iż jeg wpływ na tą dziedzinę będzie craz większy z biegiem czasu i rzwjem nauki. Maszynwe uczenie wpływa na zwiększenie pprawnści działania systemów przez analizę dświadczenia reprezentwaneg przez zbiór przykładów uczących. ISA Strna 6

Literatura Uczenie maszynwe i sieci neurnwe, Krzysztf Krawiec, Jerzy Stefanwski Artykuły i materiały zamieszczne w internecie ISA Strna 7