Agenty reaktywne i hybrydowe (Reactive and hybrid agents) Na podstawie An Introduction to MultiAgent Systems oraz slajdów Michaela Wooldridge'a

Podobne dokumenty
Modelowanie i analiza systemów informatycznych

MiASI. Modelowanie systemów informatycznych. Piotr Fulma«ski. 18 stycznia Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

i, lub, nie Cegieªki buduj ce wspóªczesne procesory. Piotr Fulma«ski 5 kwietnia 2017

Wzorce projektowe strukturalne cz. 1

Uczenie Wielowarstwowych Sieci Neuronów o

Agenty wnioskuj ce dedukcyjnie (Deductive Reasoning Agents) Na podstawie An Introduction to MultiAgent Systems oraz slajdów Michaela Wooldridge'a

Systemy Agentowe główne cechy. Mariusz.Matuszek WETI PG

Edyta Juszczyk. Akademia im. Jana Dªugosza w Cz stochowie. Lekcja 1Wst p

Podstawy modelowania w j zyku UML

Robotyka mobilna. Architektury sterowania w robotyce. Dariusz Pazderski 1. 2 pa¹dziernika Wykªady z robotyki mobilnej studia niestacjonarne

Zarządzanie Zasobami by CTI. Instrukcja

Lab. 02: Algorytm Schrage

Wzorce projektowe kreacyjne

REGULAMIN KONTROLI ZARZĄDCZEJ W MIEJSKO-GMINNYM OŚRODKU POMOCY SPOŁECZNEJ W TOLKMICKU. Postanowienia ogólne

Aplikacje bazodanowe. Laboratorium 1. Dawid Poªap Aplikacje bazodanowe - laboratorium 1 Luty, 22, / 37

Model obiektu w JavaScript

Sieci komputerowe cel

Metody numeryczne i statystyka dla in»ynierów

Lekcja 8 - ANIMACJA. 1 Polecenia. 2 Typy animacji. 3 Pierwsza animacja - Mrugaj ca twarz

Harmonogramowanie projektów Zarządzanie czasem

Strategia rozwoju sieci dróg rowerowych w Łodzi w latach

Zobacz to na własne oczy. Przyszłość już tu jest dzięki rozwiązaniu Cisco TelePresence.

Wiedza niepewna i wnioskowanie (c.d.)

Użytkowanie elektronicznego dziennika UONET PLUS.

Sieci komputerowe. Definicja. Elementy

Zarz dzanie rm. Zasada 2: samoorganizuj ce si zespoªy. Piotr Fulma«ski. March 17, 2015

Budowa drogi gminnej w m. Bieganowo wraz ze skrzyŝowaniem z drogą powiatową nr 2922P PROJEKT ZMIANY TYMCZASOWEJ ORGANIZACJI RUCHU.

Jak Polacy podchodz do funduszy inwestycyjnych?

System zarządzania bazą danych (SZBD) Proces przechodzenia od świata rzeczywistego do jego informacyjnej reprezentacji w komputerze nazywać będziemy

Zmiany w Podstawie programowej przedmiotów informatycznych

Podstawy modelowania w j zyku UML

W dobie postępującej digitalizacji zasobów oraz zwiększającej się liczby dostawców i wydawców

OPIS PRZEDMIOTU ZAMÓWIENIA. wymagane minimalne parametry techniczne:

Jak postawić tablicę informacyjną? Plan działania dla animatorów przyrodniczych

PROJEKT TYMCZASOWEJ ORGANIZACJI RUCHU

Zadbaj o to aby wszyscy pracownicy w Twojej firmie zostali odpowiednio przeszkoleni pod kątem BHP

Metody numeryczne. Wst p do metod numerycznych. Dawid Rasaªa. January 9, Dawid Rasaªa Metody numeryczne 1 / 9

Teoria grafów i jej zastosowania. 1 / 126

POLITECHNIKA WROCŠAWSKA WYDZIAŠ ELEKTRONIKI PRACA DYPLOMOWA MAGISTERSKA

OPIS PRZEDMIOTU ZAMÓWIENIA DO ZAPYTANIA KE1/POIG 8.2/13

Symfonia Produkcja Instrukcja instalacji. Wersja 2013

Szeregowanie zada« Wykªad nr 5. dr Hanna Furma«czyk. 4 kwietnia 2013

12. Wyznaczenie relacji diagnostycznej oceny stanu wytrzymało ci badanych materiałów kompozytowych

1 Klasy. 1.1 Denicja klasy. 1.2 Skªadniki klasy.

System Informatyczny CELAB. Przygotowanie programu do pracy - Ewidencja Czasu Pracy

Saturn planeta z uszami

Program wymiany naukowej między Szwajcarią a nowymi paostwami członkowskimi Unii Europejskiej Sciex-NMS ch na lata

BENEFICJENT 1.1 NAZWA I ADRES BENEFICJENTA

Jak my±li czªowiek a jak my±li komputer

Programowanie wspóªbie»ne

Subversion - jak dziaªa

ST SPECYFIKACJA TECHNICZNA ROBOTY GEODEZYJNE. Specyfikacje techniczne ST Roboty geodezyjne

ADHD wyzwanie społeczne czy negacja? STYCZEŃ 2015 r.

Cyfrowe Ukªady Scalone

1. Wprowadzenie do C/C++

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

MiASI. Modelowanie analityczne. Piotr Fulma«ski. 18 stycznia Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

Schematy blokowe ukªadów automatyki

Maszyny Turinga i problemy nierozstrzygalne. Maszyny Turinga i problemy nierozstrzygalne

Metodydowodzenia twierdzeń

Baza danych - Access. 2 Budowa bazy danych

POMOC PSYCHOLOGICZNO-PEDAGOGICZNA Z OPERONEM. Vademecum doradztwa edukacyjno-zawodowego. Akademia

PRZEBUDOWA FRAGMENTU ULICY MARYSIA W CZĘSTOCHOWIE na działkach ew. o nr : 124/2; obręb: Częstochowa /2; obręb: Częstochowa 231

INSTRUKCJA Panel administracyjny

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Lekcja 5 Programowanie - Nowicjusz

MiASI. Modelowanie integracji systemów. Piotr Fulma«ski. 26 stycznia Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

PRZEDMIOTOWY SYSTEM OCENIANIA Z PODSTAW PSYCHOLOGII W KLASIE DRUGIEJ. Ocenianie wewnątrzszkolne na przedmiocie podstawy psychologii ma na celu:

Załącznik Nr 2 do Regulaminu Konkursu na działania informacyjno- promocyjne dla przedsiębiorców z terenu Gminy Boguchwała

epuap Ogólna instrukcja organizacyjna kroków dla realizacji integracji

Dokumentacja usługi SMS (Aplikacja def3000/sms)

PROGRAM PRZECIWDZIAŁANIA PRZEMOCY W RODZINIE ORAZ OCHRONY OFIAR PRZEMOCY W RODZINIE W GMINIE LIPNO NA LATA

Linc Polska Sp. z o.o. ul. Hallera Poznań. tel fax info@linc.pl

Programowanie wspóªbie»ne

Grant Blokowy Szwajcarsko-Polskiego Programu Współpracy Fundusz dla Organizacji Pozarządowych

Warszawa, 30 listopada 2013 r. Zarz d Dzielnicy Białoł ka m.st. Warszawy INTERPELACJA NR 436

Listy i operacje pytania

Bazy danych. Andrzej Łachwa, UJ, /15

Budowa bytomskiego odcinka Obwodnicy Północnej Aglomeracji Górnośląskiej Etap II oraz Etap III

1. Wprowadzenie do C/C++

REGULAMIN ZESPOŁU INTERDYSCYPLINARNEGO W KROTOSZYNIE

Przykªady problemów optymalizacji kombinatorycznej

Zasady korzystania z łączności bezprzewodowej podczas pracy na stanowisku ratowniczym

Uchwała nr 647/XXV/2012 Rady Miejskiej w Piasecznie z dnia r.

ZARZĄDZENIE NR 155/2014 BURMISTRZA WYSZKOWA z dnia 8 lipca 2014 r.

Chemoinformatyczne bazy danych - Wprowadzenie do technologii baz danych. Andrzej Bąk

Systemy mikroprocesorowe - projekt

Elementy Modelowania Matematycznego Wykªad 9 Systemy kolejkowe

WZMACNIACZE SELEKTYWNE LC

Warszawa, r.

Wnioskowanie Boolowskie i teoria zbiorów przybli»onych

System nagłośnieniowy i dźwiękowy system ostrzegawczy Bosch Praesideo

Wyzwania bezpieczeństwa nowoczesnych platform nauczania zdalnego

O WIADCZENIE MAJ TKOWE radnego gminy

Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?

ZASADY. przyznawania zwrotu kosztów przejazdu i zakwaterowania w Powiatowym Urzędzie Pracy w Nowym Dworze Gdańskim

wzór Załącznik nr 5 do SIWZ UMOWA Nr /

Przetwarzanie sygnaªów

Regulamin świadczenia usług prawnych drogą elektroniczną przez Kancelarię Doradcy Prawnego Monika Sobczyk - Moćkowska. 1

Transkrypt:

Agenty reaktywne i hybrydowe (Reactive and hybrid agents) Na podstawie An Introduction to MultiAgent Systems oraz slajdów Michaela Wooldridge'a

Architektura reaktywna - subsumpcyjna Problem z podej±ciami symbolicznymi/logicznymi (transdukcja, zªo»ono± obliczeniowa) paradygmat reaktywny Najbardziej znana architektura reaktywna oparta na nast puj cych zaªo»eniach inteligentne zachowanie mo»na wygenerowa bez jawnej reprezentacji inteligentne zachowanie mo»na wygenerowa bez jawnego wnioskowania inteligentne zachowanie to (samoczynnie) pojawiaj ca si wªa±ciwo± pewnych zªo»onych systemów

Charakterystyka architektury subsumpcyjnej Podejmowanie decyzji zrealizowane poprzez zbiór odpowiednich zachowa«ka»de zachowanie to funkcja, która mapuje percept ze ±rodowiska na akcj do wykonania zachowania zrealizowane jako maszyny stanów sko«czonych (reguªy) bez wykorzystania reprezentacji symbolicznej (percept akcja) Wiele zachowa«mo»e by uruchamianych (wyzwalanych) jednocze±nie zachowania tworz hierarch subsumpcji podzieln na warstwy (im ni»sza warstwa, tym wy»szy priorytet zachowania) ni»e warstwy w hierarchii mog zablokowa wy»sze warstwy

Wybór akcji w architekturze subsumpcyjnej Surowy odczyt z sensora nie jest ani przetwarzany, ani transformowany Akcje zdeniowane przez zbiór zachowa«wraz z relacj blokowania b 1 b 2 oznacza,»e 'b 1 blokuje b 2 ' b 1 znajduje si ni»ej w hierarchii ni» b 2 i przez to ma wy»szy priorytet ni» b 2

Mars Explorer Naszym celem jest eksploracja odlegªej planety i zebranie próbek cennych skaª. Poªo»enie próbek nie jest znane wiadomo tylko,»e wyst puj one w skupiskach. Mamy do dyspozycji zestaw autonomicznych robotów, które mog porusza si po planecie zbieraj c próbki i dostarcza je do statku-bazy. Nie mamy mapy planety wiadomo tylko,»e jest na niej du»o przeszkód, które uniemo»liwiaj komunikacj radiow.

Wykorzystane mechanizmy 1 Pole gradientu Statek-baza generuje sygnaª radiowy, dzi ki któremu agenty-roboty znaj poªo»enie statku Sygnaª nie niesie»adnej informacji Aby dosta si do statku agent musi porusza si w stron rosn cego gradientu 2 Po±rednia komunikacja Agenty wykorzystuj radioaktywne okruszki, które mog by upuszczane, podnoszone i wyczuwane przez przeje»d»aj ce roboty

Zachowania indywidualne b 0 : if detect an obstacle then change direction b 1 : if carrying a sample and at the base then drop sample b 2 : if carrying a sample and not at the base then travel up gradient b 3 : if detect a sample and not at the base then pick up sample b 4 : if true then move randomly Zachowania te tworz nast puj c hierarchi : b 0 b 1 b 2 b 3 b 4

Zachowania kooperatywne b 5 : if carrying a sample and not at the base then drop 2 crumbs and travel up gradient b 6 : if sense crumbs then pick 1 crumb and travel down gradient Zmodykowana hierarchia subsumpcji jest nast puj ca: b 0 b 1 b 5 b 3 b 6 b 4

Ograniczenia agentów reaktywnych 1 Brak modeli ±rodowiska konieczno± wykorzystywana rozbudowanej informacji lokalnej w celu wyboru akceptowalnych akcji 2 Brak perspektywy dªugookresowej w podejmowaniu decyzji 3 Brak jasnych zwi zków mi dzy indywidualnymi zachowaniami a zachowaniem caªego systemu brak metodologii pozwalaj cej na budow agentów realizuj cych konkretne (i zaawansowane) zadania 4 Trudno±ci w przypadku budowy bardziej zªo»onych agentów (10 warstw i wi cej) z uwagi na mo»liwe interakcje zachodz ce pomi dzy ró»nymi zachowaniami

Pokaz A teraz troch zabawy... :)

Agenty hybrydowe Ekstremalne podej±cia (tylko pro-aktywne lub tylko reaktywne) nie sprawdzaj si w praktycznych problemach Poª czenie obu podej± do budowy agentów skªadaj cych si z 2 (lub wi cej) podsystemów podsystemu stosuj cego wnioskowanie praktyczne, zawieraj cego model ±rodowiska oraz tworz cego plany z wykorzystaniem reprezentacji i technik logicznych i symbolicznych podsystemu reaktywnego, który potra reagowa na zdarzenia bez zªo»onego wnioskowania Podsystemy s zorganizowane w hierarchi komunikuj cych si ze sob warstw ( architektury warstwowe)

Typy architektur warstwowych Horyzontalne/równolegªe (horizontal layering) Poszczególne warstwy s podª czone do sensorów i do aktuatorów ka»da warstwa przypomina niezale»nego agenta, który wybiera najbardziej odpowiedni akcj do wykonania Wertykalne/szeregowe (vertical layering) Sensory i aktuatory obsªugiwane s przez jedn warstw przepªyw sterowania miedzy poszczególnymi warstwami

Typy architektur warstwowych

TouringMachines TouringMachines skªada si z trzech równolegªych warstw Ka»da warstwa dostarcza sugestii dotycz cych akcji do wykonania przez agenta Rozwa»any scenariusz sterowanie autonomicznym pojazdem w ±rodowisku, w którym porusza si wiele takich pojazdów (rozwa»ania teoretyczne/symulacja)

Architektura TouringMachines

Warstwy w TouringMachines Warstwa reaktywna (reactive) dostarcza natychmiastowych reakcji (akcji) na zmiany w ±rodowisku zaimplementowana jako zbiór reguª sytuacja akcja, podobnie jak w architekturze subsumpcyjnej r u l e 1: k e r b a v o i d a n c e i f i s i n f r o n t ( Kerb, O b s e r v e r ) and s p e e d ( O b s e r v e r ) > 0 and s e p a r a t i o n ( Kerb, O b s e r v e r ) < K e r b T h r e s h H o l d t h e n change o r i e n t a t i o n ( K e r b A v o i d a n c e A n g l e )

Warstwy w TouringMachines Warstwa planowania (planning) odpowiada za proaktywne zachowanie agenta (formuªowanie i wykonywanie planów) tworzy nalne plany korzystaj c z biblioteki schematów/szkieletów planów wybiera na bie» co najbardziej odpowiedni plan Warstwa modelowania (modeling) reprezentuje ró»ne obiekty w ±rodowisku (równie» samego agenta) przewiduje konikty mi dzy agentami i generuje cele/intencje w celu rozwi zania tych koniktów cele te s przekazywane do warstwy planowania

Podsytem sterowania w TouringMachines Decyduje, która warstwa powinna w danej sytuacji kontrolowa agenta (wybra akcj ) Implementacja w formie zbioru reguª, które mog blokowa wej±cie z sensorów lub wyj±cie z poszczególnych warstw kontrolnych c e n s o r r u l e 1: i f e n t i t y ( o b s t a c l e 6) i n p e r c e p t i o n b u f f e r t h e n remove s e n s o r y r e c o r d ( l a y e r R, e n t i t y ( o b s t a c l e 6))

InteRRaP InterRRaP wykorzystuje warstwy horyzontalne i dwukierunkowy przepªyw sterowania miedzy nimi Skªada si z trzech warstw behavior-based odpowiedzialnej za zachowanie reaktywne local planning odpowiedzialnej za ustalanie planów i ich realizacj cooperative planning odpowiedzialnej za interakcje ze ±rodowiskiem Ka»da warstwa posiada swoja baz wiedzy z reprezentacj ±rodowiska odpowiedni dla danej warstwy od surowych sygnaªów z sensorów do zªo»onych modeli ±rodowiska

Architektura InterRRaP

Interakcje mi dzy warstwami w InterRRaP Aktywacja bottom-up ni»sza warstwa przekazuje sterowanie do warstwy wy»szej je±li nie ma wystarczaj cych kompetencji, aby poradzi sobie z aktualn sytuacj Realizacja top-down warstwa wy»szego poziomu korzysta z usªug dostarczonych przez warstw poni»ej, aby osi gn swoje cele Przepªyw sterowania rozpoczyna si od odebrania sygnaªu z receptora przez najni»sz warstw, mo»e dotrze do wy»szych warstw i nast pnie wraca na dóª w celu wyboru i wykonania akcji

DARPA Challenge Stanley Pierwsze miejsce w DARPA Grand Challenge w 2005 r. Stworzony na Stanford przez zespóª Sebastiana Thruna (Google, Udacity) Zªo»ony system (oprogramowanie + sensory) zamontowane w standardowym VW Touareg R5 rozbudowanym o drive-by-wire

Software

Hardware 6 serwerów (Pentium M) pod kontrola Linuxa 3 serwery dla oprogramowania, 1 do logowania, 2 zapasowe 1 serwer odpowiedzialny za przetwarzanie sygnaªy wideo 2 serwery odpowiedzialne za pozostaªe funkcje (np. planowanie)

Planowanie Brak planowania dªugoterminowego denicja trasy dostarczona przez organizatorów wy±cigu punkty kontrolne, szeroko±ci korytarza, ograniczenia pr dko±ci Planowanie krótkoterminowe (przeszukiwanie) poruszanie si blisko ±rodka korytarza omijanie przeszkód (np. innych pojazdów) maksymalizacja pr dko±ci (w ramach ogranicze«) i minimalizacja czasu przejazdu

Planowanie

DARPA Challenge Junior Drugie miejsce w DARPA Grand Challenge w 2007 r. Przygotowany przez zespóª, który wcze±niej opracowaª Stanley'a System zamontowany w VW Passat Wagon (z systemem drive-by-wire)

Organizacja zawodów Dokªadna mapa otoczenia (drogi, pasy ruchu, znaki stopu, parkingi, punkty kontrolne) Dodatkowa mapa lotnicza okolicy mo»liwo± doprecyzowania mapy przez organizatorów Bez ±wiateª na skrzy»owaniach i dodatkowych znaków drogowych (?) 3 misje do wykonania, podczas których trzeba byªo unika kolizji, przestrzega przepisów ruchu drogowego i minimalizowa czas realizacji

Software Architektura warstwowa taka sama, jak w przypadku Stanley'a Rozbudowana cz ± zwi zana z planowaniem dwa moduªy do planowania ruchu na trasie i na parkingu (mniej standardowe manewry)

Hardware Dwa serwery (quad core) dziaªaj ce pod kontrol Linuxa