Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD II: Agent i jego środowisko

Podobne dokumenty
Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD III: Problemy agenta

Systemy Agentowe główne cechy. Mariusz.Matuszek WETI PG

Inteligentne Agenty. Na podstawie: AIMA ch2 i slajdów S. Russel a. Wojciech Jaśkowski. 18 marca Inteligentne Agenty

Inteligentne Agenty. Na podstawie: AIMA ch2 i slajdów S. Russel a. Wojciech Jaśkowski. 14 marca

WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI

Systemy hybrydowe reaktywno-racjonalne

Elementy kognitywistyki III: Modele i architektury poznawcze

Wykład 2. Inteligentni agenci. w oparciu o: S. Russel, P. Norvig. Artificial Intelligence. A Modern Approach. Inteligentni agenci (2g)

Wstęp do kognitywistyki. Wykład 12: Wprowadzenie do SI. Obliczeniowa teoria umysłu

Elementy kognitywistyki III: Modele i architektury poznawcze

Problemy Decyzyjne Markowa

Wycena opcji rzeczywistych zgodnie z teorią perspektywy

Halina Piotrowska. Rozwiązywanie problemów decyzyjnych w nauczaniu fizyki

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Autonomia robotów. Cezary Zieliński Instytut Automatyki i Informatyki Stosowanej Wydział Elektroniki i Technik Informacyjnych Politechnika Warszawska

Problemy Decyzyjne Markowa

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Założenia dynamicznego obiegu dokumentów. Korzyści i przykłady sukcesów

Technologie obiektowe

Formacyjne znaczenie programowania w kształceniu menedżerów

Marketing dr Grzegorz Mazurek

Projektowanie Zorientowane na Użytkownika (UCD)

Przepustowość kanału, odczytywanie wiadomości z kanału, poprawa wydajności kanału.

Wykład 1. Wiadomości wstępne

Systemy wbudowane. Cel syntezy systemowej. Wykład 12: Przykłady kosyntezy systemów wbudowanych

Systemy autonomiczne wykorzystujące sterowanie reaktywne

dr Przemysław Sołdacki Wiceprezes Astrafox Sp. z o.o. pso@astrafox.pl Tel

KOMPETENCJE SPOŁECZNE

Marketing. Marketing-mix. Cena w marketingu. Wykład V. Klasyfikacja środków konkurencji wg McCarthy ego - 4 P. dr Grzegorz Mazurek.

PRZEDMIOTOWY SYSTEM OCENIANIA Z ZAJĘĆ KOMPUTEROWYCH. dla klas IV-VI. 2. Systematyczne dokumentowanie postępów uczenia się. 3. Motywowanie do rozwoju;

SPOTKANIE 11: Reinforcement learning

Tytuł szkolenia: Angular 4 - budowanie nowoczesnych i wydajnych aplikacji przeglądarkowych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

MAKROEKONOMIA 2. Wykład 1. Model AD/AS - powtórzenie. Dagmara Mycielska Joanna Siwińska - Gorzelak

5. Wprowadzenie do prawdopodobieństwa Wprowadzenie Wyniki i zdarzenia Różne podejścia do prawdopodobieństwa Zdarzenia wzajemnie wykluczające się i

dr inż. Jarosław Forenc

Spis treści WSTĘP. Rozdział 1 CHARAKTERYSTYKA WIEDZY O ZARZĄDZANIU

Obliczenia inspirowane Naturą

CogGGP - kognitywnie inspirowany agent GGP - opis architektury

Fragment wykładu z języka C ( )

SZTUCZNA INTELIGENCJA

Podstawy programowania. Wykład Funkcje. Krzysztof Banaś Podstawy programowania 1

POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI

Z punktu widzenia kognitywisty: język naturalny

Wstęp do kognitywistyki. Wykład 5: Rewolucja kognitywna?

Wykład 4. Decyzje menedżerskie

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

SPIS TREŚCI ROZDZIAŁ 1. Jerzy Apanowicz ( ), Ryszard Rutka (1.6.)

O ALGORYTMACH I MASZYNACH TURINGA

Projektowanie oprogramowania cd. Projektowanie oprogramowania cd. 1/34

mgr Lucjan Lukaszczyk nauczyciel informatyki PRZEDMIOTOWY SYSTEM OCENIANIA Z INFORMATYKI W SZKOLE PODSTAWOWEJ IM. KAROLA MIARKI W PIELGRZYMOWICACH

Elementy kognitywistyki III: Modele i architektury poznawcze

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Aktualizowanie systemów operacyjnych

Instrukcja obsługi modułu Clickshop w Systemie FLASHCOM FIS.

PRZEDMIOTOWY SYSTEM. OCENIANIA Z ZAJĘĆ KOMPUTEROWYCH dla klas IV-VI

Wykład I. Wprowadzenie do baz danych

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Elementy kognitywistyki III: Modele i architektury poznawcze

Hybrydowe racjonalno reaktywne systemy sterowania

Elementy kognitywistyki III: Modele i architektury poznawcze

Przedmiotowy system oceniania został skonstruowany w oparciu o następujące dokumenty:

Podstawy sztucznej inteligencji

Znaczenie wartości w budowaniu więzi w rodzinie

Czy i/lub w jakim sensie można uważać, że świat jest matematyczny? Wprowadzenie do dyskusji J. Lubacz, luty 2018

Procedury ustalania kompetencji w projekcie EDGE wzór do celów badań w zakładach

Przedmiotowy System Oceniania z informatyki dla. Szkoły Podstawowej i Gimnazjum Specjalnego. Przy Specjalnym Ośrodku Szkolno - Wychowawczym w Lubsku

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Kognitywistyka: odkrywanie labiryntu umysłu z różnymi nićmi Ariadny w ręku

Metodologia badań naukowych

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD XII: Modele i architektury poznawcze

5. Indeksy materiałowe

Obiekt. Obiekt sterowania obiekt, który realizuje proces (zaplanowany).

Wprowadzenie w tematykę zarządzania projektami/przedsięwzięciami

Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji

Przedmiot BIZNES W TURYSTYCE I REKREACJI WTR. studiów Turystyka i Rekreacja

Nazwa wariantu modułu (opcjonalnie): Laboratorium programowania w języku C++

Decyzje konsumenta I WYBIERZ POPRAWNE ODPOWIEDZI

w kontekście percepcji p zmysłów

WYMAGANIA EDUKACYJNE I KYTERIA OCENIANIA

Weryfikacja i ocenianie efektów kształcenia

Podstawy metodologiczne symulacji

KARTA PRZEDMIOTU. Systemy agentowe w informatyce D1_7

MAKROEKONOMIA 2. Wykład 2. Dynamiczny model DAD/DAS. Dagmara Mycielska Joanna Siwińska - Gorzelak

Komputerowe systemy pomiarowe. Podstawowe elementy sprzętowe elektronicznych układów pomiarowych

ECTS - program studiów kierunku Automatyka i robotyka, Studia I stopnia, rok akademicki 2015/2016

Systemy Wspomagania Decyzji

Kierunek i poziom studiów: nauki o rodzinie, drugi stopień Sylabus modułu: Praktyka mediacji rodzinnej część 2 (11- R2S-12-r2_16)

Mikroekonomia. Wykład 11

Wydział Filozofii i Socjologii UMCS września 2014 Wykłady i warsztaty w ramach XI Lubelskiego Festiwalu Nauki

Ocena kondycji finansowej organizacji

dr Anna Mazur Wyższa Szkoła Promocji Intuicja a systemy przekonań

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Aby zakwitnąć najwyższą jakością

Ankieta do samooceny kontroli zarządczej WIJHARS Zielona Góra kierownicy komórek organizacyjnych

Ankieta do samooceny kontroli zarządczej w Urzędzie Miejskim w Radomiu kierownicy komórek organizacyjnych

Dopasowanie IT/biznes

Komunikowanie grupowe. Grupowe podejmowanie decyzji Sytuacje konfliktowe Różnice kulturowe

Transkrypt:

Elementy kognitywistyki II: Sztuczna inteligencja WYKŁAD II: Agent i jego środowisko

Agent racjonalny Agent jednostka traktowana jakby postrzegała swoje środowisko dzięki pewnym czujnikom oraz działająca w tym środowisku dzięki efektorom. Agent racjonalny podejmuje odpowiednie działania tj. takie, które maksymalizują jego pomyślność Miara wykonania (performance measure) kryteria oceny, na ile agent działa pomyślnie To, co racjonalne w danym momencie zależy od: miary wykonania tego, co agent percypował do tej pory; kompletna historia postrzeżeń to ciąg percepcyjny, tego, co agent wie o swoim środowisku, działań jakie agent jest w stanie podjąć

Idealny agent racjonalny dla każdego ciągu percepcyjnego idealny agent winien podjąć działania co do których oczekuje, iż będą maksymalizowały miarę wykonania w oparciu o dostępne mu informacje (ciąg percepcyjny oraz wbudowana wiedza) wykonywanie działań mających na celu uzyskanie użytecznych informacji istotny element racjonalności ciąg percepcyjny 1 działanie 1 ciąg percepcyjny 2 działanie 2... odwzorowanie [mapping] ciągów percepcyjnych na działania opis agenta

Autonomia agenta działania agenta oparte wyłącznie na wiedzy wbudowanej agentowi brak autonomii system jest autonomiczny na tyle, na ile jego działania są determinowane przez własne doświadczenia (percepcje) agenta od czego zacząć? problem elastyczności

Struktura inteligentnych agentów program agenta: funkcja implementująca odwzorowanie między ciągami perceptów i działań architektura agenta: urządzenie (obliczeniowe) na którym można uruchomić program agenta agent = program + architektura Warunek wstępny projektu agenta: znajomość możliwych perceptów, działań, realizowanych celów, miar wykonania oraz środowiska w jakim agent będzie funkcjonował opis PAGE (Percepts, Actions, Goals, Environment) (por. Tab.1)

Program agenta Wspólny szkielet agenta: akceptacja perceptów ze środowiska generowanie działań w środowisku wykorzystanie struktur wewnętrznych, aktualizowanych wraz z nowymi perceptami procedury podejmowania decyzji działające na strukturach wewnętrznych przekaz działania do architektury por. Algor. 1

Najprostszy agent...to tabela zawierająca odpowiednie działania dla wszelkich możliwych ciągów perceptów. Ale...: tabela dla prostego agenta grającego w szachy musiałaby zawierać ok. 35 100 pozycji długi czas konstruowania takiego agenta całkowity brak autonomii nawet wyposażony w moduł uczenia się taki agent potrzebowałby wieczności by wyuczyć się odpowiednich wartości tabeli Przykład: kierowca taksówki (por. Tab.2)

Agent oparty na odruchach Pewne fragmenty tabeli można podsumować w postaci reguł ujmujących typowe skojarzenia wejścia i wyjścia jeśli samochód z przodu hamuje to uruchom hamowanie reguła warunek-działanie (produkcja, reguła jeśli-to) por.: wrodzone odruchy i nabyte reakcje człowieka Funkcjonuje poprawnie, gdy można podjąć decyzję w oparciu o bieżący percept

Agent śledzący stan świata ma pewien stan wewnętrzny ułatwiający dobór działań aktualizacja stanu wewnętrznego wymaga: wiedzy o tym, jak świat się zmienia niezależnie od agenta wiedzy o tym, jak działania agenta wpływają na świat

Agent nakierowany na cel Agent podejmuje odpowiednie działania w oparciu o: opis bieżącego stanu informacje nt. celów opisujące sytuacje pożądane Agent zestawia je z informacją nt. skutków podjętych działań cel osiągany jest w wyniku pojedynczego działania agent musi podjąć szereg działań by osiągnąć cel: uruchamiane są procedury szukania i planowania podejmowanie decyzji w tym przypadku obejmuje rozpatrywanie przyszłości (Co się stanie jeśli postąpię tak-a-tak?) agent nastawiony na cel jest mniej wydajny, ale bardziej elastyczny niż agent oparty na odruchach

Agent nakierowany na cel

Agent oparty na korzyściach racjonalne zachowanie to nie tylko cele......bowiem cel można zrealizować na wiele sposobów cele pozwalają rozróżnić stany: szczęśliwy i nieszczęśliwy miara użyteczności pozwala dokonać wyboru między różnymi rozwiązaniami użyteczność to funkcja odwzorowująca stan na liczbę rzeczywistą opisującą skojarzony z nią stopień szczęścia w szczególności funkcja użyteczności: gdy cele pozostają w konflikcie umożliwia pewnego rodzaju kompromis gdy żadnego z celów nie można osiągnąć na pewno, f.u. pozwala ważyć prawdopodobieństwo sukcesu i istotność celu

Agent oparty na korzyściach

Typy środowisk agenta 1. dostępne vs. niedostępne: aparatura sensoryczna agenta ma dostęp do kompletnego stanu środowiska 2. deterministyczne vs. niedeterministyczne: jeśli następny stan środowiska jest całkowicie zależny od stanu bieżącego i działań agenta środowisko nazywamy deterministycznym 3. epizodyczne vs. nieepizodyczne: środowisko epizodyczne to takie, w którym doświadczenie agenta dzielone jest na epizody; na epizod składają się postrzeganie i działanie agenta 4. statyczne vs. dynamiczne: jeśli środowisko może się zmienić w trakcie podejmowania decyzji przez agenta nazywamy je dynamicznym

Typy środowisk agenta 5. dyskretne vs. ciągłe: jeśli istnieje ograniczona liczba odmiennych, jasno określonych perceptów i działań mówimy, że środowisko jest dyskretne odmienne typy środowisk wymagają odmiennych programów agenta najtrudniejszy przypadek: środowisko niedostępne, nieepizodyczne, dynamiczne i ciągłe w większości realnych sytuacji zakładamy iż środowisko jest niedeterministyczne

Typy środowisk agenta