Wstęp do kognitywistyki Wykład 12: Wprowadzenie do SI. Obliczeniowa teoria umysłu
Sztuczna inteligencja...to próba zrozumienia i wyjaśnienia jednostek inteligentnych. Specyfika SI polega na metodzie: wyjaśnianie przez budowę Podstawowa zagadka: jak stosunkowo prosty system (np. mózg) jest w stanie postrzegać, rozumieć, przewidywać i manipulować światem: dużo większym i bardziej złożonym niż on sam? Obejmuje obecnie liczne poddziedziny, jak: percepcja, wnioskowanie logiczne, gra w szachy, dowodzenie twierdzeń, diagnostyka
Czym jest SI? 1. Myśleć po ludzku: modelowanie kognitywne opieramy się na teoriach dot. ludzkiego myślenia dane z introspekcji i eksperymentów psychologicznych precyzyjna teoria umysłu ludzkiego wyrażalna w postaci programu komputerowego zbieżność pewnych czynników hipoteza o podobieństwie mechanizmów (umysł program)
Czym jest SI? Simon, Newell, GPS: kroki w rozwiązywaniu problemów przez człowieka i komputer, ale: Wang: interesujące jest uzyskanie jedynie poprawnych odpowiedzi, niezależnie od sposobu dojścia do nich Kognitywistyka łączy modele obliczeniowe AI oraz techniki eksperymentalne psychologii próbując konstruować precyzyjne i testowalne teorie dotyczące działań umysłu ludzkiego
Czym jest SI? 2. Zachowywać się po ludzku Test Turinga TT miał być satysfakcjonującą, operacyjną definicją inteligencji. Zachowanie inteligentne, to zdolność do realizacji czynności poznawczych na poziomie ludzkim. By przejść TT komputer musiałby mieć zdolności: przetwarzanie języka naturalnego reprezentację wiedzy automatyczne wnioskowanie maszynowe uczenie się
Czym jest SI? 3. Myślenie racjonalne prawa myśli Rozwój logiki formalnej - precyzyjna notacja dla stwierdzeń o wszelkiego rodzaju rzeczach i relacjach między nimi Do 65 r. istniały programy, które mając dostatecznie wiele czasu i pamięci oraz opis problemu w notacji logicznej mogły odnaleźć rozwiązanie problemu problem z formalizacją wiedzy nieformalnej rozwiązywalność w zasadzie a w praktyce
Czym jest SI? 4. Racjonalne zachowanie agent racjonalny SI badania nad konstrukcją racjonalnych agentów Częścią racjonalności są poprawne inferencje (por. 3), ale poza tym np. odruchy Wszystkie zdolności poznawcze, jakich wymaga TT pojawiają się również w tym podejściu Podejście bardziej ogólne, niż prawa myśli bardziej podatne na naukowy rozwój: racjonalność jasno zdefiniowana i ściśle ogólna
SHRDLU Podnieś duży czerwony blok OK. Chwyć piramidę Nie rozumiem, którą piramidę masz na myśli. znajdź blok, który jest większy, niż ten który trzymasz i włóż go do pudełka Zakładam, że przez go rozumiesz blok, który właśnie trzymam OK Co zawiera pudełko? Niebieską piramidę i niebieski blok Co wspiera (tą) piramidę? Pudełko
SHRDLU Jak wiele bloków nie znajduje się w pudełku? Cztery z nich. Czy przynajmniej jedne z nich jest węższy niż ten, który kazałem ci podnieść? Tak, czerwona kostka Czy jest ona wsparta? Tak, przez stół Czy stół może podnosić bloki? Nie Co piramidę może wspierać blok? Tak Czy piramida może wspierać piramidę? Nie wiem.
Obliczeniowa teoria umysłu OTU stanowi szczególny przypadek starszej RTU: (1) stany poznawcze to relacje do (mentalnych) reprezentacji mających treść (2) procesy poznawcze są (mentalnymi) operacjami na tych reprezentacjach
Reprezentacyjna teoria umysłu Dwie wpływowe tradycje RTU: Hume: reprezentacje są ideami które żywimy znajdując się w stanach mentalnych jak przekonanie, pragnienie. Procesy mentalne to ciągi skojarzonych ze sobą idei Problemy: dlaczego przekonania mają wartość logiczną jak idee w ramach przekonań determinują referencję (obrazy i asocjacje) ogólnie mówiąc, problemem była semantyka reprezentacji
Reprezentacyjna teoria umysłu Frege i Russell: wprowadzone zostaje pojecie postaw propozycjonalnych oraz relacji między osobą a sądami: chwytanie (grasping) sądów, różne sposoby ich chwytania skutkuje odmiennymi postawami teoria Hume'a (skojarzenia + podobieństwo) umożliwiała wyjaśnienia psychologiczne, brakowało wyjaśnień zawartości propozycjonalnej; teoria F-R obejmuje pojęcie zawartości reprezentacyjnej (prawdziwość fałszywość, problem referencji), nie umożliwia wyjaśnień psychologicznych
Obliczeniowa teoria umysłu źródła: test Turinga funkcjonalizm maszynowy Turinga i Putnama rozszerzenie z automatów probabilistycznych na systemy obliczeniowe w ogólności (Fodor, Block) język myśli, modularność, psychologia potoczna, treści wąskie (Fodor) Hipoteza fizycznego systemu symboli (Newell, Simon 1976): fizyczny system symboliczny ma wystarczające i konieczne środki do zachowań ogólnie inteligentnych
Obliczeniowa teoria umysłu OTU, to szczególny przypadek RTU, tzn: relacje w RTU są obliczeniowe operacje w RTU są obliczeniowe reprezentacje w RTU mają charakter obliczeniowy, ograniczenie formalne (Fodor 81): procesy obliczeniowe są symboliczne ponieważ są zdefiniowane na reprezentacjach są one formalne, bowiem stosują się do reprezentacji na mocy składni tych reprezentacji: OTU wymaga, by można było rozróżnić dwie myśli co do ich treści jedynie wtedy, gdy są identyfikowane z relacjami w stosunku do dwóch formalnie odmiennych reprezentacji
Obliczeniowa teoria umysłu O tym, że reprezentacja jest raczej przekonaniem niż pragnieniem decyduje sposób współdziałania z innymi reprezentacjami sposób w jaki jest ona wykorzystywana w procesach teoretycznego i praktycznego wnioskowania
Obliczeniowa teoria umysłu OTU: (1) Stany poznawcze są obliczeniowymi relacjami do obliczeniowych reprezentacji mentalnych mających treść (zawartość) (2) Procesy poznawcze (zmiany w stanach mentalnych) są obliczeniowymi operacjami na obliczeniowych reprezentacjach mentalnych, które mają treść (zawartość) Cyfrowa OTU: obliczeniowa architektura (pamięć i sterowanie) musi mieć charakter cyfrowy reprezentacje muszą być cyfrowe
Zasięg stosowalności COTU można ja traktować jako teorię wszystkich zjawisk mentalnych (stanów i procesów) jako teorię jedynie zjawisk poznawczych jako teorię postaw propozycjonalnych istnieje grupa zjawisk, które określamy mianem 'mentalne', choć prawdopodobnie nie są cyfrowo obliczalne: emocje, sny i marzenia senne, twórczość, ciągi skojarzeń, pozakognitywne zmiany w poznaniu (wyżywienie, opieka, wzrost i dojrzewanie organów ciała, uszkodzenia tychże), zatem:
Zasięg stosowalności COTU
Architektury Architektura organizacja maszyn cyfrowych (sposób przechowywania informacji, co decyduje o przepływie tychże w systemie) (1) Maszyny Turinga abstrakcyjne urządzenia obliczające z dwoma podstawowymi częściami: taśmą i głowicą odczytująco-zapisującą, wyposażona w program listę instrukcji (por. np. Penrose, Nowy umysł cesarza) (2) Maszyny von Neumanna: w pełni automatyczne (niezależne od ludzkiego operatora, gdy obliczanie się rozpocznie)
Architektury [pamięć] istnieje organ do przechowywania informacji niezbędnych do obliczeń oraz poleceń sterujących działaniem; [przechowywany program] [sterowanie] jednostka automatycznie wykonująca polecenia przechowywane w pamięci [arytmetyka] organ wykonujący niektóre z elementarnych operacji arytmetycznych [wejście-wyjście] urządzenia umożliwiające komunikację człowiek maszyna Idea przetwarzania sekwencyjnego poprzez wykonanie operacji 'wychwyć' (instrukcję), wykonaj ją, przechowaj wynik [fetch, operate, store: Pylyshyn]
Architektury Maszyny Turinga a maszyny von Neumanna MvN: dostęp do pamięci zarówno bezpośredni (absolutny), jak i pośredni; MT: pośredni dostęp do pamięci Pamięć jest pośrednia, gdy jest tak zorganizowana, że maszyna musi przejść przez jeden adres, by dotrzeć do innych MvN: program może być przechowywany jako dane w pamięci dysponuje wyspecjalizowanymi jednostkami obliczeniowymi (np. jedn. arytmetyczna) umożliwia pełne wykorzystanie podprocedur - modularność MvN
Architektury Systemy produkcji (Simon, Newell 1972; Newell 1973) System Soar: http://sitemaker.umich.edu/soar/home Schemat systemu przetwarzania informacji składa się ze zbioru produkcji produkcja to para warunek działanie zawiera struktury danych: wyrażenia kodujące informacje na których SP operuje i w oparciu o które określamy prawdziwość/fałszywość warunków Składniki SP: zbiór reguł produkcji (jeśli warunek to wykonaj działanie) obszar roboczy pamięci (zwany kontekstem) interpreter reguł stosujący odpowiednią regułę do zawartości obszaru roboczego