MODELOWANIE INŻYNIERSKIE nr 51, ISSN 1896-771X STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ Marcin Szuster 1a 1 Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska a mszuster@prz.edu.pl Streszczenie W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pionier 2-DX w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw: warstwy planowania trajektorii i warstwy realizacji ruchu. Zadaniem warstwy planowania trajektorii jest generowanie parametrów ruchu kół robota w czasie rzeczywistym na podstawie sygnałów z układu sensorycznego. W warstwie tej zastosowano koncepcję sterowania behawioralnego, zrealizowanego z zastosowaniem układów z logiką rozmytą. Warstwa realizacji ruchu generuje sygnały sterowania modułami napędowymi robota, w warstwie tej zastosowano algorytmy aproksymacyjnego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono z zastosowaniem robota Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni. Słowa kluczowe: aproksymacyjne programowanie dynamiczne, mobilny robot kołowy, sterowanie behawioralne, sterowanie nadążne, układy z logiką rozmytą EHAVIOURAL CONTROL OF THE WHEELED MOILE ROOT USING FUZZY LOGIC SYSTEMS Summary In the article a hierarchical control system of the Wheeled Mobile Robot Pioneer 2-DX movement in the unknown environment with static obstacles is presented. The control system consists of two layers: the path planning layer and the tracking control layer. On the basis of the sensory system signals the path planning layer generates the desired trajectory in real time. In this layer of the hierarchical control system, the conception of behavioural control was used. It was realised using Fuzzy Logic systems. The tracking control system is the lower layer of the hierarchical control system. It generates control signals for the WMR s motors and is realised using Approximate Dynamic Programming algorithms. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed. The WMR was equipped with the scanning laser range finder for obstacles detection. Keywords: approximate dynamic programming, wheeled mobile robot, behavioral control, tracking control, fuzzy logic system 1. WSTĘP Rozwój robotyki mobilnej, który nastąpił w ciągu ostatnich lat, znacznie poszerzył obszar jej zastosowań. Jednocześnie możliwa stała się realizacja bardziej skomplikowanych zadań, co pociągnęło za sobą konieczność zastosowania złożonych algorytmów sterowania robotów mobilnych. Jednakże nadal jednym z najistotniejszych problemów pozostaje generowanie w czasie rzeczywistym bezkolizyjnych trajektorii ruchu mobilnych robotów kołowych i ich realizacja. W literaturze problem ten jest często poruszany, co świadczy o jego aktualności i braku 108
Marcin Szuster uniwersalnych rozwiązań sprawdzających się we wszystkich warunkach. Istnieje wiele różnych metod planowania trajektorii ruchu mobilnych robotów kołowych (WMR, ang. Wheeled Mobile Robot) [1,2,3,4,7,11,12], wśród których można wyróżnić dwie główne grupy: metody lokale i globalne. W metodach globalnych proces planowania trajektorii ruchu WMR odbywa się off-line, metody te bazują na znajomości mapy otoczenia robota. W metodach lokalnych algorytm nawigacji wyznacza trajektorię ruchu, korzystając jedynie z informacji o odległości do przeszkód w bezpośrednim otoczeniu robota, dostarczanej przez układ sensoryczny. Metody lokalne mogą być stosowane do generowania trajektorii ruchu w czasie rzeczywistym, nadają się do nawigacji robota w nieznanym środowisku. Kolejnym problemem dotyczącym aplikacji robotów mobilnych jest opis ich dynamiki z zastosowaniem nieliniowych, dynamicznych równań ruchu, w których niektóre parametry mogą być nieznane lub zmieniać się w czasie ruchu robota. Powoduje to konieczność stosowania algorytmów, których parametry mogą adaptować się do zmieniających się warunków pracy obiektu sterowania. Obecnie coraz chętniej stosuje się nowoczesne metody sztucznej inteligencji (AI, ang. Artificial Intelligence), takie jak sztuczne sieci neuronowe (NN, ang. Neural Networks) czy algorytmy z logiką rozmytą (FL, ang. Fuzzy Logic), w układach sterowania ruchem nadążnym WMR, czy algorytmach generowania trajektorii ruchu [2,3,7,12]. W ostatnich latach można również zaobserwować znaczący wzrost zainteresowania algorytmami aproksymacyjnego programowania dynamicznego (ADP, ang. Approximate Dynamic Programming) [13,14,15], których idea wywodzi się z programowania dynamicznego ellmana, a zastosowanie NN umożliwia aplikacje w sterowaniu w czasie rzeczywistym [12,14]. W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pioneer 2-DX. Algorytm sterowania składa się z dwóch warstw. Pierwsza z nich, nadrzędna, to warstwa generowania bezkolizyjnych trajektorii ruchu WMR w nieznanym środowisku 2D ze statycznymi przeszkodami, w której zastosowano koncepcję sterowania behawioralnego. Idea sterowania behawioralnego wynika z obserwacji świata organizmów żywych i odwzorowania ich elementarnych zachowań typu podążaj do celu (GS, ang. Goal Seeking), czy omijaj przeszkody (OA, ang. Obstacle Avoiding) przez robot mobilny. Algorytmy te są zaliczane do grupy metod lokalnych, w których proces generowania trajektorii ruchu bazuje na sygnałach z układu sensorycznego WMR Pioneer 2-DX, który w prezentowanym artykule składał się ze skanera laserowego przestrzeni Hokuyo UG-04LX-F01. W warstwie planowania trajektorii ruchu zastosowano algorytmy FL do generowania sterowań behawioralnych w zadaniach typu GS i OA oraz dodatkowy algorytm FL do miękkiego przełączania realizacji poszczególnych zadań w zależności od warunków środowiska. Takie podejście umożliwia generowanie bezkolizyjnych trajektorii ruchu w zadaniu typu podążaj do celu z omijaniem przeszkód (GSOA, ang. Goal Seeking with Obstacle Avoiding). Realizacja takiego zadania w większości przypadków nie jest możliwa, gdy stosuje się jeden z typów sterowań behawioralnych GS lub OA. W literaturze można spotkać rozwiązania umożliwiające generowanie trajektorii ruchu w zadaniu typu GSOA, w których udział poszczególnych sterowań behawioralnych typu GS i OA jest stały, ustalony w sposób heurystyczny przez autora opracowania. W prezentowanym algorytmie nawigacji udział ten zmienia się w czasie ruchu WMR w zależności od odległości do celu i przeszkód znajdujących się w otoczeniu robota. Drugą warstwę hierarchicznego układu sterowania stanowi algorytm sterowania ruchem nadążnym WMR, który generuje sygnały sterowania modułami napędowymi zapewniające realizację trajektorii ruchu wygenerowanej przez warstwę nadrzędną. W warstwie realizacji ruchu zastosowano algorytmy ADP w konfiguracji Dualnego Heurystycznego Programowania Dynamicznego (DHP, ang. Dual-Heuristic Dynamic Programming), zrealizowane w formie struktur aktorkrytyk, w których zastosowano NN Random Vector Functional Link (RVFL). Wyniki badań prezentowane w artykule są kontynuacją prac autora, związanych z algorytmami planowania trajektorii ruchu [9,10] oraz sterowania ruchem nadążnym WMR [8]. Artykuł składa się z następujących części: w części pierwszej zawarto wprowadzenie w tematykę artykułu, część druga zawiera opis obiektu sterowania, w części trzeciej przedstawiono hierarchiczny układ sterowania WMR, w części czwartej zaprezentowano budowę stanowiska laboratoryjnego zastosowanego w badaniach. W części piątej przedstawiono wyniki badań weryfikacyjnych algorytmu, część ostatnia podsumowuje artykuł. 2. MOILNY ROOT KOŁOWY PIONEER 2-DX Obiektem sterowania jest mobilny robot dwukołowy, z trzecim kołem samonastawnym, Pioneer 2-DX. Ruch WMR jest analizowany w płaszczyźnie xy. WMR Pioneer 2-DX przedstawiono na rys. 1.a), jego schemat w torze pomiarowym ze statycznymi przeszkodami przedstawiono na rys. 1.b). WMR składa się z ramy 4, dwóch kół napędzających 1 i 2 oraz koła samonastawnego 3. Jest to obiekt nieholonomiczny, którego dynamika jest opisana nieliniowymi równaniami ruchu. Zadaniem algorytmu sterowania jest wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu G(, ), znajdującego się w odległości od punktu A(, ) ramy robota, z którym związano ruchomy układ współrzędnych x1y1, 109
STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO gdzie: - kąt pomiędzy prostą pg a osią x, - kąt obrotu ramy WMR, - kąt pomiędzy prostą pg a osią x1 ruchomego układu współrzędnych,,, - odległości do przeszkód zmierzone przez skaner laserowy przed WMR, po prawej i lewej stronie ramy robota,,, - kąty pomiędzy osią i-tego pomiaru i osią ramy WMR, i=1,2,3, - sygnał sterujący j-tego koła, j=1,2, - prędkość kątowa j-tego koła. sił odśrodkowych i Coriolis a, )' ( wektor oporów ruchu, * + wektor zakłóceń o ograniczonych wartościach,, wektor sygnałów sterowania. Wyznaczono dyskretne błędy nadążania - # +, - # +, (2) gdzie + - wektor zadanych kątów obrotu kół, + - wektor zadanych prędkości kątowych, generowany przez warstwę planowania trajektorii w czasie ruchu WMR. Na podstawie błędów (2) zdefiniowano uogólniony błąd nadążania. -!Λ-, (3) gdzie Λ - stała macierz diagonalna o dodatnich współczynnikach. Na podstawie modelu dynamiki WMR oraz definicji błędów nadążania (2) i (3) wyznaczono wartość uogólnionego błędu nadążania WMR w kroku k+1 gdzie. #/ 0 ' (!/ + ', +, +1 (! #/ 2!"$ %, (4) / 0 ' ("$ % &' (!)' (, / + ', +, +1 (.!/ 3 ', +, +1 (, / 3 ', +, +1 ("Λ- # +1, / 2 "$ % * +, (5) Rys. 1 a) Robot Pioneer 2-DX, b) schemat robota mobilnego w laboratoryjnym torze pomiarowym Dynamika WMR Pioneer 2-DX została zamodelowana z zastosowaniem formalizmu Maggiego [5,6]. Model ciągły dynamiki WMR został zdyskretyzowany z zastosowaniem metody Eulera. Przyjęto wektor stanu,, w którym wektor, odpowiada wektorowi prędkości kątowych w zapisie ciągłym. Dyskretny model dynamiki WMR przyjęto w postaci układu równań!", #"$ % &' (!)' ( #"$ % * + #,, (1) gdzie k indeks kroków iteracji, h parametr dyskretyzacji czasu, M dodatnio określona macierz bezwładności WMR Pioneer 2-DX, wektor kątów obrotu kół napędzających, &' ( wektor momentów od gdzie / 0 ' ( wektor zawierający wszystkie nieliniowości modelu WMR, +1 wektor zawierający zadane wartości przyspieszeń kątowych kół napędzających, jego obecność wynika z zapisu wektora + w kroku k- tym z zastosowaniem metody Eulera. 3. HIERARCHICZNY UKŁAD STEROWANIA Hierarchiczny układ sterowania ruchem WMR składa się z dwóch warstw: warstwy generowania bezkolizyjnej trajektorii ruchu WMR, zrealizowanej z zastosowaniem algorytmów FL, oraz warstwy realizacji ruchu, zrealizowanej z zastosowaniem algorytmu DHP. 3.1 WARSTWA GENEROWANIA TRAJEKTORII RUCHU Koncepcja sterowania behawioralnego opiera się na próbie odwzorowania elementarnych zachowań organizmów żywych przez roboty mobilne. Przykładami takich zachowań są zadania typu GS i OA. Pierwsze z nich polega na generowaniu i realizacji trajektorii ruchu o torze z położenia początkowego, do celu wyznaczonego we współrzędnych mapy, przy czym nie jest istotna 110
Marcin Szuster informacja o lokalizacji przeszkód w otoczeniu robota. W drugim z zachowań elementarnych generowana jest bezkolizyjna trajektoria ruchu, jednak nie jest możliwe zdefiniowanie celu. W zadaniu tym istotna jest informacja z układu sensorycznego robota o odległościach do przeszkód. Jednak w robotyce mobilnej najczęściej spotykane jest zadanie typu GSOA, które jest połączeniem zadań typu GS i OA. Polega ono na wygenerowaniu i realizacji bezkolizyjnej trajektorii ruchu robota do wyznaczonego celu z ominięciem statycznych przeszkód. W proponowanym algorytmie sterowania warstwę planowania trajektorii ruchu zrealizowano z zastosowaniem układów FL. Składa się ona z trzech struktur sterowania, z których pierwsza generuje sygnały sterowania behawioralnego w zadaniu typu GS, 4 5, 6 7 8, druga struktura warstwy planowania trajektorii generuje sygnały sterowania behawioralnego w zadaniu typu OA,, 9 4 95, 96 7 8. Trzeci element warstwy generowania trajektorii, zrealizowany z zastosowaniem układu FL, generuje sygnał : ; służący do miękkiego przełączania między realizacją sterowań behawioralnych zadań typu GS i OA, na podstawie informcji o odległości do celu oraz odległości do przeszkód, zgodnie z zależnością dmx=4 [m] - maksymalny zasięg pomiaru skanera laserowego, 9 min',, ( - minimalna odległość do przeszkód, i=1,2,3, min' (/ EU minimalna znormalizowana odległość do przeszkód przed WMR, E min' ( minimalna odległość do przeszkód po lewej stronie WMR, E min' ( minimalna odległość do prze- szkód po prawej stronie, 24Z E /' E! E ([#0.58 znormalizowana minimalna odległość do przeszkód po lewej stronie ramy robota, 24Z E /' E! E ([#0.58 - znormalizowana minimalna odległość do przeszkód po prawej stronie WMR, dgm, dod, us lingwistyczne etykiety funkcji przynależności do zbiorów rozmytych przesłanek i konkluzji, gdzie: M0 bardzo mały, bliski 0, M bardzo mały, M mały, S średni, D duży, D bardzo duży, D1 bardzo duży, bliski 1. Schemat bazy reguła układu FL pokazano na rys. 2., : ;,!'1#: ; (, 9, (6) gdzie, 4 5, 6 7 8 całkowite sygnały sterowania warstwy generowania trajektorii, 5 - sygnał sterujący zadaną prędkością ruchu punktu A ramy WMR, 6 - sygnał sterujący zadaną prędkością kątową obrotu ramy WMR 7. Na podstawie tych 7 sygnałów są generowane zadane prędkości kątowe obrotu kół napędzających WMR zgodnie z zależnością = + > @A 7? + A # 7 C = 5 >, (7) 6 7 gdzie r, l1 wymiary wynikające z geometrii WMR, A - zdefiniowana maksymalna prędkość punktu A, 7 - maksymalna prędkość kątowa obrotu ramy WMR. Układ FL generujący sygnał : ;, który zmienia udziął poszczególnych sterowań behawioralnych w całkowitych sygnałach sterowania warstwy generowania bezkolizyjnych trajektorii ruchu, został zealizowany na podstawie modelu Mamdaniego, z trójkątnymi lub trapezowymi funkcjami przynależności do zbiorów rozmytych przesłanek i konkluzji. Posiada on bazę m=25 reguł typu D E :JEŻELI' JEST NO( I ' 9 TO : ; JEST :S, JEST PQ( (8) gdzie / EU - znormalizowana odległość do celu, EU - maksymalna odległość do celu, 9 9 / EU - znormalizowana odległość do przeszkód, Rys. 2. Schemat bazy reguł Przestrzenie wejść do układu FL podzielono na 5 zbiorów trójkątnych i trapezowych, natomiast w konkluzjach zastosowano 7 funkcji przynależności. Otrzymano powierzchnię modelu FL przedstawioną na rys. 3. Rys. 3. Powierzchnia modelu rozmytego. Z zastosowanej bazy reguł wynika, że jeżeli WMR znajduje się w pobliżu przeszkód, w generowanej 111
STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO trajektorii ruchu dominujący udział ma zachowanie typu OA, gdy WMR znajduje się w pobliżu celu, dominuje zachowanie typu GS, natomiast w pozostałych przypadkach wynikowe zachowanie jest połączeniem zachowań typu GS i OA w różnych proporcjach. Strukturę generującą sterowania w zadaniu typu GS zbudowano z zastosowaniem dwóch układów FL. Generuje ona sygnały sterowania 5 i 6 7 na podstawie znajomości położenia i orientacji ramy WMR oraz położenia celu. Trajektoria jest generowana w taki sposób, aby zminimalizować odległość do celu, poprzez ruch ramy WMR w kierunku punktu G, gdy minimalizowany jest kąt #, (9) zawarty między osią ramy WMR a prostą pg. Strukturę generującą sterowania w zadaniu typu OA zbudowano z zastosowaniem dwóch układów FL, które generują sygnały sterowania 95 i 96 na podstawie 7 sygnałów z układu sensorycznego WMR. Generowana jest bezkolizyjna trajktoria ruchu powodująca minimalizację błędu gdzie g b macierz diagonalna, i b, 1 jeżeli jk jlm, w przeciwnym przypadku i b, 0, m dodatnia stała, i=1,2, b - wektor sygnałów sterowania nadzorującego, wyznaczonych stosując analizę stabilności układu zamkniętego z zastosowaniem teorii stabilności Lapunova, h a dodatnio określona macierz diagonalna wzmocnień regulatora PD. Sygnał sterowania generowanego przez NN RVFL struktury aktora określony jest zależnością 'n,o (o p'q n (, (13) gdzie n wektor wejść do i-tej NN aktora, o wektor wag warstwy wyjściowej sieci adaptowanych w czasie ruchu WMR, S(.) wektor sigmoidlanych bipolarnych funkcji aktywacji neuronów, DA macierz stałych wag warstwy wejściowej. Schemat struktury hierarchicznego układu sterowania ruchem WMR Pioneer 2-DX przedstawiono na rys. 4. _ 9 #, (10) co powoduje ruch WMR środkiem wolnej przestrzeni. 3.2 WARSTWA REALIZACJI RUCHU Wygenerowana trajektoria jest realizowana przez warstwę sterowania ruchem nadążnym WMR. W warstwie tej zastosowano nowoczesne meteody AI w postaci algorytmów ADP [13,14,15] w konfiguracji DHP, zrealizowanych z zastosowaniem NN RVFL. Sposób generowania sygnałów sterowania w algorytmch ADP bazuje na idei sterowania optymalnego ellmana, jednakże dzięki zastosowani metod AI umożliwia aproksymację funkcji wartości przez NN struktury krytyka oraz generowanie sygnału sterowania przez NN struktury aktora. Całkowity sygnał sterowania ruchem nadążnym WMR,, składa się z sygnału sterowania generowanego przez strukurę aktor-krytyk DHP,, sygnału sterowania regulatora PD,,`a, sygnału sterowania nadzorującego, b, o strukturze wynikającej z analizy stabilności zamkniętego układu sterowania zrealizowanej z zastosowaniem teorii stabilności Lapunova, oraz dodatkowego sygnału sterowania, c. Całkowity sygnał sterowania ruchem nadążnym przyjęto w formie, d $e#,!, b #,`a #, c f, (11) Rys. 4. Schemat hierarchicznego układu sterowania Neuronowy algorytm sterowania ruchem nadążnym został szczegółowo omówiony w [8]. 4. STANOWISKO ADAWCZE Schemat stanowiska badawczego pokazano na rys. 5. Rys. 5. Schemat stanowiska badawczego. gdzie, b g b, b,,`a h a.,, c "Λ- # +1, (12) Zaproponowany hierarchiczny układ sterowania przetestowano na stanowisku badawczym składającym się z WMR Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni Hokuyo UG-4LX-F01, układu 112
Marcin Szuster zasilania oraz komputera PC z kartą kontrolnopomiarową dspace DS1102, oraz oprogramowaniem Matlab/Simulink i dspace ControlDesk. 5. WYNIKI EKSPERYMENTU Przeprowadzono szereg eksperymentów weryfikujących proces planowania trajektorii oraz realizacji ruchu. W tym rozdziale, w celu uproszczenia zapisu, pominięto indeks k w oznaczeniach zmiennych. Przyjęto wartość h=0.01 [s] parametru dyskretyzacji czasu. Trajektoria ruchu była generowana w czasie rzeczywistym przez warstwę nadrzędną hierarchicznego układu sterowania na bazie sygnałów z układu sensorycznego robota, oraz realizowana przez warstwę sterowania ruchem nadążnym. Zadanie było uznawane za zrealizowane, jeżeli w trakcie ruchu WMR nie wystąpiła kolizja z przeszkodą oraz gdy po zakończeniu ruchu punkt A ramy WMR znalazł się w odległości do celu r0.05 [m]. Tory ruchu WMR z położenia początkowego w punkcie S(0.6, 0.95), do celu w punktach GA(4.8, 3.5), G(9.3, 3.5), GC(7.0, 0.75), wraz z mapą toru pomiarowego i współrzędnymi przeszkód zlokalizowanych przez czujnik laserowy przestrzeni, oznaczonych szarymi kropkami, przedstawiono na rys. 6. Zadane położenia GA(4.8, 3.5), G(9.3, 3.5) i GC(7.0, 0.75) oznaczono symbolami X. Ich lokalizacje dobrano tak, aby wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu nie było możliwe z zastosowaniem sterowań behawioralnych typu GS lub OA. Rozwiązanie tego problemu wymaga zastosowania algorytmu planowania trajektorii, który generuje sygnały sterowania będące połączeniem sterowań behawioralnych zadań typu GS i OA w odpowiednich proporcjach, w zależności od warunków środowiska, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu typu GSOA. Na rys. 6a-c można zauważyć występowanie różnic między rzeczywistą mapą otoczenia WMR a położeniem przeszkód zlokalizowanych przez układ sensoryczny robota. Wynika to z zakłóceń pojawiających się w trakcie ruchu WMR po nierównym podłożu, co ma wpływ na pracę czujnika laserowego przestrzeni, jak również z niejednolitej faktury powierzchni przeszkód i ich ustawienia pod różnym kątem do wiązki laserowej. Kolejnym problemem zaobserwowanym w trakcie realizacji badań było przesunięcie zmierzonego położenia przeszkód względem mapy rzeczywistej, wynikające z obliczania lokalizacji przeszkód na podstawie położenia i orientacji ramy WMR, ustalanych na podstawie pomiaru kąta obrotu kół realizowanego z zastosowaniem enkoderów inkrementalnych. Pojawiające się błędy sumują się w czasie ruchu, co wpływa na coraz większe przesunięcie lokalizacji wykrytych przeszkód w stosunku do ich rzeczywistego położenia. Wpływ tego zjawiska można ograniczyć poprzez zastosowanie zewnętrznej metody lokalizacji WMR w torze pomiarowym. Odległości do celu otrzymane w trakcie realizacji ruchu WMR przedstawiono na rys. 7. Realizacja bezkolizyjnej trajektorii ruchu WMR do punktu GC(7.0, 0.75) wymaga chwilowego zwiększenia odległości do zadanego położenia końcowego w celu ominięcia przeszkody. Rys. 7. Przebiegi wartości odległości lg do celów GA, G i GC Rys. 6. Mapa otoczenia z torem ruchu robota Pioneer 2-DX do celu a) GA(4.8, 3.5), b) G(9.3, 3.5), c) GC(7.0, 0.75) Poniżej przedstawiono wyniki eksperymentu otrzymane w trakcie realizacji ruchu WMR do punktu GC. Na rys. 8a przedstawiono przebieg wartości współczynnika koordynacji sterowań behawioralnych a, generowanego przez układ FL, którego wartość zależy od odległości do przeszkód, oraz do celu. W czasie eksperymentu zmiany wartości tego sygnału powodują zmianę wpływ poszczególnych sterowań behawioralnych 113
STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO na realizowane zadanie. W czasie stu16;18y [s] można zaobserwować wzrost znaczenia sygnałów sterowania behawioralnego typu OA w całkowitych sygnałach sterowania, co wynika ze zmniejszenia odległości do przeszkody. Natomiast po czasie sz30 [s] następuje całkowite przełączenie warstwy generowania trajektorii ruchu na realizację zadania typu GS, ze względu na odległość do celu. Otrzymane sygnały sterowania warstwy planowania trajektorii ruchu 5 i 6 7 przedstawiono na rys. 8b, są one połączeniem w odpowiednich proporcja sygnałów sterowań behawioralnych zadań typu GS (rys. 8d), oraz OA (rys. 8c), gdzie współczynnikiem proporcjonalności jest wartość sygnału a. fazie ruchu w zależności od odległości do przeszkód, w sposób zapewniający bezkolizyjny ruchu WMR. W końcowej fazie ruchu większe znaczenie w całkowitych wartościach sygnałów sterowania mają sygnały sterowania zadania typu GS, sygnał sterowania 6 7 zmienia się tak, aby możliwe było osiągnięcie celu GC przez punkt A ramy WMR. Na podstawie wartości sygnałów sterowania warstwy planowania trajektorii ruchu WMR generowano w czasie ruchu zadane wartości parametrów kątowych obrotu kół napędzających. Na rys. 9a przedstawiono przebiegi wartości zadanych prędkości kątowych obrotu kół napędzających WMR. Zadane parametry ruchu zostały zrealizowane z zastosowaniem warstwy realizacji ruchu, poprzez podanie do układów napędowych WMR sygnałów sterowania ruchem nadążnym, pokazanych na rys. 9b. Trajektoria ruchu WMR została zrealizowana z błędami nadążania, których przebiegi dla i=2 koła WMR przedstawiono na rys. 9c. Rys. 8 a) Przebieg wartości sygnału a, b) przebiegi wartości sygnałów 5 i 6 7, c) przebieg wartości sygnałów sterowania behawioralnego typu: c) OA ( 95, 96 7 ), d) GS ( 5, 6 7 ) Wartość sygnału sterowania prędkością kątową obrotu własnego ramy WMR, 6 7, zmienia się w początkowej Rys. 9 a) Przebiegi wartości zadanych prędkości kątowych obrotu kół 1 i 2 robota, b) przebiegi wartości całkowitych sygnałów sterowania ruchem nadążnym, c) przebiegi wartości błędów nadążania koła i=2 robota W warstwie realizacji ruchu hierarchicznego układu sterowania zastosowano algorytm DHP, w którym znajdują się NN RVFL o m=8 neuronach każda, realizu- 114
Marcin Szuster jące zadania struktur aktora i krytyka. Przyjęto zerowe wartości początkowe wag sieci. Przebiegi wartości wag NN i=1 krytyka przedstawiono na rys. 10. Rys. 10. Przebiegi wartości wag NN i=1 krytyka. 6. PODSUMOWANIE W artykule przedstawiono hierarchiczny układ sterowania ruchem WMR Pioneer 2-DX, który składa się z dwóch warstw. Warstwa nadrzędna generuje bezkolizyjną trajektorię ruchu robota w nieznanym środowisku 2D ze statecznymi przeszkodami, zastosowano w niej koncepcję sterowania behawioralnego. Składa się ona z dwóch struktur generujących sterowania behawioralne w zadaniach typu GS i OA, które zostały zrealizowane z zastosowaniam układów FL, oraz z algorytmu koordynujacego wpływ poszczególnych sterowań behawioralnych na generowaną trajektorię ruchu, w zależności od odległości do celu oraz przeszkód znajdujących się w otoczeniu WMR. Warstwę realizacji ruchu stanowi układ sterowania ruchem nadążnym WMR, w którym zastosowano algorytm ADP w konfiguracji DHP. Algorytm ten składa się z dwóch struktur, aktora oraz krytyka, zrealizowanych z zastosowaniem NN RVFL. Algorytm działa on-line i nie wymaga fazy uczenia wstępnego wag NN. Wartości błędów realizacji zadanej trajektorii ruchu, oraz wartości wag NN pozostają ograniczone w trakcie ruchu WMR Pioneer 2-DX. Literatura 1. Arkin R. C.: ehavioural-based robotics. Cambridge: MIT Press, 1998. 2. urghardt A: Sterowanie behawioralne minirobota kołowego. PAK 2004, Vol. 11, p. 26-29. 3. Drainkov D., Saffiotti A.: Fuzzy logic techniques for autonomous vehicle navigation. New York: Springer, 2001. 4. Fahimi F.: Autonomous robots : modeling, path planning, and control. New York: Springer, 2009. 5. Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie s Equations. Journal Theoretical and Applied Mechanics 2005, 3, Vol. 43, p. 511-521. 6. Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN, 2002. 7. Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. Journal Theoretical and Applied Mechanics 2004, 3, Vol. 42, p. 503-517. 8. Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control. L. Rutkowski et al. (eds.): ICAISC 2010, Part II, LNCS 2010, Vol. 6114, p. 264-271. 9. Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot. L. Rutkowski et al. (eds.): ICAISC 2012, Part II, LNCS 2012, Vol. 7268, p. 450-457. 10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robotem kołowym. Acta Mech. Automatica 2011, 1, Vol. 5, p. 28-36. 11. Maaref, H., arret, C.: Sensor-based navigation of a mobile robot in an indoor environment. Robot. Auton. Syst. 2002, Vol. 38, p. 1-18. 12. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile robot. Robot. Auton. Syst. 1995, 4, Vol. 15, p. 275-299. 13. Powell W..: Approximate dynamic programming: solving the curses of dimensionality. Princeton: Willey- Interscience, 2007. 14. Prokhorov D., Wunch D.: Adaptive critic designs. IEEE Trans. Neural Netw 1997, Vol. 8, p. 997-1007. 15. Si, J., arto, A.G., Powell, W.., Wunsch, D.: Handbook of learning and approximate dynamic programming. IEEE Press, Wiley-Interscience, 2004. 115