STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

Podobne dokumenty
PLANOWANIE TRAJEKTORII RUCHU FORMACJI ROBOTÓW MOBILNYCH Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ

PLANOWANIE RUCHU MOBILNEGO ROBOTA KOŁOWEGO Z ZASTOSOWANIEM ALGORYTMÓW Z LOGIKĄ ROZMYTĄ

ALGORYTMY APROKSYMACYJNEGO PROGRAMOWANIA DYNAMICZNEGO W GENEROWANIU I REALIZACJI TRAJEKTORII RUCHU ROBOTA MOBILNEGO PIONEER 2-DX

ROZMYTE STEROWANIE BEHAWIORALNE MOBILNYM ROBOTEM KOŁOWYM W NIEZNANYM ŚRODOWISKU

WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI KATEDRA AUTOMATYKI. Robot do pokrycia powierzchni terenu

NEURONOWO-ROZMYTE SYSTEMY STEROWANIA MOBILNYM ROBOTEM KOŁOWYM

dynamiki mobilnego robota transportowego.

Zenon Hendzel 1a, Magdalena Muszyńska 1b, Marcin Szuster 1c

MODELOWANIE KINEMATYKI I DYNAMIKI MOBILNEGO MINIROBOTA

Podstawy Automatyki. Wykład 6 - Miejsce i rola regulatora w układzie regulacji. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Mechanika Robotów. Wojciech Lisowski. 5 Planowanie trajektorii ruchu efektora w przestrzeni roboczej

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

ZESZYTY NAUKOWE INSTYTUTU POJAZDÓW 4(85)/2011

Politechnika Warszawska Wydział Samochodów i Maszyn Roboczych Instytut Podstaw Budowy Maszyn Zakład Mechaniki

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

RÓWNANIE DYNAMICZNE RUCHU KULISTEGO CIAŁA SZTYWNEGO W UKŁADZIE PARASOLA

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Temat 1. Wprowadzenie do nawigacji robotów mobilnych. Dariusz Pazderski Opracowanie w ramach programu ERA Inżyniera

PRACA DYPLOMOWA MAGISTERSKA

Sterowanie napędów maszyn i robotów

DEKOMPOZYCJA HIERARCHICZNEJ STRUKTURY SZTUCZNEJ SIECI NEURONOWEJ I ALGORYTM KOORDYNACJI

Kinematyka robotów mobilnych

MODEL STANOWISKA DO BADANIA OPTYCZNEJ GŁOWICY ŚLEDZĄCEJ

ZASTOSOWANIE DWUOSOBOWEJ GRY RÓŻNICZKOWEJ O SUMIE ZEROWEJ DO STEROWANIA ELEMENTEM MECHATRONICZNYM

MODEL MANIPULATORA O STRUKTURZE SZEREGOWEJ W PROGRAMACH CATIA I MATLAB MODEL OF SERIAL MANIPULATOR IN CATIA AND MATLAB

Sreszczenie. Słowa kluczowe: sterowanie, poziom cieczy, regulator rozmyty

Tomasz Żabiński,

Automatyka i Robotyka studia stacjonarne drugiego stopnia

Obiekt. Obiekt sterowania obiekt, który realizuje proces (zaplanowany).

ROZPROSZONY SYSTEM STEROWANIA CZASU RZECZYWISTEGO DO SERWONAPĘDÓW PŁYNOWYCH DISTRIBUTED REAL-TIME CONTROL SYSTEM FOR FLUID POWER SERVO-DRIVES

Temat: ANFIS + TS w zadaniach. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

SZTUCZNA INTELIGENCJA

Uczenie sieci typu MLP

Sztuczna inteligencja i uczenie maszynowe w robotyce i systemach autonomicznych: AI/ML w robotyce, robotyka w AI/ML

Politechnika Wrocławska, Wydział Informatyki i Zarządzania. Modelowanie

Rozszerzony konspekt preskryptu do przedmiotu Podstawy Robotyki

Podstawy Sztucznej Inteligencji (PSZT)

ZAGADNIENIA SPECJALNOŚCIOWE

Symulacja działania sterownika dla robota dwuosiowego typu SCARA w środowisku Matlab/Simulink.

NEURONOWE PROGRAMOWANIE DYNAMICZNE W STEROWANIU BEHAWIORALNYM MOBILNYM ROBOTEM KOŁOWYM

II-go stopnia. Stacjonarne. Zagadnienia egzaminacyjne AUTOMATYKA I ROBOTYKA TYP STUDIÓW STOPIEŃ STUDIÓW SPECJALNOŚĆ

Modelowanie, sterowanie i symulacja manipulatora o odkształcalnych ramionach. Krzysztof Żurek Gdańsk,

ANALIZA KINEMATYCZNA PALCÓW RĘKI

Rozszerzony konspekt preskryptu do przedmiotu Teoria Maszyn i Mechanizmów

Efekty kształcenia na kierunku AiR drugiego stopnia - Wiedza Wydziału Elektrotechniki, Automatyki i Informatyki Politechniki Opolskiej

Ćw. 18: Pomiary wielkości nieelektrycznych II

KOMPUTEROWY MODEL UKŁADU STEROWANIA MIKROKLIMATEM W PRZECHOWALNI JABŁEK

Automatyka i Regulacja Automatyczna SEIwE- sem.4

Instrukcja do ćwiczenia 6 REGULACJA TRÓJPOŁOŻENIOWA

Rozszerzony konspekt przedmiotu Inteligentne maszyny i systemy

Ćw. 18: Pomiary wielkości nieelektrycznych II

Sposoby modelowania układów dynamicznych. Pytania

Podstawy robotyki - opis przedmiotu

Wpływ tarcia na serwomechanizmy

Zastosowania Robotów Mobilnych

ALGORYTM PROJEKTOWANIA ROZMYTYCH SYSTEMÓW EKSPERCKICH TYPU MAMDANI ZADEH OCENIAJĄCYCH EFEKTYWNOŚĆ WYKONANIA ZADANIA BOJOWEGO

Algorytmy sztucznej inteligencji

Temat: Model TS + ANFIS. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Projekt rejestratora obiektów trójwymiarowych na bazie frezarki CNC. The project of the scanner for three-dimensional objects based on the CNC

Podstawy automatyki. Energetyka Sem. V Wykład 1. Sem /17 Hossein Ghaemi

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Inteligencja obliczeniowa

Informatyka studia stacjonarne pierwszego stopnia

ANALIZA OBCIĄŻEŃ JEDNOSTEK NAPĘDOWYCH DLA PRZESTRZENNYCH RUCHÓW AGROROBOTA

Problemy optymalizacji układów napędowych w automatyce i robotyce

Implementacja rozmytych systemów wnioskujących w zdaniach regulacji

Podstawy Automatyki. Wykład 7 - obiekty regulacji. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Automatyka i Regulacja Automatyczna Laboratorium Zagadnienia Seria II

Podstawy Automatyki. Wykład 7 - Jakość układu regulacji. Dobór nastaw regulatorów PID. dr inż. Jakub Możaryn. Instytut Automatyki i Robotyki

SYSTEMY CZASU RZECZYWISTEGO (SCR)

ZASTOSOWANIE ROBOTÓW MOBILNYCH W SYMULACYJNYM BADANIU CZASU EWAKUACJI

Sterowanie układem zawieszenia magnetycznego

Tematy prac dyplomowych w Katedrze Awioniki i Sterowania. Studia: I stopnia (inżynierskie)

Aplikacje Systemów. Nawigacja inercyjna. Gdańsk, 2016

UKŁAD WSPOMAGANIA OPRERATORA W ZDALNYM STEROWANIU POJAZDU LĄDOWEGO 1

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania KOMPUTEROWE SYSTEMY STEROWANIA (KSS)

SPIS TREŚCI PRZEDMOWA WYKAZ WAŻNIEJSZYCH OZNACZEŃ 1. PODSTAWOWE INFORMACJE O NAPĘDZIE Z SILNIKAMI BEZSZCZOTKOWYMI 1.1. Zasada działania i

Politechnika Warszawska Wydział Samochodów i Maszyn Roboczych Instytut Podstaw Budowy Maszyn Zakład Mechaniki

PL B1. Sposób regulacji prądu silnika asynchronicznego w układzie bez czujnika prędkości obrotowej. POLITECHNIKA GDAŃSKA, Gdańsk, PL

2.2 Opis części programowej

Temat: Sterowanie mobilnością robota z wykorzystaniem algorytmu logiki rozmytej

1. Regulatory ciągłe liniowe.

Planowanie trajektorii narzędzia skrawającego koparki hydraulicznej

PRZEWODNIK PO PRZEDMIOCIE

METODY STEROWANIA INTELIGENTNEGO W OPROGRAMOWANIU LABVIEW METHODS OF INTELLIGENT CONTROL IN LABVIEW PROGRAMMING

WYKŁAD 9 METODY ZMIENNEJ METRYKI

1. Podstawowe pojęcia

Modelowanie i symulacja II Modelling and Simulation II. Automatyka i Robotyka II stopień ogólno akademicki studia stacjonarne

8. Neuron z ciągłą funkcją aktywacji.

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

WPŁYW OPÓŹNIENIA NA DYNAMIKĘ UKŁADÓW Z REGULACJĄ KLASYCZNĄ I ROZMYTĄ

Wprowadzenie do teorii systemów ekspertowych

METODYKA BADAŃ DOKŁADNOŚCI I POWTARZALNOŚCI ODWZOROWANIA TRAJEKTORII ROBOTA PRZEMYSŁOWEGO FANUC M-16iB

Tematy prac dyplomowych w Katedrze Awioniki i Sterowania Studia II stopnia (magisterskie)

Wykaz ważniejszych oznaczeń Podstawowe informacje o napędzie z silnikami bezszczotkowymi... 13

Sterowanie pracą reaktora chemicznego

Inżynieria Wiedzy i Systemy Ekspertowe. Logika rozmyta. dr inż. Michał Bereta Politechnika Krakowska

STEROWANIE ROZMYTE KURSEM I ZANURZENIEM POJAZDU PODWODNEGO BADANIA SYMULACYJNE I EKSPERYMENTALNE

Transkrypt:

MODELOWANIE INŻYNIERSKIE nr 51, ISSN 1896-771X STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ ROZMYTĄ Marcin Szuster 1a 1 Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska a mszuster@prz.edu.pl Streszczenie W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pionier 2-DX w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw: warstwy planowania trajektorii i warstwy realizacji ruchu. Zadaniem warstwy planowania trajektorii jest generowanie parametrów ruchu kół robota w czasie rzeczywistym na podstawie sygnałów z układu sensorycznego. W warstwie tej zastosowano koncepcję sterowania behawioralnego, zrealizowanego z zastosowaniem układów z logiką rozmytą. Warstwa realizacji ruchu generuje sygnały sterowania modułami napędowymi robota, w warstwie tej zastosowano algorytmy aproksymacyjnego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono z zastosowaniem robota Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni. Słowa kluczowe: aproksymacyjne programowanie dynamiczne, mobilny robot kołowy, sterowanie behawioralne, sterowanie nadążne, układy z logiką rozmytą EHAVIOURAL CONTROL OF THE WHEELED MOILE ROOT USING FUZZY LOGIC SYSTEMS Summary In the article a hierarchical control system of the Wheeled Mobile Robot Pioneer 2-DX movement in the unknown environment with static obstacles is presented. The control system consists of two layers: the path planning layer and the tracking control layer. On the basis of the sensory system signals the path planning layer generates the desired trajectory in real time. In this layer of the hierarchical control system, the conception of behavioural control was used. It was realised using Fuzzy Logic systems. The tracking control system is the lower layer of the hierarchical control system. It generates control signals for the WMR s motors and is realised using Approximate Dynamic Programming algorithms. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed. The WMR was equipped with the scanning laser range finder for obstacles detection. Keywords: approximate dynamic programming, wheeled mobile robot, behavioral control, tracking control, fuzzy logic system 1. WSTĘP Rozwój robotyki mobilnej, który nastąpił w ciągu ostatnich lat, znacznie poszerzył obszar jej zastosowań. Jednocześnie możliwa stała się realizacja bardziej skomplikowanych zadań, co pociągnęło za sobą konieczność zastosowania złożonych algorytmów sterowania robotów mobilnych. Jednakże nadal jednym z najistotniejszych problemów pozostaje generowanie w czasie rzeczywistym bezkolizyjnych trajektorii ruchu mobilnych robotów kołowych i ich realizacja. W literaturze problem ten jest często poruszany, co świadczy o jego aktualności i braku 108

Marcin Szuster uniwersalnych rozwiązań sprawdzających się we wszystkich warunkach. Istnieje wiele różnych metod planowania trajektorii ruchu mobilnych robotów kołowych (WMR, ang. Wheeled Mobile Robot) [1,2,3,4,7,11,12], wśród których można wyróżnić dwie główne grupy: metody lokale i globalne. W metodach globalnych proces planowania trajektorii ruchu WMR odbywa się off-line, metody te bazują na znajomości mapy otoczenia robota. W metodach lokalnych algorytm nawigacji wyznacza trajektorię ruchu, korzystając jedynie z informacji o odległości do przeszkód w bezpośrednim otoczeniu robota, dostarczanej przez układ sensoryczny. Metody lokalne mogą być stosowane do generowania trajektorii ruchu w czasie rzeczywistym, nadają się do nawigacji robota w nieznanym środowisku. Kolejnym problemem dotyczącym aplikacji robotów mobilnych jest opis ich dynamiki z zastosowaniem nieliniowych, dynamicznych równań ruchu, w których niektóre parametry mogą być nieznane lub zmieniać się w czasie ruchu robota. Powoduje to konieczność stosowania algorytmów, których parametry mogą adaptować się do zmieniających się warunków pracy obiektu sterowania. Obecnie coraz chętniej stosuje się nowoczesne metody sztucznej inteligencji (AI, ang. Artificial Intelligence), takie jak sztuczne sieci neuronowe (NN, ang. Neural Networks) czy algorytmy z logiką rozmytą (FL, ang. Fuzzy Logic), w układach sterowania ruchem nadążnym WMR, czy algorytmach generowania trajektorii ruchu [2,3,7,12]. W ostatnich latach można również zaobserwować znaczący wzrost zainteresowania algorytmami aproksymacyjnego programowania dynamicznego (ADP, ang. Approximate Dynamic Programming) [13,14,15], których idea wywodzi się z programowania dynamicznego ellmana, a zastosowanie NN umożliwia aplikacje w sterowaniu w czasie rzeczywistym [12,14]. W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pioneer 2-DX. Algorytm sterowania składa się z dwóch warstw. Pierwsza z nich, nadrzędna, to warstwa generowania bezkolizyjnych trajektorii ruchu WMR w nieznanym środowisku 2D ze statycznymi przeszkodami, w której zastosowano koncepcję sterowania behawioralnego. Idea sterowania behawioralnego wynika z obserwacji świata organizmów żywych i odwzorowania ich elementarnych zachowań typu podążaj do celu (GS, ang. Goal Seeking), czy omijaj przeszkody (OA, ang. Obstacle Avoiding) przez robot mobilny. Algorytmy te są zaliczane do grupy metod lokalnych, w których proces generowania trajektorii ruchu bazuje na sygnałach z układu sensorycznego WMR Pioneer 2-DX, który w prezentowanym artykule składał się ze skanera laserowego przestrzeni Hokuyo UG-04LX-F01. W warstwie planowania trajektorii ruchu zastosowano algorytmy FL do generowania sterowań behawioralnych w zadaniach typu GS i OA oraz dodatkowy algorytm FL do miękkiego przełączania realizacji poszczególnych zadań w zależności od warunków środowiska. Takie podejście umożliwia generowanie bezkolizyjnych trajektorii ruchu w zadaniu typu podążaj do celu z omijaniem przeszkód (GSOA, ang. Goal Seeking with Obstacle Avoiding). Realizacja takiego zadania w większości przypadków nie jest możliwa, gdy stosuje się jeden z typów sterowań behawioralnych GS lub OA. W literaturze można spotkać rozwiązania umożliwiające generowanie trajektorii ruchu w zadaniu typu GSOA, w których udział poszczególnych sterowań behawioralnych typu GS i OA jest stały, ustalony w sposób heurystyczny przez autora opracowania. W prezentowanym algorytmie nawigacji udział ten zmienia się w czasie ruchu WMR w zależności od odległości do celu i przeszkód znajdujących się w otoczeniu robota. Drugą warstwę hierarchicznego układu sterowania stanowi algorytm sterowania ruchem nadążnym WMR, który generuje sygnały sterowania modułami napędowymi zapewniające realizację trajektorii ruchu wygenerowanej przez warstwę nadrzędną. W warstwie realizacji ruchu zastosowano algorytmy ADP w konfiguracji Dualnego Heurystycznego Programowania Dynamicznego (DHP, ang. Dual-Heuristic Dynamic Programming), zrealizowane w formie struktur aktorkrytyk, w których zastosowano NN Random Vector Functional Link (RVFL). Wyniki badań prezentowane w artykule są kontynuacją prac autora, związanych z algorytmami planowania trajektorii ruchu [9,10] oraz sterowania ruchem nadążnym WMR [8]. Artykuł składa się z następujących części: w części pierwszej zawarto wprowadzenie w tematykę artykułu, część druga zawiera opis obiektu sterowania, w części trzeciej przedstawiono hierarchiczny układ sterowania WMR, w części czwartej zaprezentowano budowę stanowiska laboratoryjnego zastosowanego w badaniach. W części piątej przedstawiono wyniki badań weryfikacyjnych algorytmu, część ostatnia podsumowuje artykuł. 2. MOILNY ROOT KOŁOWY PIONEER 2-DX Obiektem sterowania jest mobilny robot dwukołowy, z trzecim kołem samonastawnym, Pioneer 2-DX. Ruch WMR jest analizowany w płaszczyźnie xy. WMR Pioneer 2-DX przedstawiono na rys. 1.a), jego schemat w torze pomiarowym ze statycznymi przeszkodami przedstawiono na rys. 1.b). WMR składa się z ramy 4, dwóch kół napędzających 1 i 2 oraz koła samonastawnego 3. Jest to obiekt nieholonomiczny, którego dynamika jest opisana nieliniowymi równaniami ruchu. Zadaniem algorytmu sterowania jest wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu G(, ), znajdującego się w odległości od punktu A(, ) ramy robota, z którym związano ruchomy układ współrzędnych x1y1, 109

STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO gdzie: - kąt pomiędzy prostą pg a osią x, - kąt obrotu ramy WMR, - kąt pomiędzy prostą pg a osią x1 ruchomego układu współrzędnych,,, - odległości do przeszkód zmierzone przez skaner laserowy przed WMR, po prawej i lewej stronie ramy robota,,, - kąty pomiędzy osią i-tego pomiaru i osią ramy WMR, i=1,2,3, - sygnał sterujący j-tego koła, j=1,2, - prędkość kątowa j-tego koła. sił odśrodkowych i Coriolis a, )' ( wektor oporów ruchu, * + wektor zakłóceń o ograniczonych wartościach,, wektor sygnałów sterowania. Wyznaczono dyskretne błędy nadążania - # +, - # +, (2) gdzie + - wektor zadanych kątów obrotu kół, + - wektor zadanych prędkości kątowych, generowany przez warstwę planowania trajektorii w czasie ruchu WMR. Na podstawie błędów (2) zdefiniowano uogólniony błąd nadążania. -!Λ-, (3) gdzie Λ - stała macierz diagonalna o dodatnich współczynnikach. Na podstawie modelu dynamiki WMR oraz definicji błędów nadążania (2) i (3) wyznaczono wartość uogólnionego błędu nadążania WMR w kroku k+1 gdzie. #/ 0 ' (!/ + ', +, +1 (! #/ 2!"$ %, (4) / 0 ' ("$ % &' (!)' (, / + ', +, +1 (.!/ 3 ', +, +1 (, / 3 ', +, +1 ("Λ- # +1, / 2 "$ % * +, (5) Rys. 1 a) Robot Pioneer 2-DX, b) schemat robota mobilnego w laboratoryjnym torze pomiarowym Dynamika WMR Pioneer 2-DX została zamodelowana z zastosowaniem formalizmu Maggiego [5,6]. Model ciągły dynamiki WMR został zdyskretyzowany z zastosowaniem metody Eulera. Przyjęto wektor stanu,, w którym wektor, odpowiada wektorowi prędkości kątowych w zapisie ciągłym. Dyskretny model dynamiki WMR przyjęto w postaci układu równań!", #"$ % &' (!)' ( #"$ % * + #,, (1) gdzie k indeks kroków iteracji, h parametr dyskretyzacji czasu, M dodatnio określona macierz bezwładności WMR Pioneer 2-DX, wektor kątów obrotu kół napędzających, &' ( wektor momentów od gdzie / 0 ' ( wektor zawierający wszystkie nieliniowości modelu WMR, +1 wektor zawierający zadane wartości przyspieszeń kątowych kół napędzających, jego obecność wynika z zapisu wektora + w kroku k- tym z zastosowaniem metody Eulera. 3. HIERARCHICZNY UKŁAD STEROWANIA Hierarchiczny układ sterowania ruchem WMR składa się z dwóch warstw: warstwy generowania bezkolizyjnej trajektorii ruchu WMR, zrealizowanej z zastosowaniem algorytmów FL, oraz warstwy realizacji ruchu, zrealizowanej z zastosowaniem algorytmu DHP. 3.1 WARSTWA GENEROWANIA TRAJEKTORII RUCHU Koncepcja sterowania behawioralnego opiera się na próbie odwzorowania elementarnych zachowań organizmów żywych przez roboty mobilne. Przykładami takich zachowań są zadania typu GS i OA. Pierwsze z nich polega na generowaniu i realizacji trajektorii ruchu o torze z położenia początkowego, do celu wyznaczonego we współrzędnych mapy, przy czym nie jest istotna 110

Marcin Szuster informacja o lokalizacji przeszkód w otoczeniu robota. W drugim z zachowań elementarnych generowana jest bezkolizyjna trajektoria ruchu, jednak nie jest możliwe zdefiniowanie celu. W zadaniu tym istotna jest informacja z układu sensorycznego robota o odległościach do przeszkód. Jednak w robotyce mobilnej najczęściej spotykane jest zadanie typu GSOA, które jest połączeniem zadań typu GS i OA. Polega ono na wygenerowaniu i realizacji bezkolizyjnej trajektorii ruchu robota do wyznaczonego celu z ominięciem statycznych przeszkód. W proponowanym algorytmie sterowania warstwę planowania trajektorii ruchu zrealizowano z zastosowaniem układów FL. Składa się ona z trzech struktur sterowania, z których pierwsza generuje sygnały sterowania behawioralnego w zadaniu typu GS, 4 5, 6 7 8, druga struktura warstwy planowania trajektorii generuje sygnały sterowania behawioralnego w zadaniu typu OA,, 9 4 95, 96 7 8. Trzeci element warstwy generowania trajektorii, zrealizowany z zastosowaniem układu FL, generuje sygnał : ; służący do miękkiego przełączania między realizacją sterowań behawioralnych zadań typu GS i OA, na podstawie informcji o odległości do celu oraz odległości do przeszkód, zgodnie z zależnością dmx=4 [m] - maksymalny zasięg pomiaru skanera laserowego, 9 min',, ( - minimalna odległość do przeszkód, i=1,2,3, min' (/ EU minimalna znormalizowana odległość do przeszkód przed WMR, E min' ( minimalna odległość do przeszkód po lewej stronie WMR, E min' ( minimalna odległość do prze- szkód po prawej stronie, 24Z E /' E! E ([#0.58 znormalizowana minimalna odległość do przeszkód po lewej stronie ramy robota, 24Z E /' E! E ([#0.58 - znormalizowana minimalna odległość do przeszkód po prawej stronie WMR, dgm, dod, us lingwistyczne etykiety funkcji przynależności do zbiorów rozmytych przesłanek i konkluzji, gdzie: M0 bardzo mały, bliski 0, M bardzo mały, M mały, S średni, D duży, D bardzo duży, D1 bardzo duży, bliski 1. Schemat bazy reguła układu FL pokazano na rys. 2., : ;,!'1#: ; (, 9, (6) gdzie, 4 5, 6 7 8 całkowite sygnały sterowania warstwy generowania trajektorii, 5 - sygnał sterujący zadaną prędkością ruchu punktu A ramy WMR, 6 - sygnał sterujący zadaną prędkością kątową obrotu ramy WMR 7. Na podstawie tych 7 sygnałów są generowane zadane prędkości kątowe obrotu kół napędzających WMR zgodnie z zależnością = + > @A 7? + A # 7 C = 5 >, (7) 6 7 gdzie r, l1 wymiary wynikające z geometrii WMR, A - zdefiniowana maksymalna prędkość punktu A, 7 - maksymalna prędkość kątowa obrotu ramy WMR. Układ FL generujący sygnał : ;, który zmienia udziął poszczególnych sterowań behawioralnych w całkowitych sygnałach sterowania warstwy generowania bezkolizyjnych trajektorii ruchu, został zealizowany na podstawie modelu Mamdaniego, z trójkątnymi lub trapezowymi funkcjami przynależności do zbiorów rozmytych przesłanek i konkluzji. Posiada on bazę m=25 reguł typu D E :JEŻELI' JEST NO( I ' 9 TO : ; JEST :S, JEST PQ( (8) gdzie / EU - znormalizowana odległość do celu, EU - maksymalna odległość do celu, 9 9 / EU - znormalizowana odległość do przeszkód, Rys. 2. Schemat bazy reguł Przestrzenie wejść do układu FL podzielono na 5 zbiorów trójkątnych i trapezowych, natomiast w konkluzjach zastosowano 7 funkcji przynależności. Otrzymano powierzchnię modelu FL przedstawioną na rys. 3. Rys. 3. Powierzchnia modelu rozmytego. Z zastosowanej bazy reguł wynika, że jeżeli WMR znajduje się w pobliżu przeszkód, w generowanej 111

STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO trajektorii ruchu dominujący udział ma zachowanie typu OA, gdy WMR znajduje się w pobliżu celu, dominuje zachowanie typu GS, natomiast w pozostałych przypadkach wynikowe zachowanie jest połączeniem zachowań typu GS i OA w różnych proporcjach. Strukturę generującą sterowania w zadaniu typu GS zbudowano z zastosowaniem dwóch układów FL. Generuje ona sygnały sterowania 5 i 6 7 na podstawie znajomości położenia i orientacji ramy WMR oraz położenia celu. Trajektoria jest generowana w taki sposób, aby zminimalizować odległość do celu, poprzez ruch ramy WMR w kierunku punktu G, gdy minimalizowany jest kąt #, (9) zawarty między osią ramy WMR a prostą pg. Strukturę generującą sterowania w zadaniu typu OA zbudowano z zastosowaniem dwóch układów FL, które generują sygnały sterowania 95 i 96 na podstawie 7 sygnałów z układu sensorycznego WMR. Generowana jest bezkolizyjna trajktoria ruchu powodująca minimalizację błędu gdzie g b macierz diagonalna, i b, 1 jeżeli jk jlm, w przeciwnym przypadku i b, 0, m dodatnia stała, i=1,2, b - wektor sygnałów sterowania nadzorującego, wyznaczonych stosując analizę stabilności układu zamkniętego z zastosowaniem teorii stabilności Lapunova, h a dodatnio określona macierz diagonalna wzmocnień regulatora PD. Sygnał sterowania generowanego przez NN RVFL struktury aktora określony jest zależnością 'n,o (o p'q n (, (13) gdzie n wektor wejść do i-tej NN aktora, o wektor wag warstwy wyjściowej sieci adaptowanych w czasie ruchu WMR, S(.) wektor sigmoidlanych bipolarnych funkcji aktywacji neuronów, DA macierz stałych wag warstwy wejściowej. Schemat struktury hierarchicznego układu sterowania ruchem WMR Pioneer 2-DX przedstawiono na rys. 4. _ 9 #, (10) co powoduje ruch WMR środkiem wolnej przestrzeni. 3.2 WARSTWA REALIZACJI RUCHU Wygenerowana trajektoria jest realizowana przez warstwę sterowania ruchem nadążnym WMR. W warstwie tej zastosowano nowoczesne meteody AI w postaci algorytmów ADP [13,14,15] w konfiguracji DHP, zrealizowanych z zastosowaniem NN RVFL. Sposób generowania sygnałów sterowania w algorytmch ADP bazuje na idei sterowania optymalnego ellmana, jednakże dzięki zastosowani metod AI umożliwia aproksymację funkcji wartości przez NN struktury krytyka oraz generowanie sygnału sterowania przez NN struktury aktora. Całkowity sygnał sterowania ruchem nadążnym WMR,, składa się z sygnału sterowania generowanego przez strukurę aktor-krytyk DHP,, sygnału sterowania regulatora PD,,`a, sygnału sterowania nadzorującego, b, o strukturze wynikającej z analizy stabilności zamkniętego układu sterowania zrealizowanej z zastosowaniem teorii stabilności Lapunova, oraz dodatkowego sygnału sterowania, c. Całkowity sygnał sterowania ruchem nadążnym przyjęto w formie, d $e#,!, b #,`a #, c f, (11) Rys. 4. Schemat hierarchicznego układu sterowania Neuronowy algorytm sterowania ruchem nadążnym został szczegółowo omówiony w [8]. 4. STANOWISKO ADAWCZE Schemat stanowiska badawczego pokazano na rys. 5. Rys. 5. Schemat stanowiska badawczego. gdzie, b g b, b,,`a h a.,, c "Λ- # +1, (12) Zaproponowany hierarchiczny układ sterowania przetestowano na stanowisku badawczym składającym się z WMR Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni Hokuyo UG-4LX-F01, układu 112

Marcin Szuster zasilania oraz komputera PC z kartą kontrolnopomiarową dspace DS1102, oraz oprogramowaniem Matlab/Simulink i dspace ControlDesk. 5. WYNIKI EKSPERYMENTU Przeprowadzono szereg eksperymentów weryfikujących proces planowania trajektorii oraz realizacji ruchu. W tym rozdziale, w celu uproszczenia zapisu, pominięto indeks k w oznaczeniach zmiennych. Przyjęto wartość h=0.01 [s] parametru dyskretyzacji czasu. Trajektoria ruchu była generowana w czasie rzeczywistym przez warstwę nadrzędną hierarchicznego układu sterowania na bazie sygnałów z układu sensorycznego robota, oraz realizowana przez warstwę sterowania ruchem nadążnym. Zadanie było uznawane za zrealizowane, jeżeli w trakcie ruchu WMR nie wystąpiła kolizja z przeszkodą oraz gdy po zakończeniu ruchu punkt A ramy WMR znalazł się w odległości do celu r0.05 [m]. Tory ruchu WMR z położenia początkowego w punkcie S(0.6, 0.95), do celu w punktach GA(4.8, 3.5), G(9.3, 3.5), GC(7.0, 0.75), wraz z mapą toru pomiarowego i współrzędnymi przeszkód zlokalizowanych przez czujnik laserowy przestrzeni, oznaczonych szarymi kropkami, przedstawiono na rys. 6. Zadane położenia GA(4.8, 3.5), G(9.3, 3.5) i GC(7.0, 0.75) oznaczono symbolami X. Ich lokalizacje dobrano tak, aby wygenerowanie bezkolizyjnej trajektorii ruchu WMR do celu nie było możliwe z zastosowaniem sterowań behawioralnych typu GS lub OA. Rozwiązanie tego problemu wymaga zastosowania algorytmu planowania trajektorii, który generuje sygnały sterowania będące połączeniem sterowań behawioralnych zadań typu GS i OA w odpowiednich proporcjach, w zależności od warunków środowiska, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu typu GSOA. Na rys. 6a-c można zauważyć występowanie różnic między rzeczywistą mapą otoczenia WMR a położeniem przeszkód zlokalizowanych przez układ sensoryczny robota. Wynika to z zakłóceń pojawiających się w trakcie ruchu WMR po nierównym podłożu, co ma wpływ na pracę czujnika laserowego przestrzeni, jak również z niejednolitej faktury powierzchni przeszkód i ich ustawienia pod różnym kątem do wiązki laserowej. Kolejnym problemem zaobserwowanym w trakcie realizacji badań było przesunięcie zmierzonego położenia przeszkód względem mapy rzeczywistej, wynikające z obliczania lokalizacji przeszkód na podstawie położenia i orientacji ramy WMR, ustalanych na podstawie pomiaru kąta obrotu kół realizowanego z zastosowaniem enkoderów inkrementalnych. Pojawiające się błędy sumują się w czasie ruchu, co wpływa na coraz większe przesunięcie lokalizacji wykrytych przeszkód w stosunku do ich rzeczywistego położenia. Wpływ tego zjawiska można ograniczyć poprzez zastosowanie zewnętrznej metody lokalizacji WMR w torze pomiarowym. Odległości do celu otrzymane w trakcie realizacji ruchu WMR przedstawiono na rys. 7. Realizacja bezkolizyjnej trajektorii ruchu WMR do punktu GC(7.0, 0.75) wymaga chwilowego zwiększenia odległości do zadanego położenia końcowego w celu ominięcia przeszkody. Rys. 7. Przebiegi wartości odległości lg do celów GA, G i GC Rys. 6. Mapa otoczenia z torem ruchu robota Pioneer 2-DX do celu a) GA(4.8, 3.5), b) G(9.3, 3.5), c) GC(7.0, 0.75) Poniżej przedstawiono wyniki eksperymentu otrzymane w trakcie realizacji ruchu WMR do punktu GC. Na rys. 8a przedstawiono przebieg wartości współczynnika koordynacji sterowań behawioralnych a, generowanego przez układ FL, którego wartość zależy od odległości do przeszkód, oraz do celu. W czasie eksperymentu zmiany wartości tego sygnału powodują zmianę wpływ poszczególnych sterowań behawioralnych 113

STEROWANIE EHAWIORALNE RUCHEM MOILNEGO ROOTA KOŁOWEGO na realizowane zadanie. W czasie stu16;18y [s] można zaobserwować wzrost znaczenia sygnałów sterowania behawioralnego typu OA w całkowitych sygnałach sterowania, co wynika ze zmniejszenia odległości do przeszkody. Natomiast po czasie sz30 [s] następuje całkowite przełączenie warstwy generowania trajektorii ruchu na realizację zadania typu GS, ze względu na odległość do celu. Otrzymane sygnały sterowania warstwy planowania trajektorii ruchu 5 i 6 7 przedstawiono na rys. 8b, są one połączeniem w odpowiednich proporcja sygnałów sterowań behawioralnych zadań typu GS (rys. 8d), oraz OA (rys. 8c), gdzie współczynnikiem proporcjonalności jest wartość sygnału a. fazie ruchu w zależności od odległości do przeszkód, w sposób zapewniający bezkolizyjny ruchu WMR. W końcowej fazie ruchu większe znaczenie w całkowitych wartościach sygnałów sterowania mają sygnały sterowania zadania typu GS, sygnał sterowania 6 7 zmienia się tak, aby możliwe było osiągnięcie celu GC przez punkt A ramy WMR. Na podstawie wartości sygnałów sterowania warstwy planowania trajektorii ruchu WMR generowano w czasie ruchu zadane wartości parametrów kątowych obrotu kół napędzających. Na rys. 9a przedstawiono przebiegi wartości zadanych prędkości kątowych obrotu kół napędzających WMR. Zadane parametry ruchu zostały zrealizowane z zastosowaniem warstwy realizacji ruchu, poprzez podanie do układów napędowych WMR sygnałów sterowania ruchem nadążnym, pokazanych na rys. 9b. Trajektoria ruchu WMR została zrealizowana z błędami nadążania, których przebiegi dla i=2 koła WMR przedstawiono na rys. 9c. Rys. 8 a) Przebieg wartości sygnału a, b) przebiegi wartości sygnałów 5 i 6 7, c) przebieg wartości sygnałów sterowania behawioralnego typu: c) OA ( 95, 96 7 ), d) GS ( 5, 6 7 ) Wartość sygnału sterowania prędkością kątową obrotu własnego ramy WMR, 6 7, zmienia się w początkowej Rys. 9 a) Przebiegi wartości zadanych prędkości kątowych obrotu kół 1 i 2 robota, b) przebiegi wartości całkowitych sygnałów sterowania ruchem nadążnym, c) przebiegi wartości błędów nadążania koła i=2 robota W warstwie realizacji ruchu hierarchicznego układu sterowania zastosowano algorytm DHP, w którym znajdują się NN RVFL o m=8 neuronach każda, realizu- 114

Marcin Szuster jące zadania struktur aktora i krytyka. Przyjęto zerowe wartości początkowe wag sieci. Przebiegi wartości wag NN i=1 krytyka przedstawiono na rys. 10. Rys. 10. Przebiegi wartości wag NN i=1 krytyka. 6. PODSUMOWANIE W artykule przedstawiono hierarchiczny układ sterowania ruchem WMR Pioneer 2-DX, który składa się z dwóch warstw. Warstwa nadrzędna generuje bezkolizyjną trajektorię ruchu robota w nieznanym środowisku 2D ze statecznymi przeszkodami, zastosowano w niej koncepcję sterowania behawioralnego. Składa się ona z dwóch struktur generujących sterowania behawioralne w zadaniach typu GS i OA, które zostały zrealizowane z zastosowaniam układów FL, oraz z algorytmu koordynujacego wpływ poszczególnych sterowań behawioralnych na generowaną trajektorię ruchu, w zależności od odległości do celu oraz przeszkód znajdujących się w otoczeniu WMR. Warstwę realizacji ruchu stanowi układ sterowania ruchem nadążnym WMR, w którym zastosowano algorytm ADP w konfiguracji DHP. Algorytm ten składa się z dwóch struktur, aktora oraz krytyka, zrealizowanych z zastosowaniem NN RVFL. Algorytm działa on-line i nie wymaga fazy uczenia wstępnego wag NN. Wartości błędów realizacji zadanej trajektorii ruchu, oraz wartości wag NN pozostają ograniczone w trakcie ruchu WMR Pioneer 2-DX. Literatura 1. Arkin R. C.: ehavioural-based robotics. Cambridge: MIT Press, 1998. 2. urghardt A: Sterowanie behawioralne minirobota kołowego. PAK 2004, Vol. 11, p. 26-29. 3. Drainkov D., Saffiotti A.: Fuzzy logic techniques for autonomous vehicle navigation. New York: Springer, 2001. 4. Fahimi F.: Autonomous robots : modeling, path planning, and control. New York: Springer, 2009. 5. Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie s Equations. Journal Theoretical and Applied Mechanics 2005, 3, Vol. 43, p. 511-521. 6. Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN, 2002. 7. Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. Journal Theoretical and Applied Mechanics 2004, 3, Vol. 42, p. 503-517. 8. Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control. L. Rutkowski et al. (eds.): ICAISC 2010, Part II, LNCS 2010, Vol. 6114, p. 264-271. 9. Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot. L. Rutkowski et al. (eds.): ICAISC 2012, Part II, LNCS 2012, Vol. 7268, p. 450-457. 10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robotem kołowym. Acta Mech. Automatica 2011, 1, Vol. 5, p. 28-36. 11. Maaref, H., arret, C.: Sensor-based navigation of a mobile robot in an indoor environment. Robot. Auton. Syst. 2002, Vol. 38, p. 1-18. 12. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile robot. Robot. Auton. Syst. 1995, 4, Vol. 15, p. 275-299. 13. Powell W..: Approximate dynamic programming: solving the curses of dimensionality. Princeton: Willey- Interscience, 2007. 14. Prokhorov D., Wunch D.: Adaptive critic designs. IEEE Trans. Neural Netw 1997, Vol. 8, p. 997-1007. 15. Si, J., arto, A.G., Powell, W.., Wunsch, D.: Handbook of learning and approximate dynamic programming. IEEE Press, Wiley-Interscience, 2004. 115