Analiza stanów gry na potrzeby UCT w DVRP

Podobne dokumenty
Algorytmy heurystyczne w UCB dla DVRP

Seminarium IO. Zastosowanie metody PSO w Dynamic Vehicle Routing Problem (kontynuacja) Michał Okulewicz

Seminarium IO. Zastosowanie wielorojowej metody PSO w Dynamic Vehicle Routing Problem. Michał Okulewicz

Seminarium IO. Zastosowanie algorytmu UCT w Dynamic Vehicle Routing Problem. Michał Okulewicz

Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski

Risk-Aware Project Scheduling. SimpleUCT

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań

Optymalizacja ciągła

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym

Wybrane podstawowe rodzaje algorytmów

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation)

SZTUCZNA INTELIGENCJA

EGZAMIN - Wersja A. ALGORYTMY I STRUKTURY DANYCH Lisek89 opracowanie kartki od Pani dr E. Koszelew

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Sztuczna Inteligencja Projekt

POŁĄCZENIE ALGORYTMÓW SYMULACYJNYCH ORAZ DZIEDZINOWYCH METOD HEURYSTYCZNYCH W ZAGADNIENIACH DYNAMICZNEGO PODEJMOWANIA DECYZJI

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Strefa pokrycia radiowego wokół stacji bazowych. Zasięg stacji bazowych Zazębianie się komórek

Hierarchiczna analiza skupień

Techniki optymalizacji

Programowanie dynamiczne cz. 2

Techniki optymalizacji

Algorytmy mrówkowe. H. Bednarz. Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Inteligentne systemy informatyczne

Przestrzeń algorytmów klastrowania

Heurystyczne metody przeszukiwania

SYSTEMY OPERACYJNE LABORATORIUM 2014/2015

Generowanie i optymalizacja harmonogramu za pomoca

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633

SZTUCZNA INTELIGENCJA

Algorytmy metaheurystyczne Wykład 6. Piotr Syga

Struktury danych i złożoność obliczeniowa Wykład 2. Prof. dr hab. inż. Jan Magott

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

ZADANIE 1 ZADANIE 2. NAJWIEKSZY INTERNETOWY ZBIÓR ZADAŃ Z MATEMATYKI A) 5,5 B) 8 C) 5,75 D) 4. nie wygramy nagrody jest równe A)

Gra TransEdu - instrukcja

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Mixed-UCT: Zastosowanie metod symulacyjnych do poszukiwania równowagi Stackelberga w grach wielokrokowych

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

ALGORYTMY EWOLUCYJNE W OPTYMALIZACJI JEDNOKRYTERIALNEJ

Projektowanie rozmieszczenia stanowisk roboczych

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

Zofia Kruczkiewicz, Algorytmu i struktury danych, Wykład 14, 1

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Spacery losowe generowanie realizacji procesu losowego

Algorytmy mrówkowe. Plan. » Algorytm mrówkowy» Warianty» CVRP» Demo» Środowisko dynamiczne» Pomysł modyfikacji» Testowanie

Algorytmy genetyczne

Problem skoczka szachowego i inne cykle Hamiltona na szachownicy n x n

3.5. Podejście socjotechniczne do problemów organizacji

Elementy statystyki opisowej, teoria prawdopodobieństwa i kombinatoryka

Projektowanie logistyki magazynu

System transakcyjny oparty na średnich ruchomych. ś h = gdzie, C cena danego okresu, n liczba okresów uwzględnianych przy kalkulacji.

Zadanie 1: Piętnastka

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań

Rozdział 6 PROGRAMOWANIE WYPUKŁE I KWADRATOWE

Uczeń: -podaje przykłady ciągów liczbowych skończonych i nieskończonych oraz rysuje wykresy ciągów

Algorytmy z powrotami. Algorytm minimax

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Systemy mrówkowe. Opracowali: Dawid Strucker, Konrad Baranowski

Wstęp do Sztucznej Inteligencji

Wzrost przychodów i optymalne koszty sprzedaży. Zarządzanie terytorium sprzedaży z iq GIS

Wymagania egzaminacyjne z matematyki. Klasa 3C. MATeMATyka. Nowa Era. Klasa 3

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Algorytm memetyczny w grach wielokryterialnych z odroczoną preferencją celów. Adam Żychowski

Problem komiwojażera ACO. Zagadnienie optymalizacyjne, polegające na znalezieniu minimalnego cyklu Hamiltona w pełnym grafie ważonym.

Proces badawczy schemat i zasady realizacji

Kompresja tablic obliczeń wstępnych alternatywa dla tęczowych tablic. Michał Trojnara.

Ewolucja Różnicowa Differential Evolution

Propensity Score Matching

Podstawy OpenCL część 2

Wstęp do programowania

ALGORYTM KLASTERYZACJI W ZASTOSOWANIU DO PROBLEMU TRASOWANIA POJAZDÓW

Zarządzanie projektami. Wykład 2 Zarządzanie projektem

Podstawy Sztucznej Inteligencji (PSZT)

Zadanie transportowe i problem komiwojażera. Tadeusz Trzaskalik

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

PODEJMOWANIE DECYZJI W WARUNKACH NIEPEŁNEJ INFORMACJI

Wstęp do Techniki Cyfrowej... Teoria automatów

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

Zadania laboratoryjne i projektowe - wersja β

Monte Carlo, bootstrap, jacknife

Statystyka podstawowe wzory i definicje

Wstęp do sieci neuronowych, wykład 12 Wykorzystanie sieci rekurencyjnych w optymalizacji grafowej

Algorytmy ewolucyjne optymalizacji wielokryterialnej sterowane preferencjami decydenta

Rozdział 7 ZARZĄDZANIE PROJEKTAMI

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

Temat: Algorytmy zachłanne

Statystyka matematyczna

Rój cząsteczek. Particle Swarm Optimization. Adam Grycner. 18 maja Instytut Informatyki Uniwersytetu Wrocławskiego

Metody przeszukiwania

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Część I. Zasady obrotu. 1. Organizacja notowań i zawierania transakcji pozaseryjnych na RDN.

Zaliczenie. Ćwiczenia (zaliczenie = min. 15 punktów)

Projekt i implementacja systemu wspomagania planowania w języku Prolog

Metoda UCT w stochastycznych problemach transportowych

Marcel Stankowski Wrocław, 23 czerwca 2009 INFORMATYKA SYSTEMÓW AUTONOMICZNYCH

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Transkrypt:

Analiza stanów gry na potrzeby UCT w DVRP Seminarium IO na MiNI 04.11.2014 Michał Okulewicz based on the decision DEC-2012/07/B/ST6/01527

Plan prezentacji Definicja problemu DVRP DVRP na potrzeby UCB Analiza stanów w UCB Wyniki i wnioski based on the decision DEC-2012/07/B/ST6/01527 2

WPROWADZENIE based on the decision DEC-2012/07/B/ST6/01527 3

DVRP Dane Flota pojazdów Ładowność Magazyn Położenie Godziny otwarcia Lista zamówień Położenie Wielkość Godzina pojawienia się zamówienia Czas wyładunku based on the decision DEC-2012/07/B/ST6/01527 4

DVRP Cel Znalezienie sumarycznie najkrótszej trasy dla floty pojazdów Zrealizowanie każdego zamówienia w ciągu dnia roboczego Powrót pojazdów do magazynu przed jego zamknięciem based on the decision DEC-2012/07/B/ST6/01527 5

Ogólny schemat rozwiązywania based on the decision DEC-2012/07/B/ST6/01527 6

UCB W DVRP based on the decision DEC-2012/07/B/ST6/01527 7

Reprezentacja problemu na potrzeby UCB W kolejnych krokach czasowych generujemy kilkukrotnie nieznane zamówienia na podstawie znajomości: obszaru, na którym mogą pojawiać się zamówienia położenia części zamówień rozmiaru części zamówień częstotliwości pojawiania się zamówień Rozpatrujemy zamówienia pojedynczo, decydując do którego pojazdu je przypisać (trasa budowana w sposób zachłanny) Z najlepszego rozwiązania odrzucamy zamówienia sztuczne i optymalizujemy trasy Pytanie: Na jakiej podstawie rozróżniać przypisania zamówień do pojazdów? based on the decision DEC-2012/07/B/ST6/01527 8

Analiza rozwiązań φ1 φ2 r1 r2 request2 / capacity d request1 / capacity based on the decision DEC-2012/07/B/ST6/01527 9

Pierwotne podejście UCB 80. rozpatrywanych stanów dla par pojazd/zamówienie 4 fazy (stany) rozgrywki 5 możliwych stanów zapełnienia pojazdu po dodaniu zamówienia 4 możliwe stany odległości zamówienia od pojazdu 21. możliwych akcji w każdej z faz Wybór dodania do 1 z max. 20 typów pojazdów Dodanie nowego pojazdu based on the decision DEC-2012/07/B/ST6/01527 10

Stany rozgrywki 4 fazy (stany) Stany wyznaczane przez stosunek sumy wielkości zamówień przypisanych do pojazdów (w trakcie aktualnej symulacji) do sumy wszystkich zamówień: < 0.25 [0.25; 0.50) [0.50; 0.75) >= 0.75 Możliwe źródła problemów: Arbitralny podział faz Zależność od aktualnej sumy wielkości zamówień a więc od wygenerowanego modelu based on the decision DEC-2012/07/B/ST6/01527 11

Rozpatrywane pary zamówienie - pojazd Wypełnienie pojazdu po przypisaniu zamówienia < 0.2 [0.2; 0.4) [0.4; 0.6) [0.6; 0.8) >= 0.8 Średnia odległość zamówienia od zamówień pojazdu < 0.2 [0.2; 0.4) [0.4; 0.6) >= 0.6 Możliwe źródło problemów: Podział niedostosowany do aktualnego zadania Liczenie odległości średniej zamiast minimalnej based on the decision DEC-2012/07/B/ST6/01527 12

Liczba wykonań akcji zagregowana wielkość Distance Phase <0.2 <0.4 <0.6 <=1.0 New 25% 5683 1668 2899 1380 431 50% 3739 4033 3421 1546 55 75% 2716 5268 3448 513 365 100% 2727 3793 4127 772 1416 based on the decision DEC-2012/07/B/ST6/01527 13

Liczba wykonań akcji zagregowana odległość Capacity Phase <0.2 <0.4 <0.6 <0.8 <=1.0 New 25% 467 2312 4142 3391 1318 431 50% 155 3447 2052 3775 3310 55 75% 263 903 4721 4674 1384 365 100% 1319 2964 4249 1924 963 1416 based on the decision DEC-2012/07/B/ST6/01527 14

Nowe podejście UCB Stan jest identyfikowany jako zagregowana procentowa faza przydziału zamówień oraz zbiór akcji możliwych do wykonania x i + C 2ln(n) n i x i = 1 L i L min L max L min C = 1 n liczba odwiedzin danego stanu L sumaryczna długość tras pojazdów (normalizowana przez medianę wyniku zachłannego przydziału dla danego losowania nieznanych zamówień) based on the decision DEC-2012/07/B/ST6/01527 15

Zastosowanie UCB W danej fazie Spośród obecnych par zamówienie-pojazd oraz dodanie nowego pojazdu wybierana jest akcja zgodnie z regułami UCB Po wybraniu stanu maksymalizującego sumę średniego zwrotu i współczynnika liczby odwiedzin wybierany jest zachłannie najlepszy pojazd spośród spełniających kryteria pojemności i odległości Zamówienia prawdziwe i wygenerowane są podawane łącznie w kolejności losowej Przy decyzjach o przypisaniu zamówienia do pojazdu są brane pod uwagę stany, które były odwiedzone przynajmniej 15 razy based on the decision DEC-2012/07/B/ST6/01527 16

Stany często powtarzające się _20P,NA,NA _20P,40%,0.4 10 566 1,46 1,16 _20P,NA,NA _20P,40%,0.6 414 9 1,19 1,29 _20P,NA,NA _20P,20%,0.4 334 9 1,19 1,44 _20P,NA,NA _20P,20%,0.6 8 268 1,38 1,20 _20P,NA,NA _20P,40%,0.4 _20P,40%,0.6 16 9 244 1,35 1,39 1,15 based on the decision DEC-2012/07/B/ST6/01527 17

Stany prowadzące do dobrych wyników _20P,NA,NA _20P,40%,0.2 _20P,60%,0.2 _20P,80%,0.2 _20P,100%,0.2 _20P,40%,0.4 _20P,20%,0.6 N/A 0,87 1,10 0,68 0,82 0,68 N/A _40P,NA,NA _40P,60%,0.4 _40P,80%,0.4 _40P,100%,0.4 _40P,20%,0.6 _40P,60%,0.6 0,00 0,97 1,01 0,68 0,00 0,75 _20P,NA,NA _20P,80%,0.2 _20P,40%,0.4 _20P,60%,0.4 _20P,100%,0.4 _20P,40%,0.6 _20P,20%,1.0 N/A N/A N/A 0,68 0,83 N/A N/A _80P,NA,NA _80P,80%,0.2 _80P,60%,0.6 _80P,80%,0.6 _80P,100%,0.6 0,93 0,77 0,90 0,68 N/A _20P,NA,NA _20P,20%,0.2 _20P,40%,0.6 _20P,80%,0.6 _20P,100%,0.6 _20P,40%,1.0 _20P,60%,1.0 0,00 1,22 N/A 0,87 0,68 N/A N/A _40P,NA,NA _40P,20%,0.4 _40P,40%,0.4 _40P,80%,0.4 _40P,100%,0.4 _40P,60%,0.6 _40P,80%,0.6 N/A N/A N/A 0,68 0,93 N/A N/A _100P,NA,NA _100P,80%,0.2 _100P,80%,0.4 _100P,60%,0.6 _100P,100%,0.6 N/A 1,29 N/A N/A 0,68 _40P,NA,NA _40P,40%,0.4 _40P,100%,0.4 _40P,20%,0.6 _40P,60%,0.6 _40P,100%,0.6 N/A 0,68 1,19 N/A N/A 0,94 _20P,NA,NA _20P,40%,0.2 _20P,60%,0.2 _20P,40%,0.4 _20P,80%,0.4 _20P,100%,0.4 _20P,20%,1.0 N/A N/A 0,68 0,88 1,01 N/A N/A _20P,NA,NA _20P,40%,0.4 _20P,80%,0.4 _20P,40%,0.6 _20P,80%,0.6 _20P,100%,0.6 _20P,20%,1.0 N/A 0,86 1,21 N/A N/A 0,68 N/A based on the decision DEC-2012/07/B/ST6/01527 18

Liczba stanów w kolejnych iteracjach based on the decision DEC-2012/07/B/ST6/01527 19

Czas trwania kolejnych iteracji based on the decision DEC-2012/07/B/ST6/01527 20

Rodzaje stanów z liczbą odwiedzin > 20 based on the decision DEC-2012/07/B/ST6/01527 21

Liczba stanów z liczbą odwiedzin > 20 based on the decision DEC-2012/07/B/ST6/01527 22

Liczba stanów z liczbą odwiedzin > 10 based on the decision DEC-2012/07/B/ST6/01527 23

Wnioski Potrzebna bardziej efektywna implementacja słownika stanów i/lub wyrzucanie niepotrzebnych stanów Potrzebna jest większa liczba iteracji, aby lepiej zbadać obiecujące przypadki Potrzebne są eksperymenty mające ustalić optymalną z punktu widzenia użyteczności liczbę możliwych stanów Przy przypisywaniu należy wypróbować kolejność, gdzie znane zamówienia będą na początku based on the decision DEC-2012/07/B/ST6/01527 24

Literatura Application of Particle Swarm Optimization to Dynamic Vehicle Routing Problem, Okulewicz and Mańdziuk, 2013, LNAI, vol. 7895, pp. 547-558 Multi-Swarm Optimization for Dynamic Combinatorial Problems: A Case Study on Dynamic Vehicle Routing Problem, Khouadjia et al., 2010, LNCS, vol. 6234, pp. 227-238 A comparative study between dynamic adapted PSO and VNS for the vehicle routing problem with dynamic requests, Khouadjia et al., Applied Soft Computing 12 (2012) 1426 1439 DVRP Benchmarks, http://www.fernunihagen.de/winf/inhalte/benchmark_data.htm based on the decision DEC-2012/07/B/ST6/01527 25