Seminarium IO. Zastosowanie algorytmu UCT w Dynamic Vehicle Routing Problem. Michał Okulewicz

Podobne dokumenty
Analiza stanów gry na potrzeby UCT w DVRP

Algorytmy heurystyczne w UCB dla DVRP

Seminarium IO. Zastosowanie wielorojowej metody PSO w Dynamic Vehicle Routing Problem. Michał Okulewicz

Seminarium IO. Zastosowanie metody PSO w Dynamic Vehicle Routing Problem (kontynuacja) Michał Okulewicz

Podejście memetyczne do problemu DCVRP - wstępne wyniki. Adam Żychowski

Risk-Aware Project Scheduling. SimpleUCT

SYSTEMY OPERACYJNE LABORATORIUM 2014/2015

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation)

Łyżwy - omówienie zadania

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

Metoda UCT w stochastycznych problemach transportowych

Modelowanie motywów łańcuchami Markowa wyższego rzędu

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia niestacjonarne

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku.

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

Algorytmy zrandomizowane

Spacery losowe generowanie realizacji procesu losowego

Ilustracja metody Monte Carlo obliczania pola obszaru D zawartego w kwadracie [a,b]x[a,b]

Program MC. Obliczyć radialną funkcję korelacji. Zrobić jej wykres. Odczytać z wykresu wartość radialnej funkcji korelacji w punkcie r=

Technologie Informacyjne

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE

Zaawansowane programowanie

Algorytmy równoległe. Rafał Walkowiak Politechnika Poznańska Studia inżynierskie Informatyka 2010

Wykład 9: Markov Chain Monte Carlo

Algorytm hybrydowy dla alokacji portfela inwestycyjnego przy ograniczonych zasobach

STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR

Algorytm Dijkstry znajdowania najkrótszej ścieżki w grafie

Algorytmy zachłanne. dr inż. Urszula Gałązka

Zofia Kruczkiewicz, Algorytmu i struktury danych, Wykład 14, 1

Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość

ALHE. prof. Jarosław Arabas semestr 15Z

Zastosowanie UCT w problemach transportowych ze zmiennym zakorkowaniem ulic

Wykładnicze grafy przypadkowe: teoria i przykłady zastosowań do analizy rzeczywistych sieci złożonych

Zadania laboratoryjne i projektowe - wersja β

Heurystyczne metody przeszukiwania

Wybrane podstawowe rodzaje algorytmów

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Algorytmy ewolucyjne (3)

Podstawy OpenCL część 2

Monte Carlo, bootstrap, jacknife

Algorytmy i str ruktury danych. Metody algorytmiczne. Bartman Jacek

Drzewa decyzyjne i lasy losowe

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

Systemy uczące się Lab 4

Metoda podziału i ograniczeń

Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).

Filogeneza: problem konstrukcji grafu (drzewa) zależności pomiędzy gatunkami.

Maciej Piotr Jankowski

Algorytmy genetyczne. Materiały do laboratorium PSI. Studia stacjonarne i niestacjonarne

Algorytmy równoległe: prezentacja i ocena efektywności prostych algorytmów dla systemów równoległych

Rozwiązywanie problemów metodą przeszukiwania

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

EGZAMIN - Wersja A. ALGORYTMY I STRUKTURY DANYCH Lisek89 opracowanie kartki od Pani dr E. Koszelew

RISK-AWARE PROJECT SCHEDULING

Konkursy w województwie podkarpackim w roku szkolnym 2013/2014

Algorytmy wyznaczania centralności w sieci Szymon Szylko

Znajdowanie wyjścia z labiryntu

OPTYMALIZACJA W LOGISTYCE

Wstęp do Sztucznej Inteligencji

Wyznaczanie optymalnej trasy problem komiwojażera

Metody Programowania

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Tworzenie gier na urządzenia mobilne

KOMBINATORYKA OBIEKTY KOMBINATORYCZNE MATEMATYKA DYSKRETNA (2014/2015)

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Kwantowa wariacyjna metoda Monte Carlo. Problem własny dla stanu podstawowego układu N cząstek

Wykorzystanie algorytmów mrówkowych w dynamicznym problem

01. dla x 0; 1 2 wynosi:

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Ogólne wiadomości o grafach

Partition Search i gry z niezupełną informacją

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

MODELE SIECIOWE 1. Drzewo rozpinające 2. Najkrótsza droga 3. Zagadnienie maksymalnego przepływu źródłem ujściem

Metody przeszukiwania

Zadanie transportowe i problem komiwojażera. Tadeusz Trzaskalik

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

Algorytmy z powrotami

Metody numeryczne. Wykład nr 12. Dr Piotr Fronczak

Drzewa. Jeżeli graf G jest lasem, który ma n wierzchołków i k składowych, to G ma n k krawędzi. Własności drzew

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

z przedziału 0,1 liczb dodatnich. Rozważmy dwie zmienne losowe:... ma złożony rozkład dwumianowy o parametrach 1,q i, gdzie X, wszystkie składniki X

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Zastosowanie metody UCT i drzewa strategii behawioralnej do aproksymacji stanu równowagowego Stackelberga w grach wielokrokowych

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

Algorytmy klasyfikacji

Rozdział 8 PROGRAMOWANIE SIECIOWE

Wstęp do programowania

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP

Matematyka ubezpieczeń majątkowych r.

Strefa pokrycia radiowego wokół stacji bazowych. Zasięg stacji bazowych Zazębianie się komórek

5 Błąd średniokwadratowy i obciążenie

Matematyka Dyskretna - zadania

Kody Huffmana. Konrad Wypyski. 11 lutego 2006 roku

Transkrypt:

Seminarium IO Zastosowanie algorytmu UCT w Dynamic Vehicle Routing Problem Michał Okulewicz 05.11.2013

Plan prezentacji Przypomnienie Problem DVRP Algorytm UCT Zastosowanie algorytmu UCT/PSO w DVRP Zastosowanie algorytmu MC/PSO w DVRP Wstępne wyniki Otwarte zagadnienia 2/15

DVRP Pojazd Ładowność Magazyn Położenie Godziny otwarcia Zamówienie Położenie Wielkość Godzina zamówienia Czas wyładunku 3/15

DVRP Znalezienie sumarycznie najkrótszej trasy dla pojazdów Zrealizowanie każdego zamówienia w ciągu dnia roboczego Powrót pojazdów do magazynu przed jego zamknięciem Znalezienie f n oraz i j f : POJAZDY 2 ZAMÓWIENIA POJAZDY 4/15

UCT UCT jest algorytmem typu Monte Carlo i stanowi uogólnienie algorytmu UCB UCT odpowiada za sposób wyboru sekwencji akcji w kolejnych symulacjach mając za zadanie równoważenie pomiędzy eksploracją a eksploatacją Sekwencje akcji reprezentowane są w formie drzewa W liściu drzewa UCT przeprowadzane są wielokrotne symulacje metodą Monte Carlo w celu uzyskania kolejnych przybliżeń wyników do jakich prowadzi sekwencja akcji reprezentowana przez ten liść W każdym wierzchołku przechowywana jest liczba symulacji Ti, w których została wykonana dana akcja i oraz średni końcowy wynik Xi tych symulacji Gdy dany wierzchołek odwiedzany jest po raz t-ty wykonywana jest akcja, która ma największą wartość wyrażenia X i 2 ln t T i 5/15

Zastosowanie UCT/PSO w DVRP Przed rozpoczęciem dnia roboczego Zbudowanie modelu M 0 z którego będą generowane nieznane zamówienia w oparciu o wielkości zamówień znanych na początku dnia roboczego średnią częstotliwość pojawiania się zamówień granice obszaru w jakim pojawiają się zamówienia Wygenerowanie n(=25) przypadków z zamówień znanych na początku dnia roboczego oraz sztucznych zamówień z modelu M 0 Rozwiązanie każdego z n przypadków przy użyciu istniejącego algorytmu (np. 2PSO+2OPT) Przeanalizowanie każdego z uzyskanych rozwiązań i wybranie zbiorów zamówień najczęściej występujących wspólnie 6/15

Zastosowanie UCT/PSO w DVRP W trakcie dnia roboczego Wygenerowanie zaktualizowanego modelu M i generującego zamówienia Po pojawieniu się kolejnego zamówienia rozpatrujemy jego przydzielenie do każdego z pojazdów, do którego są już przydzielone zamówienia (oraz do pustego pojazdu jeżeli jest dostępny) Przydziały w kolejnych symulacjach są wybierane za pomocą algorytmu UCT (wielkość drzewa UCT jest zdeterminowana przez liczbę jednocześnie pojawiających się zamówień w praktyce nie więcej niż 3 a zwykle 1) Reszta zamówień w każdej z symulacji jest generowana z modelu M i i przydzielana do pojazdów w sposób losowy (zamówienia są umieszczane na trasie pojazdu w sposób zachłanny) Ostateczna trasa dla każdego z pojazdów w każdej symulacji jest poprawiana algorytmem 2-OPT i suma długości tych tras jest wynikiem symulacji 7/15

Zastosowanie MC/PSO w DVRP Przed początkiem dnia roboczego identycznie jak dla UCT W trakcie dnia roboczego Wygenerowanie zaktualizowanego modelu M i generującego zamówienia (analogicznie jak na początku dnia roboczego) wygenerowanie n(=25) zamówień z modelu M i i rozwiązanie ich algorytmem 2PSO+2OPT (analogicznie jak na początku dnia roboczego) wybór zamówień najczęściej występujących wspólnie 8/15

Wybór rozwiązania początkowego Zliczenie wspólnego występowania par zamówień we wszystkich wygenerowanych rozwiązaniach Odrzucenie par, które wystąpiły razem w mniej niż połowie rozwiązań Wybranie (w sposób zachłanny jednokrotna iteracja po zamówieniach) istniejącego rozwiązania, które maksymalizuje sumę wag krawędzi 9/15

Usprawnienia W algorytmie UCT wraz z postępem dnia roboczego kolejne zamówienia pozostają na stałe przydzielone do danego pojazdu, w związku z czym po połowie dnia roboczego, kiedy znane są już wszystkie zamówienia rozwiązanie jest poprawiane algorytmem PSO Aktualny najlepszy znany wynik powstaje poprzez przydział aktualnie znanych zamówień zgodnie z przydziałem dla węzła drzewa UCT o najlepszym średnim wyniku z trasą dla tych zamówień zoptymalizowaną algorytmem PSO+2OPT 10/15

Wyniki Nazwa MC 25 PSO 40/250 UCB 10000 PSO 40/250 PSO 100/2500 Min Śr. Odch.Std. Min Śr. Odch.Std. Min Śr. Odch.Std. 17.clustered 1030,92 1095,96 18,06 1037,77 1104,32 37,12 1014,8 1082,67 28,79 17.plain 1248,52 1266,68 35,32 1270,53 1393,09 116,39 1248,52 1255,8 6,45 11/15

17.Clustered 12/15

17.plain 13/15

Zagadnienia do zbadania Zbadanie innych sposobów wybierania zamówień najczęściej występujących wspólnie Uruchomienie algorytmu na benchmarkach Christofides'a, Taillard'a i Fishera Wpływ rozkładu z jakiego losowane są identyfikatory pojazdów w fazie Monte Carlo algorytmu UCT na jakość rozwiązania Wpływ głębokości drzewa UCT na jakość rozwiązania Zachowanie UCT ze stałym modelem i losowym przydziałem zamówień do pojazdów Zachowanie UCT z rzeczywistym modelem i losowym przydziałem zamówień do pojazdów Zachowanie UCT ze zmiennym modelem i zachłannym przydziałem zamówień do pojazdów 14/15

Literatura Kocsis L, Szepesvári C. Bandit based monte-carlo planning. 2006, LNAI 4212, 282-93 Benchmarki DVRP, http://www.fernuni-hagen.de/winf/inhalte/benchmark_data.htm 15/15