Efektywne algorytmy związane z kombinatoryczną strukturą słów

Podobne dokumenty
JAO - J zyki, Automaty i Obliczenia - Wykªad 1. JAO - J zyki, Automaty i Obliczenia - Wykªad 1

Wykład 1 Wybrane problemy algorytmiki

A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.

Metodydowodzenia twierdzeń

Maszyny Turinga i problemy nierozstrzygalne. Maszyny Turinga i problemy nierozstrzygalne

Hotel Hilberta. Zdumiewaj cy ±wiat niesko«czono±ci. Marcin Kysiak. Festiwal Nauki, Instytut Matematyki Uniwersytetu Warszawskiego

Algorytmika i kombinatoryka tekstów

Matematyka dyskretna dla informatyków

1. Wprowadzenie do C/C++

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

Metody numeryczne i statystyka dla in»ynierów

1. Wprowadzenie do C/C++

Teoria grafów i sieci 1 / 58

Indeksowane rodziny zbiorów

Dokªadna arytmetyka liczb rzeczywistych w j zyku Python

Relacj binarn okre±lon w zbiorze X nazywamy podzbiór ϱ X X.

Matematyka dyskretna dla informatyków

Algorytmy zwiazane z gramatykami bezkontekstowymi

i, lub, nie Cegieªki buduj ce wspóªczesne procesory. Piotr Fulma«ski 5 kwietnia 2017

Wst p do sieci neuronowych, wykªad 14 Zespolone sieci neuronowe

Logika dla matematyków i informatyków Wykªad 1

ALGORYTMIKA Wprowadzenie do algorytmów

Regulamin ustalania wysoko±ci, przyznawania i wypªacania stypendium za wyniki w nauce dla doktorantów MIMUW v4.3

Ciaªa i wielomiany. 1 Denicja ciaªa. Ciaªa i wielomiany 1

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Arkusz maturalny. Šukasz Dawidowski. 25 kwietnia 2016r. Powtórki maturalne

Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna

2 Liczby rzeczywiste - cz. 2

Rzut oka na zagadnienia zwi zane z projektowaniem list rozkazów

1 Metody iteracyjne rozwi zywania równania f(x)=0

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

Przykªady problemów optymalizacji kombinatorycznej

Matematyka. Justyna Winnicka. rok akademicki 2016/2017. Szkoªa Gªówna Handlowa

O seminarium Algorytmika

Podstawy matematyki dla informatyków

Wykªad 4. Funkcje wielu zmiennych.

Wektory w przestrzeni

Teoria grafów i jej zastosowania. 1 / 126

Wst p do informatyki. Systemy liczbowe. Piotr Fulma«ski. 21 pa¹dziernika Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

Listy i operacje pytania

Twierdzenie Wainera. Marek Czarnecki. Warszawa, 3 lipca Wydziaª Filozoi i Socjologii Uniwersytet Warszawski

Drzewa Gomory-Hu Wprowadzenie. Drzewa Gomory-Hu. Jakub Š cki. 14 pa¹dziernika 2009

Biostatystyka, # 5 /Weterynaria I/

Uproszczony dowod twierdzenia Fredricksona-Maiorany

Proste modele o zªo»onej dynamice

Wykªad 4. Droga i cykl Eulera i Hamiltona

Zestaw 1 ZESTAWY A. a 1 a 2 + a 3 ± a n, gdzie skªadnik a n jest odejmowany, gdy n jest liczb parzyst oraz dodawany w przeciwnym.

Elementy geometrii w przestrzeni R 3

1 Bª dy i arytmetyka zmiennopozycyjna

Inform., 72(1-3): (2006) 2 Antonio Cano Gómez, Giovanna Guaiana and Jean-Éric Pin When Does Partial Commutative

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Twierdzenie Levy-Steiniza i zbiory osi galne szeregów warun

AUTO-ENKODER JAKO SKŠADNIK ARCHITEKTURY DEEP LEARNING

Ekonometria. wiczenia 7 Modele nieliniowe. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Co i czym mo»na skonstruowa

Paweł Gawrychowski Wyszukiwanie wzorca października / 31

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Metody dowodzenia twierdze«

Biedronka. Wej±cie. Wyj±cie. Przykªady. VI OIG Zawody dru»ynowe, Finaª. 19 V 2012 Dost pna pami : 64 MB.

Umieszczanie zbiorów częściowo uporządkowanych w książce o minimalnej liczbie stron

1 Przypomnienie wiadomo±ci ze szkoªy ±redniej. Rozwi zywanie prostych równa«i nierówno±ci

Wst p do sieci neuronowych 2010/2011 wykªad 7 Algorytm propagacji wstecznej cd.

In»ynierskie zastosowania statystyki wiczenia

Ksztaªt orbity planety: I prawo Keplera

Zastosowania metod analitycznej złożoności obliczeniowej do przetwarzania sygnałów cyfrowych oraz w metodach numerycznych teorii aproksymacji

Zadania z kolokwiów ze Wst pu do Informatyki. Semestr II.

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Bash i algorytmy. Elwira Wachowicz. 20 lutego

Materiaªy do Repetytorium z matematyki

Mikro II: Krzywe kosztów, Poda» rmy i Poda» gaª zi.

Arytmetyka zmiennopozycyjna

Informatyka, matematyka i sztuczki magiczne

O pewnym zadaniu olimpijskim

Maksymalna liczba punktów do zdobycia: 80. Zadanie 1: a) 6 punktów, b) 3 punkty, Zadanie 2: a) 6 punktów, b) 4 punkty,

MNIEJ I BARDZIEJ ZNANE PROBLEMY TEORII LICZB

Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA. W obu podpunktach zakªadamy,»e kolejno± ta«ców jest wa»na.

Wyniki badania PISA 2009

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Lekcja 8 - ANIMACJA. 1 Polecenia. 2 Typy animacji. 3 Pierwsza animacja - Mrugaj ca twarz

Rachunek caªkowy funkcji wielu zmiennych

Bibliografia z BibTeX

Ekonometria Bayesowska

Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.

Usługa Powszechna. Janusz Górski Michał Piątkowski Polska Telefonia Cyfrowa

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Wykªad 1. Wprowadzenie do teorii grafów

Uogólnione drzewa Humana

Oba zbiory s uporz dkowane liniowo. Badamy funkcj w pobli»u kresów dziedziny. Pewne punkty szczególne (np. zmiana denicji funkcji).

Tomograa komputerowa

'()(*+,-./01(23/*4*567/8/23/*98:)2(!."/+)012+3$%-4#"4"$5012#-4#"4-6017%*,4.!"#$!"#%&"!!!"#$%&"#'()%*+,-+

Wykorzystanie lokalnej geometrii danych w Maszynie Wektorów No±nych

Lab. 02: Algorytm Schrage

PROGRAM NR 2(4)/T/2014 WSPIERANIE AKTYWNOŚCI MIĘDZYNARODOWEJ

Lekcja 9 - LICZBY LOSOWE, ZMIENNE

Statystyka matematyczna - ZSTA LMO

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Arkusz maturalny. Šukasz Dawidowski. 25 kwietnia 2016r. Powtórki maturalne

Rozdziaª 8. Modele Krzywej Dochodowo±ci

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

Przekroje Dedekinda 1

Transkrypt:

Efektywne algorytmy związane z kombinatoryczną strukturą słów Autoreferat rozprawy doktorskiej Marcin Pi tkowski Uniwersytet Mikoªaja Kopernika Wydziaª Matematyki i Informatyki Badanie struktury powtórze«jest jednym z podstawowych problemów kombinatoryki i algorytmiki sªów, patrz [9], [11], [12]. Pocz tki bada«w tej dziedzinie datuj si na okoªo sto lat temu, patrz [18] (1906) oraz [19] (1912). Najwa»niejszymi typami rozwa»anych powtórze«s kwadraty (powtórzenia postaci zz) zwi zane z kompresowalno±ci sªów, oraz maksymalne powtórzenia maj ce wiele zastoswa«algorytmicznych, patrz [10]. Maksymalnym powtórzeniem w sªowie s nazywamy podsªowo w sªowa s postaci w = u k v, gdzie k 2, u jest minimalne o tej wªasno±ci (u y l ), za± v jest wªa±ciwym preksem u, które nie mo»e by rozszerzone w»adn stron bez zmiany okresu (u). Na przykªad w sªowie abaababa mamy 3 maksymalne powtórzenia: abaaba, ababa, aa oraz 4 parami ró»ne kwadraty: abab, baba, aa, abaaba. Oznaczmy przez sq(w) liczb parami ró»nych kwadratów, za± przez ρ(w) liczb maksymalnych powtórze«w sªowie w; dodatkowo niech sq(n) oraz ρ(n) oznaczaj odpowiednio maksymaln liczb parami ró»nych kwadratów oraz maksymalnych powtórze«w sªowach dªugo±ci n. Mimo wielu bada«w tej dziedzinie dokªadne asymptotyczne oszacowanie dla sq(n) oraz ρ(n) nadal nie jest znane, za± algorytmy wyznaczania sq(w) oraz ρ(w) s skomplikowane. W rozprawie zbadana zostaªa struktura wyst pie«powtórze«dla klasy standardowych sªów Sturma S jednej z intensywniej badanych klas w kombina- 1

toryce sªów, zobacz na przykªad [1], [4], [5], [6], [14], [16], [17], [20]. Podobne rezultaty uzyskuje si dla sªów Christoela, b d cych pewnymi cyklicznymi przesuni ciami sªów standardowych, oraz maj cych wiele zastosowa«geometrycznych, patrz [6], [7], [8]. Slowa standardowe posiadaj zwarte reprezentacje w postaci ci gów dodatnich liczb caªkowitych. Dla ci gu γ = (γ 0,..., γ n ) sªowo standardowe Sw(γ) = x n+1 okre±lamy za pomoc rekurencji: x 1 = b, x 0 = a, x 1 = x γ 0 0 x 1, x 2 = x γ 1 1 x 0,. x n = x γ n 1 n 1 x n 2,. x n+1 = x γn n x n 1. Ci g γ mo»emy traktowa jako skompresowan reprezentacj sªowa standardowego. Dªugo± sªowa N = Sw(γ) jest wykªadniczo zale»na od dªugo- ±ci ci gu (n + 1) = γ. W szczególno±ci dla ustalonego n najmniesza dªugo± sªowa jest równa dªugosci sªowa Fibonacciego F n = Sw(1, 1,..1), a wi c Sw(γ) c φ n, gdzie φ = 1+ 5 2. Wyniki prezentowane w rozprawie opieraj si na opisanej powy»ej reprezentacji sªów standardowych. Mamy wi c do czynienia z badaniem struktury powtórze«w skompresowanej wersji sªów, wykªadniczych wzgl dem rozmiaru wej±cia, co dodatkowo komplikuje konstrukcj algorytmów dziaªaj cych w czasie liniowym ze wzgl du na rozmiar wej±cia. W rozdziale 1 zdeniowana zostaªa klasa S standardowych sªów Sturma nieokresowych sªów nad alfabetem binarnym o minimalnej zªo»ono±ci kombinatorycznej. Na wst pie przedstawiona zostaªa denicja rekurencyjna, prowadz ca do efektywnej skompresowanej reprezentacji w postaci ci gów liczb caªkowitych o dªugo±ci logarytmicznie zale»nej od dªugo±ci sªowa. Nast pnie zaprezentowana zostaªa geometryczna denicja sªów Christoela pewnych cyklicznych przesuni sªów standardowych jako dyskretyzacji prostych na pªaszczy¹nie dyskretnej oraz jako etykietowania grafu Cayley'a pewnej grupy sko«czonej zwi zanej z liczb liter w generowanym sªowie. Zaprezentowana równie» zostaªa konstrukcja sªów standardowych za pomoc rodziny morzmów oraz ich arytmetyczny opis za pomoc uªamków ªa«cuchowych. Rozdziaª 2 po±wi cony zostaª dokªadnemu zbadaniu struktury grafów podsªów sªów standardowych. Struktura ta pozwala uzyska nowe prostsze dowody wielu znanych faktów dotycz cych sªów standardowych oparte na strukturze grafów oraz prowadzi do prostych algorytmów wyznaczaj cych takie 2

wªasno±ci sªów standardowych jak: liczba podsªów, punkt rozkªadu krytycznego, leksykogracznie maksymalne suksy oraz zbiory wyst pie«podsªów okre±lonej dªugo±ci wczasie liniowo zale»nym od dªugo±ci skompresowanej reprezentacji sªowa (logarytmicznie zale»nym od dªugo±ci samego sªowa). W rozdziale 3 na podstawie struktury grafów podsªów rozwa»anej w rozdziale 2 uzyskano prost charakteryzacj okresów maksymalnych powtórze«w sªowach standardowych. Prowadzi ona do zwartego wzoru na liczb ρ(w) maksymalnych powtórze«w sªowach w S oraz algorytmu licz cego ρ(w) w czasie liniowo zale»nym od rozmiaru skompresowanej reprezentacji w (zatem logarytmicznie zale»nym od dªugo±ci caªego w). Dowiedziono równie»,»e ρ(w) w 4 5 dla dowolnego w S, oraz skonstruowano niesko«czony ci g sªów w k S o ±ci±le rosn cej dªugo±ci, dla którego ρ(w k ) lim = 4 k w k 5. Dokªadne zbadanie struktury powtórze«dla du»ej klasy skomplikowanych sªów S umo»liwia lepsze zrozumienie tego problemu w szerszych klasach sªów. W rozdziale 4 badanie powtórze«zostaªo rozszerzone na kwadraty. Wykorzystane zostaªy wyniki pracy [13], gdzie zaprezentowane zostaªy skomplikowane wzory na liczb kwadratów w sªowach standardowych. W rozprawie uproszczono nieznacznie wzory, dowiedziono,»e sq(w) 9 w dla dowolnego w S 10 oraz skonstruowano niesko«czony ci g sªów w k S o ±ci±le rosn cej dªugo±ci, dla którego sq(w k ) lim = 9 k w k 10. Klasa sªów standardowych S jest najwi ksz klas sªów, dla której znane s zwarty wzór oraz asymptotyczne oszacowanie na liczb kwadratów. W rozdziale tym dokonano równie» asymptotycznej analizy liczby maksymalnych powtórze«oraz kwadratów w sªowach Christoela. W rozdziale 5 struktura skompresowanych grafów podsªów sªów standardowych opisana w rozdziale 2 zostaªa wykorzystana do opisania dualnego systemu liczbowego Ostrowskiego. System ten mo»e zosta zdeniowany bez 3

odwoªywania si do sªów standardowych, jednak podej±cie grafowe prowadzi do prostej interpretacji reprezentacji dodatnich liczb caªkowitych w tym systemie jako dªugo±ci ±cie»ek w grae podsªów odpowiedniego sªowa standardowego. Wprowadzone równie» zostaªo nowe poj cie zwi zane ze sªowami standardowymi automat Ostrowskiego. Analiza maksymalnych powtórze«oraz kwadratów w bardzo dªugich sªowach standardowych byªa w sposób istotny wspomagana komputerowo. Kilka przydatnych apletów zwi zanych z problemami rozwa»anymi w rozprawie jest dost pnych na stronie: http://www.mat.umk.pl/~martinp/stringology/applets/ Podsumowuj c, gªównymi wynikami rozprawy s : 1. algorytm znajdowania ρ(w) dla w S w czasie liniowo zale»nym od jego (zazwyczaj logarytmicznej) skompresowanej reprezentacji γ (patrz [2]); 2. asymptotyczna granica ρ(w) 0.8 w dla w S (patrz [2]); 3. algorytmiczna konstrukcja niesko«czonego ci gu sªów standardowych {w k } asymptotycznie osi gaj cego granic ρ(w k ) = 0.8 w k o( w k ) (patrz [2]); 4. asymptotyczna granica sq( w ) 0.9 w dla w S (S stanowi najwi ksz klas sªów, dla której znane jest dokªadna asymptotyczna granica, dla ogólniejszych klas sªów najlepszym oszacowaniem jest n sq(n) 2n, a uzyskanie dokªadniejszego ograniczenia jest bardzo trudne) (patrz [15]); 5. algorytmiczna konstrukcja niesko«czonego ci gu sªów standardowych {w k } asymptotycznie osi gaj cego granic sq(w k ) = 0.8 w k o( w k ) (patrz [15]); 6. zbadanie struktury skompresowanych grafów podsªów dla sªów standardowych rozmiar tych grafów jest liniowo zale»ny od γ, przy ich pomocy uzyskano kilka efektywnych algorytmów zwi zanych z kombinatorycznymi wªasno±ciami sªów standardowych (patrz [3]); 7. zwi zek mi dzy struktur grafów podsªów sªów standardowych a pewnymi systemami liczbowymi oraz pewn szczególn klas automatów sko«czonych (patrz [3]). Wyniki te zostaªy opublikowane w pracach [2], [3] oraz [15]. 4

Literatura [1] J. Allouche and J. Shallit. Automatic Sequences. Theory, Applications, Generalizations. Cambridge University Press, 2003. [2] P. Baturo, M. Pi tkowski, and W. Rytter. The number of runs in Sturmian words. In Proceedings of the 13th international conference on Implementation and Applications of Automata, volume 5148 of Lecture Notes in Computer Science, pages 252261. Springer, 2008. [3] P. Baturo, M. Pi tkowski, and W. Rytter. Usefulness of directed acyclic subword graphs in problems related to standard Sturmian words. International Journal of Foundations of Computer Science, 20(6):10051023, 2009. [4] P. Baturo and W. Rytter. Compressed string-matching in standard Sturmian words. Theoretical Computer Science, 410(3032):28042810, 2009. [5] J. Berstel. Sturmian and Episturmian words: a survey of some recent results. In Proceedings of the 2nd international conference on Algebraic informatics, volume 4728 of Lecture Notes in Computer Science, pages 2347. Springer, 2007. [6] J. Berstel, A. Lauve, C. Reutenauer, and F. Saliola. Combinatorics on Words: Christoel Words and Repetitions in Words. CRM monograph series. Providence, R.I: American Mathematical Society, 2009. [7] E. B. Christoffel. Observatio arithmetica. Mathematische Annalen, 6:145152, 1875. [8] E. B. Christoffel. Lehrsätze über arithmetische eigenshaften du irrationnalzahlen. Annali di Mathematica Pura ed Applicata, Series II, 15:253276, 1888. [9] M. Crochemore, L. Ilie, and W. Rytter. Repetitions in strings: Algorithms and combinatorics. Theoretical Computer Science, 410(50):52275235, 2009. [10] M. Crochemore, C. S. Iliopoulos, M. Kubica, J. Radoszewski, W. Rytter, and T. Walen. Extracting powers and periods in a string from its runs structure. In Proceedings of 17th International Symposium on String Processing and Information Retrieval, volume 6393 of Lecture Notes in Computer Science, pages 258269. Springer, 2010. 5

[11] M. Crochemore and W. Rytter. Squares, cubes, and time-space ecient string searching. Algorithmica, 13(5):405425, 1995. [12] M. Crochemore and W. Rytter. Jewels of Stringology: text algorithms. World Scientic, 2003. [13] D. Damanik and D. Lenz. Powers in Sturmian sequences. European Journal of Combinatorics, 24(4):377390, 2003. [14] M. Lothaire. Algebraic Combinatorics on Words, volume 90 of Encyclopedia of mathematics and its application. Cambridge University Press, 2002. [15] M. Pi tkowski and W. Rytter. Asymptotic behaviour of the maximal number of squares in standard Sturmian words. In Proceedings of the 14-th Prague Stringology Conference, pages 237248. Czech Technical University, 2009. accepted to International Journal of Foundations of Computer Science. [16] M. Sciortino and L. Zamboni. Sux automata and standard Sturmian words. In Proceedings of the 11th International Conference on Developments in Language Theory, volume 4588 of Lecture Notes in Computer Science, pages 382398. Springer, 2007. [17] J. Shallit. Characteristic words as xed points of homomorphisms. Technical Report CS-91-72, University of Waterloo, Department of Computer Science, 1991. [18] A. Thue. Über unendliche zeichenreihen. Norske Vid. Selsk. Skr. I Math-Nat., Christiana 7:122, 1906. [19] A. Thue. Über die gegenseitige lage gleicher teile gewisser zeichenreihen. Norske Vid. Selsk. Skr. I Math-Nat., Christiana 10:167, 1912. [20] H. Uscka-Wehlou. Digital lines, Sturmian words, and continued fractions. PhD thesis, Department of Mathematics, Upspsala University, 2009. 6