Translacja sterowana składnią w generatorze YACC

Wielkość: px
Rozpocząć pokaz od strony:

Download "Translacja sterowana składnią w generatorze YACC"

Transkrypt

1 Translacja sterowana składnią w generatorze YACC Wojciech Complak 1

2 Plan wykładu zasady implementacji translacji sterowanej składnią w generatorze YACC korzystanie z atrybutów syntetyzowanych typy atrybutów korzystanie z atrybutów dziedziczonych akcje wielokrotne akcja domyślna Translacja sterowana składnią w generatorze YACC (2) W ramach wykładu zostaną przedstawione następujące zagadnienia: zasady implementacji translacji sterowanej składnią w generatorze YACC, korzystanie z atrybutów syntetyzowanych, definiowanie i posługiwanie się typami atrybutów, korzystanie z atrybutów dziedziczonych, konsekwencje wykorzystania akcji wielokrotnych, sytuacje, gdy jawne użycie akcji domyślnej jest konieczne. 2

3 Implementacja translacji sterowanej składnią w YACCu reguły semantyczne w YACCu są obliczane w trakcie translacji drzewo rozbioru nie jest jawnie konstruowane, porządek ewaluacji atrybutów jest narzucony przez samą metodę analizy składniowej zaletą takiego podejścia jest prostota i efektywność translatora (małe narzuty pamięciowe i czasowe) wadą takiego podejścia jest możliwość przetwarzania tylko L-atrybutowych definicji sterowanych składnią Translacja sterowana składnią w generatorze YACC (3) W YACCu reguły semantyczne są obliczane w trakcie przetwarzania wejścia. Samo drzewo nie jest konstruowane jawnie, a kolejność obliczania atrybutów wynika z zasady działania LR-parsera akcje są wykonywane tylko w trakcie redukcji. Dzięki tym regułom wygenerowane analizatory są relatywnie proste i efektywne. Z początku może się wydawać, że ograniczenie możliwości przetwarzania definicji sterowanych składnią do zbioru tylko L-atrybutowych jest istotne. W praktyce jednak rzadko jest to istotny problem. Jeżeli jednak definicja sterowana składnią nie jest L-atrybutowa, a chcemy taki translator skonstruować w YACCu mamy dwa rozwiązania: -przepisać definicję tak, aby była L-atrybutowa, czasami definicję sterowaną składnią można łatwo zmodyfikować tak, żeby była L-atrybutowa (a nawet S-atrybutowa), w niektórych przypadkach konieczne może być jednak znaczące przebudowanie gramatyki i wtedy warto rozważyć drugie rozwiązanie, - samodzielnie skonstruować niezbędną część (albo całe) drzewo rozbioru i dokonać ewaluacji wtedy, gdy znane będą już konieczne wartości atrybutów 3

4 Dlaczego nie używać zmiennych globalnych w YACCu? realizując translację sterowaną składnią w YACCu bezpieczniej jest korzystać z mechanizmu atrybutów wbudowanego w generator używanie, nawet w przypadku prostych analizatorów, zmiennych globalnych obok tradycyjnych zagrożeń związanych z ich użyciem zmusza również do uwzględnienia efektów ubocznych kolejności wykonywania akcji przez LR-parser Translacja sterowana składnią w generatorze YACC (4) Translację sterowaną składnią można w YACCu realizować w oparciu o zmienne globalne albo wbudowany mechanizm atrybutów. Można także stosować kombinację obu podejść. Wydaje się jednak, że mechanizm atrybutów wbudowany w generator YACC jest dostatecznie elastyczny i efektywny, aby implementować z jego użyciem wszystkie translatory unikając zagrożeń wynikających z używania zmiennych globalnych. W bardziej złożonych specyfikacjach łatwo jest stracić kontrolę nad użyciem zmiennych globalnych, a dodatkowe zagrożenie stanowi ścisłe kontrolowanie kolejności wykonywania obliczeń związanej z działaniem LR-parsera. Lepiej więc nie korzystać ze zmiennych globalnych ani w samym analizatorze składniowym, ani pośredniczących w przekazywaniu wartości między skanerem a parserem. 4

5 Zmienne globalne na wejściu dany jest ciąg liczb naturalnych rozdzielonych znakami dodawania i ewentualnie ciągami spacji i/lub tabulatorów. Ciąg zakończony jest znakiem równości. Po natrafieniu na znak równości należy wypisać sumę wszystkich dotychczas rozpoznanych liczb. Na przykład, dla ciągu: = powinniśmy otrzymać rezultat: 6 Translacja sterowana składnią w generatorze YACC (5) Jako przykład niebezpieczeństwa związanego z użyciem zmiennych globalnych rozważmy implementację prostego kalkulatora. Jego zadaniem jest obliczenie sumy liczb całkowitych napotkanych na wejściu, a w momencie napotkania znaku równości wydrukowanie tej sumy na standardowym wyjściu. 5

6 Zmienne globalne analizator leksykalny: globalna zmienna x %{ extern int x; %} %% [0-9]+ { x = atoi(yytext); return ; } "+" { return ; } "=" { return '='; } " " { ; } Translacja sterowana składnią w generatorze YACC (6) Analizator leksykalny implementujemy z wykorzystaniem generatora LEX. Analizator rozpoznaje liczby całkowite (zgodne z wzorcem [0-9]+), konwertuje je do postaci binarnej i przekazuje jako atrybut jednostki leksykalnej. Do przekazywania wartości atrybutu do analizatora składniowego najprościej (co nie znaczy najbezpieczniej) jest użyć globalnej zmiennej typu całkowitego (int). Zmienna globalna może zostać zdefiniowana w: - analizatorze leksykalnym - analizatorze składniowym (tak jak w przykładzie) - pliku pomocniczym. Na marginesie, warto zwrócić uwagę na to, że nazwy niektórych zmiennych mogą kolidować z wewnętrznymi zmiennymi wykorzystywanymi w wygenerowanym analizatorze (tak jest np. ze zmienną i w MKS LEX & YACC). Należy także unikać nadawania własnym zmiennym nazw zaczynających się od prefiksu yy. Analizator rozpoznaje również znaki dodawania i równości, tym razem jednak nie przypisując żadnej wartości atrybutu. Znaki spacji na wejściu są ignorowane. 6

7 Zmienne globalne do opisania powtarzania się na wejściu kolejnych liczb i znaków dodawania możemy użyć rekurencji lewostronnej bądź prawostronnej %{ int x, y = 0; %} %token %% L : E '=' { printf("%d",y); } ; E : E { y += x; } { y = x; } ; rekurencja lewostronna %{ int x, y = 0; %} %token %% L : E '=' { printf("%d",y); } ; E : E { y += x; } { y = x; } ; rekurencja prawostronna Translacja sterowana składnią w generatorze YACC (7) Analizator składniowy tworzony z wykorzystaniem YACCa można oczywiście zapisać na różne sposoby. Sam fakt powtarzania się liczb i znaków dodawania możemy opisać za pomocą rekurencji lewostronnej bądź prawostronnej. Obie przedstawione w przykładzie gramatyki poprawnie opisują język wejściowy i bez problemów można je wykorzystać w metodzie LR (co nie znaczy, że definicje sterowane składnią wykorzystujące zmienne globalne będą dawać poprawne rezultaty). W obu przykładowych rozwiązaniach do akumulowania wartości sumy w trakcie obliczeń wykorzystamy zmienną globalną y typu całkowitego (int). W obu rozwiązaniach rekurencyjny opis wejścia składa się z przypadku bazowego pojedynczej liczby oraz z przypadku ogólnego (w rekurencji lewostronnej: przetworzone wyrażenie, znak + i kolejna liczba; w rekurencji prawostronnej: liczba, znak + i przetworzone wyrażenie). Akcje związane z produkcjami mają za zadanie: -w przypadku ogólnym zwiększyć zakumulowaną w zmiennej y sumę o atrybut bieżącej jednostki leksykalnej (czyli wartość liczby), -w przypadku bazowym zainicjalizować zmienną y wartością rozpoznanej pojedynczej liczby, -po rozpoznaniu ciągu liczb rozdzielonych znakami dodawania i napotkaniu na wejściu znaku równości wypisać na wyjście rezultat znajdujący się w zmiennej y. Na marginesie warto zwrócić uwagę, że jeżeli nie ma innych istotnych powodów do wymuszenia określonej sekwencji ewaluacji atrybutów efektywniej jest wykorzystać lewostronną rekurencję ze względu na mniejszą zajętość stosu oraz mniejszą wrażliwość na ograniczenia konkretnej implementacji (zazwyczaj wygenerowane analizatory składniowe mają statycznie ograniczoną wielkość stosu) 7

8 Zmienne globalne kompilujemy i uruchamiamy obie wersje: Wyjście wersji z lewostronną rekurencją: Wyjście wersji z prawostronną rekurencją: = 6 9 dlaczego wersja z prawostronną rekurencją mimo poprawnej gramatyki daje zły rezultat? Translacja sterowana składnią w generatorze YACC (8) Obydwie wersje analizatora składniowego kompilujemy i testujemy za pomocą przykładowego wejścia "1+2+3=". Jak nietrudno sprawdzić poprawną odpowiedzią jest 6. Taką odpowiedź rzeczywiście podaje analizator wykorzystujący lewostronną rekurencję. Analizator zaimplementowany z wykorzystaniem prawostronnej rekurencji daje jednak odpowiedź 9. Jak już było zasugerowane wcześniej błąd nie leży w gramatyce. Problem polega na ścisłym uwzględnieniu kolejności wykonywania akcji przez analizator LR w sposobie ewaluacji atrybutów przechowywanych w zmiennych globalnych. Prześledźmy teraz w jaki sposób obydwie wersje analizowały wejście. Zacznijmy od wersji z rekurencję lewostronną. 8

9 Zmienne globalne przesunięcie symbolu (1) Zmienne przesunięcie (1) Zmienne y=0, x=1 y=0, x=? = = Translacja sterowana składnią w generatorze YACC (9) Analizator składniowy rozpoczyna przetwarzanie tekstu wejściowego w konfiguracji początkowej z pustym stosem symboli. Zmienna y początkowo zgodnie z inicjalizacją -ma wartość 0. Początkowa wartość zmiennej x jest w przedstawionym analizatorze nieistotna (w ANSI C będzie to 0, ponieważ jest to zmienna statyczna). Analizator rozpoczyna działanie od przesunięcia z wejścia pierwszej liczby (1) na stos, zmienna x (zgodnie z instrukcją przypisania w skanerze) przyjmuje wartość 1. 9

10 Zmienne globalne redukcja zgodnie z produkcją E Zmienne y=0, x=1 redukcja E : {y=x;} E Zmienne y=1, x= = = Translacja sterowana składnią w generatorze YACC (10) Symbol jest redukowany do nieterminala E zgodnie z produkcją E >. Jednocześnie (zgodnie z zasadami działania LR-parsera) wykonywana jest akcja skojarzona z tą produkcją, czyli przypisanie zmiennej y bieżącej wartości zmiennej x (y=x). 10

11 Zmienne globalne przesunięcie symbolu + Zmienne E Zmienne y=1, x=1 przesunięcie E y=1, x=1 Wejście : = Wejście : = Translacja sterowana składnią w generatorze YACC (11) Z wejścia przesuwany na stos jest teraz znak dodawania (). Bieżące wartości zmiennych nie ulegają zmianie, ponieważ w skanerze z akcją rozpoznania znaku dodawania nie jest skojarzona żadna instrukcja obliczania atrybutu. 11

12 Zmienne globalne przesunięcie symbolu (2) Zmienne Zmienne y=1, x=2 E y=1, x=1 przesunięcie (2) E Wejście : = Wejście : + 3 = Translacja sterowana składnią w generatorze YACC (12) Na stos przesuwana jest kolejna liczba (2) z wejścia. Zmienna x (zgodnie z instrukcją przypisania w skanerze) przyjmuje wartość 2. Przy okazji warto zauważyć, że osiągnęliśmy maksymalną zajętość stosu dla tej gramatyki (z lewostronną rekurencją) i niezależnie od rozmiaru wejścia (liczby liczb na wejściu) są to 3 komórki 12

13 Zmienne globalne redukcja zgodnie z produkcją E E + E Wejście : + 3 = Zmienne y=1, x=2 redukcja E : E Zmienne {y+=x;} E y=3, x=2 Wejście : + 3 = Translacja sterowana składnią w generatorze YACC (13) Następuje teraz redukcja zgodnie z produkcją E > E + Jednocześnie wykonywana jest akcja skojarzona z tą produkcją polegająca na powiększeniu wartości zmiennej y o bieżącą wartość zmiennej x (y+=x). Zmienna y ma teraz wartość 3. 13

14 Zmienne globalne przesunięcie symbolu + Zmienne E Zmienne y=3, x=2 przesunięcie E y=3, x=2 Wejście : + 3 = Wejście : 3 = Translacja sterowana składnią w generatorze YACC (14) Z wejścia przesuwany na stos jest kolejny znak dodawania (), a bieżące wartości zmiennych nie ulegają zmianie. 14

15 Zmienne globalne przesunięcie symbolu (3) Zmienne Zmienne y=3, x=3 E y=3, x=2 przesunięcie (3) E Wejście : 3 = Wejście : = Translacja sterowana składnią w generatorze YACC (15) Na stos przesuwana jest ostatnia liczba (3) z wejścia. Zmiennej x skaner nadaje wartość 3. 15

16 Zmienne globalne redukcja zgodnie z produkcją E E + Zmienne E y=3, x=3 redukcja E : E {y+=x;} E Zmienne y=6, x=3 Wejście : = Wejście : = Translacja sterowana składnią w generatorze YACC (16) Następuje redukcja zgodnie z produkcją E > E + i wykonywana jest akcja y+=x. Zmienna y ma teraz wartość 6. 16

17 Zmienne globalne przesunięcie symbolu = Zmienne E Zmienne y=6, x=3 przesunięcie '=' '=' E y=6, x=2 Wejście : Wejście : 3 = Translacja sterowana składnią w generatorze YACC (17) Na stos przesuwany jest znak równości. Wartości zmiennych x i y nie ulegają zmianie. 17

18 Zmienne globalne redukcja zgodnie z L E = '=' E Zmienne y=6, x=2 redukcja L : E '=' {printf("%d",y);} OK L Wejście : Wejście : 6 Zmienne y=6, x=3 Translacja sterowana składnią w generatorze YACC (18) Następuje redukcja zgodnie z produkcją L > E =. Wykonywana jest akcja wypisania wartości zmiennej y za pomocą funkcji printf. Na wyjście zostaje wypisana poprawna wartość -6. Analizator składniowy pomyślnie zakończył akceptację zdania, na stosie jest tylko aksjomat gramatyki a na wejściu koniec pliku. Dlaczego w takim razie analizator oparty o prawostronną rekurencję wykonał obliczenia błędnie? 18

19 Zmienne globalne przesunięcie symbolu (1) Zmienne przesunięcie (1) Zmienne y=0, x=1 y=0, x=? Wejście : = Wejście : = Translacja sterowana składnią w generatorze YACC (19) Analizator składniowy rozpoczyna przetwarzanie tekstu wejściowego w konfiguracji początkowej z pustym stosem symboli. Analogicznie, jak w przypadku analizatora wykorzystującego lewostronną rekurencję wartość zmiennej x jest nieistotna. Analizator rozpoczyna działanie od przesunięcia z wejścia pierwszej liczby (1) na stos, zmienna x (zgodnie z instrukcją przypisania w skanerze) przyjmuje wartość 1. 19

20 Zmienne globalne przesunięcie symbolu + Zmienne Zmienne y=0, x=1 przesunięcie y=0, x= = = Translacja sterowana składnią w generatorze YACC (20) Z wejścia przesuwany na stos jest teraz znak dodawania. Bieżące wartości zmiennych nie ulegają zmianie, ponieważ w skanerze z akcją rozpoznania znaku dodawania nie jest skojarzona żadna instrukcja obliczania atrybutu. 20

21 Zmienne globalne przesunięcie symbolu (2) Zmienne Zmienne y=0, x=2 y=0, x=1 przesunięcie (2) = + 3 = Translacja sterowana składnią w generatorze YACC (21) Na stos przesuwana jest druga liczba (2) z wejścia. Zmienna x (zgodnie z instrukcją przypisania w skanerze) przyjmuje wartość 2. 21

22 Zmienne globalne przesunięcie symbolu + Zmienne Zmienne y=0, x=2 y=0, x=2 przesunięcie + 3 = 3 = Translacja sterowana składnią w generatorze YACC (22) Z wejścia przesuwany na stos jest kolejny znak dodawania (), a bieżące wartości zmiennych nie ulegają zmianie. 22

23 Zmienne globalne przesunięcie symbolu (3) Zmienne Zmienne y=0, x=3 y=0, x=2 przesunięcie (3) 3 = = Translacja sterowana składnią w generatorze YACC (23) Na stos przesuwana jest kolejna liczba (3) z wejścia. Zmienna x przyjmuje wartość 3. Ta wersja analizatora składniowego (z prawostronną rekurencją) osiągnęła teraz maksymalną zajętość stosu dla przykładowego wejścia 5 komórek. Warto zauważyć, że zajętość stosu przy prawostronnej rekurencji jest większa i liniowo zależna od liczby liczb na wejściu (w analizatorze opartym o lewostronną rekurencję maksymalna zajętość stosu była stała i nie zależała od rozmiaru wejścia). Na przykład dla 100 liczb na wejściu zajętość stosu wzrosłaby do 199 symboli (100 liczb + 99 znaków). Jeżeli koniecznie chcemy użyć prawostronnej rekurencji i zredukować zajętość stosu można modyfikować gramatykę, na przykład w następujący sposób: Zastąpić w produkcji E n + E dwie jednostki leksykalne pomocniczym nieterminalem o nazwie np. Nplus co pozwoli LR-parserowi wykonać redukcję po każdym przesunięciu znaku dodawania i zaoszczędzić prawie połowę stosu. Zmodyfikowany fragment gramatyki będzie miał wówczas następującą postać: Nplus > n + ; E : Nplus E n ; 23

24 Zmienne globalne redukcja zgodnie z produkcją E Zmienne Zmienne y=0, x=3 E y=3, x=3 redukcja E : {y=x;} = = Translacja sterowana składnią w generatorze YACC (24) Symbol jest redukowany do nieterminala E zgodnie z produkcją E >. Jednocześnie (zgodnie z zasadami działania LR-parsera) wykonywana jest akcja skojarzona z tą produkcją, czyli przypisanie zmiennej y bieżącej wartości zmiennej x (y=x). Widać już pierwsze znamiona problemu - wartość zmiennej globalnej x zawiera atrybut ostatniego rozpoznanego symbolu. Poprzednie wartości zostały zamazane i bez ponownego przetworzenia wejścia nie ma już możliwości ich odtworzenia. 24

25 Zmienne globalne redukcja zgodnie z produkcją E + E Zmienne E y=3, x=3 Zmienne redukcja E : E {y+=x;} E y=6, x=3 = = Translacja sterowana składnią w generatorze YACC (25) Następuje teraz redukcja zgodnie z produkcją E > + E. Jednocześnie wykonywana jest akcja skojarzona z tą produkcją polegająca na powiększeniu wartości zmiennej y o bieżącą wartość zmiennej x (y+=x). Zmienna y ma teraz (błędną) wartość 6. 25

26 Zmienne globalne redukcja zgodnie z produkcją E + E Zmienne E y=6, x=3 redukcja E : E {y+=x;} E Zmienne y=9, x=3 = = Translacja sterowana składnią w generatorze YACC (26) Następuje kolejna redukcja zgodnie z produkcją E > + E. Jednocześnie wykonywana jest akcja skojarzona z tą produkcją polegająca na powiększeniu wartości zmiennej y o bieżącą wartość zmiennej x (y+=x). Zmienna y przyjmuje teraz (błędną) wartość 9. 26

27 Zmienne globalne przesunięcie symbolu = Zmienne E Zmienne y=9, x=3 przesunięcie '=' '=' E y=9, x=3 = Translacja sterowana składnią w generatorze YACC (27) Na stos przesuwany jest znak równości. Wartości globalnych zmiennych x i y nie ulegają zmianie. 27

28 Zmienne globalne redukcja zgodnie z L E = '=' E Zmienne y=9, x=3 redukcja L : E '=' {printf("%d",y);} L Zmienne y=9, x=3? 9 Translacja sterowana składnią w generatorze YACC (28) Następuje redukcja zgodnie z produkcją L > E =. Wykonywana jest akcja wypisania wartości zmiennej y za pomocą funkcji printf. Na wyjście zostaje wypisana błędna wartość -9. Analizator składniowy pomyślnie zakończył akceptację zdania, na stosie jest tylko aksjomat gramatyki a na wejściu koniec pliku. Natomiast akcje zostały wykonane w innej kolejności niż przewidział to programista i obliczony wynik jest błędny. 28

29 Atrybuty ogólne reguły atrybuty w specyfikacjach YACCa z każdym symbolem w produkcji związany jest atrybut: A : X1 X2 X3 Xn : n indeks w wyrażeniu n nie może być zmienną Translacja sterowana składnią w generatorze YACC (29) Problemów związanych z użyciem zmiennych globalnych można uniknąć stosując wbudowany w YACCa system atrybutów. W YACCu z każdym symbolem w produkcji (zarówno terminalnym, jak i nieterminalnym) jest związany atrybut. Atrybut nieterminala po lewej stronie produkcji oznaczany jest przez. Atrybuty symboli po prawej stronie produkcji erowane są kolejnymi liczbami naturalnymi (1, 2,..., n). Przy odwoływaniu się do symboli po prawej stronie produkcji nie można jednak posłużyć się zmienną, er w wyrażeniu er musi być stałą. 29

30 Atrybuty - analizator leksykalny wartość atrybutu jednostki leksykalnej jest nadawana w analizatorze leksykalnym za pomocą zmiennej yylval zmienna yylval domyślnie jest typu całkowitego (w języku C - int) %% [0-9]+ { yylval = atoi(yytext); return ; } "+" { return ; } "=" { return '='; }. { ; } Translacja sterowana składnią w generatorze YACC (30) Atrybuty jednostek leksykalnych są obliczane przez analizator leksykalny. Do przekazania obliczonej wartości do analizatora leksykalnego służy predefiniowana zmienna yylval. Domyślnie jest ona typu całkowitego (int), ale może zostać inaczej zdefiniowana w analizatorze składniowym. 30

31 Atrybuty - analizator składniowy akcje zapisujemy z wykorzystaniem atrybutów %token %% L : E '=' {printf("%d",1);} ; E : E { =1+3; } { =1; } ; rekurencja lewostronna %token %% L : E '=' {printf("%d",1);} ; E : E { =1+3; } { =1; } ; rekurencja prawostronna Translacja sterowana składnią w generatorze YACC (31) Wartości atrybutów symboli nieterminalnych są natomiast obliczane w trakcie redukcji przy pomocy akcji semantycznych wpisywanych na końcu prawej strony produkcji. W przypadku braku akcji wykonywana jest akcja domyślna - kopiowanie =1. Taka postać akcji wynika z samej zasady wykorzystywania stosu w parserze w trakcie redukcji zastępujemy prawą stronę produkcji symbolem z lewej strony, a zatem przy braku innych instrukcji atrybut nieterminala po lewej stronie () wypada w tej samej komórce stosu co atrybut najbardziej lewego symbolu znajdującego się po prawej stronie produkcji (1). Akcje są modyfikowane przez YACCa w trakcie generowania parsera, wszystkie odwołania do atrybutów przeliczane są na odpowiednie odwołania do stosu atrybutów. Szczegóły implementacyjne są w zasadzie (poza zaawansowanym debugowaniem parsera) nieistotne dla użytkownika i należy unikać polegania na nich skorzystanie z nich wiąże nas z konkretną implementacją YACCa (a czasami nawet konkretną wersją). Z punktu widzenia użytkownika ważne jest jednak, że stos jest implementowany zwykle jako tablica (np. MKS LEX & YACC, Bison) o statycznym rozmiarze (MKS 150, Bison 200) a w razie konieczności modyfikując szkielet parsera można te wartości zmienić. Domyślne wartości zazwyczaj wystarczają do przetworzenia typowych gramatyk (należy zwrócić uwagę na długość form zdaniowych, a w szczególności na prawostronną rekurencję). Niektóre analizatory (np. BYACC) pewnym kosztem wydajności są w stanie dynamicznie zwiększyć rozmiar stosu w trakcie działania programu. 31

32 Atrybuty drzewo składniowe drzewo składniowe i ewaluacja atrybutów w rekurencji lewostronnej E E E E = E = 1 Translacja sterowana składnią w generatorze YACC (32) Zasady ewaluacji atrybutów w obu wersjach specyfikacji widać wyraźnie w drzewach składniowych. W przypadku rekurencji lewostronnej mamy do czynienia z dwoma przypadkami: -wywiedzeniem symbolu z nieterminala E, wówczas podczas redukcji atrybut symbolu (1 w zapisie YACCa) powinien zostać skopiowany do atrybutu rodzica ( w notacji YACCa) -wywiedzeniem ciągu E z symbolu E, w tym przypadku w atrybucie symbolu E (1) znajduje się obliczony już atrybut (suma liczb) całego poddrzewa, w atrybucie symbolu (2) nie ma żadnej użytecznej informacji, a w atrybucie symbolu (3) znajduje się wartość kolejnej liczby, należy więc nadać rodzicowi () wartość sumy atrybutów symbolu E (1) i symbolu (3) 32

33 Atrybuty drzewo składniowe drzewo składniowe i ewaluacja atrybutów w rekurencji prawostronnej E 1 2 E 3 E E = E = 1 Translacja sterowana składnią w generatorze YACC (33) W przypadku rekurencji prawostronnej mamy również do czynienia z dwoma przypadkami: -wywiedzeniem symbolu z nieterminala E, wówczas podczas redukcji atrybut symbolu (1) powinien zostać skopiowany do atrybutu rodzica () -wywiedzeniem ciągu E z symbolu E, drzewo wygląda teraz nieco inaczej, jednak zasada obliczeń pozostaje bez zmian, atrybut symbolu E (3) zawiera obliczony już do tej pory atrybut (sumę liczb) w całym poddrzewie, w atrybucie symbolu (2) nie ma żadnej użytecznej informacji, a w atrybucie symbolu (1) znajduje się wartość kolejnej liczby, nadajemy więc rodzicowi () wartość sumy atrybutów symbolu E (3) i symbolu (1) 33

34 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu (1) Atrybut przesunięcie (1) Atrybut = = Translacja sterowana składnią w generatorze YACC (34) W rzeczywistej implementacji parsera potrzebne są dwa równolegle działające stosy stos stanów i stos atrybutów. symboli nie jest konieczny do działania analizatora składniowego wykorzystywany jest tylko do zobrazowania przetwarzania tekstu wejściowego lub uruchamiania analizatora za pomocą debuggera. Analizator składniowy rozpoczyna przetwarzanie tekstu wejściowego w konfiguracji początkowej z pustym stosem symboli. Akcja przesunięcia powoduje umieszczenie na stosie symboli symbolu, na stosie wartości - wartości przekazanej za pomocą zmiennej yylval z analizatora leksykalnego - w tym przypadku jest to 1. 34

35 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu + Atrybut Atrybut 1 przesunięcie? = = Translacja sterowana składnią w generatorze YACC (35) Akcja przesunięcia umieszcza na stosie symboli terminal +. W przypadku znaku dodawania nie są nam potrzebne żadne atrybuty jednostki leksykalnej, ale bieżąca wartość yylval jest i tak w trakcie każdej akcji przesunięcia - zawsze odkładana na stos (jeżeli nie nadaliśmy jej konkretnej wartości atrybut będzie zależał od przebiegu programu). 35

36 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu (2) Atrybut Atrybut 2? 1 przesunięcie (2)? = + 3 = Translacja sterowana składnią w generatorze YACC (36) Na stos symboli odkładany jest symbol, na stos wartości liczba 2. 36

37 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu + Atrybut Atrybut 2? 1 przesunięcie? 2? = 3 = Translacja sterowana składnią w generatorze YACC (37) Na stos symboli odkładany jest symbol +. 37

38 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu (3) Atrybut Atrybut 3? 2? 1 przesunięcie (3)? 2? 1 3 = = Translacja sterowana składnią w generatorze YACC (38) Na stos symboli odkładany jest symbol, na stos wartości liczba 3. 38

39 Korzystanie z atrybutów syntetyzowanych redukcja zgodnie z produkcją E Atrybut Atrybut 3 E 3?? 2 2? 1 redukcja E : { =1;}? 1 = = Translacja sterowana składnią w generatorze YACC (39) Terminal jest redukowany do nieterminala E. Jednocześnie wykonywana jest akcja =1 skojarzona z produkcją E > nadająca wartość atrybutu symbolu nieterminalnego E. 39

40 Korzystanie z atrybutów syntetyzowanych redukcja zgodnie z produkcją E + E Atrybut E 3? Atrybut 2? 1 redukcja E : E { = 1 + 3;} E 5? 1 = = Translacja sterowana składnią w generatorze YACC (40) Wykonywana jest redukcja zgodnie z produkcją E > + E. Atrybutem symbolu E stojącego po lewej stronie produkcji (wynikiem redukcji) będzie zgodnie z akcją: =1+3 suma wartości kolejnej liczby (2) i dotychczas zredukowanego wyrażenia (poddrzewa) E (3). 40

41 Korzystanie z atrybutów syntetyzowanych redukcja zgodnie z produkcją E + E Atrybut E 5? 1 redukcja E : E { = 1 + 3;} E Atrybut 6 = = Translacja sterowana składnią w generatorze YACC (41) Ponownie wykonywana jest redukcja zgodnie z produkcją E > + E. Atrybutem symbolu E stojącego po lewej stronie produkcji (wartością redukcji) będzie teraz suma wartości kolejnej liczby (1) i dotychczas zredukowanego wyrażenia E (5). 41

42 Korzystanie z atrybutów syntetyzowanych przesunięcie symbolu = Atrybut E Atrybut 6 przesunięcie '=' '=' E? 6 = Translacja sterowana składnią w generatorze YACC (42) Na stos symboli odkładany jest symbol =. 42

43 Korzystanie z atrybutów syntetyzowanych redukcja zgodnie z produkcją L E '=' akcja domyślna: = 1 Atrybut '='? E 6 redukcja L : E '=' {printf("%d",1);} OK 6 Atrybut L 6 Translacja sterowana składnią w generatorze YACC (43) Wykonana zostaje kolejna redukcja tym razem zgodnie z produkcją L > E = i skojarzona z nią akcja wypisania atrybutu dziedziczonego symbolu E, w którym znajduje się obliczona wartość sumy. Dzięki przechowywaniu wartości atrybutów na stosie udało się uniknąć efektów ubocznych wynikających ze stosowania zmiennych globalnych i obliczona wartość jest poprawna. W wyniku redukcji na stosie symboli znajdzie się aksjomat gramatyki, wejście jest puste, a zatem analizator pomyślnie kończy przetwarzanie tekstu wejściowego. Oczywiście zgodnie z domyślnymi zasadami ewaluacji atrybutów (=1) nieterminal L otrzyma również atrybut o wartości 6, ale z wartości tej nie będziemy już korzystać. 43

44 Typy atrybutów domyślny typ atrybutów można zmodyfikować za pomocą słowa kluczowego %union umieszczanego w specyfikacji parsera wewnątrz deklaracji %union należy określić wszystkie potrzebne typy atrybutów wywołując YACCa należy użyć opcji d w celu wygenerowania definicji interfejsu (y.tab.h) %union { char *text; int int_val; } yacc d typedef union { char *text; int int_val; } YYSTYPE; y.tab.h Translacja sterowana składnią w generatorze YACC (44) Jak już wspomniano wcześniej domyślnie wszystkie symbole mają atrybuty typu całkowitego (int). Często jednak zachodzi potrzeba zmiany domyślnego typu atrybutów. Do tego celu służy słowo kluczowe %union umieszczane w specyfikacji YACCa. Po nim należy wyspecyfikować wszystkie typy jakie będą potrzebne dla wszystkich symboli w całej gramatyce. Na podstawie tej deklaracji YACC generuje definicję unii, która umieszczana jest w pliku y.tab.h (w niektórych implementacjach plik ten ze względu na ograniczenia systemu plików może nosić inną, podobną nazwę). Każdy symbol ma więc atrybut będący na poziomie implementacji unią. Symbol może więc mieć atrybut tylko jednego z zadeklarowanych wcześniej typów. Jednakowy rozmiar wszystkich atrybutów istotnie upraszcza zarządzanie stosem symboli w analizatorze składniowym (w przeciwnym wypadku musiałaby to być lista), ale co zrobić jeśli dla danego symbolu potrzebnych jest więcej atrybutów? Najprostszym (ale nieefektywnym rozwiązaniem) jest umieszczenie w unii struktury lub tablicy. Automatycznie powoduje jednak to, że atrybuty wszystkich symboli, niezależnie od tego czy jest to potrzebne, czy nie, będą miały ten sam rozmiar niepotrzebnie zajmując stos atrybutów. Lepiej jest więc definiując unię nie umieszczać bezpośrednio w niej dużych struktur danych, ale użyć raczej wskaźnika do odpowiednich obiektów alokowanych np. ze sterty. Wygenerowany przez YACCa plik interfejsu y.tab.h, należy koniecznie włączyć do specyfikacji analizatora leksykalnego. Dzięki temu definicja unii będzie dostępna w akcjach skanera. 44

45 Typy atrybutów deklaracje w parserze w celu zadeklarowania typów symboli należy najpierw zdefiniować typ atrybutów za pomocą %union, np.: %union { char *text; int ival; } a następnie na podstawie tej definicji przypisać typy symbolom: dla symboli terminalnych: %token <text> str ident dla symboli nieterminalnych: %type <ival> R A Translacja sterowana składnią w generatorze YACC (45) Po zdefiniowaniu typów atrybutów za pomocą %union konieczne jest wskazanie typów wszystkich symboli gramatyki, na których będziemy operować w akcjach semantycznych. W celu przypisania typów symbolom nieterminalnym należy użyć słowa kluczowego %type. Za %type należy wskazać - w nawiasach trójkątnych pole unii odpowiedniego typu, a następnie wymienić nieterminal lub nieterminale, których atrybuty mają być tego typu. W przypadku symboli terminalnych przypisywanie typów odbywa się podobnie. Zamiast słowa kluczowego %type używamy %token (tak jak do deklarowania jednostek leksykalnych). Niektóre (starsze) wersje YACCów dopuszczały również korzystanie z atrybutów bez deklaracji typów za pomocą bezpośrednich odwołań do pól unii (w C za pomocą. lub -> ). Jest to jednak metoda nieprzenośna i merytorycznie niewskazana. 45

Podstawy programowania. dr inż. Krzysztof Białek

Podstawy programowania. dr inż. Krzysztof Białek Podstawy programowania dr inż. Krzysztof Białek 1 Cele i zakres przedmiotu Zapoznanie z istotą i metodyką programowania Opanowanie podstawowych technik programowania strukturalnego Nabycie umiejętności

Bardziej szczegółowo

Opis języka AWK. Tomasz Przechlewski. 18 listopada 2000 roku

Opis języka AWK. Tomasz Przechlewski. 18 listopada 2000 roku Opis języka AWK Tomasz Przechlewski 18 listopada 2000 roku 2 Poszerzona i poprawiona wersja tekstu: B. Lichoński i T. Przechlewski, AWK opis języka z przykładami [5]. Copyright (C) 2000, T. Przechlewski

Bardziej szczegółowo

C#. Praktyczny kurs. Autor: Marcin Lis ISBN: 978-83-246-0818-8 Format: B5, stron: 376 Przyk³ady na ftp: 199 kb

C#. Praktyczny kurs. Autor: Marcin Lis ISBN: 978-83-246-0818-8 Format: B5, stron: 376 Przyk³ady na ftp: 199 kb C#. Praktyczny kurs Autor: Marcin Lis ISBN: 978-83-246-0818-8 Format: B5, stron: 376 Przyk³ady na ftp: 199 kb Wydawnictwo Helion ul. Koœciuszki 1c 44-100 Gliwice tel. 032 230 98 63 e-mail: helion@helion.pl

Bardziej szczegółowo

Podstawy Programowania

Podstawy Programowania Podstawy Programowania Łukasz Kuszner http://www.kaims.pl/ kuszner/ kuszner@kaims.pl Wykład, 2012/13 : Strona 1 z 78 1. Zasady Cel Poznać podstawy języka C, zbudować dobre podstawy do dalszej nauki programowania.

Bardziej szczegółowo

SZYBKI START Workbox v 3.1.0.3269

SZYBKI START Workbox v 3.1.0.3269 Datapolis.com, ul Wiktorska 63, 02-587 Warszawa tel. (+48 22) 398-37-53; fax. (+ 48 22) 398-37-93, office@datapolis.com SZYBKI START Workbox v 3.1.0.3269 Ostatnia aktualizacja: 21 października 2013 Dziękujemy

Bardziej szczegółowo

JĘZYKI I PARADYGMATY PROGRAMOWANIA PROGRAMOWANIA ZMIENNE, TYPY I PODPROGRAMY

JĘZYKI I PARADYGMATY PROGRAMOWANIA PROGRAMOWANIA ZMIENNE, TYPY I PODPROGRAMY JĘZYKI I PARADYGMATY JĘZYKI I PROGRAMOWANIA PARADYGMATY PROGRAMOWANIA ZMIENNE, TYPY I PODPROGRAMY Plan Translatory Zmienne Wiązania Wiązanie typu Wiązanie pamięci Sprawdzanie zgodności typów Języki silnie

Bardziej szczegółowo

Programowanie w C. Stworzone na Wikibooks, bibliotece wolnych podręczników.

Programowanie w C. Stworzone na Wikibooks, bibliotece wolnych podręczników. Programowanie w C Stworzone na Wikibooks, bibliotece wolnych podręczników. Wydanie I z dnia 17 lutego 2008 Copyright c 2004-2008 użytkownicy Wikibooks. Permission is granted to copy, distribute and/or

Bardziej szczegółowo

SZYBKI START Datapolis Process System v 4.2.0.4294

SZYBKI START Datapolis Process System v 4.2.0.4294 Datapolis.com, ul Wiktorska 63, 02-587 Warszawa tel. (+48 22) 398-37-53; fax. (+ 48 22) 398-37-93, office@datapolis.com SZYBKI START Datapolis Process System v 4.2.0.4294 Ostatnia aktualizacja: 10 czerwca

Bardziej szczegółowo

SZYBKI START Workbox v 2.3.20.1500

SZYBKI START Workbox v 2.3.20.1500 Datapolis.com, ul Wiktorska 63, 02-587 Warszawa tel. (+48 22) 398-37-53; fax. (+ 48 22) 398-37-93, office@datapolis.com SZYBKI START Workbox v 2.3.20.1500 Ostatnia aktualizacja: 19 sierpnia 2014 Dziękujemy

Bardziej szczegółowo

Programowanie w języku. Dla początkujących oraz średnio zaawansowanych programistów wersja: 1.0 (27.10.2010)

Programowanie w języku. Dla początkujących oraz średnio zaawansowanych programistów wersja: 1.0 (27.10.2010) Programowanie w języku C Dla początkujących oraz średnio zaawansowanych programistów wersja: 1.0 (27.10.2010) 1 Spis treści 1 Wprowadzenie...5 1.1 Informacje od autora...5 1.2 Jak napisana jest ta książka?...5

Bardziej szczegółowo

Języki programowania. ToMasz Wierzbicki. Instytut Informatyki Uniwersytetu Wrocławskiego

Języki programowania. ToMasz Wierzbicki. Instytut Informatyki Uniwersytetu Wrocławskiego Języki programowania Notatki do wykładu Programowanie dla studentów I roku dziennych studiów magisterskich kierunku Informatyka na Uniwersytecie Wrocławskim Języki programowania ToMasz Wierzbicki Instytut

Bardziej szczegółowo

PODRĘCZNIK WPROWADZENIE DO JĘZYKA SKRYPTOWEGO C

PODRĘCZNIK WPROWADZENIE DO JĘZYKA SKRYPTOWEGO C PODRĘCZNIK WPROWADZENIE DO JĘZYKA SKRYPTOWEGO C Ważne wskazówki dotyczące bezpieczeństwa! Przykładowe aplikacje i rozwiązanie zawarte w tym podręczniku należy traktować jako uproszczone i niekompletne

Bardziej szczegółowo

Wykład Java 07-01-31 ver3.0 1

Wykład Java 07-01-31 ver3.0 1 Wykład Java 07-01-31 ver3.0 1 Java jest językiem stosowanym w Internecie. Aby zrozumieć jego ważność, można przyjąć, że ma on tak samo duże znaczenie dla programowania w Internecie, jak C++ dla programowania

Bardziej szczegółowo

Język C++ podstawy programowania

Język C++ podstawy programowania Język C++ podstawy programowania Uniwersytet Marii Curie-Skłodowskiej Wydział Matematyki, Fizyki i Informatyki Instytut Informatyki Język C++ podstawy programowania Paweł Mikołajczak Lublin 2011 Instytut

Bardziej szczegółowo

KOMPILATOR JĘZYKA VHDL DO PROJEKTOWANIA UKŁADÓW LOGICZNYCH. Edytor: prof. dr hab. inż. Włodzimierz Bielecki

KOMPILATOR JĘZYKA VHDL DO PROJEKTOWANIA UKŁADÓW LOGICZNYCH. Edytor: prof. dr hab. inż. Włodzimierz Bielecki KOMPILATOR JĘZYKA VHDL DO PROJEKTOWANIA UKŁADÓW LOGICZNYCH Edytor: prof. dr hab. inż. Włodzimierz Bielecki ii Spis treści ISBN 83-87362-50-6 Pracownia Poligraficzna WYDZIAŁU INFORMATYKI POLITECHNIKI SZCZECIŃSKIEJ

Bardziej szczegółowo

C++ i Pascal kurs podstawowy

C++ i Pascal kurs podstawowy C++ i Pascal kurs podstawowy Wykład: program, algorytm, kompilator, interpreter, debugger, linker, zmienne, typy danych, komentarze, instrukcje wejścia, wyjścia, operatory, instrukcja warunkowa if, pętla

Bardziej szczegółowo

OBSŁUGA WYJĄTKÓW. Mechanizm języka PL/SQL. Wyjątki:

OBSŁUGA WYJĄTKÓW. Mechanizm języka PL/SQL. Wyjątki: OBSŁUGA WYJĄTKÓW W języku PL/SQL zaimplementowano obsługę błędów za pomocą: mechanizmu wyjątków programów obsługi wyjątków w tzw. sekcji obsługi wyjątków. Wyjątki mogą być związane z: błędami systemu Oracle

Bardziej szczegółowo

Excel Średniozaawansowany

Excel Średniozaawansowany WROcomp Excel Średniozaawansowany MATERIAŁ DYDAKTYCZNY Spis treści: Strona 2 z 46 II. ARKUSZE KALKULACYJNE, POZIOM ZAAWANSOWANY... 4 1. PRACA Z ARKUSZEM... 4 1.1.TWORZENIE NOWEGO SKOROSZYTU WEDŁUG DOMYŚLNEGO

Bardziej szczegółowo

Nowoczesność i doświadczenie. Akademia rozwoju kompetencji pracowników HS Wrocław Sp. z o.o.

Nowoczesność i doświadczenie. Akademia rozwoju kompetencji pracowników HS Wrocław Sp. z o.o. WROcomp Excel Zaawansowany MATERIAŁ DYDAKTYCZNY Spis treści: Strona 2 z 61 II. ARKUSZE KALKULACYJNE, POZIOM ZAAWANSOWANY... 4 1. PRACA Z ARKUSZEM... 4 1.1.TWORZENIE NOWEGO SKOROSZYTU WEDŁUG DOMYŚLNEGO

Bardziej szczegółowo

Poznajemy język ACTIONSCRIPT 3.0

Poznajemy język ACTIONSCRIPT 3.0 Poznajemy język ACTIONSCRIPT 3.0 Informacje prawne Informacje prawne Informacje prawne można znaleźć na stronie http://help.adobe.com/pl_pl/legalnotices/index.html. iii Spis treści Rozdział 1: Wprowadzenie

Bardziej szczegółowo

Wstęp do programowania w C#

Wstęp do programowania w C# Anna Kempa Tomasz Staś Wstęp do programowania w C# Łatwy podręcznik dla początkujących Aktualna wersja podręcznika na stronie http://c-sharp.ue.katowice.pl Katowice, kwiecień 2014 Wersja 1.1 Anna Kempa,

Bardziej szczegółowo

Wprowadzenie do pisania Script-Fu w GIMP.

Wprowadzenie do pisania Script-Fu w GIMP. Poradnik Prezentowany poniżej poradnik, to wynik analizy dostępnych informacji oraz własnych doświadczeń i przemyśleń. Wiedza dotycząca tego tematu jest rozproszona, a jednocześnie stale się rozwija. Wprowadzenie

Bardziej szczegółowo

Wykłady z informatyki. Janusz Górczyński, Paweł Górczyński. Wyższa Szkoła Zarządzania i Marketingu

Wykłady z informatyki. Janusz Górczyński, Paweł Górczyński. Wyższa Szkoła Zarządzania i Marketingu Wykłady z informatyki Janusz Górczyński, Paweł Górczyński Projektowanie baz danych w MS Access, wykorzystanie VBA Wyższa Szkoła Zarządzania i Marketingu Sochaczew 2005 2 Zeszyt ten jest drugą pozycją w

Bardziej szczegółowo

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski

Podstawy programowania w języku Java. mgr inż. Piotr Kowalski Podstawy programowania w języku Java mgr inż. Piotr Kowalski 18 stycznia 2013 Spis treści 1 Podstawy architektury komputera 5 1.1 Części składowe komputera..................... 5 1.1.1 Rzecz o rejestrach......................

Bardziej szczegółowo

IDZ DO KATALOG KSI EK TWÓJ KOSZYK CENNIK I INFORMACJE CZYTELNIA PRZYK ADOWY ROZDZIA SPIS TRE CI KATALOG ONLINE ZAMÓW DRUKOWANY KATALOG

IDZ DO KATALOG KSI EK TWÓJ KOSZYK CENNIK I INFORMACJE CZYTELNIA PRZYK ADOWY ROZDZIA SPIS TRE CI KATALOG ONLINE ZAMÓW DRUKOWANY KATALOG IDZ DO PRZYK ADOWY ROZDZIA KATALOG KSI EK ZAMÓW DRUKOWANY KATALOG Wydawnictwo Helion ul. Chopina 6 44-100 Gliwice tel. (32)230-98-63 e-mail: helion@helion.pl TWÓJ KOSZYK CENNIK I INFORMACJE ZAMÓW INFORMACJE

Bardziej szczegółowo

Bazy danych jak je ugryźć

Bazy danych jak je ugryźć Bazy danych jak je ugryźć Rodzaj zajęć: Wszechnica Poranna Tytuł: Bazy danych jak je ugryźć Autor: mgr inż. Andrzej Ptasznik, dr hab. inż. Zenon Gniazdowski Redaktor merytoryczny: prof. dr hab. Maciej

Bardziej szczegółowo

1 z 10 2014-01-03 13:24

1 z 10 2014-01-03 13:24 1 z 10 2014-01-03 13:24 SK Moduł 9 From Studia Informatyczne Pod koniec lat 60 eksperymentalna, rozległa sieć komputerowa ARPAnet finansowana przez Agencję ds. Zaawansowanych Projektów Badawczych (ARPA)

Bardziej szczegółowo

Gniazda rozszerzeń w WF-Mag dla Windows. Przewodnik wdrożeniowca.

Gniazda rozszerzeń w WF-Mag dla Windows. Przewodnik wdrożeniowca. Gniazda rozszerzeń w WF-Mag dla Windows. Przewodnik wdrożeniowca. obowiązuje od wersji 7.60.0 Opracował i wykonał: Rafał Mróz Asseco Business Solutions SA Oddział w Warszawie Warszawa, ul. Jana Olbrachta

Bardziej szczegółowo

Programowanie komputerowe

Programowanie komputerowe Programowanie komputerowe dr inż. Sławomir Koczubiej Politechnika Świętokrzyska Wydział Zarządzania i Modelowania Komputerowego Katedra Informatyki Stosowanej (14 kwietnia 2014) dr inż. Sławomir Koczubiej

Bardziej szczegółowo