Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Praca magisterska System do zdalnego wspomagania nauki fleksji języka polskiego Marcin Zioło Kierunek: Informatyka Specjalność: Inżynieria systemów informatycznych i baz danych Nr albumu: 117045 Promotor dr inż. Piotr Pisarek Wydział Elektroniki Automatyki Informatyki i Elektrotechniki Kraków 2008
Oświadczenie autora Ja, niżej podpisany Marcin Zioło oświadczam, że praca ta została napisana samodzielnie i wykorzystywała (poza zdobytą na studiach wiedzą) jedynie wyniki prac zamieszczonych w spisie literatury..................................... (Podpis autora) Oświadczenie promotora Oświadczam, że praca spełnia wymogi stawiane pracom magisterskim..................................... (Podpis promotora)
Spis treści Wstęp............................................ 2 Cel pracy.......................................... 4 Rozdział 1. Fleksja języka polskiego....................... 5 1.1. Podstawowe pojęcia - fleksja, wyraz, forma.................... 5 1.2. Powiązania fleksji ze słowotwórstwem....................... 6 1.3. Podział języków ze względu na morfologię..................... 7 1.4. Deklinacja i koniugacja............................... 8 1.5. Klasy wyrazów w języku polskim.......................... 8 1.5.1. Części mowy................................... 8 1.5.2. Rzeczownik - rodzaj rzeczownika........................ 9 1.5.3. Czasownik.................................... 11 1.5.4. Przymiotnik................................... 13 1.5.5. Liczebnik..................................... 13 1.5.6. Zaimek...................................... 14 1.5.7. Przysłówek.................................... 15 1.6. Schemat klasyfikacji fleksyjnej wyrazów języka polskiego............. 15 1.6.1. Wzorzec odmiany................................ 15 1.6.2. Drzewo kategorii gramatycznych i końcówek fleksyjnych........... 16 1.7. Podsumowanie.................................... 18 Rozdział 2. Zdalne wspomaganie procesu dydaktycznego......... 19 2.1. Kształcenie tradycyjne................................ 19 2.2. Kształcenie na odległość czyli e-learning..................... 20 2.3. Nauczanie komplementarne - blended learning.................. 22 2.4. Przegląd systemów e-learningowych........................ 23 2.4.1. System moodle.................................. 24 2.4.2. Grampol..................................... 26 2.4.3. Podsumowanie.................................. 28 Rozdział 3. Projekt systemu............................. 29 3.1. Ogólne założenia................................... 29 3.2. Analiza funkcjonalna systemu............................ 29 3.2.1. Wymagania funkcjonalne............................ 29 3.2.2. Wymagania niefunkcjonalne.......................... 30 3.3. Role w systemie................................... 30 3.3.1. Podział funkcji na role............................. 30 1
Spis treści 3.4. Poziomy trudności.................................. 31 3.5. Wybór technologii.................................. 32 3.5.1. Język programowania.............................. 32 3.5.2. Architektura systemu.............................. 32 3.5.3. Moduł serwera.................................. 34 3.5.4. Serwer bazy danych............................... 34 3.5.5. Biblioteka CLP................................. 34 3.6. Kształt bazy danych................................. 35 3.6.1. Diagram ERD.................................. 35 3.6.2. Opis tabel.................................... 35 3.7. Algorytm planowania nauki............................. 36 3.8. Algorytm wyboru wyrazów z tekstu........................ 37 3.8.1. Definiowanie wyboru wyrazów z tekstu.................... 38 3.8.2. Rozpoznawanie wyrazów z tekstu przez ucznia................ 38 3.9. Algorytm nauczania wyrazów............................ 39 3.10.Słownik języka polskiego............................... 40 Rozdział 4. Słowo końcowe.............................. 41 Dodatek A. Podręcznik użytkownika....................... 42 A.1.Role.......................................... 42 A.1.1. Rola ucznia................................... 42 A.1.2. Rola lektora................................... 42 A.2.Metariał dydaktycznym............................... 43 A.3.Tworzenia materiału dydaktycznego........................ 44 A.4.Planowanie lekcji................................... 45 A.5.Nauczanie....................................... 46 A.6.Drzewo kategorii gramatycznych.......................... 47 A.7.Słownik........................................ 48 A.8.Metody uczenia się - metoda fiszek......................... 49 Bibliografia......................................... 51 Spis rysunków....................................... 52 Spis tabel.......................................... 53
Wstęp Niniejsza praca prezentuje system komputerowy przeznaczony do zdalnego wspomagania nauczania fleksji języka polskiego. Wzrost rangi Polski na świecie powoduje, że wzrasta zapotrzebowanie systemów wspomagających naukę języka polskiego jako języka obcego. Języka polskiego chcą się uczyć nie tylko obcokrajowcy mieszkający za granicą, ale także osoby, które przebywają w Polsce. Z pewnością zjawisko wzrostu chętnych na naukę języka polskiego będzie rosło. Język polski należy do grupy języków fleksyjnych, czyli języków z rozbudowaną fleksją. Oznacza to, że większość wyrazów odmienia się co sprawia, że język polski jest językiem trudnym. Czasowniki odmieniają się przez osoby, czasy, liczby, rodzaje, strony i tryby, co daje łącznie 48 form fleksyjnych. Przymiotniki z kolei odmieniają się przez przypadki, liczby i rodzaje, co daje 42 formy dla każdego przymiotnika. Rzeczowniki i zaimki odmieniają się już tylko przez przypadki i liczby, dając łącznie 14 form. Tylko nieliczne wyrazy nie odmieniają się, czyli posiadają jedną formę, można tu wymienić przyimki, spójniki i partykuły. Aby płynnie posługiwać się językiem polskim, trzeba te wszystkie formy fleksyjne mieć utrwalone i zautomatyzowane. Oczywiście w obrębie wyrazów języka polskiego występują podobieństwa pod względem zbioru form, które uzyskujemy przy odmianie danego wyrazu. Wyrazy można zatem poklasyfikować na grupy wyrazów podobnych do siebie pod względem odmiany, każda taka grupa wyrazów ma swój unikalny wzorzec odmiany, czyli ogólnie mówiąc jest to zbiór końcówek dla konkretnych form. Można więc stwierdzić, że aby dobrze posługiwać się fleksją języka polskiego należy: znać wzorce odmiany, poprawnie je odmieniać oraz prawidłowo klasyfikować wyraz do konkretnego wzorca odmiany. W przypadku osób, dla których język polski jest językiem ojczystym, umiejętności te zdobywane są automatycznie podczas nauki mówienia oraz później w szkole. W przypadku osób, które w późniejszym okresie rozpoczynają naukę języka polskiego, fleksja sprawia nie mały problem, przede wszystkim chodzi tutaj o ogrom informacji potrzebnych do prawidłowej odmia- 3
Wstęp ny wyrazów. Do utrwalenia i zautomatyzowania tak obszernej wiedzy świetnie nadaje się program komputerowy. System ma wspomagać fleksję języka polskiego i to właśnie od słowa fleksja została utworzona nazwa systemu - Flex. Warto tutaj wspomnieć o tym, że system Flex opiera swoje działanie na Słowniku fleksyjnym języka polskiego 1. Flex wspomaga nauczanie fleksji języka polskiego na odległość. Bez fizycznej obecności na uczelni możemy zaliczyć lekcję czy ukończyć kurs. Takie właśnie nauczanie na odległość z wykorzystaniem technik komputerowych i Internetu nazywamy e-learningiem. W ostatnim czasie wskutek coraz większej powszechności Internetu e-learning znacznie się rozwinął, coraz więcej szkół wyższych oferuje poprzez swoje platformy e-learningowe kursy w wielu dziedzinach. E-learning umożliwia uczniom swobodny czas pracy i wygodę. Uczeń w dogodnym dla siebie czasie może rozpocząć naukę, nie tracąc przy tym czasu na dojazd na uczelnie. E-learning nie musi być jedynym z elementów nauczania, może również wspomagać proces dydaktyczny, mówimy wtedy o tak zwanym nauczaniu komplementarnym. Takie podejście wydaje się najlepsze, łącząc zalety e-learningu z zaletami nauczania tradycyjnego można stworzyć efektywny proces kształcenia. Wszystkie te kwestie związane bezpośrednio z e-learningiem, a pośrednio również z systemem Flex zostaną omówione w tej pracy. Prace została podzielona na trzy rozdziały oraz dodatek, w którym zawarto podręcznik użytkownika systemu. W rozdziale pierwszym została omówiona charakterystyka fleksji języka polskiego. Przedstawiono tutaj m.in. schemat klasyfikacji fleksyjnej wyrazów w języku polskim. W drugim rozdziale zostały omówione charakterystyki procesów dydaktycznych począwszy od tradycyjnego modelu nauczania poprzez model e-leraningowy, a skończywszy na modelu pośrednim. Został tutaj zaprezentowany także przegląd systemów e-learningowych dostępnych na rynku. Rozdział trzeci dotyczy części praktycznej pracy, zostało tutaj opisane działanie końcowej wersji systemu Flex. 1 Grupa Lingwistyki Komputerowej, Słownik języka polskiego, http://winnie.ics.agh.edu.pl
Cel pracy Celem pracy jest stworzenie systemu e-learningowego do wspomagania nauki fleksji języka polskiego. Podstawą działania systemu ma być Słownik fleksyjny języka polskiego opracowany przez Grupę Lingwistyki Komputerowej. Informacje o grupie można zobaczyć na stronie internetowej - http://winnie.ics.agh.edu.pl/ 5
Rozdział 1 Fleksja języka polskiego Pierwszy rozdział niniejszej pracy będzie dotyczył fleksji języka polskiego, której wspomaganiem zajmuje się system Flex. Zostaną omówione podstawowe zagadnienia i pojęcia związane z fleksją. Język polski jest językiem fleksyjnym oznacza to, że większość wyrazów odmienia się, istnieje wiele wzorców odmiany wyrazów. Wzorce te musiały zostać uporządkowane i przedstawione w logiczny sposób w postaci elektronicznej, co zostanie również opisane w tym rozdziale. 1.1. Podstawowe pojęcia - fleksja, wyraz, forma Jeśli chodzi o pojęcie fleksji to właściwie tylko dwie definicje mają charakter powszechny. Pierwsza z nich mówi nam: Fleksja (...) odmiana wyrazów; zespół form służących do oznaczania stosunków między wyrazami w zdaniu. 1 Druga brzmi: Fleksja, odmiana wyrazów; zespół form wyrazowych zróżnicowanych w zależności od funkcji, jakie wyrazy pełnią w zdaniu. 2 Aby dobrze rozumieć sens tych definicji, należy wyjaśnić terminy podstawowe takie jak wyraz i forma. Słowo wyraz jest podstawowym pojęciem lingwistycznym, nie jest to jednak pojęcie jednoznaczne. Tokarski 3 rozpatruje wyrazy w sensie pocztowym oraz w sensie hasłowym. Rozważmy zdanie: Wróg mojego wroga jest moim przyjacielem. Jeśli wyraz rozumiemy jako zwartą grupę liter, gdzie każdy wyraz piszemy osobno to możemy naliczyć sześć wyrazów. Gdyby to zdanie było przesłane na poczcie jako telegram 1 W.Doroszewski, Słownik języka polskiego, T1, Warszawa 1958, Wiedza Powszechna 2 Wielka encyklopedii powszechna, PWN, 1962-1969 3 Jan Tokarski, Fleksja polska, Wydawnictwo Naukowe PWN, Warszawa, 2001 6
1.2. Powiązania fleksji ze słowotwórstwem to poczta naliczyła by opłatę za sześć wyrazów. Wyraz w tym znaczeniu możemy nazwać wyrazem pocztowym. Ale wyraz można również rozumieć również jako pojęcie zbiorcze względem wspomnianych wyrazów traktowanych jako zwarta grupa liter. Wróg, wroga to formy deklinacyjne wyrazu wróg. Wyraz wróg jest główną formą danego zbioru form, stanowiącą tak jakby jego etykietę, pod którą można go znaleźć w słowniku. Wyraz w takim znaczeniu można nazwać wyrazem hasłowym. Z tym typem znaczenia wyrazu mamy np. kontakt w szkolnych poleceniach typu: odmieniaj wyraz, np. mama, iść. W takim poleceniu chodzi o przekształcenie wyrazu hasłowego według zasad gramatycznych do otrzymania zbioru form. W definicji słowa fleksja w przypadku sformułowania odmiana wyrazów chodzi o wyrazy hasłowe i tworzenie od nich odpowiednich form pochodnych. Słowo forma występowało już przy omawianiu wyrazu. W słowniku terminów językoznawczych pod hasłem forma mamy: Przez formę w odniesienie do zjawisk mowy należy rozumieć abstrakcyjny schemat, abstrakcyjną zasadę organizującą i umożliwiającą proces mówienia i porozumienia(...) Elementarna forma reprezentowana jest (...) na płaszczyźnie morfologicznej (...) przez morfemy 4. W słowniku w sposób jednak dość zawiły jest także objaśniony termin forma językowa. W definicji ogólnie chodzi o fakt, że jeżeli weźmiemy np. pod uwagę dwie formy oglądam i oglądasz to pierwsza z nich odnosi czynność czytania do mówiącego, druga zaś do adresata wypowiedzi. Mówią nam o tym końcówki -m i -sz. Końcówki fleksyjne są tymi elementami, które różnicują formy danego wyrazu. Słowo forma najczęściej jest używane w kontekście tworzenia,budowania form pochodnych. Chodzi nam tutaj o tworzenie wyrazów pochodnych na podstawie kryteriów fleksyjnych. 1.2. Powiązania fleksji ze słowotwórstwem Słowotwórstwo czyli dział językoznawstwa zajmujący się sposobami tworzenia wyrazów w języku. Powstaje pytanie, czy dany wyraz zaliczyć jako formę pochodną, a zatem tworzenie wyrazu zaliczamy do fleksji, czy może włączać dany wyraz do słownika jako odrębny wyraz hasłowy czym zajmuje się słowotwórstwo. Weźmy na przykład wyraz pracujący, który jest imiesłowem przymiotnikowym. Imiesłowy podlegają deklinacji, lecz są włączone do form koniugacyjnych czasownika. Otóż fakt ten można wyjaśnić względami ekonomicznymi, bowiem włącznie imiesłowów jako odrębnych wyrazów hasłowych spowodowałoby podwojenie liczby haseł w słownikach. Można zadać sobie pytanie, dlaczego nie postąpiono podobnie na przy rzeczownikach zdrobniałych? Weźmy jednak np. pod uwagę serię zdrobnień: kot, kotek, koteczek, 4 Z. Gołąb, A.Heinz, K.Polański, Słownik terminologii językoznawczej, wyd 2, Warszawa 1970, s 182 7
1.3. Podział języków ze względu na morfologię kotuś. Zdrobnienia są traktowane inaczej niż imiesłowy, dzieje się tak, ponieważ imiesłowy dają się wyprowadzić od czasownika w sposób regularny(czytający,pracujący). W przypadku zdrobnień takiej regularności nie ma(kot - kotek ale koń - konik a nie koniek ). To co posiada możliwość tworzenia regularnych serii form językowych, dających się utworzyć przy pomocy odpowiednich algorytmów można zaliczyć do fleksji, a to co takiej możliwości nie ma zaliczamy do słowotwórstwa. 1.3. Podział języków ze względu na morfologię Występują trzy główne typy języków. Najprostszym z nich jest język pozycyjny. O funkcji składniowej decyduje pozycja wyrazu w zdaniu. Zjawisko fleksji nie występuje, czyli wyrazy w sensie pocztowym są jednoznaczne z wyrazami w sensie hasłowym. Inaczej mówiąc każdy wyraz ma jedną formę. Przykładem języka pozycyjnego może być język chiński. Innym typem języka jest język aglutynacyjny. Nazwa pochodzi od łac. agglutinaresklejać. W językach aglutynacyjnych o funkcji składniowej wyrazu w zdaniu decydują afiksy. Afiksy zazwyczaj określają jedną kategorię gramatyczną i nie powodują zmian w rdzeniu wyrazu. Np. w węgierskim mając słowa: vonat - pociąg i ban - w, wyrażenie w pociągu tworzymy za pomocą sklejenia tych słów czyli vonatban. Sam rdzeń słowa się nie zmienia w zależności od dodawanych afiksów. Zazwyczaj w językach aglutynacyjnych występuje konieczność dodania wielu afiksów jak np. w tureckim geliyorum = idę, gdzie -iyor oznacza czas teraźniejszy a um pierwszą osobę. Kolejnym typem języka jest język fleksyjny do którego zaliczamy też język polski. W językach fleksyjnych istnieje wyraźny podział na elementy, z którymi wiąże się znaczenie wyrazu, czyli rdzeń wyrazu oraz końcówka fleksyjna wymienna w zależności od funkcji, jaką wyraz pełni w zdaniu. Znaczenie wyrazów rozumiemy gdy połączymy rdzeń wyrazu z końcówką fleksyjną. Osobno te elementy zazwyczaj nie są jednoznaczne w przeciwieństwie do języków aglutynacyjnych. Dla przykładu rozważmy wyraz sen w dopełniaczu pozbawiony końcówki -u traci swoją treść znaczeniową (z cząstką -sn nie wiąże się określone znaczenie). Końcówki są wieloznaczne w przeciwieństwie do afiksów w językach aglutynacyjnych. Na przykład końcówka -a jest wieloznaczna - może charakteryzować mianownik rzeczowników (żona) ale także dopełniacz l. poj. rodzaju męskiego (komputera). Te dwie główne cechy czyli wieloznaczność elementów funkcjonalnych i ich ścisłe powiązanie ze sobą powodują że dany język zaliczamy do języków fleksyjnych. 8
1.4. Deklinacja i koniugacja 1.4. Deklinacja i koniugacja Deklinacja i koniugacja to dwa główne procesy, którymi zajmuje się fleksja. Deklinacja to odmiana wyrazów przez przypadki, natomiast odmianę przez osoby i czasy nazywamy koniugacją. Wspólną cechą dla zarówno deklinacji jak i koniugacji jest kategoria gramatyczna liczby. W języku polskim występują dwie liczby: liczba pojedyncza oraz liczba mnoga. Ponadto w deklinacji spotykamy się z kategorią rodzaju gramatycznego(rodzaj męski, żeński, nijaki, męskoosobowy, niemęskoosobowy). W przypadku koniugacji wyróżniamy kategorię czasu(czas przeszły, teraźniejszy i przyszły) oraz dodatkowo kategorię trybu, strony i rodzaju przy czym rozróżnienie kategorii rodzaju gramatycznego w przypadku koniugacji występuję dla czasów przeszłego i przyszłego. W przeciągu wieków zarówno w deklinacji jaki i koniugacji zachodziły liczne zmiany. W przypadku koniugacji nastąpiło uproszczenie języka w stosunku do języka staropolskiego, natomiast przypadku deklinacji nastąpiło stopniowe skomplikowanie systemu gramatycznego co w konsekwencji wytworzyło trzy typy deklinacji(rzeczownikowej, zaimkowo-przymiotnikowej i liczebnikowej) zamiast dwóch typów. Według jednego odmieniały się rzeczowniki, przymiotniki i liczebniki, zaś według drugiego zaimki. Pozostałe aspekty koniugacji i deklinacji zostaną przedstawione w kolejnym rozdziale przy omawianiu konkretnych części mowy. 1.5. Klasy wyrazów w języku polskim W niniejszym rozdziale omówione zostaną klasy wyrazów z języku polskim, począwszy od podziału na części mowy, przechodząc dalej do podziałów wewnątrz części mowy. 1.5.1. Części mowy Część mowy to specyficzna dla danego języka, wyróżniona głównie na podstawie kryteriów składniowych i fleksyjnych klasa wyrazów. W języku polskim wyróżniamy następujące części mowy: A B C D E F G części mowy rzeczownik czasownik przymiotnik liczebnik zaimek przysłówek nieodmienny 9
1.5. Klasy wyrazów w języku polskim Tabela 1.1: Podział ze względu na część mowy Opis części mowy: rzeczownik - część mowy nazywająca rzeczy, obiekty, istoty rozumne, rośliny, zwierzęta, zjawiska, pojęcia abstrakcyjne - odpowiada na pytanie kto?, co? czasownik - to nazwa części mowy przedstawiającej dziejące się czynności oraz niektóre stany - odpowiada na pytanie co robi? przymiotnik - to część mowy określająca cechy i właściwości ludzi, zwierząt, roślin, rzeczy, zjawisk - odpowiada na pytanie jaki?, jaka?, jakie? liczebnik - jest częścią mowy określającą liczbę lub kolejność zaimek - część mowy zastępująca rzeczownik, przymiotnik, liczebnik lub przysłówek i pełni ich funkcje w zdaniu przysłówek - nieodmienna część mowy, określająca cechy czynności, stany oraz inne cechy. Występuje zawsze z czasownikiem, przymiotnikiem lub innym przysłówkiem - odpowiada na pytanie jak?, gdzie?, kiedy? nieodmienny - spójniki, przyimki, wykrzykniki, partykuły. 1.5.2. Rzeczownik - rodzaj rzeczownika Rzeczowniki mogą występować w funkcji rozmaitych części zdania. Mogą być: podmiotem orzeczeniem dopełnieniem przydawką W zależności od tych funkcji przyjmują różne końcówki fleksyjne. Te końcówki wraz z tematami tworzą formy przypadków. W języku polskim rozróżniamy sześć form przypadków: mianownik dopełniacz celownik biernik narzędnik 10
1.5. Klasy wyrazów w języku polskim miejscownik Mianownik odpowiada na pytania: kto? co?, dopełniacz - na pytania: kogo? czego?, celownik - komu? czemu?, biernik - kogo? co?, narzędnik - z kim? z czym? i miejscownik - o kim? o czym?. Rzeczowniki przybierają także siódmą formę zwaną wołaczem. Wołacz nie ma jednak bezpośredniego związku z całością zdania, nie wskazuje bowiem na związki zachodzące między danym rzeczownikiem a innymi wyrazami w zdaniu. W języku polskim mamy siedem rodzajów rzeczowników odmiennych oraz rzeczowniki nieodmienne. W języku polskim rodzaj jest powiązany z płcią. Najogólniej można wyróżnić trzy rodzaje: rodzaj męski rodzaj żeński rodzaj nijaki W przypadku rodzaju męskiego znaczenie ma jeszcze żywotność i osobowość. Rzeczowniki żywotne to z reguły te, które oznaczają istoty żywe, pozostałe są nieżywotne. Dla rzeczowników żywotnych w liczbie pojedynczej biernik jest równy dopełniaczowi, a dla nieżywotnych biernik jest równy mianownikowi. Rzeczowniki żywotne pies człowiek wąż sms email Rzeczowniki nieżywotne dom samochód długopis znak kwadrat Tabela 1.2: Żywotność rzeczowników Jak widać do rzeczowników żywotnych możemy zaliczyć takie wyrazy jak sms czy email, mimo, że nie oznaczają one istot żywych. Dzieje się tak ponieważ, nowym wyrazom wchodzącym dopiero co do języka często przypisuje się cechy żywotne. Częściej mówimy Wysyłam smsa niż Wysyłam sms. Rzeczowniki osobowe to z reguły te, które oznaczają osoby, pozostałe są nieosobowe. Zdarzają się jednak wyjątki od tych reguł. Wszystkie rzeczowniki osobowe są również żywotne. Osobowość odgrywa rolę w liczbie mnogiej. Rzeczowniki żywotne dzielą się na osobowe i nieosobowe co widać na podstawie liczby mnogiej biernika. 11
1.5. Klasy wyrazów w języku polskim Podsumowując dla liczby pojedynczej mamy 5 rodzajów rzeczowników: rodzaj męski osobowy rodzaj męski żywotny rodzaj męski nieżywotny rodzaj żeński rodzaj nijaki Pozostałe dwa rodzaje rzeczowników czyli: rodzaj osobowy i rodzaj nieosobowy są podziałem rzeczowników występujących tylko w liczbie mnogiej. Niższe klasy rzeczowników ustalane są ze względu na końcówkę w odpowiednim przypadku. 1.5.3. Czasownik Czasowniki pełnią bardzo ważną funkcję w języku, nazywają dziejące się czynności i stany. Cechą wyróżniającą czasowniki spośród innych części mowy jest to, że pozostają one w jakimś związku z czasem i posiadają formy wyrażające kategorię czasu. Każda forma czasownika pozostaje w określonym stosunku do kategorii czasu i do podmiotu, którym może być pierwsza osoba, druga lub trzecia zarówno w liczbie pojedynczej jak i mnogiej. Czasowniki występują w następujących formach: czasowniki osobowe - podlegają koniugacji imiesłów przymiotnikowy czynny(myjący) i bierny(myty), imiesłów przymiotnikowy podlega deklinacji bezokolicznik imiesłów przysłówkowy współczesny (myjąc) i uprzedni (wziąwszy) nieosobowa forma czasownika (myto) Koniugacja czasownika Koniugacja jest to odmiana czasownika przez osoby, tryby, czasy, liczby, strony. Czasownik występuje w następujących formach: Forma osoby oznacza stosunek narratora wypowiedzi do podmiotu zdania. Występują 3 osoby: pierwsza gdy narrator jest identyczny z podmiotem (czytam), druga gdy osoba mówiąca zwraca się bezpośrednio do podmiotu zdania (czytasz) i osoba trzecia, gdy narrator opowiada o podmiocie zdania (czyta). Forma liczby dotyczy oprócz czasownika jest rzeczownika oraz przymiotnika. 12
1.5. Klasy wyrazów w języku polskim W języku polskim występuje liczba pojedyncza oraz liczba mnoga. Orzeczenie w zdaniu przyjmuje liczbę pojedynczą lub mnogą na podstawie związku zgody z podmiotem. Np. ja idę ale my idziemy Formy czasu pokazują związek między chwilą mówienia o czynności, a chwilą odbywania danej czynności. Jeżeli mówimy o czynności wykonywanej w tym samym czasie mamy do czynienia z czasem teraźniejszym, jeżeli mówimy o czynności wcześniejszej względem chwili mówienia, to mówimy o czasie przeszłym, a gdy mamy do czynienia z sytuacją gdy mówimy o czynności późniejszej względem chwili wykonywania, to wtedy jest to czas przyszły. W przypadku formy strony chodzi o stosunek podmiotu do orzeczenia. Podmiot może być albo wykonawcą czynności(strona czynna) np. On kieruje samochodem, albo jej odbiorcą (strona bierna) np. Samochód jest kierowany przez niego, albo i wykonawcą, i odbiorcą jednocześnie(strona zwrotna) np. Ona ubiera się. Aby można było przekształcić stronę czynną na bierną orzeczenie musi być czasownikiem przechodnim. Formy trybu pokazują ustosunkowanie się narratora zdania do jego treści. Jeżeli w wypowiedzi mówi się o realnych faktach w opinii autora bez żadnych warunków to mamy do czynienia z trybem orzekającym. Jeżeli przypuszczamy, że jakaś czynność się może odbyć to mówimy o trybie przypuszczającym. Jeżeli mówiący formułuje rozkazy i żąda wykonania czynności to mamy do czynienia z trybem rozkazującym. Podsumowując mamy następujące formy czasowników: osoby - pierwsza myję, druga myjesz, trzecia myje liczby - pojedyncza myję, mnoga myjemy czasu - teraźniejszy myję, przeszły myłem, przyszły prosty umyję, przyszły złożony będę mył strony - czynna myje, bierna myta, zwrotna myje się trybu - orzekający myje, przypuszczający myłby, rozkazujący myj Podział czasownika Podstawowy podział czasowników jest dokonywany na podstawie końcówki w pierwszej i drugiej osobie liczy pojedynczej -ę -esz (chcę, chcesz) -ę -isz (śpię, śpisz) 13
1.5. Klasy wyrazów w języku polskim -ę -ysz (leżę, leżysz) -m -sz (rozumiem, rozumiesz) Pozostały podział czasowników odbywa się na podstawie sufiksu tematycznego i pretematycznego oraz końcówki trybu rozkazującego. 1.5.4. Przymiotnik Przymiotnik jest wyrazem którego główną funkcją jest określanie innych wyrazów w zdaniu. Przymiotniki w języku polskim występują w pięciu przypadkach: męskim, żeńskim, nijakim, męskoosobowym i niemęskoosobowy. Przymiotniki podlegają deklinacji. Dla rodzaju męskiego i nijakiego, gdy przymiotnik określa wyraz żywotny, biernik jest równy dopełniaczowi, a w przypadku wyrazów nieżywotnych biernik jest równy mianownikowi. Podstawowy podział polega na podziale przymiotników ze względu na końcówkę przymiotnika w rodzaju męskim w liczbie pojedynczej. Występują końcówki -i (rześki) -y (chory) -0 (gotów). Osobną kategorią są przymiotniki nieodmienne głównie zapożyczone z innego języka jak np. (brutto). 1.5.5. Liczebnik Liczebnik jest częścią mowy która określa liczbę, ilość, wielokrotność lub kolejność. Niektóre liczebniki (np. główne) odmieniają się przez przypadki i rodzaje, uzależnione jest to od typu liczebnika. W języku polskim istnieją następujące typy liczebników: główne - jeden, dwa, trzy, cztery, pięć, sześć, siedem, tysiąc porządkowe - pierwszy, setny, tysięczny ułamkowe - ćwierć, jedna druga zbiorowe - dwoje, troje, czworo mnożne - podwójny, potrójny, poczwórny nieokreślone - niewiele, kilka, kilkaset Ze względów na liczbę rodzajów dokonujemy podziału liczebników na: wielorodzajowe - posiada trzy rodzaje (jeden, jedna, jedno) dwurodzajowe - posiada dwa rodzaje męskoosobowy i niemęskoosobowy(trzy, trzej ) jednorodzajowe - posiada jeden rodzaj (tysiąc) 14
1.5. Klasy wyrazów w języku polskim bezrodzajowe - nie posiada rodzaju (dwoje) nieokreślone - (kilka, wiele) Ze względów fleksyjnych można dokonać podziału liczebników na: liczebniki odmieniające się przez przypadki, nie mające w swej odmianie różnic zależnych od kategorii liczby liczebniki odmieniające się przez przypadki, mające tylko formy liczby pojedynczej i jednego rodzaju gramatycznego liczebniki odmieniające się przez przypadki, liczby i rodzaje liczebniki nieodmienne Do grupy pierwszej należą liczebniki główne, do drugiej zbiorowe, do trzeciej mnożne oraz wielorakie i do czwartej - ułamkowe. 1.5.6. Zaimek Zaimek jest częścią mowy zastępującą rzeczownik (np. on), przymiotnik (np. twój ), liczebnik (np. ile) lub przysłówek (np. wtedy) i pełni ich funkcje w zdaniu. Odmiana zaimka zależy od tego, którą część mowy dany zaimek zastępuje. Ze względu na odmianę dzielimy zaimki na: rzeczowne - zaimek rzeczowny (ja) przymiotne - zaimek przymiotny (mój ) liczebne - zaimek liczebny (ile) przysłowne - zaimek przysłowny (tak) Podział zaimków ze względu na znaczenie: osobowe (ja) zwrotne (się) dzierżawcze (mój ) wskazujące (ten) pytające ( kto?) względne ( kto bez znaku zapytania; łączą zdanie nadrzędne z podrzędnym) nieokreślone (ktoś) przeczące (nic) upowszechniające (wszyscy) 15
1.6. Schemat klasyfikacji fleksyjnej wyrazów języka polskiego 1.5.7. Przysłówek Przysłówek - nieodmienna część mowy, określająca cechy czynności, stany oraz inne cechy. Występuje zawsze z czasownikiem, przymiotnikiem lub innym przysłówkiem. Tworzy się je najczęściej od przymiotników za pomocą końcówki -e, -o. Przysłówki utworzone od przymiotników (odprzymiotnikowe) zazwyczaj stopniują się (tak jak przymiotniki, od których pochodzą). Pozostałe przysłówki, np. dziś, wczoraj, zawsze, nie stopniują się. 1.6. Schemat klasyfikacji fleksyjnej wyrazów języka polskiego Opisany powyżej podział wyrazów na klasy jest tylko wierzchołkiem piramidy kolejnych podziałów. W obrębie każdej części mowy dokonują się kolejne podziały ze względu na końcówki odpowiednich form fleksyjnych, tworząc wzorce odmiany, czyli schematy odmiany dla konkretnych grup wyrazów. Należało te wszystkie wzorce odmiany uporządkować i przedstawić w logiczny sposób. System Flex bazuje na Słowniku fleksyjnym języka polskiego 5 w którym są zawarte wszystkie wzorce odmiany, występujące w języku polskim. Posłużył do tego schemat klasyfikacji fleksyjnej języka polskiego, który przedstawiony jest w formie drzewa kategorii gramatycznych. Bez tego słownika i schematu klasyfikacji fleksyjnej system Flex nie mógłby w ogóle działać. Cała wiedza systemu opiera się na drzewie kategorii gramatycznych. Idea działania systemu polega na nauczaniu wzorców odmiany z drzewa kategorii gramatycznych. Słownik fleksyjny języka polskiego zawiera ponad 120 000 haseł. Każde hasło to kompletny zbiór form fleksyjnych konkretnego wyrazu, opis fleksyjny wyrazu, czyli część mowy i identyfikator wzorca odmiany. W dalszej części rozdziału zostaną szczegółowo opisane: wzorzec odmiany oraz drzewo kategorii gramatycznych używane przy generacji słownika. 1.6.1. Wzorzec odmiany Każdy wyraz w języku polskim należy do pewnej grupy wyrazów, która odmienia się według tego samego schematu, lub inaczej ma unikalny wzorzec odmiany. Formalnie wzorzec odmiany można przedstawić jako: 6 Trzy zbiory O, F i T, takie że: W = {O, F, T } 5 W.Lubaszewski, H.Wróbel, M.Gajęcki, B.Moskal, A.Orzechowska, P.Pietras, P.Pisarek, T.Rokicka Słownik fleksyjny języka polskiego, Grupa Lingwistyki Komputerowej, 2001 6 Piotr Pisarek, Automatyczne generowanie słownika języka polskiego metodą gramatyk lokalnych, AGH, 2003 16
1.6. Schemat klasyfikacji fleksyjnej wyrazów języka polskiego Gdzie: O = {o1, o2,..., on}, gdzie o jest opisem formy i wyraża jedną z kombinacji wartości gramatycznych. Innymi słowy, O jest zbiorem opisów form, np. charakterystyczny dla rzeczowników i zaimków O = {M.Lp., D.Lp., C.Lp., B.Lp., N.Lp., Mc.Lp., W.Lp., M.Lm., D.Lm., C.Lm., B.Lm., N.Lm., Mc.Lm., W.Lm.}. F = {f1, f2,..., fn}, gdzie f jest końcówka fleksyjna. Innymi słowy, F to równoliczny ze zbiorem opisów O zbiór końcówek fleksyjnych, np. {0, a, owi, a, em, e, e, y, ów, om, ów, ami, ach, y}. Zbiór końcówek F musi różnic się od innych F przynajmniej jednym elementem, na przykład: F = {0, a, owi, a, em, e, e, y, ów, om, ów, ami, ach, y} dla wyrazu typu aktor i F = {0, a, owi, a, em, e, e, owie, ów, om, ów, ami, ach, owie} dla wyrazów typu profesor. T = {(t 1 1,t 2 1), (t 1 2,t 2 2),...,(t n 1,t n 1) }, gdzie t jest dowolnym ciągiem znaków. Innymi słowy, T to zbiór par uporządkowanych, np.(#,#),..., (r,rz), (t,ci), (s,si),... }, takich, że każda para opisuje jedno z możliwych we wzorcu przekształceń tematu fleksyjnego, zachodzących w kontekście elementów O i F. W skrócie zbiór O definiuje nam kategorie gramatyczne jakim podlega dany wyraz, zbiór F to zbiór końcówek jakie może przyjmować dany wyraz, a zbiór T to zbiór oboczności tematu. Na podstawie tych trzy zbiorów możemy odmienić każdy wyraz, który jest przypisany dla danego wzorca odmiany. 1.6.2. Drzewo kategorii gramatycznych i końcówek fleksyjnych Wszystkie wzorce odmiany wyrazów występujących w języku polskim można przedstawić w postaci drzewa kategorii gramatycznych i końcówek charakterystycznych. Każdy wyraz ma ściśle określoną kategorie fleksyjna czyli inaczej mówiąc należy on do określonej klasy wyrazów w języku polskim i ma określony wzorzec odmiany. Drzewo kategorii gramatycznych i końcówek fleksyjnych jest hierarchicznym podziałem wyrazów w języku polskim ze względu na właściwości fleksyjne. Najwyższym podziałem jest podział ze względu na części mowy. Dalej dla każdej części mowy, wyrazy dzielą się na coraz większą liczbę klas. Na przykład rzeczowniki dzielą się ze względu na rodzaj na: męskie, żeńskie, nijakie a następnie ze względu na końcówki fleksyjne w odpowiednich przypadkach. Tworzy się drzewo podziału fleksyjnego wyrazów w języku polskim. Na przykład dla wyrazu polityka jego kategoria fleksyjna jest określona jako 4 elementy: 17
1.6. Schemat klasyfikacji fleksyjnej wyrazów języka polskiego rzeczownik rodzaj żeński mianownik liczby pojedynczej ma końcówkę -a mianownik liczby mnogiej ma końcówkę -i Każdy wierzchołek drzewa posiada swój opis w postaci litery alfabetu. W każdym węźle jego podwęzły są opisane jako kolejne litery alfabetu poczynając od A. Biorąc pod uwagę pierwszy poziom drzewa otrzymamy następujące przyporządkowanie węzłom liter: rzeczownik to litera - A czasownik - B przymiotnik - C liczebnik - D zaimek - E przysłówek - F nieodmienny - G Takie oznaczenie wierzchołków w drzewie powoduje że każdy wyraz języka polskiego ma określoną etykietę np. rzeczownik kot ma etykietę ABABAB co oznacza, że opis jego kategorii fleksyjnej jest następujący: A - rzeczownik B - męski żywotny A - mianownik liczby pojedynczej - brak końcówki B - mianownik liczby mnogiej - końcówka y A - dopełniacz liczby pojedynczej - końcówka a B - celownik liczby pojedynczej - końcówka u Mamy o wyrazie 6 informacji tyle ile jest liter w etykiecie można powiedzieć, że każda litera etykiety zawiera informacje o wyrazie, jednak nie jest to stwierdzenie zbyt precyzyjne, gdyż to nie sama litera daje nam konkretną informację, ale ciąg liter od początku etykiety do danego zagłębienia. Dla wyrazu kot ciąg liter A mówi nam, ze jest to rzeczownik, ciąg liter AB mówi nam ze jest to rzeczownik męski żywotny i 18