O pojęciu wyrazu morfologicznego
|
|
- Tomasz Przybylski
- 6 lat temu
- Przeglądów:
Transkrypt
1 O pojęciu wyrazu morfologicznego Janusz S. Bień 9 luty Wstęp Witold Doroszewski w swojej książce Elementy leksykologii i semiotyki ([8, 242]) z uznaniem cytował pogląd francuskiego lingwisty Antoine a Meilleta ( ), który twierdził, że wyrazu zasadniczo zdefiniować nie można. Pogląd taki był dla mnie zawsze nieakceptowalny (por. [1], [2], [22]). Ścisły opis języka naturalnego musi posługiwać się dobrze zdefiniowanymi pojęciami, zwłaszcza gdy ma stanowić teoretyczną podstawę zastosowań praktycznych. Nieostrość intuicyjnego pojęcia wyrazu bierze się z jednoczesnego stosowania niejednorodnych kryteriów, które niekiedy popadają ze sobą w konflikt. Konflikty te można rozwiązywać dwojako: albo rozkładając definiowane pojęcie na kilka pojęć bardziej szczegółowych, albo dokonując rozstrzygnięć arbitralnych. W swoich pracach stosowałem z lepszym lub gorszym skutkiem obie te metody. Znaczącym etapem w tworzeniu precyzyjnego aparatu pojęciowego dla morfologii polskiej był przygotowany wspólnie z Prof. Zygmuntem Salonim artykuł Pojęcie wyrazu morfologicznego i jego zastosowanie do opisu fleksji polskiej (wersja wstępna) ([3]). W swojej książce Koncepcja słownikowej informacji morfologicznej i jej komputerowej weryfikacji ([4]) zaproponowałem nieco inne rozumienie wyrazu morfologicznego i wprowadziłem pojęcie wyrazu morfosyntaktycznego. Głównym celem niniejszego artykułu jest uzasadnienie tych propozycji terminologicznych. Aby jednak było to możliwe, niezbędne jest szczegółowe przedstawienie pojęć bardziej podstawowych. Niniejszy artykuł ukazał się w tomie: Włodzimierz Gruszczyński (red. prowadzący), Urszula Andrejewicz, Mirosław Bańko, Dorota Kopcińska (red.), Nie bez znaczenia... Prace ofiarowane Profesorowi Zygmuntowi Saloniemu z okazji dni pracy naukowej. Białystok 2001: Wydawnictwo Uniwersytetu w Białymstoku, s (ISBN ). Niniejsza wersja elektroniczna dostępna jest na zasadach licencji GNU Verbatim Copying and Distribution; numeracja stron różni się od wersji drukowanej. Zakład Zastosowań Informatycznych, Instytut Orientalistyczny Uniwersytetu Warszawskiego, patrz [Afiliacja z czasu publikacji, obecnie nieaktualna]. 1
2 2 Pojęcia unilateralne i bilateralne Zgodnie z tradycją językoznawstwa strukturalnego sięgającą Ferdynanda de Saussure a elementy języka czyli znaki językowe można opisywać jako posiadające dwa składniki: formę (signifiant) i znaczenie (signifié). Zygmunt Saloni takie jednostki nazywa bilateralnymi czyli dwustronnymi. Jednostkom bilateralnym przeciwstawia on jednostki unilateralne czyli jednostronne; mamy z nimi do czynienia, gdy opisujemy samą formę znaków językowych nie odwołując się bezpośrednio do znaczenia. Szczegółową dyskusję tego zagadnienia można znaleźć w artykule Unilateralne i bilateralne podejście do znaków języka (naturalnego) ([15]). Rozróżnienie to uważamy za bardzo użyteczne i za Salonim od dawna stosujemy je w praktyce, rozumiejąc je jednak bardziej technicznie i konkretnie. Podstawową różnicę stanowi to, że pojęcia te odnosimy nie do języka jako całości, ale do wybranej warstwy opisu języka. Dla uniknięcia nieporozumień należy od razu wyjaśnić, że nasze podejście do opisu języka nie ma nic wspólnego z gramatyką stratyfikacyjną Sydneya M. Lamba ([12]) i jego kontynuatorów, choć stanowiła ona jedno ze źródeł inspiracji. Uważamy, że wyróżnienie warstw czy poziomów i to w stosunkowo dużej liczbie ułatwia i upraszcza ścisły opis języka, zaś za podstawowe kryterium podziału opisu na warstwy uważamy praktyczne potrzeby. Chodzi nam przy tym zarówno o komputerowe przetwarzanie tekstów, które w zależności od konkretnego zastosowania może się odbywać na różnych poziomach, jak i praktykę językoznawców i leksykografów, którzy opisują język z różnym stopniem dokładności i koncentrują swoją uwagę na różnych jego własnościach. Najbardziej podstawowym pojęciem unilateralnym jest dla nas czysty tekst elektroniczny kodowany symbolicznie. Jak pisaliśmy w [6], pojęcie tekstu traktujemy jako pierwotne, którego nie trzeba definiować, wyróżniamy natomiast dwa podstawowe typy tekstów: teksty fizyczne i teksty elektroniczne. Za charakterystyczną cechę tekstów elektronicznych uznajemy fakt, że nie zmieniają one swojej tożsamości przy zmianie ich nośnika fizycznego: ten sam tekst elektroniczny może być zapisany na dyskietce, twardym dysku komputera lub na płycie CD-ROM i mimo to pozostaje tym samym tekstem. Tym czasem w przypadku tekstów fizycznych każde skopiowanie bez względu na zastosowaną technikę wprowadza mniejsze lub większe zmiany i zniekształcenia w rezultacie po wielokrotnym kopiowaniu tekst może np. znacznie zmniejszyć swoją czytelność. Niektóre teksty elektroniczne są po prostu mniej lub bardziej wiernym zapisem pewnych tekstów fizycznych możemy mówić wtedy o tekście pierwotnym (fizycznym) i wtórnym (elektronicznym). Mamy wówczas do czynienia z kodowaniem akustycznym, tj. z cyfrowym zapisem dźwięku tekstu mówionego, lub z kodowaniem wizualnym, tj. z cyfrowym zapisem informacji wizualnej. Najważniejszym typem kodowania tekstów jest jednak kodowanie symboliczne, gdzie pewnym elementom składowym tekstów (w przypadku alfabetycznych systemów pisma będą to m.in. litery i inne znaki pisarskie czy drukarskie) przyporządkowuje się pewne reprezentacje w postaci liczb lub ciągów bitów, a następnie zapisuje się tekst jako ciąg reprezentacji jego elementów składowych. 2
3 Charakterystyczną cechą tekstów elektronicznych stosujących kodowanie symboliczne jest możliwość wyboru stopnia dokładności i szczegółowości, z jaką dany tekst jest zapisany. W terminologii anglosaskiej przyjęło się ten fakt odzwierciedlać rozróżniając plain text (dosłownie zwykły tekst) z jednej strony i fancy text (dosłownie tekst wymyślny) lub rich text (dosłownie tekst bogaty); dla plain text dość szeroko stosowane również przeze mnie jest tłumaczenie czysty tekst, termin rich text tłumaczę jako tekst wzbogacony. Za standardem UNICODE (definiującym tzw. Uniwersalny Zestaw Znaków, patrz [24], s. 2-7) przyjmujemy, że czysty tekst reprezentuje podstawową treść tekstu w wymienialnej to znaczy nie związanej z konkretnym oprogramowaniem postaci. W konsekwencji czysty tekst nie ma określonego swojego wyglądu kwestie kroju i wielkości znaków, podziału na wiersze i strony, koloru, odsyłaczy hipertekstowych, a nawet języka, w którym tekst lub jego fragmenty są zapisane, należą już do domeny tekstu wzbogaconego. W praktyce przetwarzania tekstów posługujemy się w szczególności takimi tekstami wzbogaconymi, które stanowią jawną reprezentację na poziomie określonej warstwy lingwistycznego opisu danego tekstu. W stosunku do takiego tekstu pojęciem unilateralnym jest takie pojęcie, które odwołuje się wyłącznie do własności tekstu zapisanych w jego reprezentacji. Pojęciem bilateralnym dla danej warstwy jest każde takie pojęcie, którego definicja odwołuje się do jakichś aspektów tekstu lub języka nie zawartych w jego formalnym zapisie takim elementem zewnętrznym może być zarówno dodatkowy słownik komputerowy jak i intuicja użytkownika języka. 3 Znaki i ich zestawy Każdy tekst języka naturalnego stanowi ciąg jednostek bardziej podstawowych. W lingwistyce tekst mówiony traktuje się jako ciąg fonemów, czyli obiektów zdefiniowanych za pomocą ich cech dystynktywnych (dzwięczność, bezdzwięczność itp.). Uznając ten aspekt definicji fonemów za najbardziej istotny, Adam Weinsberg traktował je za Leonem Zawadowskim jako szczególny przypadek jeszcze bardziej ogólnego pojecia diakrytu (z greckiego diakritikos który odróżnia). Od Weinsberga termin ten przejął Zygmunt Saloni ([15]) stosując go w szczególności w podręczniku akademickim [18]. Jak się wydaje, głównym powodem wprowadzenia tego terminu była możliwość stosowania go również do tekstów pisanych. Tę propozycję terminologiczną uważam za wyjątkowo nieszczęśliwą, ponieważ jest ona w konflikcie z powszechnym rozumieniem terminu diakryt jako pewnego elementu kształtu litery. Język mówiony zwykło przeciwstawiać się językowi pisanemu, przy czym wielu lingwistom uchodziła i uchodzi uwagi zasadnicza różnica między tekstem pisanym ręcznie a tekstem drukowanym. W pierwszym wypadku rozpoznanie w tekście jego elementów jest niemal równie trudne, jak zidentyfikowanie fonemów w wypowiedzi mówionej, w drugim przypadku mamy do czynienia w praktyce z ciągiem elementów ze skończonego zbioru czcionek. Fakt ten znalazł odzwierciedlenie w angielskiej terminologii informatycznej, gdzie podstawowa 3
4 jednostka tekstu lub napisu nazywa się character, którego jednym z polskim odpowiedników jest właśnie czcionka. Oto definicja tego pojęcia, zaczerpnięta z międzynarodowej normy ISO/IEC :1999 ([9]): character: A member of a set of elements used for the organisation, control or representation of data oraz moje jej tłumaczenie 1 ([6]) znak: jeden z elementów pewnego zbioru, którego elementy służą do organizacji danych, sterowania nimi lub ich reprezentowania. Jak widać, jest to pojęcie tak ogólne i abstrakcyjne, że można nawet mieć wątpliwości co do jego zakresu. Warto zatem powiedzieć, że zakres tego pojęcia jest wystarczająco dobrze określony przez kontekst licznych użyć tego terminu, zaś cytowana definicja ogrywa rolę raczej dekoracyjną. Swoją drogą definicja ta staje się jaśniejsza po skonfrontowaniu jej z definicją zawartą w normie ISO/IEC ([10]) coded character: A character together with its coded representation. co tłumaczę znak kodowy: Znak rozpatrywany łącznie z jego reprezentacją kodową. Należy podkreślić, że coded character jest obiektem wyraźnie bilateralnym, co jak mi się wydaje dobrze jest odzwierciedlone przez zaproponowane przeze mnie tłumaczenie znak kodowy; bardziej dosłowne tłumaczenie znak zakodowany sugerowałoby obiekt unilateralny zlokalizowany całkowicie na płaszczyźnie reprezentacji, a więc byłoby bliższe znaczeniu angielskiego terminu encoded character. Z drugiej strony z zestawienia powyższych definicji wynika wyraźnie, że character należy rozumieć jako obiekt bliższy płaszczyźnie znaczenia; aby fakt ten lepiej oddać w języku polskim, można rozważyć tłumaczenie terminu character jako znak piśmienny, rozumiejąc przymiotnik piśmienny zgodnie z jego stosunkowo rzadkim ale notowanym w słownikach znaczeniu odnoszący się do pisma (oczywiście, w kontekstach nie budzących wątpliwości przymiotnik ten powinien być pomijany). Tak rozumiany znak piśmienny jest ogólniejszy od tradycyjnych określeń znak drukarski czy znak pisarski; stosowanie w tym znaczeniu terminu znak pisemny byłoby moim zdaniem mylące, sugerowałoby bowiem znak zapisany na papierze lub innym nośniku. Przez wspomniane wcześniej symboliczne kodowanie tekstów rozumiem właśnie jego reprezentację za pomocą znaków kodowych. Symboliczny charakter tego kodowania jest dobrze widoczny w definicji zestawu znaków kodowych czyli coded character set. W wersji z normy ISO/IEC :1999 ([9]) brzmi ona 1 Oficjalne tłumaczenie zawarte w projekcie polskiej normy PrPN-ISO różni się od mojego; zainteresowany Czytelnik może sam ocenić, które z nich jest bardziej właściwe. 4
5 coded character set; code: A set of unambigous rules that establishes a character set and the one-to-one relationship between the characters of the set and their bit combinations. a w moim nieco swobodnym tłumaczeniu zestaw znaków kodowych; kod: Zbiór ścisłych reguł, które wyznaczają pewien zbiór znaków, a także wzajemnie jednoznaczne przypisanie znakom tego zbioru pewnych kombinacji bitowych. Jak widać z definicji, zestaw znaków kodowych nie jest w istocie zestawem tych znaków, ale pewnych niekiedy dość skomplikowanych reguł; w związku równie dobrze można termin coded character set tłumaczyć jako kodowy zestaw znaków; to drugie tłumaczenie wydaje mi się bardziej zręczne. Typowy tzw. plik tekstowy zapisany w komputerze stanowi dobry przykład wykorzystania kodowego zestawu znaków; każdy, kto kiedykolwiek musiał się zastanowić, jak reprezentowane są polskie litery w otrzymanym pliku (czyli w jakim kodzie zapisany jest plik), w pełni uświadamia sobie umowność i konwencjonalność symbolicznego kodowania tekstów. 4 Napisy, słowa i wyrazy Najbardziej ogólnym określeniem ciągu znaków jest w informatyce napis por. ang. (character) string. Jeśli ciąg znaków jest wyznaczony przez jakieś mniej lub bardziej formalne reguły np. stanowi element pewnego języka formalnego to nazywamy go słowem. Tak rozumiane pojęcie słowa ma o wiele szerszy zakres niż można by się spodziewać. Jest ono stosowane w odniesieniu do tekstów języka naturalnego również w życiu codziennym, kiedy należy obliczyć np. opłatę za telegram lub ogłoszenie drobne. Ze słowami w tym znaczeniu mamy do czynienia również w komputerowych edytorach tekstu, gdy wykonujemy komendy typu przesuń kursor o jedno słowo do przodu, skasuj słowo wskazane przez kursor. Do wykonania tych operacji nie jest potrzebna znajomość języka, w którym został napisany tekst (często może to być język programowania), a tylko znajomość odpowiednich własności poszczególnych znaków. Jest więc słowo pojęciem unilateralnym na najniższym (jeśli pominąć reprezentację bitową) poziomie reprezentacji tekstu, który nazywamy poziomem lub warstwą kodową. Jeśli ustalimy, do jakiego języka naturalnego należy dane słowo, przenosimy się na wyższy poziom reprezentacji, który nazywamy alfabetycznym. Począwszy od tego poziomu mamy już do czynienia z wyrazami, które są jednostkami bilateralnymi. Z jednej strony zawsze możemy przyporządkować im pewne jednostki niższego poziomu o jednostkach tych będziemy mówić, że reprezentują dane wyrazy lub że są ich kształtami. Z drugiej strony wyrazy zawsze możemy traktować jako reprezentacje jednostek jeszcze wyższych poziomów, również takich jak semantyka i pragmatyka, których nie próbujemy nawet formalizować. Z teoretycznego punktu widzenia wyróżnianie poziomu alfabetycznego może wydawać się dzieleniem włosa na czworo, ale poziom ten ma duże znaczenie 5
6 praktyczne. To na tym poziomie decyduje się dopiero np. taki fakt, że znak piśmienny «ó» jest samodzielną literą w języku polskim, a nie literą «o» z diakrytem, jak w języku francuskim, co ma decydujący wpływ na tzw. porządek alfabetyczny (por. [5]) 2. Na tym poziomie również zostaje ustalona przynajmniej wstępnie wymowa wyrazu, co jest zadaniem rozwiązywanym również przez programy komputerowe odczytujące teksty (np. wyszukane w Internecie) na potrzeby osób niewidomych lub niedowidzących. Zarówno do słów, jak i do wyrazów stosuje się rozróżnienie znane w literaturze anglosaskiej jako type token distinction. O ile interpretację typu token możemy wskazać jawnie mówiąc o egzemplarzach lub wystąpieniach słowa lub wyrazu, to ciągle brakuje wygodnego i uznanego sposobu jednoznacznego wskazania interpretacji typu type. Zaproponowane przez mnie w [4] (s. 13) tłumaczenie type jako prototyp okazało się niewygodne i mylące. Wydaje mi się obecnie, że lepsze jest znacznie bardziej swobodne tłumaczenie jako matryca. Na szczęście przeważnie sposób interpretacji wynika z kontekstu, stąd konieczność sprecyzowania, że chodzi o matrycę wyrazu, a nie jego egzemplarz czy wystąpienie, pojawia się bardzo rzadko. Jednym z takich przypadków jest opis własności korpusów tekstów przeznaczonych do celów badawczych, gdzie stosunek liczby matryc do liczby egzemplarzy wyrazów jest pożyteczną miarą różnorodności korpusu. 5 Wyrazy paradygmatyczne i syntagmatyczne Pojęcia wyrazu paradygmatycznego i syntagmatycznego zostały wprowadzone przez Jana Tokarskiego w książce [21] (s. 55). Mówiąc krótko, wyraz paradygmatyczny to abstrakcyjna jednostka słownika lub słownictwa; w przypadku wyrazów odmiennych można ją sobie wyobrażać np. jako zbiór wszystkich form fleksyjnych danego wyrazu paradygmatycznego zbiór taki nazywamy paradygmatem. Wyraz syntagmatyczny to wyraz użyty lub przystosowany do użycia przez dobór odpowiedniej formy fleksyjnej w pewnym kontekście. W pierwszym przypadku mamy do czynienia z egzemplarzem wyrazu syntagmatycznego, który charakteryzuje się m.in. konkretną pozycją w linearnym tekście (pierwszy lub ostatni wyraz itp.). W drugim przypadku mamy do czynienia z matrycą możemy powiedzieć, że dopełniacz liczby pojedynczej wyrazu paradygmatycznego dom ma postać domu bez odwoływania się do konkretnego tekstu. Przydatność wprowadzonych pojęć jest widoczna w rozwiązywaniu tak konkretnych zadań, jak ustalanie identyczności i granic wyrazów. Jak zwrócił na to uwagę już Tokarski ([21], s. ), odpowiedź na pytanie: ile jest wyrazów w aforyzmie Człowiek człowiekowi powinien być człowiekiem wcale nie jest oczywista. Jeśli liczymy wyrazy paradygmatyczne, to odpowiedź brzmi 3 (człowiek, być, powinien). Jednak odpowiedź, że w powyższym przykładzie mamy 5 wyrazów 2 Inny ciekawy przykład to stanowiąca jedną całość litera «Ł», która na poziomie kodowym może być ze względów technicznych jak we wczesnej wersji systemu TEX reprezentowana przez dwa znaki piśmienne: znak «L» oraz specjalny znak diakrytyczny 6
7 (o których przepisy ortograficzne stanowią, że wyrazy piszemy osobno) jest również zasadna liczymy wówczas wyrazy syntagmatyczne (w tym konkretnym przypadku nie jest istotne, czy mamy na myśli egzemplarze czy matryce). Inny problem ilustruje przykład zaczerpnięty z [11] (s. xx): czy jakiś wyraz powtarza się w zdaniach To jest zła wola. i Wyrządził im wiele zła.. Naturalna jest odpowiedź negatywna, stwierdzająca, że mamy tu do czynienia z hominimią form wyrazu zło i zły. Ta odpowiedź jest w pełni uzasadniona, jeśli mamy na myśli wyrazy paradygmatyczne odpowiednio wysokiego poziomu. Choć dokonywanie takich rozróżnień przez komputer zaczyna być możliwe, w wielu prozaicznych zastosowaniach praktycznych wystarczy nam znajomość cech wspólnych wyrazu syntagmatycznego zły, przysługujących mu zarówno jako formie rzeczownika zło jak i przymiotnika zły: jest to wyraz języka polskiego, odczytuje się go zatem zgodnie z regułami języka polskiego i w razie potrzeby przenosi się go do nowego wiersza zgodnie z regułami języka polskiego. Wynika z tego, że wyrazy syntagmatyczne warto rozpatrywać zawsze na określonym poziomie opisu języka wspomniane wyżej własności należą naszym zdaniem do poziomów alfabetycznego i grafemicznego. 6 Wyrazy alfabetyczne i grafemiczne W hierarchii zaproponowanej w [4] wyróżnialiśmy 5 poziomów: typograficzny, alfabetyczny, grafemiczny, morfologiczny i morfosyntaktyczny. Obecnie za podstawowy, najniższy poziom uważamy poziom kodowy, traktując poziom typograficzny jako pomocnicze pojęcie służące z jednej strony do opisu wizualnego wyglądu tekstu, z drugiej zaś strony do opisu procesu interpretacji tekstu np. wprowadzonego do komputera za pomocą optycznego rozpoznawania znaków (OCR ang. Optical Character Recognition) lub bezpośrednio z klawiatury za pomocą edytora typu co widzisz [na ekranie], to dostaniesz [na drukarce] (WYSIWYG ang. What You See Is What You Get). Warto też pamiętać, że poprawne wydrukowanie tekstu to nie tylko właściwe przenoszenie wyrazów do nowego wiersza, ale także dobór właściwego dla danego języka kształtu czcionek np. akcent nad dużą literą A ma inny kształt w języku francuskim niż w węgierskim. Wyrazy typograficzne uważamy za jednostki unilateralne i traktujemy je obecnie jako fragmenty pewnego elektronicznego tekstu wzbogaconego. Podstawowym motywem wprowadzenia pojęcia wyrazu alfabetycznego jest dokonanie wstępnej segmentacji tekstu kodowanego każdy odstęp, znak interpunkcyjny lub łącznik stanowi granicę wyrazu alfabetycznego. Na poziomie alfabetycznym rozróżniamy małe i duże litery (czyli miniskuły i majuskuły). Rozróżnienie to, bardzo istotne przy komputerowym przetwarzaniu tekstów, nie ma w języku polskim powszechnie przyjętej nazwy, zaś w angielskim jest określana bardzo wieloznacznym słowem case oraz słowami i zwrotami pochodnymi: upper case, lower case, case-free, case-sensitive itp. Terminy upper case i lower case oznaczały pierwotnie po prostu kaszty drukarskie; przynajmniej w niektórych drukarniach majuskuły trzymano w kaszcie umieszczonej wyżej, zaś minu- 7
8 skuły w kaszcie umieszczonej niżej. Ponieważ wygodne a więc nie opisowe polskie odpowiedniki tych często używanych terminów są bardzo potrzebne, tłumaczę je odpowiednio jako górna i dolna kaszta, kasztowy (case-sensitive) i bezkasztowy (case-free). Wspomniany wcześniej poziom grafemiczny to pojęcie ważne, ale tylko sporadycznie reprezentowane w komputerze w sposób jawny. Do poziomu tego zaliczamy informacje o przenoszeniu wyrazu do nowego wiersza, a także o właściwym użyciu dużych i małych liter. Są one z reguły przechowywane w odpowiednim słowniku komputerowym. O słownikach takich można powiedzieć, że zawierają one paradygmatyczne (a więc, etymologicznie rzecz biorąc, wzorcowe) wyrazy grafemiczne. 7 Morfologia taksonomiczna Warto podkreślić, że podstawowym celem naszego opisu morfologicznego jest klasyfikacja wyrazów ze względu na ich wybrane własności, w szczególności ich funkcje składniowe. Wzajemne związki między kształtami form wyrazowych, stanowiące główny przedmiot zainteresowania tradycyjnej morfologii, uwzględniamy tylko w takim stopniu, w jakim to jest niezbędne do realizacji naszych celów. Dla podkreślenia tej różnicy tworzony przez nas opis nazywamy morfologią taksonomiczną czyli klasyfikacyjną. W artykule [3] (s. 33) pisaliśmy Wyrazy grafemiczne języka polskiego nie są jednak jeszcze obiektem zainteresowania językoznawców ani nie są bezpośrednio notowane w słownikach. Dzieje się tak dlatego, że są one czasem jednostkami utworzonymi przez mechaniczne połączenie na podstawie reguł ortograficznych kilku jednostek mających bardziej podstawowy charakter... Po przejściu na wyższy poziom abstrakcji wprowadzimy pojęcie wyrazu morfologicznego... Wyraz morfologiczny posiada swój kształt będący wyrazem niższego poziomu, sam zaś z kolei jest kształtem pewnej jednostki słownikowej czyli wyrazu paradygmatycznego, reprezentowanego najczęściej przez tradycyjnie rozumianą formę hasłową wyrazu, a mówiąc bardziej ogólnie i precyzyjnie przez symbol nazywany reprezentantem paradygmatycznym. Jego własności morfologiczne są opisane przez zestaw indykatorów morfologicznych (będacych uogólnieniem współrzędnych morfologicznych wprowadzonych w [7]). We współczesnej angielskojęzycznej terminologii przetwarzania tekstów pojęciu indykatorów morfologicznych odpowiada termin (morphological) tag, zaś cały asortyment indykatorów czyli taksonomia jest określany krótko jako tagset. W zdaniu Ładnegoś mi narobił kłopotu. wyróżniamy 4 wyrazy alfabetyczne i grafemiczne, ale 5 wyrazów morfologicznych. Zgodnie z artykułem [3] opis pierwszego wyrazu tego zdania składa się z następujących elementów: Kształt grafemiczny : ładnego (grafemy są bezkasztowe ). 8
9 Reprezentant paradygmatyczny : ładny (oznaczenie umowne). Typ wyrazu morfologicznego : przymiotnik (własność ta niekoniecznie musi być zapisana jawnie). Indykatory morfologiczne : Stopień : pos (stopień równy; inne możliwe wartości to comp i sup). Liczba : sing (pojedyncza; inna możliwa wartość to pl). Przypadek : gen (dopełniacz; inne możliwe wartości to nom, dat, acc, inst, loc, voc). Rodzaj : m3 (męski nieżywotny; inne możliwe własności to m1, m2, f, n1, n2 ). Kontraktywność : nie stosuje się (dla tzw. tradycyjnie zaimków dzierżawczych przyjmuje wartości neut i char). Predykatywność : nie stosuje się (dla nielicznych wyrazów przyjmuje wartości neut i char). Wariant : nie stosuje się (w razie potrzeby przyjmuje wartości var1 i var2 ). Pomińmy w dalszych rozważaniach indykatory kontraktywności, predykatywności i wariantów, i skoncentrujmy się na pozostałych. Zwróćmy uwagę na to, że przypisanie wartości kształtowi ładnego wartości indykatorów przypadka i rodzaju nie jest możliwe bez uwzględnienia kontekstu, a konkretnie wymaga to dokonania rozbioru gramatycznego całego zdania. Indykatory te w istocie opisują funkcję syntaktyczną danego wyrazu i dlatego obecnie tak rozumiany wyraz wolimy nazywać wyrazem morfosyntaktycznym. 8 Wyrazy morfologiczne Wyraz morfologiczny w sensie zaproponowanym po raz pierwszy w książce [4] to abstrakcyjna konstrukcja służąca do klasyfikacji wyrazów ze względu na ich kształt (formę, postać). Obiekty takie choć normalnie nie nazywane są stosowane w praktyce, co zilustrujemy dwoma przykładami. Pierwszy przykład to Schematyczny indeks a tergo polskich form wyrazowych ([23]), którego redaktorem a faktycznie współtwórcą jest Zygmunt Saloni. Stanowił on podstawę teoretyczną analizatora morfologicznego SAM (por. np. [19], [20]). Dla wyrazów przymiotnikowych otrzymujemy w wyniku ich opisy w formie zilustrowanej poniższymi przykładami: nasz A 1 żabi A 1,9 srogich A 10 słabymi A 11 drugiego A 2 jakiemu A 3 dzikim A 4 słabe A 5 słaba A 6 grubej A 7 9
10 słabą A 8 garbaci A 9 szybszy A com1 najszybszy A com1... słabsi A com9 Analogiczną informację uzyskalibyśmy korzystając z Indeksu ręcznie. Litera A to oznaczenie typu wyrazu morfologicznego, zaś numer identyfikuje pozycję danego wyrazu w paradygmacie przymiotnikowym zgodnie z propozycją sformułowaną przez Saloniego w artykule [14]. Warto zwrócić uwagę, że dla większości przymiotników pozycja ta może być wyznaczona całkowicie jednoznacznie na podstawie ich kształtu. Dla pełności obrazu wspomnimy tylko, że stopień wyższy i najwyższy jest w Indeksie traktowany łącznie, ponieważ Indeks opisuje tylko zakończenia wyrazów, a nie ich początki oba stopnie są zatem oznaczane tym samym symbolem comp. Brak tego symbolu oznacza stopień równy. Z każdą pozycją paradygmatu przymiotnikowego związane są w systematyczny sposób funkcje składniowe, które reprezentujemy przez odpowiednie wyrazy morfosyntaktyczne w określonym wyżej sensie. Ponieważ obecnie za Salonim [13] wyróżniamy 9 wartości kategorii rodzaju (omówionych również w podręczniku [18]) potrzebnych do ścisłego opisu składni liczebników (patrz [17]), występuje tutaj daleko idący synkretyzm. Skrajnym przypadkiem są wyrazy morfologiczne typu ładnym (forma nr 4), które są kształtami aż 25 wyrazów morfosyntaktycznych: 8 wyrazów reprezentujących nieżeńskie formy narzędnika liczby pojedynczej, 8 wyrazów reprezentujących nieżeńskie formy miejscownika liczby pojedynczej i 9 wyrazów reprezentujących wszystkie wartości kategorii rodzaju dopełniacza liczby mnogiej. Oczywiście, wyróżnianie 25 funkcji wyrazu ładnym jest całkowicie zbędne, jeśli interesuje nas np. tylko jego postać hasłowa wystarczające jest wtedy operowanie wyłącznie pojęciem wyrazu morfologicznego. Inny przykład to tabele odmiany czasowników zaprojektowane na potrzeby opracowanej przez Zygmunta Saloniego pracy Czasownik polski. Odmiana, słownik, której założenia zostały przedstawione w broszurze [16]. Dla czasu teraźniejszego czasownika gnieść podaje się tam tradycyjnie zresztą następujące formy wyrazowe gniotę gnieciesz gniecie gnieciemy gnieciecie gniotą Każdy z tych wyrazów według obecnej terminologii są to wyrazy morfologiczne stanowi kształt kilku wyrazów morfosyntaktycznych (morfologicznych w sensie [3]). Dla przykładu, wyraz gniotę to kształt 9 wyrazów morfosyntaktycznych różniących się wartością kategorii rodzaju (5 wyrazów morfologicznych w sensie [3]). Podobnie jak w poprzednim przykładzie, dla wielu zastosowań praktycznych wystarczające jest operowanie wyrazami morfologicznymi w obecnym sensie tego terminu. 10
11 9 Zakończenie Mam nadzieję, że udało mi się przekonać Czytelnika, że rozumienie terminu wyraz morfologiczny w sensie [4] jest bardziej wygodne i naturalne niż jego definicja sformułowana prawie 10 lat wcześniej w [3]. Chciałbym jednocześnie zastrzec, że w niniejszym artykule ze względów objętościowych nie byłem w stanie dokonać pełnego omówienia problematyki wyrazów morfologicznych (jednym z ważniejszych pominiętych aspektów jest kwestia wewnętrznej struktury paradygmatów). Literatura [1] Janusz Stanisław Bień. O pewnych problemach przetwarzania języków fleksyjnych na maszynach cyfrowych. Prace Filologiczne, XXIII: , [2] Janusz Stanisław Bień. O dwóch pojęciach pożytecznych przy automatycznym przetwarzaniu tekstów. [W:] Z polskich studiów slawistycznych. Seria 4. Językoznawstwo, s Państwowe Wydawnictwo Naukowe, [3] Janusz Stanisław Bień, Zygmunt Saloni. Pojęcie wyrazu morfologicznego i jego zastosowanie do opisu fleksji polskiej (wersja wstępna). Prace Filologiczne, XXXI:31 45, , 7, 8, 9 [4] Janusz Stanisław Bień. Koncepcja słownikowej informacji morfologicznej i jej komputerowej weryfikacji, Rozprawy Uniwersytetu Warszawskiego t Wydawnictwa Uniwersytetu Warszawskiego, Warszawa, , 4, 6, 8, 9 [5] Janusz Stanisław Bień. Uwagi o porządku alfabetycznym i leksykograficznym. Prace Językoznawcze Uniwersytetu Gdańskiego t. 16, s , Gdańsk [6] Janusz S. Bień. Kodowanie tekstów polskich w systemach komputerowych. Postscriptum nr (jesień 1998 wiosna 1999), s Wersja rozszerzona dostępna w Internecie ftp://ftp.mimuw.edu.pl/pub/users/ polszczyzna/ogonki/. 2, 3 [7] Janusz S. Bień, Witold Łukaszewicz, Stanisław Szpakowicz. Opis systemu MARYSIA, I. Zasady pisania scenariusza i scenopisu. Sprawozdania Instytutu Maszyn Matematycznych i Zakładu Obliczeń Numerycznych Uniwersytetu Warszawskiego. Warszawa [8] Witold Doroszewski. Elementy leksykologii i semiotyki. Państwowe Wydawnictwo Naukowe: Warszawa Por. recenzja: Frank Y. Gladney. Jan Tokarski Redivivus. Journal of Slavic Linguistic Vol. 2 No. 2, summer-fall 1994, pp
12 [9] ISO/IEC :1999. Information Processing 8-bit Single-Byte Coded Graphic Character Sets Part 2: Latin alphabet No [10] ISO/IEC :1993. Information Technology Universal Multiple octet Coded Character Set (UCS) Part 1: Architecture and Basic Multilingual Plane. First edition 1993, second edition [11] I. Kurcz, A. Lewicki, J. Sambor, K. Szafran, J. Woronczak, Słownik frekwencyjny współczesnej polszczyzny pisanej. Instytut Języka Polskiego PAN, Kraków [12] Sydney M. Lamb. Outline of stratificational grammar (2nd ed). Georgetown U.P [13] Zygmunt Saloni. Kategoria rodzaju w języku polskim. Kategorie gramatyczne grup imiennych w języku polskim. Wrocław, s i , [14] Zygmunt Saloni. Rygorystyczny opis polskiej deklinacji przymiotnikowej. Prace Językoznawcze Uniwersytetu Gdańskiego nr 16, 1992, s [15] Zygmunt Saloni. Unilateralne i bilateralne podejście do znaków języka (naturalnego). J.J. Jadacki, W. Strawiński (red.), W świecie znaków. Warszawa 1996, s , 3 [16] Saloni, Z. Wstęp do koniugacji polskiej. Wydawnictwo Uniwersytetu Warmińsko Mazurskiego: Olsztyn [17] Zygmunt Saloni, Włodzimierz Gruszczyński. Składnia grup liczebnikowych we współczesnym języku polskim. Studia Gramatyczne II, s Ossolineum [18] Saloni, Z., Świdziński, M Składnia współczesnego języka polskiego. Wydanie czwarte, zmienione. Wydawnictwo Naukowe PWN: Warszawa , 8 [19] K. Szafran. Analizator morfologiczny SAM-95 opis użytkowy. Raport Instytutu Informatyki Uniwersytetu Warszawskiego TR (226), maj Raport dostępny w Internecie ftp://ftp.mimuw.edu.pl/pub/ users/polszczyzna/sam-95/. 8 [20] K. Szafran, Automatyczne hasłowanie tekstu polskiego. Polonica tom XVIII. IJP PAN: Kraków 1997, s [21] Jan Tokarski. Słownictwo (teoria wyrazu). Panstwowe Zakłady Wydawnictw Szkolnych, Warszawa [22] Jan Tokarski. Dialog: człowiek maszyna cyfrowa, poszukiwanie wspólnego języka. Prace Filologiczne, XXIII: ,
13 [23] Tokarski, J Schematyczny indeks a tergo polskich form wyrazowych. Opracowanie i redakcja Zygmunt Saloni. Wydawnictwo Naukowe PWN, Warszawa [24] The Unicode Standard, Version 2.0, The Unicode Consortium, Addison-Wesley, ISBN Por. także
Spis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa
Spis treści -1 LXIII Zjazd PTJ, Warszawa 16-17.09.2003 Pomor, Humor Morfeusz SIAT Poliqarp Holmes Kryteria wyboru Robert Wołosz Marcin Woliński Adam Przepiórkowski Michał Rudolf Niebieska gramatyka Saloni,
Kodowanie informacji. Przygotował: Ryszard Kijanka
Kodowanie informacji Przygotował: Ryszard Kijanka Komputer jest urządzeniem służącym do przetwarzania informacji. Informacją są liczby, ale także inne obiekty, takie jak litery, wartości logiczne, obrazy
Wprowadzenie do informatyki i użytkowania komputerów. Kodowanie informacji System komputerowy
1 Wprowadzenie do informatyki i użytkowania komputerów Kodowanie informacji System komputerowy Kodowanie informacji 2 Co to jest? bit, bajt, kod ASCII. Jak działa system komputerowy? Co to jest? pamięć
BachoTEX Janusz S. Bień. UNICODE 4.0 Podstawowe pojęcia i terminy slajdy/jsb-gust04-s.
Spis treści -1 BachoTEX 2004 Kodowanie tekstów w komputerze Kodowanie tekstów w komputerze Unicode 4.0 Unicode Consortium (www.unicode.org) Terminologia Unicode Unicode 4.0 Alfabety i symbole Alfabety
Języki programowania zasady ich tworzenia
Strona 1 z 18 Języki programowania zasady ich tworzenia Definicja 5 Językami formalnymi nazywamy każdy system, w którym stosując dobrze określone reguły należące do ustalonego zbioru, możemy uzyskać wszystkie
Techniki multimedialne
Techniki multimedialne Digitalizacja podstawą rozwoju systemów multimedialnych. Digitalizacja czyli obróbka cyfrowa oznacza przetwarzanie wszystkich typów informacji - słów, dźwięków, ilustracji, wideo
Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu.
Andrzej Wiśniewski Logika I Materiały do wykładu dla studentów kognitywistyki Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu. 1 Logika Klasyczna obejmuje dwie teorie:
12. Wprowadzenie Sygnały techniki cyfrowej Systemy liczbowe. Matematyka: Elektronika:
PRZYPOMNIJ SOBIE! Matematyka: Dodawanie i odejmowanie "pod kreską". Elektronika: Sygnały cyfrowe. Zasadę pracy tranzystorów bipolarnych i unipolarnych. 12. Wprowadzenie 12.1. Sygnały techniki cyfrowej
Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego
Arytmetyka cyfrowa Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego (binarnego). Zapis binarny - to system liczenia
Filozofia z elementami logiki Język jako system znaków słownych część 2
Filozofia z elementami logiki Język jako system znaków słownych część 2 Mariusz Urbański Instytut Psychologii UAM Mariusz.Urbanski@.edu.pl Rozkład jazdy 1 Pojęcie znaku 2 Funkcje wypowiedzi językowych
Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997
1 Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997 SPIS TREŚCI WSTĘP... 1 WYKŁAD 1: WPROWADZENIE DO JĘZYKOZNAWSTWA
SYLLABUS. Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny SYLLABUS Instytut Filologii Polskiej i Lingwistyki Stosowanej Zakład Językoznawstwa Kierunek Podyplomowe Studium Filologii Polskiej
Komputer i urządzenia cyfrowe
Temat 1. Komputer i urządzenia cyfrowe Cele edukacyjne Celem tematu 1. jest uporządkowanie i rozszerzenie wiedzy uczniów na temat budowy i działania komputera, przedstawienie różnych rodzajów komputerów
Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki.
Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki. Zespół bibliotek cyfrowych PCSS 6 maja 2011 1 Cel aplikacji Aplikacja wspomaga przygotowanie poprawnego materiału uczącego dla
OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU Nazwa
Gramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P7 KWIECIEŃ 2019 Zadanie 1. (0 1) PF Zadanie 2. (0 1) II. Analiza i interpretacja
Wprowadzenie do logiki Język jako system znaków słownych
Wprowadzenie do logiki Język jako system znaków słownych Mariusz Urbański Instytut Psychologii UAM Mariusz.Urbanski@.edu.pl język system znaków słownych skoro system, to musi być w tym jakiś porządek;
Programowanie komputerów
Programowanie komputerów Wykład 1-2. Podstawowe pojęcia Plan wykładu Omówienie programu wykładów, laboratoriów oraz egzaminu Etapy rozwiązywania problemów dr Helena Dudycz Katedra Technologii Informacyjnych
Logika dla socjologów Część 2: Przedmiot logiki
Logika dla socjologów Część 2: Przedmiot logiki Rafał Gruszczyński Katedra Logiki Uniwersytet Mikołaja Kopernika 2011/2012 Spis treści 1 Działy logiki 2 Własności semantyczne i syntaktyczne 3 Błędy logiczne
Pracownia Komputerowa wyk ad VII
Pracownia Komputerowa wyk ad VII dr Magdalena Posiada a-zezula Magdalena.Posiadala@fuw.edu.pl http://www.fuw.edu.pl/~mposiada Magdalena.Posiadala@fuw.edu.pl 1 Notacja szesnastkowa - przypomnienie Szesnastkowy
OPIS MODUŁU (PRZEDMIOTU)
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS MODUŁU (PRZEDMIOTU)
Systemy liczenia. 333= 3*100+3*10+3*1
Systemy liczenia. System dziesiętny jest systemem pozycyjnym, co oznacza, Ŝe wartość liczby zaleŝy od pozycji na której się ona znajduje np. w liczbie 333 kaŝda cyfra oznacza inną wartość bowiem: 333=
Podstawy Programowania Obiektowego
Podstawy Programowania Obiektowego Wprowadzenie do programowania obiektowego. Pojęcie struktury i klasy. Spotkanie 03 Dr inż. Dariusz JĘDRZEJCZYK Tematyka wykładu Idea programowania obiektowego Definicja
Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Opracował Jan T. Biernat
Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Program, to lista poleceń zapisana w jednym języku programowania zgodnie z obowiązującymi w nim zasadami. Celem programu jest przetwarzanie
Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz
Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i Debiuty Naukowe III Leksykon tekst wyraz WARSZAWA 2009-1 - Seria Debiuty Naukowe Redaktor tomu
OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) / k, 1, II. prof. dr hab. Andrzej S. Dyszak
Nazwa przedmiotu Kod przedmiotu OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) 09.03.20/ k, 1, II Humanistyczny Instytut/Katedra Instytut Filologii Polskiej i Kulturoznawstwa Specjalność/specjalizacja
Arytmetyka komputera
Arytmetyka komputera Systemy zapisu liczb System dziesiętny Podstawą układu dziesiętnego jest liczba 10, a wszystkie liczby można zapisywać dziesięcioma cyframi: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Jednostka
Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD
Projektowanie systemów informatycznych Roman Simiński roman.siminski@us.edu.pl siminskionline.pl Modelowanie danych Diagramy ERD Modelowanie danych dlaczego? Od biznesowego gadania do magazynu na biznesowe
Gramatyka. języka rosyjskiego z ćwiczeniami
Gramatyka języka rosyjskiego z ćwiczeniami Autor Dorota Dziewanowska Projekt graficzny okładki i strony tytułowej Krzysztof Kiełbasiński Ilustracje Maja Chmura (majachmura@wp.pl) Krzysztof Kiełbasiński
WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO DLA UCZNIÓW KLASY VI ZGODNE Z PROGRAMEM NAUCZANIA JĘZYKA POLSKIEGO SŁOWA NA START W KLASIE VI
WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO DLA UCZNIÓW KLASY VI ZGODNE Z PROGRAMEM NAUCZANIA JĘZYKA POLSKIEGO SŁOWA NA START W KLASIE VI Uczniowie z obniżoną sprawnością intelektualną OCENA NIEDOSTATECZNA
Programowanie w języku Python. Grażyna Koba
Programowanie w języku Python Grażyna Koba Kilka definicji Program komputerowy to ciąg instrukcji języka programowania, realizujący dany algorytm. Język programowania to zbiór określonych instrukcji i
Analiza wyników egzaminu gimnazjalnego 2014 r. Test humanistyczny język polski
Analiza wyników egzaminu gimnazjalnego 2014 r. Test humanistyczny język polski Zestaw standardowy zawierał 22 zadania, w tym 20 zadań zamkniętych i 2 zadania otwarte. Wśród zadań zamkniętych dominowały
2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK
OPIS MODUŁU KSZTAŁCENIA (SYLABUS) I. Informacje ogólne 1. Nazwa modułu kształcenia: JĘZYKOZNAWSTWO OGÓLNE 2. Kod modułu kształcenia: 08-KODM-JOG 3. Rodzaj modułu kształcenia: OBLIGATORYJNY 4. Kierunek
Ewa Krassowska-Mackiewicz Język japoński. dla początkujących Wydanie drugie zmienione i rozszerzone
Ewa Krassowska-Mackiewicz Język japoński dla początkujących Wydanie drugie zmienione i rozszerzone Ewa Krassowska-Mackiewicz - filolog, japonistka. Od 1997 roku związana z PJWSTK. Zajmuje się metodologią
SYLLABUS. Leksykologia i leksykografia
SYLLABUS Lp. Element Opis 1 2 Nazwa Typ Leksykologia i leksykografia Obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki 4 5 Kod Kierunek, specjalność, poziom i profil PPWSZ-FP-1-45-s
Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych
rk Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych pojęć, prawdopodobnie zastanawiasz się, kiedy zaczniesz
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 23 października 2016 Metodologia i metoda naukowa 1 Metodologia Metodologia nauka o metodach nauki
Wstęp do logiki. Semiotyka cd.
Wstęp do logiki Semiotyka cd. Semiotyka: język Ujęcia języka proponowane przez językoznawców i logików różnią się istotnie w wielu punktach. Z punktu widzenia logiki każdy język można scharakteryzować
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P8 KWIECIEŃ 2016 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY
PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY NR 134 Katarzyna Kwapisz Osadnik PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY Wydawnictwo Uniwersytetu
Programowanie. programowania. Klasa 3 Lekcja 9 PASCAL & C++
Programowanie Wstęp p do programowania Klasa 3 Lekcja 9 PASCAL & C++ Język programowania Do przedstawiania algorytmów w postaci programów służą języki programowania. Tylko algorytm zapisany w postaci programu
Po uruchomieniu programu nasza litera zostanie wyświetlona na ekranie
Część X C++ Typ znakowy służy do reprezentacji pojedynczych znaków ASCII, czyli liter, cyfr, znaków przestankowych i innych specjalnych znaków widocznych na naszej klawiaturze (oraz wielu innych, których
Komunikacja człowiek-komputer
Komunikacja człowiek-komputer Wykład 3 Dr inż. Michał Kruk Komunikacja człowiek - komputer dr inż. Michał Kruk Reprezentacja znaków Aby zakodować tekst, trzeba każdej możliwej kombinacji bitów przyporządkować
WYMAGANIA EDUKACYJNE
SZKOŁA PODSTAWOWA W RYCZOWIE WYMAGANIA EDUKACYJNE niezbędne do uzyskania poszczególnych śródrocznych i rocznych ocen klasyfikacyjnych z JĘZYKA ANGIELSKIEGO w klasie 3 Szkoły Podstawowej str. 1 Wymagania
Typy, klasy typów, składnie w funkcji
Typy, klasy typów, składnie w funkcji Typy w Haskell Każde wyrażenie w Haskell posiada zdefiniowany typ. Dzięki temu już na etapie kompilacji kodu następuje sprawdzenie poprawności kodu i zabezpiecza nas
INFORMATYKA KLASA IV
1 INFORMATYKA KLASA IV WYMAGANIA NA POSZCZEGÓLNE OCENY SZKOLNE 1. Komputer i programy komputerowe Posługiwanie się komputerem i praca z programem komputerowym wymienia przynajmniej trzy podstawowe zasady
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 14.02.2017r. odbył się próbny egzamin gimnazjalny z języka polskiego. Do
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019 CZĘŚĆ 1. JĘZYK POLSKI ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ GH-P2 KWIECIEŃ 2019 Zadanie 1. (0 1) 2) wyszukuje w wypowiedzi potrzebne informacje
Wymagania edukacyjne na poszczególne stopnie szkolne z języka angielskiego w klasie VII
Wymagania edukacyjne na poszczególne stopnie szkolne z języka angielskiego w klasie VII Rozdział 1 Ocenę dopuszczającą otrzymuje uczeń, który: Przy pomocy kolegów lub nauczyciela łączy nazwy czynności
Teraz bajty. Informatyka dla szkoły podstawowej. Klasa IV
Teraz bajty. Informatyka dla szkoły podstawowej. Klasa IV 1 Posługiwanie się komputerem i praca z programem komputerowym wymienia przynajmniej trzy podstawowe zasady ich, m.in.: dba o porządek na stanowisku
Teraz bajty. Informatyka dla szkoły podstawowej. Klasa 4 Wymagania edukacyjne na poszczególne oceny szkolne dla klasy 4
1 Teraz bajty. Informatyka dla szkoły podstawowej. Klasa 4 Wymagania edukacyjne na poszczególne oceny szkolne dla klasy 4 1. Komputer i programy komputerowe Posługiwanie się komputerem i praca z programem
OPIS MODUŁU (PRZEDMIOTU) filologia polska. prof. dr hab. Andrzej S. Dyszak
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS MODUŁU (PRZEDMIOTU)
SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE Temat: Prosty serwis internetowy oparty o zestaw powiązanych
Przedmiotowy System Oceniania z zajęć komputerowych w klasach IV - VI
Przedmiotowy System Oceniania z zajęć komputerowych w klasach IV - VI Obszary aktywności ucznia w zakresie wiedzy, umiejętności i postaw, będące przedmiotem oceny Z uwagi na charakter przedmiotu jedną
Nakład pracy studenta bilans punktów ECTS Obciążenie studenta
Lp. Element Opis 1 Nazwa Wstęp do językoznawstwa 2 Typ obowiązkowy 3 Instytut Instytut Nauk Humanistyczno-Społecznych i Turystyki Kod 4 PPWSZ-FA-1-15t-s/n Kierunek, kierunek: filologia 5 specjalność, specjalność:
INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE
Studia podyplomowe dla nauczycieli INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE Przedmiot JĘZYKI PROGRAMOWANIA DEFINICJE I PODSTAWOWE POJĘCIA Autor mgr Sławomir Ciernicki 1/7 Aby
Pascal typy danych. Typy pascalowe. Zmienna i typ. Podział typów danych:
Zmienna i typ Pascal typy danych Zmienna to obiekt, który może przybierać różne wartości. Typ zmiennej to zakres wartości, które może przybierać zmienna. Deklarujemy je w nagłówku poprzedzając słowem kluczowym
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 14 grudnia 2014 Metodologia i metoda badawcza Metodologia Zadania metodologii Metodologia nauka
ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI
ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI W dniu 18.04.2016r. odbył się egzamin gimnazjalny z języka polskiego. Do badania diagnostycznego
Cele kształcenia wymagania ogólne
Cele kształcenia wymagania ogólne konieczne ocena: dopuszczająca podstawowe ocena: dostateczna rozszerzone ocena: dobra dopełniające ocena: bardzo dobra ponadprogramowe ocena: celująca I Kształcenie literackie
WYMAGANIA EDUKACYJNE Z ZAJĘĆ KOMPUTEROWYCH KLASA 4:
WYMAGANIA EDUKACYJNE Z ZAJĘĆ KOMPUTEROWYCH KLASA 4: zna regulamin pracowni komputerowej; bezpiecznie obchodzi się z komputerem; zna urządzenia wchodzące w skład zestawu komputerowego; poprawnie obsługuje
GH - Charakterystyka arkuszy egzaminacyjnych.
GH - Charakterystyka arkuszy egzaminacyjnych. A. Arkusz standardowy GH-A, B, C oraz arkusze przystosowane: GH-A4, GH-A5, GH-A6. Zestaw zadań z zakresu przedmiotów humanistycznych, skonstruowany wokół tematu
INFORMATYKA. Zajęcia organizacyjne. Arytmetyka komputerowa.
INFORMATYKA Zajęcia organizacyjne Arytmetyka komputerowa http://www.infoceram.agh.edu.pl http://home.agh.edu.pl/~grzesik/ KONSULTACJE Zbigniew Grzesik środa, 9 ; A-3, p. 2 tel.: 67-249 e-mail: grzesik@agh.edu.pl
Raport z analizy badania diagnozującego uczniów klas czwartych
Zgodnie z Uchwałą Rady Pedagogicznej z dnia 17 czerwca 21 roku objęto badaniem diagnozującym stopień opanowania umiejętności polonistycznych, matematycznych i języka obcego uczniów rozpoczynających naukę
Systemy liczbowe. 1. Przedstawić w postaci sumy wag poszczególnych cyfr liczbę rzeczywistą R = (10).
Wprowadzenie do inżynierii przetwarzania informacji. Ćwiczenie 1. Systemy liczbowe Cel dydaktyczny: Poznanie zasad reprezentacji liczb w systemach pozycyjnych o różnych podstawach. Kodowanie liczb dziesiętnych
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium
Technologie i systemy oparte na logice rozmytej
Zagadnienia I Technologie i systemy oparte na logice rozmytej Mają zastosowania w sytuacjach kiedy nie posiadamy wystarczającej wiedzy o modelu matematycznym rządzącym danym zjawiskiem oraz tam gdzie zbudowanie
Zasady Nazewnictwa. Dokumentów XML 2007-11-08. Strona 1 z 9
Zasady Nazewnictwa Dokumentów 2007-11-08 Strona 1 z 9 Spis treści I. Wstęp... 3 II. Znaczenie spójnych zasady nazewnictwa... 3 III. Zasady nazewnictwa wybrane zagadnienia... 3 1. Język oraz forma nazewnictwa...
ARYTMETYKA BINARNA. Dziesiątkowy system pozycyjny nie jest jedynym sposobem kodowania liczb z jakim mamy na co dzień do czynienia.
ARYTMETYKA BINARNA ROZWINIĘCIE DWÓJKOWE Jednym z najlepiej znanych sposobów kodowania informacji zawartej w liczbach jest kodowanie w dziesiątkowym systemie pozycyjnym, w którym dla przedstawienia liczb
Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty. Literatura
Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty Dr inŝ. Janusz Majewski Katedra Informatyki Literatura Aho A. V., Sethi R., Ullman J. D.: Compilers. Principles, Techniques
Krój czcionki można wybrać na wstążce w zakładce Narzędzia główne w grupie przycisków Cz cionka.
Podstawowe sposoby formatowania Procesory tekstu umożliwiają nie tylko wpisywanie i wykonywanie modyfikacji (edycję tekstu), ale również formatowanie, czyli określenie wyglądu tekstu Podstawowe możliwości
Lokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Modelowanie diagramów klas w języku UML. Łukasz Gorzel 244631@stud.umk.pl 7 marca 2014
Modelowanie diagramów klas w języku UML Łukasz Gorzel 244631@stud.umk.pl 7 marca 2014 Czym jest UML - Unified Modeling Language - Rodzina języków modelowania graficznego - Powstanie na przełomie lat 80
Temat 1. Więcej o opracowywaniu tekstu
Temat 1. Więcej o opracowywaniu tekstu Cele edukacyjne Celem tematu 1. jest uporządkowanie i rozszerzenie wiedzy uczniów na temat opracowywania dokumentów tekstowych (m.in. stosowania tabulatorów, spacji
EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018
EGZMIN W KLSIE TRZECIEJ GIMNZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 1. JĘZYK POLSKI ZSDY OCENINI ROZWIĄZŃ ZDŃ RKUSZ GH-P8 KWIECIEŃ 2018 Zadanie 1. (0 1) Zadanie 2. (0 1) C Zadanie 3. (0 1) 3. Świadomość językowa.
Architektura systemów komputerowych Laboratorium 5 Kodowanie liczb i tekstów
Architektura systemów komputerowych Laboratorium 5 Kodowanie liczb i tekstów Marcin Stępniak Informacje. Kod NKB Naturalny kod binarny (NKB) jest oparty na zapisie liczby naturalnej w dwójkowym systemie
Zad. 3: Układ równań liniowych
1 Cel ćwiczenia Zad. 3: Układ równań liniowych Wykształcenie umiejętności modelowania kluczowych dla danego problemu pojęć. Definiowanie właściwego interfejsu klasy. Zwrócenie uwagi na dobór odpowiednich
M T E O T D O ZI Z E E A LG L O G R O Y R TM
O ALGORYTMACH I METODZIE ALGORYTMICZNEJ Czym jest algorytm? Czym jest algorytm? przepis schemat zestaw reguł [ ] program ALGORYTM (objaśnienie ogólne) Algorytm Pojęcie o rodowodzie matematycznym, oznaczające
Kontrola i ocena pracy ucznia.
Kontrola i ocena pracy ucznia. Formy kontroli 1. Kontrola bieżąca (w formie oceny udziału w lekcji, odpowiedzi ustnych, niezapowiedzianych kartkówek i innych form testów osiągnięć szkolnych) to sprawdzanie
Modelowanie i Programowanie Obiektowe
Modelowanie i Programowanie Obiektowe Wykład I: Wstęp 20 październik 2012 Programowanie obiektowe Metodyka wytwarzania oprogramowania Metodyka Metodyka ustandaryzowane dla wybranego obszaru podejście do
O REDUKCJI U-INFORMACJI
O REDUKCJI U-INFORMACJI DO DANYCH Cztery punkty odniesienia (dla pojęcia informacji) ŚWIAT ontologia fizyka UMYSŁ psychologia epistemologia JĘZYK lingwistyka nauki o komunikacji KOMPUTER informatyka elektronika
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Zapisywanie algorytmów w języku programowania
Temat C5 Zapisywanie algorytmów w języku programowania Cele edukacyjne Zrozumienie, na czym polega programowanie. Poznanie sposobu zapisu algorytmu w postaci programu komputerowego. Zrozumienie, na czym
Instrukcja do ćwiczeń nr 4 typy i rodzaje zmiennych w języku C dla AVR, oraz ich deklarowanie, oraz podstawowe operatory
Instrukcja do ćwiczeń nr 4 typy i rodzaje zmiennych w języku C dla AVR, oraz ich deklarowanie, oraz podstawowe operatory Poniżej pozwoliłem sobie za cytować za wikipedią definicję zmiennej w informatyce.
Towarzystwo Kultury Języka, Warszawa Janusz S. Bień. O informatyce i przyszłości polszczyzny
Spis treści -1 Towarzystwo Kultury Języka, Warszawa 19.01.2004 Towarzystwo Kultury Języka, Warszawa 19.01.2004 Rada Języka Polskiego Polszczyzna sterowana komputerowo Czyj postulat? Za dzień? Za tydzień?
1. Liczby naturalne, podzielność, silnie, reszty z dzielenia
1. Liczby naturalne, podzielność, silnie, reszty z dzielenia kwadratów i sześcianów przez małe liczby, cechy podzielności przez 2, 4, 8, 5, 25, 125, 3, 9. 26 września 2009 r. Uwaga: Przyjmujemy, że 0 nie
Praca licencjacka. Seminarium dyplomowe Zarządzanie przedsiębiorstwem dr Kalina Grzesiuk
Praca licencjacka Seminarium dyplomowe Zarządzanie przedsiębiorstwem dr Kalina Grzesiuk 1.Wymagania formalne 1. struktura pracy zawiera: stronę tytułową, spis treści, Wstęp, rozdziały merytoryczne (teoretyczne
Wymagania na poszczególne oceny z języka hiszpańskiego dla klasy siódmej. Podręcznik GENTE JOVEN 1
Wymagania na poszczególne oceny z języka hiszpańskiego dla klasy siódmej. Podręcznik GENTE JOVEN 1 1 Rozdział w podręczniku Ocena dopuszczająca Ocena dostateczna Ocena dobra Ocena bardzo dobra Uczeń, z
Podstawy programowania. Wykład Funkcje. Krzysztof Banaś Podstawy programowania 1
Podstawy programowania. Wykład Funkcje Krzysztof Banaś Podstawy programowania 1 Programowanie proceduralne Pojęcie procedury (funkcji) programowanie proceduralne realizacja określonego zadania specyfikacja
prawda symbol WIEDZA DANE komunikat fałsz liczba INFORMACJA kod (pojęcie interdyscyplinarne) znak wiadomość ENTROPIA forma przekaz
WIEDZA prawda komunikat symbol DANE fałsz kod INFORMACJA (pojęcie interdyscyplinarne) liczba znak forma ENTROPIA przekaz wiadomość Czy żyjemy w erze informacji? Czy żyjemy w erze informacji? RACZEJ TAK:
CZYTANIE CICHE ZE ZROZUMIENIEM
Edukacja polonistyczna klasa 2 PISANIE - kryteria pięknego pisania 1. Pismo utrzymuję w liniaturze. 2. Litery w wyrazach są z sobą połączone. 3. Unikam skreśleń i poprawek. 4. Wyraz błędnie napisany przekreślam
01. Rodzaj publikacji artykuł, recenzja, sprawozdanie, wywiad 01.1 Język publikacji Nazwa języka, np. polski 02. Autor/autorzy publikacji
Dokumentował/a: imię i nazwisko studenta Źródło cytujące: 01. Rodzaj publikacji artykuł, recenzja, sprawozdanie, wywiad 01.1 Język publikacji Nazwa języka, np. polski 02. Autor/autorzy publikacji Nazwisko/imiona/(rodzaj
KRYTERIA OCENIANIA KLASA I KLASA II KLASA III
KRYTERIA OCENIANIA II ETAP EDUKACYJNY - JĘZYK ANGIELSKI KLASA I KLASA II KLASA III DOPUSZCZAJĄCY: rozumie proste polecenia nauczyciela, poparte gestem; rozumie proste zwroty grzecznościowe i proste pytania;
W obrębie polskiego języka narodowego należy wydzielić dwa systemy:
Wykład nr 2 W obrębie polskiego języka narodowego należy wydzielić dwa systemy: a) polszczyznę ogólną (zwaną literacką); b)polszczyznę gwarową (gwary ludowe). Jest to podział dokonany ze względu na zasięg
NaCoBeZu na co będę zwracać uwagę. Nauka o języku
NaCoBeZu na co będę zwracać uwagę Komunikacja językowa: Nauka o języku znam pojęcia z zakresu komunikacji językowej: schemat komunikacyjny; nadawca; odbiorca; komunikat; kod; kontekst ; znaki niewerbalne