1 1. WPROWADZENIE DO JĘZYKOZNAWSTWA STRUKTURALNEGO 1. Językoznawstwo jako nauka empiryczna Gramatyka opisowa języka polskiego jest działem nauki zwanej językoznawstwem. Ze względu na przedmiot badania językoznawstwo sytuuje się wśród nauk humanistycznych (w odróżnieniu od biologii, fizyki czy astronomii dyscyplin przyrodniczych); ze względu na metodę badawczą jest ono nauką empiryczną (w odróżnieniu od matematyki nauki dedukcyjnej). Przywykło się uważać językoznawstwo za dział semiotyki, czyli nauki o znakach. Jest rzeczą istotną, że szczegółowe techniki poznawcze, jakimi posługuje się językoznawstwo: obserwacja, eksperyment, a nawet pomiar, zbliżają je do eksperymentalnych nauk przyrodniczych. Przedmiotem opisu jest dla empirysty jakiś fragment czy wycinek rzeczywistości obiektywnej. Wycinek ten poddaje on analizie, buduje jego teorię albo model, ujawnia mechanizmy funkcjonowania zjawisk. Językoznawca zajmuje się fragmentem rzeczywistości, któremu na imię język naturalny. 2. Język naturalny definicja Powiemy, że zna dany język (polski, niemiecki, chiński itp.), o kimś, kto potrafi się porozumieć w tym języku; kto rozumie wyrażenia tego języka (znajomość bierna) lub umie takie wyrażenia wytwarzać (znajomość czynna). Formułując rzecz inaczej: zna dany język ten, kto zna słówka i gramatykę. Język naturalny jest wyrafinowanym urządzeniem komunikacji ludzkiej, niezwykłą umiejętnością, która dana jest, być może, wyłącznie gatunkowi homo sapiens. Język jako narzędzie, jako mechanizm interakcji międzyludzkich, wreszcie jako proces mózgowy stanowi przedmiot zainteresowania psychologa. Językoznawca-strukturalista patrzy na język jako na system znaków. Oto definicja strukturalna: Język naturalny jest to dwuklasowy system znaków wykorzystywany przez daną grupę społeczną do porozumiewania się o wszystkim.
2 3. Pojęcie znaku Znak to taki element rzeczywistości, który jest istotny nie ze względu na swoje cechy zewnętrzne, ale ze względu na inny element rzeczywistości, do którego się odnosi (Milewski (1965: 15-26)). Znak ma dwie strony: formę i treść; jest, jak mówią semiolodzy, przezroczysty, postrzegając bowiem jego formę, odbiorca nie widzi jej: widzi, niejako poprzez nią, treść. Pewna forma żółty trójkąt równoramienny z czerwonym obrysem i sylwetką parowozu przekazuje następującą treść: Przejazd kolejowy niestrzeżony. Widząc ów kształt, kierowca odbiera kryjącą się za tym kształtem informację. Znakiem jest również okrzyk pacjenta na fotelu stomatologa: słysząc ten dźwięk, lekarz dowiaduje się, że otworzył właśnie kanał. Pewne znaki są wytwarzane celowo, z intencją przekazania informacji. Nazywamy je znakami konwencjonalnymi, ponieważ związek pomiędzy formą a treścią jest umowny. Znakiem konwencjonalnym jest znak drogowy z poprzedniego akapitu. Istnieją również znaki bez nadawcy, nie produkowane celowo: znaki naturalne (symptomy, objawy, oznaki). Związek między formą a treścią jest naturalny, odbiorca interpretuje je na podstawie wiedzy o świecie. Niech za przykład posłuży jęk bólu pacjenta. Nietrudno dostrzec naturę znakową języka naturalnego. Przeciwstawiając komunikację językową jakiejś innej (na przykład porozumiewaniu się poprzez gesty, mimikę, flagi kodu żeglarskiego), mówimy o porozumiewaniu się słowami. Słowo zatem jest znakiem językowym; w każdym razie jednym z typów znaków językowych. Nie ma naturalnego związku między napisem dom a przedmiotem tak nazywanym. Powiemy więc, że znaki językowe są konwencjonalne. 4. System znaków Znaki naturalne istnieją, by tak rzec, w pojedynkę. Znaki konwencjonalne z natury rzeczy funkcjonują w zbiorach. Intuicyjnie rzecz ujmując, zbiór taki wyznaczony jest przez wycinek rzeczywistości, który elementy tego zbioru obsługują. Zbiór taki nazywamy systemem. Znak przejazdu niestrzeżonego należy do tego samego systemu, co powiedzmy znak <Droga jednokierunkowa> albo <Zakaz wjazdu wszelkich pojazdów>; do systemu tego nie należy znak dom. Dwa znaki należą do tego samego systemu, jeśli zachodzi między nimi opozycja. Opozycja to taka różnica formy, z którą skorelowana jest ściśle określona różnica treści lub funkcji. Praktycznie wymagamy od opozycji, aby była seryjna, aby powtarzała się w całej serii par znaków. Znak <Przejazd niestrzeżony> różni się od znaku <Zakaz wjazdu wszelkich pojazdów> tym samym, czym znak <Zakręt w lewo> od znaku <Zakaz zatrzymywania>: kształt trójkąta i żółte tło z czerwonym obrysem wyraża treść Ostrzeżenie, kształt koła zaś i czerwony obrys treść Zakaz. Znak <Przejazd niestrzeżony> różni się od znaku <Droga jednokierunkowa> tym samym, czym znak <Zakręt w lewo> od znaku <Ślepa ulica>: tej znów różnicy formy (trójkąt : kwadrat) odpowiada różnica treści Ostrzeżenie Informacja. Zapisujemy opozycje na przykład tak: <Przejazd niestrzeżony> : <Zakaz wjazdu wszelkich pojazdów> <Przejazd niestrzeżony> : <Droga jednokierunkowa>
3 albo ogólniej: Ostrzeżenie : Zakaz Ostrzeżenie : Informacja Pokażmy analogiczne przykłady opozycji językowych: dom : domy, kot : koty, mysz : myszy,... kot : kota, murarz : murarza, monter : montera,... W pierwszej serii mamy opozycję Liczba pojedyncza : Liczba mnoga, w drugiej opozycję Mianownik : Dopełniacz. Czytelnik bez trudu podane niżej serie znaków językowych przedłuży i zinterpretuje ogólnie, to znaczy ustali odpowiednie różnice funkcji: nowego : nowemu, tego : temu, zdolnego : zdolnemu,... buduje : budował, hoduje : hodował, pracuje : pracował,... CZYTAĆ : CZYTANIE, GRAĆ : GRANIE, MYŚLEĆ : MYŚLENIE,... 5. Dwuklasowość: słownik i gramatyka Znaki językowe wymienione w powyższym punkcie stanowią tworzywo, z którego zbudowane są konstrukcje znakowe. Konstrukcje takie, jak: Murarz hoduje kota. wesołego murarza Pracował monter. są również znakami. Konstrukcje znakowe nazwiemy znakami złożonymi, znaki nie dające się podzielić na znaki niższego rzędu są znakami prostymi. Zbiór znaków prostych to słownik. Przynajmniej niektóre słowa są znakami prostymi, choć te z powyższych przykładów to konstrukcje. O systemie znaków, który obejmuje znaki proste i znaki złożone, powiemy, że jest dwuklasowy. System znaków drogowych warunku tego nie spełnia: jest systemem jednoklasowym. Nie wszystkie kombinacje znaków prostych dają poprawny znak złożony. Oto przykłady połączeń niepoprawnych (wyrażenia niepoprawne językoznawcy sygnują gwiazdką *): *Murarz hoduje kot. *wesołego murarz *Pracował domy. Definicja wszystkich poprawnych połączeń znaków to gramatyka. System dwuklasowy więc ma dwa składniki: słownik i gramatykę. Wyrażenie niepoprawne gramatycznie nie musi być nonsensowne lub bezsensowne, tak jak poprawne nie musi być sensowne. Pierwszy przykład z trzech powyższych reprezentuje niepoprawne gramatycznie wyrażenie sensowne. Wyrażenie poniższe: Mysz buduje kota. jest bezsensowne, choć gramatycznie poprawne. Znamy system znakowy o następującym słowniku: Słownik = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Wyrażenia zbudowane z tych elementów, takie jak 1, 17, 909, 1889, 39976145 itp., odpowiadają liczbom całkowitym nieujemnym. Gramatyka definiująca zbiór
4 poprawnych połączeń elementów powyższego słownika pozwala na dodawanie do danej cyfry dowolnej cyfry, chyba że pierwszy element budowanego wyrażenia to cyfra 0: wówczas rozbudowa nie jest możliwa. Wyrażenia *01, *027, *00007 itp. są niepoprawne, chociaż sensowne. 6. Uniwersalność języka Wymienione wyżej systemy znakowe mają różny zakres użycia. Zarówno system znaków drogowych, jak bogatszy odeń dwuklasowy system zapisu liczb naturalnych w układzie dziesiętnym różnią się od języków ludzkich tym, że są komunikacyjnie lokalne, że nadają się do obsługi jedynie pewnych wycinków czy aspektów rzeczywistości. W przeciwieństwie do nich język naturalny to narzędzie komunikacji uniwersalnej. Dany język, pojmowany jako zasób środków komunikacyjnych, wykorzystywany jest do przekazu informacji przez określoną grupę społeczną, zwykle choć niekoniecznie etniczną (plemię, naród, grupa narodów; środowisko; mniejszość językowa w diasporze itp.). 7. Opis języka naturalnego Empirysta buduje opis wycinka rzeczywistości, który go interesuje, po to, aby zachodzące w owym wycinku zjawiska wyjaśnić. Teoria w nauce empirycznej ma często postać modelu, a więc mniej lub bardziej abstrakcyjnego urządzenia, które funkcjonalnie przypomina modelowany obiekt (por. Apresjan (1971: 105-349)). Model danego języka naturalnego to urządzenie, które naśladuje rzeczywistego użytkownika języka: umie dokonać analizy i syntezy wszystkich wyrażeń danego. Opis polszczyzny traktujący ten język jako system znaków w rozumieniu podanym wyżej jest modelem polszczyzny w tym sensie, że stanowi on zbiór wszystkich informacji niezbędnych i wystarczających do rozpoznania lub wytworzenia wszystkich wyrażeń języka polskiego. Opis taki nazywamy również gramatyką. Pamiętajmy o tym i dalej, kiedy będzie mówili o morfologii czy składni: mówiąc tak, możemy mieć na myśli zarówno część systemu języka polskiego (pewien podzbiór reguł, pewien fragment rzeczywistej kompetencji językowej użytkownika), jak i część opisu polszczyzny. Opis lingwistyczny jest konwencjonalny i arbitralny. Istnieje nieograniczenie wiele równoważnych opisów danego języka. Opisywanie języka naturalnego jako systemu znaków nie jest odkrywaniem jakiejś mitycznej natury języka; jest technologią, a nie ideologią. Powstaje teraz następujący problem: z czego jest zrobiony tekst? Niech przedmiotem naszych rozważań będzie następujące wypowiedzenie polskie: Nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą. A oto seria możliwych odpowiedzi: (a) (b) (c) (d) (e) z liter, głosek lub sylab, ze znaków prostych (= morfemów), ze słów, z połączeń słów (= fraz), ze zdań,
5 (f) z wypowiedzeń. Odpowiedź (a) możemy odrzucić od razu, ani bowiem analiza, ani synteza wyrażenia nie jest rozkładaniem go na litery ani składaniem z liter chyba z punktu widzenia maszynistki, która jednak tekstu nie wytwarza, tylko go reprodukuje: N/a/s/i n/o/w/i f/l/e/c/i/ś/c/i, k/t/ó/r/y/c/h w/y/s/ł/a/n/o n/a u/r/l/o/p,... Spostrzeżenie to możemy prznieść na odmianę mówioną języka polskiego. Budulcem tekstu mówionego nie są głoski ani sylaby: n/a/ś/i/n/o/v /i/f/l/e/ć/i/ś/ć/i/k/t/u/r/y/γ/v/y/s/u^/a/n/o/n/a/u^/u/r/l/o/p,... na/śi/no/v i/fle/ći/śći/ktu/ryγ/vy/su^a/no/na/u^ur/lop,... Litery, głoski i sylaby to nie znaki, tylko diakryty, cegiełki, z których zbudowane są znaki proste. Wypowiedzenie skonstruowane jest ze znaków; dlatego odpowiedzi (b)-(f) są sensowne. Nie znaczy to jednak, że budowanie znaku złożonego jest liniowym składaniem ze znaków prostych. Segmentacja na słowa (por. (c)) o ile, oczywiście, rozważamy tekst pisany dana jest przez zapis. A oto segmentacja naszego wypowiedzenia na morfemy (por. (b)): nas/i now/i flec/iśc/i któr/ych wy/sła/no na urlop/ powiedzie/l/i/ sw/emu dyryg/ent/ow/i że nie wróc/ą gdzie znak oznacza morfem zerowy; na frazy (por. (d)): nasi nowi fleciści, których wysłano na urlop, / powiedzieli / swemu dyrygentowi /, że nie wrócą nasi nowi fleciści /, których wysłano na urlop nasi / nowi fleciści których / wysłano / na urlop i na zdania (por. (e)): nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą których wysłano na urlop że nie wrócą Szczegóły powyższych segmentacji wyjaśnimy dalej. Odpowiedzią (f) nie będziemy się tu zajmować. Uznamy po prostu wypowiedzenie za jednostkę najwyższego poziomu w opisie lingwistycznym. Z powyższego eksperymentu wynikają dwa ważne wnioski teoretyczne. Po pierwsze: tekst ma strukturę hierarchiczną, jest konstrukcją wielopoziomową. Poszczególne poziomy odpowiadają różnym poddziałom gramatyki, czyli różnym podzbiorom reguł: morfologii i składni. Po drugie: fonetyka nie należy do gramatyki (podobnie fonologia). 8. Model a rzeczywistość Jednostki językowe, które wyodrębniliśmy w trakcie analiz z poprzedniego punktu takie jak na przykład słowa nowi, wysłano, że, morfemy flec-, -ych, -ent-, frazy nowi fleciści, wysłano na urlop, na urlop itp., nie należą do systemu języka polskiego. System jest przecież obiektem abstrakcyjnym, jednostki te natomiast są konkretnymi napisami. W
6 modelu mamy znaki idealne, znaki-wzorce, inwarianty podobnie jak w kodeksie drogowym znajdujemy wzorce znaków drogowych. W tekście, podobnie jak przy szosie, występują realizacje znaków idealnych, czyli warianty. Pewne różnice formy między znakami nie są funkcjonalnie istotne. Jednostki tekstowe podane w każdej serii: (a) nowy nowego nowemu... nowi, funkcji funkcyj, dwom dwóm dwu; (b) -ent- -ca -ciel- -arz-; (c) których wysłano na urlop że nie wrócą są tożsame funkcjonalnie, reprezentują przy pewnych założeniach jedną jednostkę systemową: (a) formę wyrazową przymiotnika NOWY, formę dopełniacza liczby mnogiej rzeczownika FUNKCJA, formę celownika liczebnika DWA; (b) formę morfemu nazwy wykonawcy czynności; (c) zdanie podrzędne. Oczywiście przechodząc od jednostki tekstowej, konkretnej, do jednostki systemowej, abstrakcyjnej, lub z powrotem (pierwsze zachodzi w procesie odbierania tekstu, drugie podczas syntezy), przekracza się niejednokrotnie wiele poziomów abstrakcji. Zauważmy, że empirysty nie interesuje jednostka tekstowa okaz: konkretny napis czy konkretne wymówienie. Mówiąc o jednostce tekstowej nowi, ma on zwykle na myśli jednostkę tekstową typ (klasę abstrakcji): zbiór napisów czy wymówień równokształtnych być może, z interpretacją (w wypadku homonimii). 9. Poziomy opisu języka Pojęcie diakrytu pozwala wprowadzić ważne pojęcie subkodu. Subkod danego języka naturalnego to jego odmiana diakrytyczna. W wypadku polszczyzny rozróżnić warto następujące subkody: mówiony (diakryt: głoska), pisany (diakryt: litera), dotykowy, czyli braille owski (diakryt: znak sześciopunktowy),... e-mailowy (diakryt: litera z zestawu ASCII). Diakrytami języka naturalnego zajmuje się fonetyka i fonologia. Analogiem fonetyki i fonologii dla odmiany pisanej mogłaby być grafemika. Jednostką opisu fonetycznego jest głoska, fonologicznego wariant fonemu (allofon), grafemicznego wariant litery (allograf) (w sprawie terminów zob. m.in. Encyklopedia (1991)). Fonetyka, fonologia i grafemika nie należą do opisu gramatycznego, ich bowiem jednostki nie tworzą konstrukcji. Gramatyka zaczyna się dopiero na poziomie znaków, tam bowiem, gdzie mamy znaki, są i konstrukcje znaków (język naturalny jest systemem dwuklasowym). Znaki proste i niektóre klasy znaków złożonych są przedmiotem morfologii. Składnia opisuje
7 pozostałe znaki złożone. Pokażemy niżej jednostki opisu morfologicznego i opisu składniowego, a także konstrukcje znakowe morfologiczne i składniowe. Pamiętać trzeba przy tym, że na każdym poziomie mamy jednostki i konstrukcje tekstowe oraz jednostki i konstrukcje systemowe. Jednostką tekstową opisu morfologicznego jest wariant morfemu (allomorf), jednostką systemową morfem (por. Encyklopedia (1991)). Konstrukcje morfologiczne to: (a) temat (fleksyjny lub słowotwórczy), (b) forma wyrazowa. (a) Tematy: fleciśc- Konstrukcje morfologiczne wysładyrygent- (b) Formy wyrazowe: nasi fleciści których wysłano urlop Konstrukcje pierwszego typu są przedmiotem opisu słowotwórczego, konstrukcje drugiego typu opisu fleksyjnego. Analiza formy wyrazowej fleciści dokonuje się, mówiąc intuicyjnie, w dwóch krokach: (1) fleciśc- + -i, (2) flec- + -ist-. Ponieważ w procesie syntezy startujemy od gotowego kształtu fleciśc, umówimy się, że reguły definiujące strukturę konstrukcji słowotwórczych nie należą do gramatyki (por. Wykład 3). Jednostką opisu składniowego jest fraza lub zdanie składowe, konstrukcje składniowe zaś to frazy, zdania składowe, zdania i wypowiedzenia (por. Saloni Świdziński (1987: 13-43)). Oczywiście i tutaj zarówno analiza, jak i synteza dokonuje się w serii etapów. Zdaje sobie z tego sprawę szkolna dydaktyka składni, która operuje pojęciami grupy, zdania, zdania podrzędnego itp. (por. Klemensiewicz (1963)). Konstrukcje składniowe (a) Frazy: nowi fleciści nasi nowi fleciści nasi nowi fleciści, których wysłano na urlop (b) Zdania: nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą których wysłano na urlop że nie wrócą Ostatecznie więc gramatyka, pojmowana jako drugi składnik systemu językowego, obejmuje dwa zbiory reguł: fleksję i składnię. 10 Języki formalne Językami interesują się również matematycy. Utożsamiają oni język ze zbiorem wszystkich możliwych zdań; zbiór ten jest nieskończony, co można pokazać przez
indukcję (każde zdanie można przedłużyć). Przez gramatykę formalną rozumieją oni definicję tego języka, a więc wyliczenie wszystkich zdań; w praktyce chodzi o instrukcję budowy (lub rozbioru) tych i tylko tych zdań. Gramatyka formalna (przy pewnym rozumieniu) zawiera słownik elementów prostych, słownik symboli pomocniczych (jednym z nich jest tzw. symbol początkowy) i zbiór produkcji. Słownik zatem należy do gramatyki, a język formalny jest zadany przez gramatykę. Opis formalny języka naturalnego sprowadza się do zdefiniowania pewnego języka formalnego i dopasowania go do opisywanego języka naturalnego, pojmowanego jako zbiór zdań. Gramatyki formalne języka polskiego znaleźć można w pracach Stanisława Szpakowicza (Szpakowicz (1983)) i Marka Świdzińskiego (1992a). Możemy zapisać gramatykę formalną dla języka przestawionego w punkcie 5: Słownik: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Słownik symboli pomocniczych: {Cyfra, Cyfra 1, Liczba, Liczba 1 } Symbol początkowy: Liczba Produkcje: (1) Liczba Cyfra (2) Liczba Cyfra 1 Liczba 1 (3) Liczba 1 Cyfra (4) Liczba 1 Cyfra Liczba 1 (5) Cyfra 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (6) Cyfra 1 1, 2, 3, 4, 5, 6, 7, 8, 9 gdzie znaczy przepisz to, co po lewej, na to, co po prawej stronie reguły. Nietrudno utworzyć wszystkie zdania poprawne z punktu 5. Na przykład: Liczba symbol początkowy Cyfra 1 Liczba 1 produkcja (2) 9 Liczba 1 produkcja (6) 9 Cyfra Liczba 1 produkcja (4) 90 Liczba 1 produkcja (5) 90 Cyfra produkcja (3) 909 produkcja (5) Gramatyka nasza nie dopuszcza natomiast żadnego zdania niepoprawnego z podanych tamże, nie istnieją bowiem reguły takie, jak niżej: Liczba Cyfra Liczba Liczba Cyfra Liczba 1 8
9 ZAPAMIĘTAJ! Język naturalny dwuklasowy system znaków wykorzystywany przez daną grupę społeczną do porozumiewania się o wszystkim. Znak ma dwie strony: formę i treść (jest przezroczysty). System zbiór znaków z opozycją. Opozycja seryjna różnica formy skorelowana z różnicą funkcji (w tym: znaczenia). System dwuklasowy zbiór znaków obejmujący znaki proste i znaki złożone (konstrukcje znakowe). Sposoby łączenia znaków prostych w znaki złożone to gramatyka. System dwuklasowy zawiera słownik i gramatykę. Posługiwanie się językiem naturalnym: analiza (= rozumienie) tekstów i synteza (= wytwarzanie) tekstów. Jednostka tekstu wariant jednostki systemu. Opis języka naturalnego to model idealnego użytkownika języka. Opis ten również nazywany jest gramatyką. Gramatyka obejmuje morfologię (jednostka systemowa: morfem, tekstowa: allomorf; konstrukcja: temat fleksyjny systemowy lub tekstowy) i składnię (jednostki: fraza lub zdanie składowe, konstrukcje: frazy, zdania składowe, zdania i wypowiedzenia systemowe lub tekstowe). Nie uważamy słowotwórstwa za dział gramatyki. Diakryty nieznaczący budulec znaków (głoski, fonemy, litery, grafemy). Subkod odmiana diakrytyczna języka. Gramatyka: fleksja + składnia.