O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN Beata Trawiński SFB 441 Eberhard-Karls-Universität Tübingen trawinski@sfs.uni-tuebingen.de Rygorystyczny opis języków naturalnych Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego Wydział Polonistyki Uniwersytetu Warszawskiego Warszawa, 21.12.2005 O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.1
Świdziński i Derwojedowa (2004) Nie miejsce tu na to, co prawda, mamy jednak wielka ochotę napomknać o innej osobliwości "poprzyimkowościowej", mianowicie o klityce -ń, również dyskutowanej przez Saloniego (1981). Jest to poprzyimkowa forma dopełniacza lub biernika liczby pojedynczej zaimka ON. Interesujacym i chyba nie podjętym dotad problemem jest dystrybucja owego -ń. Po pewnych przyimkach klityka ta występuje (bezeń, doń, nań, przezeń, zań), po innych jest, zdaje się, wykluczona (*kołoń, *obokeń, *uń). [(Świdziński and Derwojedowa 2004, f. 2)] O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.2
Struktura referatu Paradygmaty fleksyjne zaimkow osobowych trzeciej osoby wg Saloniego (1981) Dystrybucja nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN Zarys analizy kwantytatywnej Podsumowanie i plany O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.3
System zaimków osobowych trzeciej osoby wg Saloniego (1981) Cechy systemu: rodzaj jako kategoria inherentna zaimków (inaczej np. (Doroszewski and Wieczorkiewicz 1972) czy (Grzegorczykowa, Laskowski, and Wróbel 1984)); 4 leksemy: [on], [on] kategorie fleksyjne:, [ono], [ona]; przypadek (mianownik, dopełniacz, celownik, biernik, narzędnik, miejscownik), liczba (pojedyncza i mnoga), poprzyimkowość (poprzyimkowe, niepoprzyimkowe), akcentowość (akcentowane, nieakcentowane). O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.4
Paradygmat fleksyjny leksemu [on] CASE SINGULAR PLURAL nominative on oni genitive jego (go) / niego (-ń) ich / nich dative jemu (mu) / niemu im / nim accusative jego (go) / niego (-ń) ich / nich instrumental nim nimi locative nim nich O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.5
Paradygmat fleksyjny leksemu [on] CASE SINGULAR PLURAL nominative on one genitive jego (go) / niego (-ń) ich / nich dative jemu (mu) / niemu im / nim accusative jego (go) / niego (-ń) je / nie instrumental nim nimi locative nim nich O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.6
Paradygmat fleksyjny leksemu [ono] CASE SINGULAR PLURAL nominative ono one genitive jego (go) / niego ich / nich dative jemu (mu) / niemu im / nim accusative je / nie je / nie instrumental nim nimi locative nim nich O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.7
Paradygmat fleksyjny leksemu [ona] CASE SINGULAR PLURAL nominative ona one genitive jej / niej ich / nich dative jej / niej im / nim accusative instrumental ja / nia nia je / nie nimi locative niej nich O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.8
Paradygmat fleksyjny leksemu [on] uściślony CASE SINGULAR PLURAL nominative on ( ) / on ( ) oni ( ) / oni ( ) genitive jego (go) / niego (-ń) ich ( ) / nich ( ) dative jemu (mu) / niemu ( ) im ( ) / nim ( ) accusative jego (go) / niego (-ń) ich ( ) / nich ( ) instrumental nim ( ) / nim ( ) nimi ( ) / nimi ( ) locative ( ) / nim ( ) ( ) / nich ( ) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.9
Paradygmat fleksyjny leksemu [on] uściślony CASE SINGULAR PLURAL nominative on ( ) / on ( ) one ( ) / one ( ) genitive jego (go) / niego (-ń) ich ( ) / nich ( ) dative jemu (mu) / niemu ( ) im ( ) / nim ( ) accusative jego (go) / niego (-ń) je ( ) / nie ( ) instrumental nim ( ) / nim ( ) nimi ( ) / nimi ( ) locative ( ) / nim ( ) ( ) /nich ( ) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.10
Paradygmat fleksyjny leksemu [on] uściślony CASE SINGULAR PLURAL nominative on ( ) / on ( ) one ( ) / one ( ) genitive jego (go) / niego (-ń) ich ( ) / nich ( ) dative jemu (mu) / niemu ( ) im ( ) / nim ( ) accusative jego (go) / niego (-ń) je ( ) / nie ( ) instrumental nim ( ) / nim ( ) nimi ( ) / nimi ( ) locative ( ) / nim ( ) ( ) / nich ( ) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.11
Paradygmat fleksyjny leksemu [ono] uściślony CASE SINGULAR PLURAL nominative ono ( ) / ono ( ) one ( ) / one ( ) genitive jego (go) / niego ( ) ich ( ) / nich ( ) dative jemu (mu) / niemu ( ) im ( ) / nim ( ) accusative je ( ) / nie ( ) je ( ) / nie ( ) instrumental nim ( ) / nim ( ) nimi ( ) / nimi ( ) locative ( ) / nim ( ) ( ) / nich ( ) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.12
Paradygmat fleksyjny leksemu [ona] uściślony CASE SINGULAR PLURAL nominative ona ( ) / ona ( ) one ( ) / one ( ) genitive jej ( ) / niej ( ) ich ( ) / nich ( ) dative jej ( ) / niej ( ) im ( ) / nim ( ) accusative instrumental ja ( ) / nia ( ) je ( ) / nie ( ) nia ( ) / nia ( ) nimi ( ) / nimi ( ) locative ( ) / niej ( ) ( ) / nich ( ) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.13
Obserwacje I Zgodnie z Salonim (1981), jedynie dopełniaczowe i biernikowe męskie osobowe zaimki trzeciej osoby liczby pojedynczej, dopełniaczowe i biernikowe męskie zwierzęce zaimki trzeciej osoby liczby pojedynczej, dopełniaczowe i biernikowe męskie rzeczowe zaimki trzeciej osoby liczby pojedynczej sa realizowane we wszystkich dostępnych formach. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.14
Obserwacje II Zgodnie z Salonim (1981), jedynie dopełniaczowe i biernikowe męskie osobowe zaimki trzeciej osoby liczby pojedynczej, dopełniaczowe i biernikowe męskie zwierzęce zaimki trzeciej osoby liczby pojedynczej, dopełniaczowe i biernikowe męskie rzeczowe zaimki trzeciej osoby liczby pojedynczej posiadaja nieakcentowana formę poprzyimkowa. (Doroszewski and Wieczorkiewicz 1972): tylko biernik! Korpus:? O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.15
Korpus IPI PAN Do badań wykorzystany został Korpus IPI PAN, a dokładniej automatycznie anotowany wstepny zawierajacy ponad 70 millionów segmentów. (Przepiórkowski 2004), (Przepiórkowski, w druku) O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.16
Cel i Procedura Cel: zbadanie dystrybucji nieakcentowanych form poprzyimkowych w Korpusie IPI PAN Procedura: odnalezienie wszystkich wystapień nieakcentowanych form poprzyimkowych, przypisanie każdej znalezionej nieakcentowanej formie poprzyimkowej interpretacji w sensie jej cech morfosyntaktycznych, analiza kwantytatywna sumy wystapień każdej formy (w trakcie). O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.17
Identyfikacja NFPs w Korpusie IPI PAN [pos=ppron3 & post-prepositionality=praep & accentability=nakc] wstepny: 0 wyników Połaczenia przyimek-zaimek nie sa rozpoznawane jako dwusegmentowe, lecz jako formy nieznane (ign). [pos=ign & orth=".*ń"] wstepny: 3308 wyników 1193 połaczeń przyimek-zaimek przypisanie interpretacji zaimkom na podstawie cech poprzedników weryfikacja wyników poprzez przeszukanie korpusu pod katem wystapień wszystkich potencjalnych połaczeń przyimek-zaimek O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.18
Wyniki I Poza dopełniaczowymi i biernikowymi męskimi osobowymi zaimkami trzeciej osoby liczby pojedynczej, dopełniaczowymi i biernikowymi męskimi zwierzęcymi zaimkami trzeciej osoby liczby pojedynczej, dopełniaczowymi i biernikowymi męskimi rzeczowymi zaimkami trzeciej osoby liczby pojedynczej zidentyfikowane zostały w Korpusie IPI PAN również dopełniaczowe i biernikowe męskie osobowe zaimki trzeciej osoby liczby mnogiej, dopełniaczowe i biernikowe męskie rzeczowe zaimki trzeciej osoby liczby mnogiej, dopełniaczowe i biernikowe nijakie zaimki trzeciej osoby liczby pojedyncyej, dopełniaczowe, biernikowe i miejscownikowe nijakie zaimki trzeciej osoby liczby mnogiej, dopełniaczowe i biernikowe żeńskie zaimki trzeciej osoby liczby pojedynczej, dopełniaczowe, biernikowe i miejscownikowe żeńskie zaimki trzeciej osoby liczby mnogiej. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.19
Przykład 1 Nieakcentowana forma poprzyimkowa dopełniacza liczby pojedynczej żeńskiego zaimka trzeciej osoby: (1) Skoro zatem państwo pozbawiło fundację ustanowionych dlań źródeł finansowania, zrozumiałe jest, że także państwo będzie przeznaczało ze swego budżetu środki na jej utrzymanie. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.20
Przykład 2 Nieakcentowana forma poprzyimkowa biernika liczby pojedynczej nijakiego zaimka trzeciej osoby: (2) Udana rola może co najwyżej spowodować, że zaprosza cię na przesłuchanie sam nań zgłaszać., a nie musisz się O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.21
Przykład 3 Nieakcentowana forma poprzyimkowa biernika liczby mnogiej żeńskiego zaimka trzeciej osoby: (3) Po ciężkiej operacji nogi i wyczerpujacym okresie rekonwalescencji zawodnik powrócił na rajdowe trasy, by rywalizować nań o punkty w grupie N. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.22
Przykład 4 Nieakcentowana forma poprzyimkowa biernika liczby mnogiej nijakiego zaimka trzeciej osoby: (4) Także przed wschodem słońca wychodzili na swoje pola gospodarze i wbijali weń zrobione z gałazek tarniny. małe krzyżyki O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.23
Przykład 5 Nieakcentowana forma poprzyimkowa miejscownika liczby mnogiej nijakiego zaimka trzeciej osoby: (5) Polskie przedsiębiorstwa przemysłowe prosperuja w Mazowieckiem i Ślaskiem. Pod koniec sierpnia br., uzyskało weń łacznie ponad 1 mln osób [...] najlepiej zatrudnienie O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.24
Wyniki II Zidentyfikowane w Korpusie IPI PAN nieakcentowane formy poprzyimkowe występuja z następujacymi przyimkami: dla, do, na, od, po, przez, w, za, z, przed. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.25
Wyniki III Brak wystapień nieakcentowanych form poprzyimkowych z przyimkami wtórnymi takimi jak: ponad, poprzez, zza, między, etc. pokrywa się z danymi słownikowymi. Brak wystapień nieakcentowanych form poprzyimkowych z przyimkami takimi jak: bez, o, nad, pod nie pokrywa się z danymi słownikowymi (por.(dubisz 2003) lub (Bańko 2000)). O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.26
Tabelka 1 Handout! O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.27
Interpretacja kwantytatywna Pytanie: Czy dystrybucja nieakcentowanych form poprzyimkowych w Korpusie IPI PAN może być uważana za lingwistycznie znaczac a i czy może być brana pod uwagę jako ewentualna podstawa do rewizji paradygmatów fleksyjnych zaimków trzeciej osoby? Procedura: określić ważność statystyczna częstotliwości wystapień każdej nieakcentowanej formy poprzyimkowej w Korpusie IPI PAN, obliczyć stosunki sum wystapień akcentowanych form poprzyimkowych do sum wystapień ich nieakcentowanych odpowiedników, porównać wyniki: znaczace różnice...), szukać powodów (niegramatyczność, błedy, metadane, niewielkie różnice dystrybuję nieakcentowanych form poprzyimkowych w Korpusie IPI PAN można uznać za lingwistycznie znaczac a. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.28
Akcentowane formy poprzyimkowe Do przeprowadzenia analizy kwantytatywnej należy scharakteryzować dystrybucję akcentowanych form poprzyimkowych występujacych z następujacymi przyimkami: dla, do, na, w, z, od, przez, po, za, przed. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.29
Interpretacja akcentowanych form poprzyimkowych Manualne przypisywanie interpretacji na podstawie formy poprzedników (wiele błędów we wstepnym). Problemy: niemożliwa identyfikacja poprzednika, kilku kandydatów na poprzedników o różnych cechach morfosyntaktycznych, niekompatybilność cech morfosyntaktycznych poprzednika i danego zaimka, np. (6) Możemy oczywiście dać Europie także słowo honoru, ale obawiam się, że nie byłaby to oferta zbyt dla nich interesujaca. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.30
Tabelka 2 Handout! O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.31
Obecne wyniki Częstotliwość dopełniaczowych i biernikowych żeńskich nieakcentowanych form poprzyimkowych liczby pojedynczej w Korpusie IPI PAN jest statystycznie znaczaca ( =101.76 (df=1), p<0.001 i =36.95 (df=1), p<0.001). Stosunek dopełniaczowych i biernikowych akcentowanych form poprzyimkowych do ich nieakcentowanych odpowiedników: Ratio gen, fem, sg 226.56 acc, fem, sg 148.42 pl 759.60 O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.32
Następne kroki Pozostałe akcentowane formy poprzyimkowe musza być zidentyfikowane w Korpusie IPI PAN i zinterpretowane. Stosunki sum ich wystapień do sum wystapień ich nieakcentowanych odpowiedników musza być obliczone. Wszystkie wyniki musza być porównane. Wyniki analizy kwantytatywnej powinny być poddane ewaluacji przez użytkowników języka polskiego. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.33
Podsumowanie Zaprezentowane i uściślone zostały paradygmaty fleksyjne zaimków osobowych trzeciej osoby wg Saloniego (1981) ze szczególnym uwzględnieniem nieakcentowanych form poprzyimkowych. Opisana została dystrybucja nieakcentowanych form poprzyimkowych w Korpusie IPI PAN. Obserwacje: więcej nieakcentowanych form poprzyimkowych, niż podaje Saloni (1981), mniej przyimków łaczych się z nieakcentowanymi formami poprzyimkowymi, niż podaja słowniki. Przedstawiony został zarys analizy kwantytatywnej dystrybucji tych form z przykładami dla dopełniaczowch i biernikowych żeńskich nieakcentowanych form poprzyimkowych oraz dla nieakcentowanych form poprzyimkowych liczby mnogiej. Dalsze plany: ukończenie analizy kwantytatywnej, analiza metadanych, porównanie z innymi korpusami (PWN, PELCRA). O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.34
References Bańko, M. (2000). Inny słownik języka polskiego [Different Polish Dictionary]. Warszawa: Wydawnictwo Naukowe PWN. Doroszewski, W. and B. Wieczorkiewicz (1972). Gramatyka opisowa języka polskiego z ćwiczeniami [A Descriptive Grammar of Polish with Exercises], Volume II: Fleksja. Składnia [Inflection. Syntax.]. Warszawa: Państwowe Zakłady Wydawnictw Szkolnych. Dubisz, S. (2003). Uniwersalny słownik języka polskiego [The Universal Polish Dictionary]. Warszawa: Wydawnictwo Naukowe PWN. Grzegorczykowa, R., R. Laskowski, and H. Wróbel (1984). Gramatyka współczesnego języka polskiego: Morfologia [The Grammar of Contemporary Polish: Morphology]. Warszawa: Państwowe Wydawnictwo Naukowe. Przepiórkowski, A. (2004). The IPI PAN Corpus. Preliminary Version. Warsaw: Institute of Computer Science PAS. Przepiórkowski, A. (to appear). The Potential of the IPI PAN Corpus. Poznań Studies in Contemporary Linguistics 41,. Świdziński, M. and M. Derwojedowa (2004). Idiosynkrazja na przecięciu idiosynkrazyj, czyli o poprzyimkowości i liczebnikach [Idiosyncrasy at the Interface of Idiosynrasies. About Postprepositionality and Numerals]. In A. Moroz and M. Wiśniewski (Eds.), Studia z gramatyki i semantyki języka polskiego, pp. 33 42. Toruń: Wydawnictwo Uniwersytetu Mikołaja Kopernika. O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.35