Czego nie można wyrazić w języku polskim, czyli o leksykalnych w nim brakach Elżbieta Kaczmarska Instytutu Slawistyki Zachodniej i Południowej Uniwersytet Warszawski Alexandr Rosen Ústav teoretické a komputační lingvistiky Univerzita Karlova v Praze
Co to jest brak leksykalny i skąd wiemy, że w ogóle istnieje? Kontakt z językiem obcym Nieprzetłumaczalność Niemożność wyrażenia dokładnie tego samego (w zgrabny sposób)
1. Toska (rosyjski ) 2. Mamihlapinatapei (Yagan australijski aborygeński) 3. Jayus (indonezyjski) 4. Iktsuarpok (Inuktitut) 5. Lítost (czeski) 6. Kyoikumama (japoński) 7. Tartle (szkocki) 8. Ilunga (luba) 9. Prozvonit (czeski) 10.Cafuné (brazylijski portugalski) 11.Schadenfreude (niemiecki) 12.Torschlusspanik (niemiecki) 13.Wabi-Sabi (japoński) 14.Dépaysement (francuski) 15.Tingo (Pascuense) 16.Hyggelig (duński) 17.L appel du vide (francuski) 18.Ya aburnee (arabski) 19.Duende (hiszpański) 20.Saudade (portugalski)
To nie fenomen języka polskiego Braki są normalne: w jednym języku (luka w systemie jednego języka) albo w porównaniu z innymi W konfrontacji języków blisko spokrewnionych braki te są dość nieoczekiwane Powodują problemy ze zrozumieniem i tłumaczeniem
Braki w językach blisko spokrewnionych (pojęcia) Braki w języku czeskim: awanturnik impreza kilkanaście Braki w języku polskim: mít rád toužit zdát se
Braki w językach blisko spokrewnionych (formalne) biernik z bezokolicznikiem *widziałam matkę płakać vs. viděla jsem matku plakat dużo + przypadki zależne Janek wspiera dużo osób. vs. *Janek pomaga dużo osobom. (luka w systemie jednego języka) Janek wspiera wiele osób. vs. Janek pomaga wielu osobom. Honza podporuje hodně lidí. vs. Honza pomáhá hodně lidem. liczebnik + pluralium tantum *pięć/*pięcioro urodzin vs. *pięć/*pięcioro okularów pięć par okularów vs. *pięć par urodzin (luka w systemie jednego języka)
Brak ogólnego wyrażenia o Formy czasu przeszłego: Myślałam (Myslela jsem) / Myślałem (Myslel jsem) I thought o Imiesłów możliwość wyrażenia rodzaju i liczby w języku czeskim: Jde, plačíc. Kto? Polak nie wie. Jda, plakal. Jdouc, plakala. Jdouce, plakali. Idąc płakał. Idąc, płakała. Idąc, płakali.
InterCorp Braki w polszczyźnie analizujemy w oparciu o dane z korpusu równoległego InterCorp Część Czeskiego Korpusu Narodowego, http://www.korpus.cz/intercorp/ Wyrównanie na poziomie zdania Aktualnie online wersja 6: 31 języków + czeski Liczba słów: 867/100 MW (obce/czeskie), z tego beletrystyka 139/62 MW Tagi morfologiczne i lematyzacja Polskie teksty: 30 MW, z tego beletrystyka: 13 MW Rozróżnienie na oryginały: czeskie/polskie/obce
Automatyczna ekstrakcja ekwiwalentów z czesko-polskiego korpusu równoległego Narzędzia: word-to-word alignment: GIZA++ tagging: Morfeusz+TakIPI, Hajič+morče Teksty: korpus InterCorp wersja 6, tylko beletrystyka bez rozróżnienia na czeskie/polskie/obce oryginały tylko zarównania 1:1 czeskie teksty: 11 885 KW polskie teksty: 11 860 KW Wyniki: wyekstraktowane pary lematów: 8 651 K wyekstraktowane hasła dwujęzyczne: 528 K
302 touha pragnienie 2 touha marzyć 105 touha tęsknota 2 touha wizja 97 touha chęć 2 touha zachcianka 92 touha pożądać 2 touha zainteresować 68 touha żądza 2 touha zapał 16 touha ochota 2 touha życzenie 16 touha pragnąć 1 touha boleć 13 touha potrzeba 1 touha fantazja 9 touha głód 1 touha gorącość 9 touha namiętność 1 touha miłość 8 touha chuć 1 touha misja 8 touha pokusa 1 touha niepokój 7 touha pożądanie 1 touha oferta 6 touha dążyć 1 touha stęsknić 3 touha apetyt 1 touha tęsknić 3 touha pasja 1 touha umiłować 3 touha pęd 1 touha zamiar 2 touha dążenie 1 touha zawiść
Braki w języku polskim w zestawieniu z językiem czeskim: mít rád, toužit, zdát se toužit chcieć, dążyć do, łaknąć, marzyć o, mieć ochotę, pożądać, pragnąć, pragnienie, spragniony, tęsknić do, tęsknić za, złakniony
12 najczęstszych ekwiwalentów czasowników toužit i pragnąć wyekstraktowanych automatycznie z korpusu InterCorp (wersja 6, BEL cs pl) 304 toužit pragnąć 455 pragnąć chtít 107 toužit chcieć 304 pragnąć toužit 82 toužit tęsknić 281 pragnąć přát 70 toužit marzyć 55 pragnąć rád 40 toužit pożądać 42 pragnąć snažit 24 toužit ochota 18 pragnąć aby 9 toužit zapragnąć 17 pragnąć potřebovat 8 toužit pragnienie 16 pragnąć touha 8 toužit tęsknota 13 pragnąć přání 8 toužit zależeć 11 pragnąć pokoušet 7 toužit spragniony 11 pragnąć prahnout 6 toužit życzyć 11 pragnąć zatoužit
cs Jsi krásná, nepřestanu po tobě toužit a bát se tvé krásy pl Jesteś piękna, nigdy nie przestanę cię pragnąć i bać się twojej urody cs Vždycky jsem toužila po člověku, který by byl prostý a přímý. pl Zawsze marzyłam o człowieku, który był by prosty i bezpośredni. cs Celý život jsem toužila po skutečném domově pl Całe życie tęskniłam za prawdziwym domem
Braki w języku polskim w zestawieniu z językiem czeskim: mít rád, toužit, zdát se zdát se wydawać się, zdawać się, mieć wrażenie wyglądać, widzieć, widać, myśleć, mniemać, podejrzewać, pomyśleć, rozumieć, sądzić, uświadamiać sobie, uważać, uznać, moim zdaniem, czuć, poczuć, doznać uczucia, mieć uczucie, wynikać, okazywać się, chyba, najwyraźniej, pewnie, prawdopodobnie, śnić się, przyśnić się, przywidzieć się, podobać się, być zadowolonym
12 najczęstszych ekwiwalentów czasowników zdát (se) i wydawać (się) wyekstraktowanych automatycznie z korpusu InterCorp (wersja 6, BEL cs pl) 1601 zdát wydawać 1601 wydawać zdát 1146 zdát zdawać 639 wydawać připadat 428 zdát wydać 381 wydawać vypadat 284 zdát śnić 171 wydawać myslit 276 zdát wyglądać 117 wydawać vydávat 161 zdát wrażenie 100 wydawać pocit 75 zdát chyba 98 wydawać být 55 zdát przyśnić 85 wydawać jevit 45 zdát uważać 70 wydawać dojem 39 zdát sen 69 wydawać myslet 38 zdát zdać 52 wydawać zřejmě 30 zdát widać 47 wydawać jako
cs Zdála se stvořena pro němý podiv. pl Góra ćwieczków wydawała się stworzoną dla niemego podziwu. cs Panna mu děkovala a zdálo se, že též s úsměvem. pl Panna odpowiedziała, zdaje się, również uśmiechem. cs V noci bylo slyšet z kuchyně křik, Růžence se zdálo, že ji honí čerti. pl W nocy było słychać z kuchni krzyk, Rużence śniło się, że ją gonią diabły. cs Zdálo se, že lež se vtělila v nenadálou děsnou pravdu a přichází se chechtat. pl Tak jakby kłamstwo wcieliło się niespodziewanie w przerażającą prawdę i przyszło z nich szydzić.
Braki w języku polskim w zestawieniu z językiem czeskim: mít rád, toužit, zdát se mít rád kochać, lubić, podobać się, uwielbiać, polubić, pokochać, w naszym guście, sympatia, miłość, ulubiony
12 najczęstszych ekwiwalentów czasowników (mít) rád i lubić wyekstraktowanych automatycznie z korpusu InterCorp (wersja 6, BEL cs pl) 1847 rád lubić 1847 lubić rád 793 rád chcieć 162 lubić líbit 667 rád woleć 50 lubić milovat 554 rád dobrze 41 lubić mít 549 rád chętnie 30 lubić obliba 511 rád kochać 28 lubić snášet 441 rád cieszyć 27 lubić oblíbený 110 rád by 20 lubić potrpět 110 rád ciekawy 16 lubić zamlouvat 110 rád raczej 14 lubić bavit 110 rád zadowolony 14 lubić oblíbit 64 rád rad 11 lubić chtít
cs Víte, pane Dvořák, já mám rád rodinu a dělám pro ni všechno. pl Wie pan, panie Dworzak, jak kocham rodzinę i że robię dla niej wszystko. cs Mám tě strašně rád, řekl. pl Strasznie cię kocham rzekł. cs Tak tě mám ráda. pl Takim cię lubię. cs Já mám podzim ráda. pl Ja lubię jesień.
Wnioski Nie istnieją w języku polskim pojęcia: o toužit mix znaczeń o zdát se niezwykle wieloznaczna jednostka o mít rád coś pomiędzy lubić i kochać. Jak sobie z tym polszczyzna radzi? Wybór jednego z ekwiwalentów niestety z pominięciem części odcieni znaczeniowych. Konsekwencje? Wybór ten potwierdzony obiema metodami analizą manualną oraz ekscerpcją automatyczną.