Humanistyka XXI wieku HUMANISTYKA 2.0. Rocznik doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego. Nr 1 (6)/2016. ISSN: (online)

Humanistyka XXI wieku HUMANISTYKA 2.0 Rocznik doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego Nr 1 (6)/2016 ISSN: 2083-5035 (online)

Humanistyka XXI wieku. Rocznik doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego ISSN: 2083-5035 (online) Nr 1 (6)/2016 HUMANISTYKA 2.0 Recenzenci: dr hab. Zbigniew Osiński, prof. UMCS Uniwersytet Marii Curie-Skłodowskiej, Lublin dr Marcin Napiórkowski Uniwersytet Warszawski, Warszawa Redakcja: Dorota Kondratczyk-Przybylska, Ewa Walewska Projekt graficzny i skład: Aldona Sieradzka Redakcja techniczna i superrewizja: Dorota Kondratczyk-Przybylska Przygotowano w ramach projektu Humanistyka XXI wieku. Badania doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego. Pierwotną wersją każdego numeru czasopisma jest wersja opublikowana online na stronie internetowej projektu pod adresem www.humanistyka.edu.pl.

Spis treści Od redakcji 4 Martyna Sabała, IJP Cyfrowa diachronia, czyli o komputerowych narzędziach edycji i analizy źródeł historycznych na przykładzie XVI-wiecznych przekładów Ewangelii na język polski 6 Dorota Kondratczyk-Przybylska, IJP Przydatność narzędzi cyfrowych w badaniach pól leksykalnych na przykładzie Słowosieci 21 Agata Sutkowska, IKP Fanony, head-canony i fanfiki. Sposoby traktowania tekstu dzieła w fandomie szkic problematyki 36 Anna Zalewska, IKP Dialogiczność rzeczywistości, czyli literatura internetowa 45 Ewelina Stachura, IJP Z internetowej ambony o nowej formie kazań i nauk rekolekcyjnych 54 Joanna Kocemba, IKP Materialność spektaklu teatru w Internecie i teatru internetowego 64 Marcin Gołąb, IKP Od piaskownicy do sandboxa. Z problematyki internetowych badań nad dzieckiem i dzieciństwem 71

Od redakcji Digitalizacja źródeł oraz nowoczesne i nieograniczone możliwości archiwizacji zasobów zmuszają humanistów do zrewidowania podejścia do tekstu i języka. Wobec przełomu cyfrowego także kluczowe pojęcia humanistyki ulegają redefinicji. Zmieniają się również metody badawcze i metody upowszechniania wyników pracy naukowej. Wreszcie zmianie ulega sama forma dyskusji, a więc tego, co stanowi istotę humanistyki. W globalnej wiosce każdy ma szansę stać się twórcą, a każdy produkt dziełem. W tym kontekście uczestnikom szóstej dorocznej konferencji naukowej doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego z cyklu Humanistyka XXI wieku zaproponowaliśmy rozważenie zmian, jakie zachodzą w humanistyce pozostającej w ścisłym związku z procesem cyfryzacji. Hasło przewodnie Humanistyka 2.0 wraz z cyfrową formułą w nim zawartą niosło, między innymi, chęć odnalezienia odpowiedzi na pytanie: Czy humanistyka cyfrowa rzeczywiście jest «ulepszona» i «usprawniona», po prostu «nowa», jak wynikałoby to ze znaczenia analogicznych konstrukcji, nawiązujących do pierwotnego terminu «Internet 2.0»?. Obrady pokazały jednak, że na stawianie tak poważnych pytań jest zdecydowanie zbyt wcześnie. Zdaje się, że humanistyka cyfrowa dopiero uważnie rozważa możliwości i zagrożenia, jakie dają jej nowe technologie i formy komunikacyjne, i stara się oszacować ich wartość. Szanowni Czytelnicy będą mogli jednak sami ocenić zasadność tego stwierdzenia podczas uważnej lektury niniejszego, szóstego numeru rocznika doktorantów Wydziału Polonistyki Uniwersytetu Warszawskiego Humanistyka XXI wieku, notabene od początku swojego istnienia funkcjonującego w formie cyfrowej. Tradycyjnie zebrano w nim artykuły powstałe na podstawie referatów wygłoszonych podczas konferencji o tym samym tytule, która odbyła się 17 stycznia 2015 roku. Każdy opatrzony jest tagiem, wskazującym zasadnicze pole zainteresowań autora. Redakcja rocznika oraz cały zespół Humanistyki XXI wieku chcieliby serdecznie podziękować Recenzentom, Panu Profesorowi Zbigniewowi Osińskiemu z Uniwersytetu Marii Curie-Skłodowskiej z Lublina, a także Panu Doktorowi Marcinowi Napiórkowskiemu z Uniwersytetu Warszawskiego, którzy podjęli się niełatwego zadania oceny, często bardzo wyspecjalizowanych, artykułów. Ich uwagi i wskazówki były dla nas i dla Autorów cennym punktem odniesienia, rzucającym nowe światło na podejmowane kwestie. Życzymy przyjemnej lektury szóstego numeru rocznika Humanistyka XXI wieku. Zespół redakcyjny 4

HUMANISTYKA 2.0 #Narzędzia #Tekst #Forma #Język

Martyna Sabała Cyfrowa diachronia, czyli o komputerowych narzędziach edycji i analizy źródeł historycznych na przykładzie XVI-wiecznych przekładów Ewangelii na język polski #NARZĘDZIA Przemiany technologiczne przełomu XX i XXI wieku niewątpliwie mają duży wpływ na rozwój nauk nie tylko matematyczno-przyrodniczych, lecz także humanistycznych. Coraz większym zainteresowaniem na świecie cieszy się humanistyka cyfrowa, która będąc ruchem interdyscyplinarnym m.in. zbliża nauki humanistyczne i nowe technologie 1, daje szansę na uprawianie nowej nauki lub usprawnienie badań wykorzystujących dotychczas znane i tradycyjne metodologie. W tytule artykułu zostało użyte wyrażenie cyfrowa diachronia, które nawiązując do wyrażenia humanistyka cyfrowa, ma zwrócić uwagę na obecność zwrotu cyfrowego w jednej z dziedzin humanistyki językoznawstwie diachronicznym. Celem artykułu jest przedstawienie narzędzi komputerowych, które wykorzystuję w badaniu leksyki dziesięciu XVI-wiecznych przekładów Ewangelii na język polski: strony internetowej projektu Szesnastowieczne przekłady Ewangelii, zrealizowanego w latach 2010 2013 pod kierunkiem Izabeli Winiarskiej-Górskiej 2, znajdującej się na stronie przeglądarki wersetów równoległych, programu Ewangelie stworzonego na potrzeby transkrypcji przez informatyka-polonistę Michała Rudolfa, a także programu AntConc ogólnodostępnego i darmowego programu do analizy korpusów językowych. Narzędzia te zostaną przedstawione na tle projektów cyfrowych wspierających badania humanistyczne. Moim celem jest również wykazanie, że wybrane programy są niezbędne w badaniu wskazanych tekstów, a ich użycie pozwala na szybkie uzyskanie pożądanych wyników. Analiza leksyki wyekscerpowanej z XVI-wiecznych przekładów Ewangelii jest przedmiotem mojej pracy doktorskiej, powstającej pod kierunkiem Aliny Kępińskiej w Zakładzie Historii Języka Polskiego i Dialektologii na Wydziale Polonistyki Uniwersytetu Warszawskiego. Badanie zakłada wybranie z dziesięciu przekładów leksemów odnoszących się do codziennego życia, ich opis zgodny z metodologią analizy polowej, klasyfikację do odpowiednich pól (np. pożywienie, zagospodarowa- 1 Radosław Bomba, Narzędzia cyfrowe jako wyznacznik nowego paradygmatu badań humanistycznych, [w:] Zwrot cyfrowy w humanistyce, pod red. Andrzeja Radomskiego, Radosława Bomby, Lublin 2013, s. 57. 2 Zob. Szesnastowieczne przekłady Ewangelii, www.ewangelie.uw.edu.pl [dostęp: 20.02.2015]. 6

#NARZĘDZIA nie przestrzeni, ubiór, obyczaje), a także analizę frekwencji jednostek leksykalnych i ich etymologii. Chodzi ponadto o odpowiedź na pytanie, w jakim stopniu słownictwo XVI-wiecznych przekładów odzwierciedla realia starożytnej Palestyny, a w jakim opisuje rzeczywistość Rzeczpospolitej okresu renesansu. Pod uwagę zostały wzięte następujące przekłady: oba powstałe w Królewcu wydania Stanisława Murzynowskiego, tj. z 1551 roku (tylko Ewangelia św. Mateusza) i z 1553 roku; Nowy Testament z 1556 roku wydany przez Marka Szarffenberga, a tłumaczony przez Marcina Bielskiego; Biblia w tłumaczeniu Jana Leopolity z 1561 roku; Biblia Brzeska z 1563 roku; dwa przekłady Szymona Budnego z 1570 i 1572 roku; Nowy Testament w przekładzie Marcina Czechowica z 1577 roku; Ewangelie z przekładów Jakuba Wujka z 1953 i 1599 roku. Zastosowana przeze mnie metodologia opiera się na koncepcji Andrzeja Markowskiego, przedstawionej w pracy Leksyka wspólna różnym odmianom polszczyzny 3. Konstruując schemat zależności leksykalno-semantycznych, badacz wyszedł z założenia, że powinien on odzwierciedlać naiwno semantyczny stosunek do rzeczywistości językowej tzw. przeciętnego użytkownika języka 4. Schemat ten opiera się na dychotomii JA WOBEC SIEBIE JA WOBEC TEGO, CO POZA MNĄ. Pierwsza makrosfera dzieli się na kolejne dwie wskazujące na to, co związane z cielesnością człowieka i jego umysłem oraz tym, co go kształtuje: literaturą, muzyką, teatrem czy malarstwem. Bardziej rozbudowana jest druga makrosfera. To właśnie ona gromadzi największy zbiór jednostek leksykalnych odnoszących się do życia codziennego. Andrzej Markowski zakwalifikował tu słownictwo dotyczące życia społecznego, pracy zawodowej, edukacji, ale też wiary i religii 5. Istotnym uzupełnieniem opisu leksykalno-semantycznego słownictwa wyekscerpowanego z Ewangelii są dane frekwencyjne dotyczące zgromadzonych jednostek leksykalnych. Frekwencja ukazuje bowiem bogactwo zebranego słownictwa, wskazuje na pewną regularność w tłumaczeniach, wyrazy częste oraz formy zaświadczone tylko raz. Zestawienie danych liczbowych może potwierdzić zależności występujące między translacjami oraz wskazać indywidualne preferencje tłumacza w kwestii wyboru odpowiednich polskich środków językowych, które mają oddać tekst podstawy przekładu. Dowodzi tego Tomasz Lisowski w swojej pracy Sola Scriptura. Leksyka Nowego Testamentu Biblii Gdańskiej (1632) na tle porównawczym. Ujęcie kwantytatywno-dystrybucyjne 6. Za pomocą metod statystycznych badacz przedstawia relacje intertekstowe oraz różnice ujawniające się na płaszczyźnie leksykalnej między Biblią Gdańską a Biblią brzeską, przekładem Nowego Testamentu z Biblii Jakuba Wujka z 1599 roku oraz Nowym Testamentem gdańskim z 1606 roku. Analiza kwan- 3 Zob. Andrzej Markowski, Leksyka wspólna różnym odmianom polszczyzny, Warszawa 1992. 4 Tamże, s. 84. 5 Założenia mojej pracy, przyjęta metodologia, oczekiwane wyniki badań oraz przykłady zostały przedstawione szerzej w artykule Realia starożytnej Palestyny w polszczyźnie renesansu na podstawie XVI-wiecznych przekładów Ewangelii, Українська полоністика 11, 2014, Житомир, s. 65 71. 6 Zob. Tomasz Lisowski, Sola Scriptura. Leksyka Nowego Testamentu Biblii Gdańskiej (1632) na tle porównawczym. Ujęcie kwantytatywno-dystrybucyjne, Poznań 2010. 7

#NARZĘDZIA tytatywno-dystrybucyjna potwierdza duże powinowactwo leksykalne Biblii Gdańskiej i przekładu Jakuba Wujka. Pod względem charakterystyki kwantytatywnej zauważa natomiast podobieństwo do Biblii brzeskiej 7. W wypadku dziesięciu przekładów Ewangelii wyszukanie wszystkich lokalizacji odpowiednich leksemów, a tym samym podanie liczby ich wystąpień oraz porównanie pod tym kątem wskazanych translacji bez użycia specjalnych programów komputerowych, byłoby zadaniem trudnym, co potwierdzają autorzy polskich konkordancji biblijnych: W historii biblistyki konkordancje nigdy dotychczas nie pojawiały się tak często, przede wszystkim dlatego, że są to przedsięwzięcia niesłychanie pracochłonne. Otóż w naszych czasach pracochłonność ową udaje się nieco zmniejszyć dzięki zastosowaniu najnowszych osiągnięć techniki elektronicznej 8. Warto więc przyjrzeć się narzędziom komputerowym umożliwiającym dokładną, a przede wszystkim szybką analizę słownictwa Ewangelii. Należy zaznaczyć, że niektóre zaprezentowane rozwiązania mogą być wykorzystane do badania różnego rodzaju tekstów, nie tylko historycznych. We współczesnej humanistyce coraz częściej poszukuje się rozwiązań technologicznych, które usprawniłyby podejmowane działania, dały możliwość zbadania do tej pory niedostępnych obszarów wybranej dziedziny, a także integrowałyby środowisko humanistów. Tego typu przedsięwzięcia realizowane są na całym świecie, również w Polsce. Warto wspomnieć tu o narzędziach stworzonych w ramach takich projektów jak CLARIN, DARIAH czy SYNAT. CLARIN (Common Language Resources and Technology Infrastructure) to ogólnoeuropejska infrastruktura naukowa, której celem jest udostępnianie zasobów językowych oraz elektronicznych narzędzi do automatycznego przetwarzania języka naturalnego badaczom we wszystkich dyscyplinach naukowych, a w szczególności z dziedzin humanistycznych 9. Dzięki niej badacze mogą skorzystać m.in. z systemu do edycji anotowanych korpusów (Inforex) czy analizatora morfologicznego (Nowy Morfeusz). Cyfrowa humanistyka rozwija się również w ramach infrastruktury DARIAH (Digital Research Infrastructure for Arts and Humanities) 10, w której udział mają też polscy naukowcy. Jest to projekt obejmujący nie tylko nauki humanistyczne, lecz także sztuki piękne. Zamiarem twórców DARIAH jest wsparcie humanistyki cyfrowej poprzez międzynarodową integrację środowiska naukowego, budowę i wymianę narzędzi cyfrowych oraz połączenie stosowanych metodologii. Podobną funkcję wyłącznie na szczeblu krajowym pełni projekt SYNAT (System Nauki i Techniki) 11 : Celem projektu jest stworzenie 7 Tamże, s. 443. 8 Kazimierz Romaniuk, Konkordancja do Pisma Świętego Nowego Testamentu, Warszawa 1988, s. 7. 9 CLARIN, https://clarin-pl.eu/pl/clarin-2/ [dostęp: 3.02.2016]. 10 Zob. DARIAH, www.dariah.eu [dostęp: 3.02.2016]. 11 Zob. SYNAT, http://www.synat.pl/ [dostęp: 3.02.2016]. 8

#NARZĘDZIA uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy 12. Wymienione przedsięwzięcia są inicjatywami o szerokim zasięgu i wciąż skupiają wokół siebie nowe grupy badawcze. W Polsce humanistyka cyfrowa nieustannie rozwija się, o czym świadczy liczba krajowych humanistycznych projektów cyfrowych 13, przeznaczonych dla badaczy zajmujących się nie tylko współczesnymi zagadnieniami humanistyki, lecz także np. historią języka. W kontekście XVI-wiecznych przekładów Ewangelii szczególnie istotne są korpusy tekstów dawnych, które umożliwiają analizę frekwencji słowa w tekście w stosunku do liczby jego wystąpień w innych tekstach, kolokacji czy określenie stopnia kluczowości danej słowoformy dla wybranego dzieła. Do tej pory w Polsce powstał Korpus tekstów staropolskich do 1500 roku. Obejmuje on transkrypcje kilkunastu zabytków w większości przygotowanych w Pracowni Języka Staropolskiego Instytutu Języka Polskiego PAN 14. Natomiast od 2012 roku w ramach Narodowego Programu Rozwoju Humanistyki w Pracowni Słownika Polszczyzny XVI-wieku Instytutu Badań Literackich PAN powstaje Korpus polszczyzny XVI wieku 15. Obecnie teksty są dygitalizowane. Należy wspomnieć jeszcze o innym projekcie cyfrowym, który wspomaga prace nad grupowaniem leksyki wyekscerpowanej z Ewangelii 16. Jest nim Słownik pojęciowy języka staropolskiego 17, przygotowywany w latach 2011 2015 pod kierownictwem Bożeny Sieradzkiej-Baziur w Instytucie Języka Polskiego PAN: Dzięki Słownikowi pojęciowemu języka staropolskiego informacje dotyczące m.in. znaczeń staropolskich wyrazów, kontekstów, w których występują (w transliteracji i w transkrypcji), są obecnie powszechnie dostępne, podobnie jak podział semantyczny jednostek leksykalnych. Pogrupowanie całego znanego dziś materiału staropolskiego to prezentacja kategorii semantycznych najstarszej warstwy polskiego słownictwa 18. Wyróżnione przez autorów Słownika pola semantyczne są dla mnie punktem odniesienia w ustalaniu kategorii dla zebranego materiału leksykalnego. W pracy nad Ewangeliami bezpośrednio wykorzystuję programy, o których wspomniałam we wstępie. Pisała o nich m.in. Alina Kępińska w artykule pt. Komputerowe narzędzia w pracy historyka 12 Tamże. 13 Stan projektów realizowanych w Polsce przedstawiony został w publikacji Humanistyczne projekty cyfrowe w Polsce, oprac. Marcin Werla, Maciej Maryl, Poznań Warszawa 2014, http://lib.psnc.pl/content/655/humanistyczne_ projekty_cyfrowe_w_polsce_final.pdf [dostęp: 4.02.2016]. 14 Korpus dostępny jest na stronie https://www.ijp-pan.krakow.pl/publikacje-elektroniczne/korpus-tekstow-staropolskich [dostęp: 4.02.2016]. 15 Zob. Korpus polszczyzny XVI wieku, http://www.spxvi.edu.pl/korpus/ [dostęp: 4.02.2016]. 16 Narzędzie to może być przydatne w analizie polowej leksyki innych tekstów dawnych. 17 Słownik pojęciowy języka staropolskiego, http://spjs.ijp-pan.krakow.pl/spjs/strona/kartatytulowa [dostęp: 4.02.2016]. 18 Tamże. 9

#NARZĘDZIA języka na przykładzie badania partykuł wzmacniających 19, jednak narzędzia te zostały przedstawione przez pryzmat konkretnego problemu z zakresu językoznawstwa diachronicznego, w związku z czym wykorzystano inne funkcje oprogramowania niż w niniejszej prezentacji, która ma na celu wskazanie właściwości programów ważnych z punktu widzenia analizy leksykologicznej. Badanie dziesięciu XVI-wiecznych przekładów Ewangelii nie byłoby możliwe bez ich transkrypcji. W ramach grantu Szesnastowieczne przekłady Ewangelii, realizowanego w Zakładzie Historii Języka Polskiego i Dialektologii na Wydziale Polonistyki Uniwersytetu Warszawskiego, członkowie zespołu dokonali transkrypcji podstawy źródłowej z mikrofilmów Ewangelii udostępnionych przez Bibliotekę Narodową, które były konfrontowane z podobiznami cyfrowymi dostępnymi na stronie Polskiej Biblioteki Internetowej lub w Dolnośląskiej Bibliotece Cyfrowej. Transkrypcje zapisywane były bezpośrednio w programie Ewangelie: W edytorze tekstów programu Ewangelie każdy werset ma przyporządkowane okno tekstu, które otwiera się po dwukrotnym kliknięciu w nie. Wersety są transkrybowane wyłącznie we właściwych oknach tekstu 20. Rys. 1. Okno transkrypcji w programie Ewangelie. Wynikiem tej pracy jest dziesięć plików z transkrypcjami, które mogą być otwierane wyłącznie za pomocą programu Ewangelie. 19 Zob. Alina Kępińska, Komputerowe narzędzia w pracy historyka języka na przykładzie badania partykuł wzmacniających, Prace Filologiczne 2014, t. LXV, s. 213 231. 20 Izabela Winiarska-Górska, Instrukcja transkrypcji w Przeglądarce szesnastowiecznych przekładów Ewangelii. Zasady szczegółowe wraz z przykładami, s. 6, http://www.ewangelie.uw.edu.pl/materialy.php [dostęp: 20.02.2015]. 10

#NARZĘDZIA Rys. 2. Przetranskrybowana Ewangelia z przekładu Jakuba Wujka z 1593 roku. Poszczególne wersety opatrzone są przypisami rzeczowymi oraz komentarzami edytorskimi: fonetycznymi, fleksyjnymi i semantycznymi 21. W badaniu leksyki Ewangelii można korzystać ze wszystkich rodzajów przypisów, jednak szczególnie użyteczne są te, dzięki którym od razu można poznać znaczenie leksemów kłopotliwych i zaklasyfikować je do odpowiedniego pola semantycznego. Aby odczytać znaczenie wyrazu opatrzonego przypisem, wystarczy ustawić kursor na cyfrze. Informacje zawarte w przypisach nie mogą jednak zastąpić badania leksykograficznego i dokładniejszej analizy wybranej jednostki leksykalnej. 21 Izabela Winiarska-Górska, Zasady edycji tekstów w Przeglądarce wersetów równoległych szesnastowiecznych przekładów Ewangelii, s. 6, http://www.ewangelie.uw.edu.pl/materialy.php [dostęp: 20.02.2015]. 11

#NARZĘDZIA Rys. 3. Przypisy semantyczne w programie Ewangelie. Program Ewangelie służy przede wszystkim do transkrypcji tekstów, jednak dzięki opatrzeniu tekstów przypisami stał się on programem ułatwiającym ich czytanie i rozumienie, a co za tym idzie ekscerpcję materiału. Transkrypcje jednak już nie w programie Ewangelie można przeglądać również na stronie projektu: www.ewangelie.uw.edu.pl. Twórcy strony zaproponowali dwa sposoby przeglądania: pierwszy umożliwia czytanie wyłącznie jednej Ewangelii. Rys. 4. Widok transkrypcji Ewangelii Leopolity z 1561 roku. 12

#NARZĘDZIA Drugi sposób zdecydowanie ułatwia jednoczesne badanie leksyki dziesięciu przekładów Ewangelii dzięki przeglądarce wersetów równoległych. Umożliwia ona wyszukiwanie wystąpienia wybranego leksemu i porównanie z jego odpowiednikami w paralelnych wersetach. Na stronie pojawia się pojedynczy werset, np. Mk 12,1; przejście do kolejnego bądź poprzedniego wersetu jest łatwe i polega na kliknięciu odpowiedniej strzałki: Rys. 5. Rozdział Mk 12,1 w przeglądarce wersetów równoległych Porównywarka wersetów równoległych umożliwia ustalenie kontekstowych odpowiedników wyrazów wytypowanych np. po lekturze Ewangelii z wybranej, jednej tylko XVI-wiecznej edycji. Przykładowy werset Mk 12,1 został wybrany ze względu na nazwy osób w nim występujących; pojawiają się tu cztery różne rzeczowniki: winiarz, winogrodnik, oracz i robotnik. W badaniu XVI-wiecznych przekładów Ewangelii na język polski z powodzeniem można wykorzystać dorobek językoznawstwa korpusowego, które rozwijało się już od lat 60. ubiegłego wieku. Korpus to zbiór tekstów albo zanotowanych wypowiedzi, wykorzystywany do celów analizy lingwistycznej 22. W językoznawstwie korpusowym wykorzystano dynamiczny rozwój nowych 22 A collection of writings or recorded remarks used for linguistic analysis [tłumaczenie własne M.S.]. The American Heritage Dictionary of the English Language, www.ahdictionary.com [dostęp: 28.02.2015]. 13

#NARZĘDZIA technologii, przede wszystkim komputerów i Internetu 23. W odpowiedzi na rosnące zapotrzebowanie np. na badania częstotliwości użycia w tekście różnych form językowych stworzono narzędzia korpusowe niezbędne do efektywnego używania korpusów 24. Jednym z takich narzędzi jest Ant- Conc darmowy program autorstwa Laurence a Anthony ego, profesora Uniwersytetu w Wasedzie w Japonii. AntConc dostępny jest w angielskiej wersji językowej na stronie autora 25 i jest kompatybilny z systemami Windows, Macintosh oraz Linux. Nie wymaga instalacji, a jedynie uruchomienia poprzez dwukrotne kliknięcie pliku.exe. Program obsługuje wyłącznie pliki tekstowe z rozszerzeniem.txt. Ze względu na polskie znaki graficzne należy pamiętać o ich zapisywaniu w systemie kodownia UTF-8. Do badania leksyki XVI-wiecznych przekładów na język polski są wykorzystywane następujące funkcje programu: konkordancja (Concordance), wykres dystrybucji (Concordance Plot), podgląd tekstu w całości (File View), kolokacje (Collocates) oraz lista słów (Word List). Program ma jeszcze inne funkcje, np. narzędzie do tworzenia listy słów kluczowych (Keyword List), jednak aby wyszukać słowo kluczowe danego tekstu, należy załadować w programie korpus referencyjny. Dopiero wtedy stanie się możliwe badanie słownictwa charakterystycznego dla wybranego korpusu. W wypadku dziesięciu przekładów Ewangelii funkcja ta nie da wiarygodnego wyniku (nawet jeśli wyszukiwane byłoby słowo kluczowe w jednym przekładzie, dla którego korpusem referencyjnym byłyby pozostałe przekłady), ponieważ niezbędny byłby tu korpus referencyjny większej liczby tekstów XVI-wiecznych. W moim badaniu przekładów Ewangelii z XVI-wieku dostępne teksty są zwykle traktowane jako jeden korpus i w takiej postaci analizowane za pomocą programu AntConc, choć program umożliwia przeglądanie także pojedynczych plików (co także wykorzystuję). Oprogramowanie łączy wszystkie teksty, zachowując jednak nazwy plików i pozostawiając możliwość odczytywania wyników tylko dla jednego przekładu. Jest to widoczne podczas tworzenia konkordancji, czyli analizy wszystkich wystąpień danego leksemu, który jest wywoływany z tekstu głównego wraz z kontekstem. Funkcja ta zostanie pokazana na przykładzie leksemu chleb. W celu wyszukania wszystkich wystąpień tego słowa można wpisywać w pole wyszukiwawcze kolejno wszystkie jego formy fleksyjne. Innym sposobem wyszukiwania jest wpisanie tematu wyrazu wraz z gwiazdką, która otwiera pole dla innych liter: 23 Narodowy Korpus Języka Polskiego, pod red. Adama Przepiórkowskiego, Mirosława Bańki, Rafała L. Górskiego, Barbary Lewandowskiej-Tomaszczyk, Warszawa 2012, s. 3 4, http://nkjp.pl/settings/papers/nkjp_ksiazka.pdf [dostęp: 20.02.2015]. 24 Tamże, s. 5. 25 Zob. Laurence Anthony s Website, http://www.laurenceanthony.net/software.html [dostęp: 28.02.2015]. 14

#NARZĘDZIA Rys. 6. Wyszukiwanie wystąpień danego leksemu w AntConc. Wstępna analiza wykazała, że w dziesięciu przekładach występuje 740 leksemów z tematem chleb-. Nie są to jednak tylko rzeczowniki. Wśród nich pięć razy występuje przymiotnik chlebowy w dopełniaczu, więc rzeczownik chleb w różnych formach fleksyjnych występuje we wszystkich Ewangeliach 735 razy. W kolumnie File program pokazuje, w którym przekładzie znajduje się dana forma. Kliknięcie w wyróżnioną formę powoduje przejście do danego przekładu i podglądu tekstu w całości (File View): Rys. 7. Podgląd wybranego przekładu. 15

#NARZĘDZIA U góry okna znajdują się informacje, ile poświadczeń danego wyrazu występuje w wybranym przekładzie oraz który przekład jest przeglądany. Badany leksem wyróżniony jest kolorem niebieskim. Funkcja Concordance umożliwia sortowanie danych z uwzględnieniem kontekstu prawo- i lewostronnego. Wystarczy w opcji Kwic sort wybrać, ile słów z każdego (lub tylko jednego) kontekstu program ma wyróżnić, np. 1L oznacza, że program będzie sortował według pierwszego słowa występującego po lewej stronie badanego leksemu. Następnie należy kliknąć Sort. Rys. 8. Wynik sortowania z uwzględnieniem kontekstu. Program kolorami oznacza kontekst danego wyrazu, dzięki czemu ułatwia dostrzeganie pewnych regularności występujących w korpusie. Dopełnieniem funkcji Concordance jest Concordance Plot, która przedstawia przekłady za pomocą grafiki. Każdy plik korpusu jest przedstawiony za pomocą poziomego paska, na którym pionowymi liniami zaznaczone są wystąpienia wybranego wyrazu: Rys. 9. Wizualizacja przekładów za pomocą funkcji Concordance plot. 16

#NARZĘDZIA Ciemniejsze pola oznaczają częstsze wystąpienia leksemu. Najmniej wystąpień leksemu chleb jest w przekładzie z 1551 roku, ponieważ jest to tylko Ewangelia wg św. Mateusza. Jak widać, leksem chleb występuje regularnie we wszystkich przekładach (co wynika z kulturowego znaczenia desygnatu chleb jest podstawowym pokarmem w Palestynie, natomiast w Nowym Testamencie często używany jest metaforycznie) i stanowi ponad 2% wszystkich słów występujących w Ewangeliach. Tego typu wyliczenie możliwe jest dzięki funkcji tworzenia listy słów (form gramatycznych, form funkcyjnych) z całego korpusu. W zakładce Word list wystarczy kliknąć Start, a program wygeneruje listę frekwencyjną, podając dwa istotne wyniki: Word Tokens (ogólna liczba słów w korpusie, rozumianych jako wyrazy od spacji do spacji; wszystkie formy fleksyjne) oraz Word Types (liczba różnych słów w korpusie). Rys. 10. Lista frekwencyjna słów Ogólna liczba słów w korpusie przekładów wynosi ok. 619573, natomiast suma różnych słów ok. 34053. Kolumna Freq pokazuje frekwencję danego wyrazu. Największą odznacza się spójnik i, a rzeczownikiem o najwyższej frekwencji jest forma syn występuje 1225 razy. Pod-czas generowania listy frekwencyjnej program bierze pod uwagę również skróty imion Ewangelistów (mt, lk), a także traktuje dwie formy graficzne tego samego wyrazu jako dwa różne wyraz, np. Jezus i Jesus, dlatego ogólną liczbę słów należy podawać w przybliżeniu. Niektóre słowa można jednak wyeliminować z korpusu tak, żeby program nie brał ich pod uwagę podczas tworzenia listy. W tym celu należy wejść w zakładkę Tool preferences, następnie wybrać kategorię Word list i zaznaczyć w niej opcję Use a stoplist listed below. W polu Add word należy wpisać niechciane słowa, a następnie zatwierdzić każde przyciskiem Add. 17

#NARZĘDZIA Rys. 11. Eliminowanie z korpusu wybranych wyrazów Program AntConc ma jeszcze jedną ważną funkcję wyszukiwanie kolokacji. Służy ona do badania łączliwości semantycznej wybranego wyrazu. Również tutaj można określić kontekst leksemu, dzięki ustawieniu odpowiedniej liczby słów mających wystąpić po prawej i lewej stronie. Co więcej, można ustawić minimalną frekwencję kolokacji, to znaczy wskazać programowi, aby pokazał wyłącznie te połączenia wyrazowe, które występują np. minimum pięć razy: Rys. 12. Badanie kolokacji leksemu chleb. 18

#NARZĘDZIA W przedstawionym przykładzie ustawiono pojedynczy kontekst lewo- i prawostronny, to znaczy, że poszukiwane są kolokacje, w których oprócz słowa kluczowego wystąpi wyraz po prawej i/lub lewej stronie. Największą frekwencją odznacza się kolokacja pięcioro chleba. Występuje w Ewangeliach 58 razy, w tym np. 7 razy w przekładzie z 1553 roku, 8 razy w przekładzie z 1561 i 7 w przekładzie z 1599. Można to policzyć, jeśli kliknie się w wybrany wyraz z kolumny Collocate. Jak widać, liczebnik pięcioro występuje tylko w kontekście lewostronnym. Rys. 13. Występowanie kolokacji pięcioro chleba Wskazane funkcje programu AntConc umożliwiają poznanie dokładnej liczebności szukanych wyrazów, ustalenie ich lokalizacji i kolokacji. Swoją funkcjonalnością zdecydowanie przewyższa on możliwości programu Ewangelie czy przeglądarki wersetów równoległych, tym bardziej, że stworzony jest do obsługi różnych tekstów w różnych językach 26. Nie może on jednak w pełni służyć analizie zgromadzonej leksyki, ponieważ nie daje możliwości wyświetlania przypisów. Z pewnością nie jest on jedynym programem, którego można użyć w badaniu tekstów dawnych, jednak został wybrany ze względu na darmowy dostęp i przyjazny użytkownikowi interface. 26 Program wykazuje pewne błędy podczas analizy korpusów języków izolujących, np. wietnamskiego. Por. Jakub Królczyk, Błędy programu do obróbki korpusu, podczas badań korpusowych słownictwa biznesowego i prawnego w języku wietnamskim, na przykładzie programu AntConc, Investigationes Linguisticae nr 31, 2014, s. 5 17, http://pressto.amu.edu.pl/index.php/il/issue/view/118 [dostęp: 4.02.2016]. 19

#NARZĘDZIA Badanie XVI-wiecznych przekładów Ewangelii na język polski za pomocą przedstawionych programów pokazuje, że w humanistyce cyfrowej jest miejsce zarówno dla metodologii wykorzystywanych na długo przed ewolucją cyfrową (np. metodologii analizy polowej), jak i dla nowych sposobów uprawiania nauki. Przedstawiony projekt i oprogramowanie dają ponadto możliwość analizy tekstów, które na co dzień są niedostępne. Dzięki nim światowe dziedzictwo kultury zostaje włączone w porządek cyfrowy (udostępniane w Internecie); możliwe jest także jego badanie za pomocą różnych programów komputerowych. Zaprezentowane narzędzia badawcze eliminują konieczność doboru próby przedmiotem badania może być wybrana część tekstu, cały tekst lub zbiór tekstów. 20

Dorota Kondratczyk- -Przybylska Przydatność narzędzi cyfrowych w badaniach pól leksykalnych na przykładzie Słowosieci #NARZĘDZIA Choć możliwości wykorzystywania nowinek technicznych do badań języka są dla współczesnych naukowców oczywiste, jeszcze kilkadziesiąt lat temu były nierealnym marzeniem. Każda analiza słownictwa poprzedzona ekscerpcją materiału leksykograficznego wymagała od badacza wielu godzin spędzonych w bibliotekach na czymś, co dla laika wydawałoby się kuriozalne czytaniu słowników strona po stronie. Postęp technik digitalizacyjnych sprawił, że wszystkie najważniejsze słowniki mogą być rozpowszechniane w wersji cyfrowej. Współcześnie mamy zatem dostęp nawet do najstarszych i najrzadszych publikacji z każdego miejsca na świecie. Coraz częściej są one także wyposażone w zestaw narzędzi, który mozolną pracę godną średniowiecznych mnichów zmienia w jedno kliknięcie. Dzięki tym osiągnięciom możliwe jest tworzenie całych map słownictwa i ukazywanie pojedynczych wyrazów w powiązaniu z innymi jednostkami, a co za tym idzie analizowanie całych pól leksykalnych. Celem artykułu jest ukazanie możliwości zastosowania narzędzi cyfrowych w badaniach pól leksykalnych na przykładzie interesującego zjawiska dotyczącego hierarchizacji pojęć i wzajemnych powiązań jednostek leksykalnych, jakim jest wordnet, a w szczególności jego polska realizacja Słowosieć. Za pole leksykalno-znaczeniowe uznaje się grupę wyrazów powiązanych wspólnym znaczeniem, między którymi istnieją określone relacje znaczeniowe mające dawać w konsekwencji system zwarty i hierarchiczny 1. Przytoczona definicja Ryszada Tokarskiego stanie się podstawą niniejszej analizy. Najstarszy i, jak do tej pory, największy wordnet na świecie Princeton WordNet powstał pod koniec lat 80. na Uniwersytecie w Princeton jako leksykalna baza języka angielskiego 2. Inspiracją do jego stworzenia były badania psycholingwistyczne nad mechanizmami zapamiętywania słów, a głównym założeniem stworzenie struktury odzwierciedlającej proces akwizycji znaczeń leksykalnych u dzieci 3. WordNet jest zatem u swych podstaw strukturą porządkującą sensy (pojęcia), 1 Ryszard Tokarski, Struktura pola znaczeniowego, Warszawa 1984, s.11. 2 About WordNet, WordNet, Princeton University 2010, http://wordnet.princeton.edu [dostęp: 5.04.2015]. 3 Maciej Piasecki, Stansław Szpakowicz, Bartosz Broda, A Wordnet from The Ground Up, Wrocław 2009, s. 7. 21

#NARZĘDZIA nie zaś jak ma to miejsce w przypadku tradycyjnych słowników jedynie jednostki leksykalne 4. Pomimo to można go nazwać rodzajem tezaurusa, bazą jednostek leksykalnych uporządkowanych według kryterium semantycznego lub po prostu siecią leksykalno-semantyczną, której węzłami są jednostki leksykalne, a nićmi spajającymi całość relacje semantyczne pomiędzy jednostkami 5. Potwierdza to struktura WordNetu jego najmniejszym samodzielnym elementem jest synset, czyli zbiór słów odnoszących się do tego samego pojęcia 6. Pomysł stworzenia podobnej bazy leksykalnej dla języka polskiego wykorzystała Grupa Technologii Językowych Politechniki Wrocławskiej, która w 2009 roku udostępniła w Internecie pierwszą wersję polskiego wordnetu Słowosieć. Obecnie to największy polski i drugi co do wielkości wordnet na świecie, który nieustannie się rozrasta. Zawiera 142 000 rzeczowników, czasowników i przymiotników, 200 000 znaczeń oraz ponad 500 000 relacji 7. Twórcy Słowosieci przyznają, że wordnet jako swoisty gatunek może być trudny do jednoznacznego zdefiniowania 8. To zarazem sieć semantycznych relacji leksykalnych, tezaurus słownik pojęciowy, komputerowy słownik synonimów, baza leksykalna dla języka, struktura odzwierciedlająca taksonomię pojęciową, jak i zwykły słownik (kolejne opracowanie leksykograficzne) 9. Badacze wykorzystujący to narzędzie do różnorodnych analiz koncentrują się na jego strukturze i funkcjonalności. Dlatego przyjmują, że: Poprzez Słowosieć należy rozumieć sieć semantycznych relacji leksykalnych dla języka polskiego, w której znaczenie jednostki leksykalnej jest opisywane poprzez umieszczenie tej jednostki w sieci powiązań wyrażających relacje znaczeniowe, w jakie wchodzi ona z innymi jednostkami 10. Obecnie Słowosieć może służyć także jako słownik polsko-angielski i angielsko-polski, ponieważ została połączona ze wspomnianym już Princeton WordNet. Jest tym samym ważnym zasobem w komputerowym przetwarzaniu języka i badaniach nad sztuczną inteligencją, m.in. znajduje zastosowanie w automatycznych tłumaczeniach Google Translate 11. Struktura wordnetu jest dostosowana do potrzeb automatycznej analizy tekstów. Jest to w istocie podstawowy zasób językowy, ważny dla badań nad sztuczną inteligencją. Dzięki Słowosieci komputerom będzie łatwiej uczyć się rozumieć polszczyznę i Polaków. 4 Marta Dobrowolska, Hiponimy miejsca w polskiej Słowosieci i amerykańskiej bazie WordNet, LingVaria 2013, nr 1 (15), s. 254. 5 Słowosieć, http://nlp.pwr.wroc.pl/narzedzia-i-zasoby/slowosiec [dostęp: 5.04.2015]. 6 Marta Dobrowolska, dz. cyt., s. 254. 7 O Słowosieci, http://plwordnet.pwr.wroc.pl/wordnet/about [dostęp: 5.04.2015]. 8 Maciej Piasecki, Stanisław Szpakowicz, Bartosz Broda, dz. cyt., s. 7. 9 Agnieszka Dziob, Paulina Łazarewicz, Słowosieć jako narzędzie wspomagające pracę tłumacza, Rocznik Kognitywistyczny 2011, z. 5, s. 34. 10 Tamże. 11 O Słowosieci, dz. cyt. 22

#NARZĘDZIA Co warte zauważania, Słowosieć jest budowana półautomatycznie: dane zaczerpnięte z korpusu IPI PAN zostały przefiltrowane pod względem częstości występowania, a następnie poddane analizie we współpracy z lingwistami 12. Wytypowano jednostki leksykalne oraz określono relacje semantyczne, w jakie mogą one wchodzić w najczęstszych użyciach. Dzięki wykorzystaniu tej metody w Słowosieci znajdują się jednostki, które są faktycznie wybierane przez użytkowników języka polskiego i które cechuje dosyć wysoka frekwencja 13. Choć Słowosieć jest wzorowana na Princeton WordNet, znacząco się od niego różni budową. Zmiany zostały podyktowane m.in. specyfiką języka polskiego. Relacje w Słowosieci podzielono na dwie klasy: relacje konstytutywne i relacje jednostek. Pierwszy rodzaj jest charakterystyczny dla pojedynczych jednostek i nie może być współdzielony. Takie są relacje derywacyjne, z natury rzeczy unikalne, lub relacje antonimii żaden wyraz nie może zastąpić przymiotnika mały w relacji antonimii do przymiotnika duży i na odwrót, nawet tak bliskie znaczeniowo, jak np. nieduży i niemały 14. Relacje jednostek uznawane są zatem za charakterystyczne dla unikalnych par wyrazów i nie są współdzielone pomiędzy zbiorami jednostek. Przeciwny mechanizm zachodzi w relacjach konstytutywnych mogą one być dzielone pomiędzy jednostkami leksykalnymi, tak jest np. z hiponimią, która może zachodzić pomiędzy wieloma jednostkami równocześnie, tzn. dwie różne jednostki leksykalne mogą jednocześnie być hiperonimami tej samej jednostki (albo zbioru jednostek).. To relacje konstytutywne wyznaczają strukturę Słowosieci, gdyż dzięki nim każda jednostka leksykalna ma ściśle określone miejsce w sieci wzajemnych powiązań. Ponieważ relacje konstytutywne mogą (choć nie muszą) być współdzielone, zdarza się, że kilka jednostek zajmuje to samo miejsce w systemie relacji takie jednostki nazywamy synonimami, a zbiory synonimów synsetami 15. Właśnie synonimia stanowi relację najbardziej charakterystyczną dla wordnetu. Jest ona bowiem podstawą wyodrębnienia najmniejszej jednostki wspomnianego już synsetu. Synset to zbiór synonimów lub zbiór słów o tej samej klasie gramatycznej, które są równoznaczne w danym kontekście. Synonimia zaś definiowana jest tu jako hiponimia wzajemna, tzn.: jeśli dwie jednostki leksykalne a i b są równoznaczne w danym kontekście, a przy tym tylko jedna z nich jest równoznaczna z jednostką c w innym kontekście, nie można włączyć jednostki c do synsetu {a, b}. Powstać powinien jeszcze jeden synset 16. Istotne dla tworzenia synsetu w Słowosieci są także warunki dotyczące relacji hipo-/hiperonimii oraz mero-/holonimii. Zakłada się, że wszystkie jednostki należące do danego synsetu powinny być hiponimami tego samego zbioru jednostek leksykalnych oraz wszystkie one powinny być hi- 12 Komputerowe przetwarzanie wiedzy, pod red. Tomasza Kubika, Wrocław 2012/2013, s. 15. 13 Agnieszka Dziob, Paulina Łazarewicz, dz. cyt., s. 7. 14 Relacje Słowosieci, http://nlp.pwr.wroc.pl/pl/slowosiec-20/relacje-slowosieci [dostęp: 5.04.2015]. 15 Tamże. 16 Joanna Rabiega-Wiśniewska, Marek Maziarz, Maciej Piasecki, Stanisław Szpakowicz, Opis relacji leksykalno-semantycznych w Słowosieci 2.0. Rzeczownik, Wrocław 2011, s. 7; na prawach rękopisu http://nlp.pwr.wroc.pl/ltg/attachments/article/35/rzeczownik_pre4.pdf [dostęp: 5.04.2015]. 23

#NARZĘDZIA peronimiczne względem jednostek podrzędnych w hierarchii. Również pozostałe relacje synsetów powinny być dzielone przez synonimy, np. relacja meronimii, jeśli się pojawia, powinna być wspólna dla wszystkich jednostek danego synsetu 17. Niespełnienie wyznaczonych warunków wyklucza jednostkę z synsetu, tym samym nie może być nazwana synonimem. Opisana procedura przekłada się bezpośrednio na określenie miejsca, które tożsame znaczeniowo jednostki zajmują w pajęczynie wordnetu powinny być one identyczne: Spośród trzech głównych warstw znaczeniowych leksemu: (a) denotacji, (b) konotacji i (c) nacechowania stylistycznego na kształt Słowosieci wpływ mają (a) i (c). Jednostki o odmiennej konotacji, ale tym samym znaczeniu denotacyjnym są w Słowosieci synonimami, o ile nie różnią się w istotny sposób rejestrem stylistycznym 18. Szczegółowo przedstawiono tę relację w poniższej tabeli: Tab. 1 Elementy znaczenia jednostki leksykalnej 19 Aby dwie jednostki zostały uznane za synonimy, muszą spełnić poniższy test 20 : Test 1. Synonimia Warunek: X i Y mają wspólny hiperonim i wchodzą w identyczne relacje synsetów. Wyrażenia testowe: TAK Jeśli ktoś/coś jest X-em, to jest także Y-em. TAK Jeśli ktoś/coś jest Y-em, to jest także X-em. Jeśli między dwiema jednostkami leksykalnymi występują różnice rejestrów stylistycznych przy jednoczesnej tożsamości znaczenia denotacyjnego, oznacza to, że zachodzi między nimi synonimia międzyrejestrowa, czyli relacja bliskoznaczności. Rozróżnienie synonimii i bliskoznaczności znaj- 17 Tamże. 18 Tamże. 19 Tamże. 20 Przywoływane testy w obrębie tego rozdziału pochodzą z artykułu: Joanna Rabiega-Wiśniewska, Marek Maziarz, Maciej Piasecki, Stanisław Szpakowicz, dz. cyt. 24

#NARZĘDZIA duje odbicie w odmiennych relacjach leksykalnych tych jednostek, a w szczególności odmiennych relacjach hiponimicznych. Podobieństwo rejestrów stylistycznych przedstawia poniższa tabela, w której znakiem plus oznaczono rejestry nieróżniące się w istotnym stopniu: Tab. 2 Podobieństwo rejestrów stylistycznych 21 Wyznaczanie synsetów bliskoznacznych pozwala uniknąć synsetów złożonych z jednostek, co do których powstaje wątpliwość, czy są synonimiczne. Test na bliskoznaczność opisuje poniższy schemat: Test 2. Bliskoznaczność Warunek: X i Y mają wspólny hiperonim, zbiory ich hiponimów nie pokrywają się. Wyrażenia testowe: X i Y mają wspólny hiperonim, zbiory ich hiponimów nie pokrywają się. X i Y nie są synonimami. Jeśli ktoś/coś jest X-em, to jest także Y-em [pomijając różnicę rejestrów stylistycznych] Jeśli ktoś/coś jest Y-em, to jest także X-em [pomijając różnicę rejestrów stylistycznych] 21 Tamże, s. 10. 25

#NARZĘDZIA O hierarchicznej strukturze Słowosieci stanowią relacje hiponimii i hiperonimii. Są one szczególnie istotne dla opisu rzeczowników hiponimia jest relacją między jednostkami należącymi do tej samej klasy fleksyjnej. Obrazuje to następujący test: Test 3. Hiponimia Warunek: Jednostki leksykalne synsetu X stanowią rodzaj jednostek synsetu Y, istnieje jeszcze co najmniej jeden synset Z, którego jednostki są rodzajem jednostek leksykalnych synsetu Y. Wyrażenia testowe: TAK Jeśli ktoś/coś jest X-em, to musi być także Y-em. TAK Jeśli ktoś/coś jest Y-em, to niekoniecznie musi być X-em. TAK Jeśli ktoś/coś nie jest Y-em, to nie może być X-em. Poza powyżej opisanymi podstawowymi relacjami Słowosieci o miejscu w pajęczynie wordnetu decydują także następujące relacje: synonimia międzyparadygmatyczna antonimia (antonimia komplementarna, antonimia właściwa, konwersja) meronimia (meronimia taksonomiczna) holonimia (holonimia taksonomimczna) relacje zawierania roli i rola nosiciel stanu cechy, stan cecha żeńskość nacechowanie mieszkaniec derywacyjność Choć opisane powyżej relacje relacje jednostek i relacje konstytutywne wyczerpują wspomniany powyżej podział na dwie klasy, w Słowosieci spotykamy jeszcze jeden typ relacji niemieszczący się w żadnej z obu klas relacje współdzielone niekonstytutywne. Rozróżnienie relacji konstytutywnych i relacji współdzielonych niekonstytutywnych jest oparte na trzech kryteriach: 26

#NARZĘDZIA 1. kryterium semantycznym relacje konstytutywne są znane językoznawcom leksykologom i dobrze opisane w literaturze, 2. kryterium leksykograficznym relacje konstytutywne są często stosowane w definicjach haseł słownikowych, 3. kryterium frekwencyjnym relacje konstytutywne są częste w języku (i w jego modelu wordnecie) 22. Relacje, które nie spełniają tych kryteriów, ale mogą być współdzielone pomiędzy zbiorami jednostek leksykalnych, zaliczamy do trzeciej grupy relacji. Taką relacją niekonstytutywną jest fuzzynimia. Zachodzi ona pomiędzy zbiorami jednostek leksykalnych i ma znaczenie X jest jakoś związane z Y. Jest zatem bardzo ogólną i trudną do uchwycenia relacją semantyczną. Fuzzynimią połączono w Słowosieci np. czasowniki miauczeć wydawać serię dźwięków miau i miauknąć raz zamiauczeć z rzeczownikiem kot. Skoro węzłami Słowosieci są jednostki leksykalne, czyli wyrazy i ich znaczenia różnorako połączone relacjami semantycznymi ze ściśle określonego repertuaru, można ją uznać za narzędzie pozwalające śledzić określone pola semantyczne, a ponadto relacje jednostek leksykalnych i semantycznych w odniesieniu do większej liczby pól. Wykorzystując Słowosieć jako narzędzie badawcze, spróbujemy przyjrzeć się jednostce przyjaciel. Wyszukiwanie przez główną przeglądarkę Słowosieci pozwala nam zaobserwować, że w ramach tego narzędzia funkcjonują trzy jednostki semantyczne określone mianem: przyjaciel 1, przyjaciel 2 kochanek, osoba, z którą zdradza się partnera, przyjaciel 3. Wszystkie trzy znajdują się w domenie ludzie i odpowiadają w przybliżeniu podziałowi znaczeniowemu przyjętemu przez Uniwersalny słownik języka polskiego 23 : 1. «osoba pozostająca z kimś w bliskich, serdecznych stosunkach, żyjąca z kimś w przyjaźni, darzona zaufaniem» 2. «osoba okazująca komuś lub czemuś swoją sympatię, sprzyjająca czemuś; zwolennik, miłośnik, protektor» 3. «mężczyzna utrzymujący z kimś kontakty erotyczne; kochanek» Właśnie jednostka przyjaciel 1 zostanie poddana analizie przy pomocy omawianego narzędzia. Jej miejsce w siatce pojęciowej obrazują poniższe ścieżki: 22 Relacje Słowosieci, dz. cyt. 23 Uniwersalny słownik języka polskiego, pod red. Stanisława Dubisz, wersja 1.0 na płycie CD, Warszawa 2004; dalej USJP. 27

#NARZĘDZIA Ścieżka 1: istota 1 osoba 4 człowiek 1 nosiciel cechy 1 charakter 4 dusza 1 bratnia dusza 1 przyjaciel 1 Ścieżka 2: istota 1 osoba 4 człowiek 1 człowiek ze względu na relacje społeczne 1 swój 1 znajomy 1 bratnia dusza 1 przyjaciel 1 Ścieżka 3: istota 1 osoba 4 człowiek 1 nosiciel cechy 1 człowiek oceniany pozytywnie 1 swój 1 znajomy 1 bratnia dusza 1 przyjaciel 1 Każda ze ścieżek ukazuje jednostki nadrzędne względem pojęcia przyjaciel 1. Jednostką najwyższego rzędu jest we wszystkich przypadkach istota 1 człowiek, duch, zwierzę każde żywe stworzenie lub byt myślący, która znajduje się w domenie najwyższe w hierarchii. Opis poparty jest przykładem: Na szacunek zasługuje każda żywa istota, która funkcjonuje na tym świecie. Jednostka ta nie znajduje się w relacji synonimii ani bliskoznaczności. Choć wydaje się przez to trudna do jednoznacznego zdefiniowania i bardzo pojemna znaczeniowo, na zrozumienie prezentowanych ciągów wpływa analiza jednostek niższego rzędu, również wspólnych wszystkim ścieżkom: 1. osoba 4 istota inteligentna, uosobienie w domenie ludzie ; 2. człowiek 1 w relacji synonimicznej z: a. osoba 1 istota żywa wyróżniająca się najwyższym stopniem rozwoju psychiki i życia społecznego, posiadająca kulturę i zdolna do jej tworzenia, b. istota ludzka 1 istota żywa wyróżniająca się najwyższym stopniem rozwoju psychiki i życia społecznego, posiadająca kulturę i zdolna do jej tworzenia c. persona 2 człowiek, istota ludzka d. jednostka 2 pojedynczy człowiek. 28

#NARZĘDZIA Ścieżki 1 i 3 jako kolejny stopień hierarchii przyjmują jednostkę nosiciel cechy 1. W ścieżce pierwszej ową cechą jest pewna predyspozycja charakteru związana z cechami psychicznymi danej osoby (charakter 4 przenośnie o człowieku ze względu na jego cechy psychiczne ), natomiast w ścieżce 3 dominuje zewnętrzna ocena danej jednostki przez inne osoby człowiek oceniany pozytywnie 1. Powyższe spostrzeżenie zdaje się potwierdza dalsza budowa obu ścieżek. Pierwsza z nich określa miejsce jednostki przyjaciel 1 w siatce znaczeń na podstawie cech immanentnych jednostki (charakter 4 > dusza 1 > bratnia dusza 1), natomiast druga ze względu na ocenę więzi i relacji z punktu widzenia innych osób (swój 1 > znajomy 1 > bratnia dusza 1 > przyjaciel 1). Ścieżka 2 określa natomiast przyjaciela 1 nie ze względu na posiadane lub przypisywane cechy, ale ze względu na miejsce osoby określanej tym mianem w społeczeństwie (człowiek ze względu na relacje społeczne 1). Mimo że ścieżki 2 i 3 wydają się podobne, ta jedna cecha determinuje ich rozróżnienie i pozwala na ogląd jednostki we wszystkich właściwych kontekstach. Należy również zauważyć, że każda ze ścieżek sytuuje jednostkę bratnia dusza 1 jako nadrzędną, hiperonimiczną, wobec przyjaciel 1 i powiązaną relacją synonimii z jednostkami pokrewna dusza 1 i przyjazna dusza 1 24. Zgodnie z przyjętymi założeniami za hiponim wymienionych trzech jednostek uznano wyraz przyjaciel 1. Sama jednostka przyjaciel 1 nie tworzy jednak relacji synonimii, co oznacza, że jest pojęciem niezastępowalnym. Za jednostki bliskoznaczne w stosunku do pojęcia przyjaciel 1 uznano: amikus 1 używane niegdyś określenie przyjaciela, kum 2, pobratymiec 2. Wszystkie trzy powinny spełniać warunek posiadania wspólnego hiperonimu, a zbiory ich hiponimów nie powinny się pokrywać. Nie powinny być także synonimami. Narzędzie nie dostarcza jednak informacji, co do hiponimów wymienionych jednostek. Potwierdzenie wniosków o ich wzajemnym powiązaniu możemy potwierdzić zatem za pomocą przywoływanego już testu: Jeśli ktoś/coś jest przyjacielem, to jest także amikusem [pomijając różnicę rejestrów stylistycznych]. Jeśli ktoś/coś jest amikusem, to jest także przyjacielem [pomijając różnicę rejestrów stylistycznych]. W opisie Słowosieci rzeczownik amikus 1 jest charakteryzowany jedynie przez bliskoznaczność z jednostką przyjaciel 1, więc element dookreślający tę jednostkę używane niegdyś określenie przyjaciela wydaje się w tym przypadku niezbędny. Ta informacja rozwiewa również wszelkie wątpliwości 24 Wartą zauważenia relacją jest tu fuzzynimia synsetów, która odwołuje się do jednostki więź 1, definiowanej jako to, co jednoczy, zespala, łączy ludzi ze sobą, która jest elementem wielu definicji słownikowych wyrazu przyjaciel. 29

#NARZĘDZIA dotyczące rejestru stylistycznego porównywanej jednostki i jej nacechowania chronologicznego. Co warte zauważenia, wyraz ten nie jest notowany ani w USJP, ani WSJP, choć pierwszy ze słowników odnotowuje słownictwo nacechowane chronologicznie. Wyraz kum 2 ukazany jest w relacji synonimicznej do kumoter 2. Choć wyraz kum opatrzony jest w USJP kwalifikatorem pot. (potoczny), funkcjonuje w dwóch znaczeniach a) ojciec chrzestny w stosunku do matki chrzestnej i do rodziców dziecka lub ojciec dziecka w stosunku do jego rodziców chrzestnych oraz b) przyjaciel, towarzysz. W Słowosieci znaczeniu a) odpowiada jednostka kum 1 ( ojciec chrzestny czyjegoś dziecka lub ojciec dziecka, które jest czyimś chrześniakiem ), której hiperonimem jest człowiek ze względu na relacje społeczne 1 w domenie ludzie, a znaczeniu b) właśnie kum 2. Powiązanie synonimiczne jednostki kum 2 z kumoter 2, mimo braku wyraźnych wskazówek w samej Słowosieci, pozwala nam również dostrzec różnicę w nacechowaniu obu wyrazów. Skoro jako synonimy muszą być bliskie pod względem rejestru stylistycznego, prawdopodobnie uznano je za jednostki nacechowane chronologicznie, na co wskazywałby kwalifikator przestarzały nadany leksemowy KUMOTER w USJP. W przywołanym słowniku KUMOTER występuje w dwóch znaczeniach: a) dobry znajomy, przyjaciel, kum oraz b) ktoś z grupy związanej wspólnymi interesami, pokrewieństwem. W Słowosieci zaś jednostka kumoter 1, której hiperonimem jest znajomy 1, a derywatem kumoterstwo, wchodzi w relację holonimii (elementu kolekcji) z wyrazem klika. Jednostka kumoter 1 bliższa jest zatem znaczeniu b). Kumoter 2 będący w relacji bliskoznaczności z przyjacielem 1 jest bliższy znaczeniu a) 25. Można więc uznać, że: Jeśli ktoś/coś jest przyjacielem, to jest także kumem [pomijając różnicę rejestrów stylistycznych]. Jeśli ktoś/coś jest kumem, to jest także przyjacielem [pomijając różnicę rejestrów stylistycznych]. Ostatnią jednostką uznaną za bliskoznaczną w stosunku do przyjaciel 1 jest pobratymiec 2. USJP definiuje jednostkę pobratymiec w dwóch znaczeniach: a) człowiek pochodzący z tego samego szczepu, co ktoś inny, mówiący tym samym albo pokrewnym językiem, b) człowiek, którego łączy z kimś pobratymstwo, związek przyjaźni; przyjaciel, druh. Znaczeniu a) odpowiada w Słowosieci jednostka pobratymiec 1 synonimiczna względem jednostek rodak 1, swojak 1, kompatriota 1 oraz bliskoznaczna z ojczyc 1 i współziomek 1. Przywołana w kontekście przyjaciela 1 jednostka pobratymiec 2 bliska jest znaczeniu b) i sklasyfikowana jako bliskoznaczna z brat 4 26. Słowosieć określa fuzzynimię syn- 25 Warto wspomnieć, że Słowosieć notuje również jednostkę kumoter 3 w gwarze podhalańskiej rodowity góral, która nie jest notowana w USJP ani WSJP. Co więcej, do opisu jednostki dołączono przykład użycia: Kumoterki w gwarze podhalańskiej: gońba to wyścig dwuosobowej pary góralskiej po śniegu w małych saniach, używanych przez kumotra (rodowitego górala) i kumoszkę (rodowitą góralkę, często zwaną też babą ) oraz powiązano go z derywatem kumoszka 3 w gwarze podhalańskiej rodowita góralka) oraz kumoterki (góralskie sanie, w których odbywa się wyścig nazywany kumoterki ). 26 Hiperonimy tej jednostki to równiacha 1 i przyjaciel 1. 30

#NARZĘDZIA setów z jednostką stronnik 1, co znajduje swoje odzwierciedlenie w diachronicznej analizie pojęcia przyjaciel 27. Co warte zaznaczenia w kontekście relacji bliskoznaczności, jednostka ta jest opatrzona w USJP kwalifikatorem książk., podobnie jak bratania dusza 1: Jeśli ktoś/coś jest przyjacielem, to jest także pobratymcem [pomijając różnicę rejestrów stylistycznych]. Jeśli ktoś/coś jest pobratymcem, to jest także przyjacielem [pomijając różnicę rejestrów stylistycznych]. Wiele do opisu jednostki przyjaciel 1 wnoszą jej hiponimy, za które uznano: opoka 4, brat syjamski 1, brat 4, przyjaciel domu 1. Opoka 4 to jednostka podrzędna względem pojęć: filar 5 osoba, na której można polegać, od której zależy powodzenie czegoś, ostoja 2 (domena: związane z myśleniem), monolit 3 (domena: ludzie), przyjaciel 1 (domena: ludzie). Związana jest relacją fuzzynimii synsetów z pojęciem zaufanie w domenie: uczucia, odczucia, emocje. Brat syjamski 1, jako hiponim, znajduje się poziom niżej od jednostki przyjaciel 1 w ścieżce 1. Usytuowanie w tym ciągu hierarchicznym pozwala stwierdzić, że mimo braku definicji i opisu innych relacji, w jakie wchodzi brat syjamski 1, znaczenie tej jednostki obejmuje nosicielstwo cechy określonej w znaczeniu bratnia dusza 1 i odwołanie do przywoływanej już relacji fuzzynimii synsetów więź 1. Hiponim brat 4 jest zaś bliskoznaczny z wyrazem pobratymiec 2 i powiązany z jednostką nacechowaną (deminutywy): bratek 1, która oznacza koleżeńskie określenie drugiego człowieka, często używane ironicznie. Brat 4 jest podrzędny wobec jednostki równiacha 1 oraz nadrzędny względem brach 1. Przyjaciel domu 1 jest w tym ujęciu hiponimem przyjaciel 1, więc traktowany jest jako odrębne pojęcie. USJP odnotowuje to wyrażenie w haśle przyjaciel jedynie jako częste połączenie, niemające statusu związku frazeologicznego. Jednostki podrzędne wobec niego to: rodzic chrzestny 1, przyszywany wujek 1, przyszywana ciocia 1, fuzzynimy synsetów zaś: najbliższa rodzina 1 hiponimiczne względem jednostki domownicy 1 holonim gospodarstwo domowe 1 grupa ludzi (najczęściej spokrewnionych), która posiada wspólny majątek i nim zarządza oraz dysponuje wspólnym budżetem w celu zaspokajania swoich głównych potrzeb. Z przytoczonych powiązań wynika zatem, że przyjaciel domu 1 może, ale nie musi być w relacji pokrewieństwa lub powinowactwa wobec osoby określającej go takim mianem. Jest jednak jakoś związany z domownikami (domownicy 1), trudno tę relację jednak dokładnie sprecyzować. Z powyższej analizy wynika, że jednostki hiponimiczne względem przyjaciel 1 (opoka 4, brat syjamski 1, brat 4, przyjaciel domu 1) powiązane są z cechami, takimi jak zaufanie, więzi, bliskość, wspólnota, które ujawniały się ze zmiennym nasileniem w znaczeniu pojęcia przyjaciel 1 w różnych okresach historycznych 28. 27 Zob. Dorota Kondratczyk-Przybylska, O przyjacielu w dawnej i współczesnej polszczyźnie, [w:] Dać wyraz uczuciom. Analizy na podstawie tekstów kultury i wypowiedzi młodzieży, Rzeszów 2015. 28 Zob. tamże. 31

#NARZĘDZIA Do pełnego opisu omawianego pojęcia przydatna może być również analiza jednostek traktowanych przez Słowosieć jako antonimy (właściwe). Według twórców Słowosieci relacja antonimii wskazuje każdą znaczeniową przeciwstawność między jednostkami leksykalnymi, wyjąwszy konwersję 29. Do antonimów zaliczono: antonimy komplementarne, np. kręgowiec bezkręgowiec, antonimy właściwe (tak zwane czyste antonimy), np. dzień noc, antonimy kierunkowe, np. północ południe, antonimy kulturowe (tzn. związane z kulturowym widzeniem i opisywaniem świata, obyczajowością, tradycją również językową), np. anioł diabeł 30. Podobnie jak synonimia antonimia jest relacją zachodzącą między jednostkami o tej samej klasie gramatycznej. Nie zawsze jednak jednostki, których dotyczy kontrast, są w opozycji binarnej. Antonimy znajdują się po przeciwnych stronach osi wartości cechy ciągłej (w równej odległości od neutralnego elementu zbioru kohiponimów) i mogą między nimi występować stany pośrednie, np. dobry i zły może istnieć coś, co nie jest ani dobre, ani złe. Aby jednostka została uznana za antonim właściwy musi spełniać określone warunki i przejść test: Test 4. Antonimia właściwa Warunek: X, Y to kohiponimy lub komeronimy lub hiponimy antonimów albo konwersów. Wyrażenia testujące: TAK To jest X? Nie, wręcz przeciwnie, to jest Y! TAK Jeśli ktoś/coś jest X-em, to nie może być Y-em TAK Jeśli ktoś/coś jest Y-em, to nie może być X-em NIE Jeśli ktoś/coś jest dla kogoś/czegoś X-em, to ktoś/coś jest dla kogoś/czegoś Y-em. Za antonimy właściwe dla jednostki przyjaciel 1 uznano wróg 1 (domena: ludzie ), i nieprzyjaciel 1 (domena: ludzie ). Trudno zbadać podany warunek bez znajomości całej siatki obu pojęć, można jednak spróbować przeprowadzić test: TAK To jest nieprzyjaciel? Nie, wręcz przeciwnie, to jest przyjaciel! TAK Jeśli ktoś jest nieprzyjacielem, to nie może być przyjacielem. 29 Joanna Rabiega-Wiśniewska, Marek Maziarz, Maciej Piasecki, Stanisław Szpakowicz, dz. cyt., s. 16. 30 Tamże. 32

#NARZĘDZIA TAK Jeśli ktoś jest przyjacielem, to nie może być nieprzyjacielem. NIE Jeśli ktoś jest dla kogoś nieprzyjacielem, to ktoś jest dla kogoś przyjacielem. Choć z punktu widzenia logiki test wydaje się jak najbardziej spójny, trudno uwierzyć, żeby zdania tego typu zostały wypowiedziane przez użytkownika języka polskiego. Znacznie prawdopodobniejsze wydawałoby się następujące wypowiedzi: TAK To jest wróg? Nie, wręcz przeciwnie, to jest przyjaciel! TAK Jeśli ktoś jest wrogiem, to nie może być przyjacielem. TAK Jeśli ktoś jest przyjacielem, to nie może być wrogiem. NIE Jeśli ktoś jest dla kogoś wrogiem, to ktoś jest dla kogoś przyjacielem. Miejsce jednostki przyjaciel 1 w siatce znaczeń wyznaczone jest również przez powiązanie z holonimami (elementami kolekcji), za które uznano pojęcia dioskurowie 1 nierozłączni przyjaciele, papużki nierozłączki 1 (w domenie grupy ludzi i rzeczy ). Pierwszy z wymienionych holonimów notowany jest w USJP jako określenie z mitologii greckiej synowie Zeusa, nierozłączni bliźniacy Kastor i Polluks oraz w znaczeniu przywołanym w Słowosieci z kwalifikatorem książk. Wyrażenie papużki nierozłączki USJP określa jako frazeologizm, nie zaś samodzielną jednostkę, określoną kwalifikatorem ekspresywnym żart. żartobliwy, który oddaje [ ] humorystyczne nastawienie nadawcy wypowiedzi do treści (desygnatów) jednostki słownikowe 31. Znaczenie tego frazeologizmu słownik określa następująco o dwóch osobach, które bardzo się lubią i spędzają ze sobą dużo czasu. Na pierwszy rzut oka wydaje się, że definicja ta jest zbyt szeroka, bo może ona dotyczyć także wyrazu kolega. Według USJP kolega to jednak towarzysz pracy, nauki, zabawy. Wynika z tego, że wcale nie musimy kogoś lubić, by określić go takim mianem. Nie musimy przecież darzyć pozytywnymi uczuciami wszystkich kolegów ze szkoły czy pracy. Czasem jesteśmy po prostu zmuszeni do wspólnego spędzania czasu. Papużki nierozłączki I to zatem przyjaciele, ale tacy, których jest tylko dwóch. Owa podwójna relacja między przyjaciółmi jest zatem cechą definicyjną. Choć w Słowosieci bezpośrednio nie opisano znaczenia tego wyrażenia, ma ono swoje odbicie w powiązaniu z hiperonimem dwójka 1. Opis będzie kompletny, jeśli przywołamy synonimy dwójka 1, czyli duet 1, dwójca 1, para 1 dwie osoby, czy tandem 2 dwoje ludzi pracujących razem nad czymś, zespół; także zespół dwojga sportowców. W poniższej tabeli przedstawiono siatkę relacji, w jakie wchodzi jednostka przyjaciel 1, która stanowi podsumowanie powyższej analizy: 31 Słownik i słownictwo, [w:] Uniwersalny słownik języka polskiego, dz. cyt. 33

#NARZĘDZIA Tab. 3. Hierarchia znaczeń z uwzględnieniem jednostek synonimicznych i bliskoznacznych Wykorzystanie Słowosieci, w kompletowaniu i analizie pola leksykalnego przyjaciel 1 pozwala ukazać ogromną przydatność tego narzędzia w badaniu słownictwa. Jego udoskonalanie wpływa na coraz precyzyjniejszy opis jednostek współczesnego języka polskiego i ukazanie trudno uchwytnych powiązań, które funkcjonują między nimi, a są niewidoczne w tradycyjnym oglądzie słownikowym. Na uwagę zasługuje wyróżnienie relacji fuzzynimii, która choć pozostaje relacją nieokreśloną 34