Elektroniczny Korpus Textow Polſkich z XVII i XVIII w. (do 1772 r.)

Podobne dokumenty
Włodzimierz Gruszczyński. Instytut Języka Polskiego PAN Korpusy Diachroniczne Polszczyzny Katowice, kwietnia 2017 r.

KORBEUSZ. Włodzimierza Grußczyńſkiego, Dorotę Adamiec, Renatę Bronikowſką Inſtytut Języka Polſkiego PAN

KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)

Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki

NAKŁADKA KORPUSOWA (NKJP, KORBA) OPARTA O TRADYCYJNĄ KLASYFIKACJĘ CZĘŚCI MOWY. Emanuel Modrzejewski.

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk

KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN

Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN

Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)

Doświadczenia z prac nad Korpusem tekstów polskich z XVII i XVIII wieku

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

1 Narzędzia przetwarzania 2 tekſtów hiſtorycznych

Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego

Tworzenie korpusu tekstów dawnych a korpusu tekstów współczesnych: różnice teoretyczne i warsztatowe

Instrukcja korzystania z wyszukiwarki do Elektronicznego Korpusu Tekstów Polskich z XVII i XVIII wieku (do 1772 r.)

LISTA LAUREATÓW Anna K. Marek K. Karolina K. Barbara K. Katarzyna K. Kamil K. Małgorzata J. Renata F. Andrzej C. Anna N. Anna M. Katarzyna M.

Lista zwycięzców za okres r.

Laureaci z poszczególnych dni: Stella Sz. Janina B. Ewa G. Przemysław S. Martyna K. Jarosław P. Rafał P. Renata N Michał K.

Lista zwycięzców 30 zł na start z BZWBK24 mobile

lp. imię żeńskie liczba wystapień lp. imię męskie liczba wystapień JULIA JAKUB WIKTORIA MATEUSZ 10.

Anna K. Marek K. Karolina K. Barbara K. Katarzyna K. Kamil K. Małgorzata J. Renata F. Andrzej C. Anna N. Anna M. Katarzyna M. Iwona Ł. Agnieszka T.

Zwycięzcy loterii promocyjnej Kamis Smaki 25-lecia. II losowanie edycja jesienna r.

Kawa? Proszę! Lista zwycięzców konkursu

Nr rezerwacji Imię AUTOKAR NR Monika 362 Jakub 362 Katarzyna 362 Krzysztof 363 Robert 363 Anna 363 Wojciech 363 Joanna 522 Andrzej 522

LISTA LAUREATÓW Nagroda IV stopnia zestaw do grillowania

Lista Zwycięzców nagród w M1 Łódź

WŁODZIMIERZ GRUSZCZYŃSKI, DOROTA ADAMIEC, MACIEJ OGRODNICZUK

Lp. Laureat Nagroda 1 Jarozlaw G. I stopnia 2 Jacek K. I stopnia 3 Przemysław B. I stopnia 4 Damian K. I stopnia 5 Tadeusz G. I stopnia 6 Bogumiła Ł.

Lista Zwycięzców nagród w M1 Poznań

Lista Zwycięzców nagród w M1 Radom

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego

Elektroniczny korpus tekstów polskich z XVII i XVIII wieku (do 1772 roku) prezentacja projektu badawczego

SPIS TELEFONÓW WEWNĘTRZNYCH W INSTYTUCIE JĘZYKA POLSKIEGO POLSKIEJ AKADEMII NAUK W KRAKOWIE

Mieczysława B. Małgorzata R.

Częstochowa, r

Program warsztatów CLARIN-PL

GRUPA 1 - POZIOM A1 GRUPA 2 - POZIOM A1

Lista Zwycięzców nagród w M1 Częstochowa

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

SKŁAD. Członków Obwodowej Komisji Nr: 1 do spraw Referendum. Siedziba: Urząd Miejski Adres: Mszczonów ul. Plac Piłsudskiego 1 Kontakt:

HARMONOGRAM EGZAMINU POTWIERDZAJĄCEGO KWALIFIKACJE W ZAWODZIE CZĘŚĆ PISEMNA BHP3. Z.13 - Zarządzanie bezpieczeństwem w środowisku pracy

Spis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa

EGZAMIN MATURALNY Z JĘZYKA POLSKIEGO ( część ustna ) 10 MAJA 2018r.

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

0 Y PRZEPROWADZENIA CZĘŚCI USTNEJ EGZAMINU MATURALNEGO z języka angielskiego poziom podstawowy. Ogłoszenie wyników o godzinie 18:15

Zwycięzcy loterii promocyjnej Kamis Smaki 25-lecia

Główna lista rankingowa funduszu stypendialnego - obowiązuje od

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

PROPONOWANY RODZAJ ZAJĘĆ POZALEKCYJNYCH Z UCZNIAMI REALIZOWANY ZGODNIE Z ICH POTRZEBAMI I ZAINTERESOWANIAMI KOMISJA: JĘZYK POLSKI

Data: r. Rok Ak.: 2016/17

I Cykl Tygodniowy. ipady wygrywają: Głośniki Creative wygrywają:

Składy obwodowych komisji wyborczych w m. Lipno. Obwodowa Komisja Wyborcza nr 1: Obwodowa Komisja Wyborcza nr 2:

Wiśniowa gra. Uczniowie kontynujący udział w projekcie w nowym roku szkolnym 2018/2019 obowiązuje od: 3 październik 2018

14 maja 2015 r. (czwartek) egzamin ustny z języka polskiego (bez określania poziomu)


Rok akad. 2010/2011 Semestr 4. Lista studentów II roku studiów stacjonarnych I stopnia kierunku Fizjoterapia Grupa 440-A1.

Załącznik Nr 1 do Zarządzenia Nr 48/SOR/15 Burmistrza Miasta Chełmży z dnia 20 kwietnia 2015 r.

TERMIN: 09 styczeń 2017r. ZMIANA 1 GODZINA 9:00 (150 min)

Sukcesy uczniów Gimnazjum nr 8 w Płocku w wojewódzkich i ogólnopolskich konkursach przedmiotowych

Mistrzostwa Gminy Wielka Wieś Zawody w Narciarstwie Alpejskim Gigant Kluszkowce

Kod Kwalifikacji Nazwa Kwalifikacji Nazwisko Imie ZdajePisemny ZdajePraktyczny A.71. Projektowanie i wytwarzanie wyrobów odzieżowych Bartnik - Ból

Dyżury nauczycieli w roku szkolnym 2017 / 2018

O SKŁADZIE OBWODOWEJ KOMISJI WYBORCZEJ

ZWYCIĘZCY KONKURSU "APETYT NA MUNDIAL"

Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących z XVI, XVII i XVIII w.

LISTA REFERENDARZY SĄDU REJONOWEGO DLA M. ST. WARSZAWY W WARSZAWIE LP. NAZWISKO IMIĘ WYDZIAŁ DELEGACJA

TERMIN: 27 czerwiec 2017r. - GODZINA 9:00 (180 min)

ZARZĄDZENIE Nr 116/2015 BURMISTRZA MIEROSZOWA z dnia 5 października 2015 r.

WOJEWÓDZKIE KONKURSY PRZEDMIOTOWE

WYNIKI TCZEWSKIEJ LIGI STRZELECKIEJ 2015/ 2016 I. SENIORZY

Skład Obwodowej Komisji Wyborczej ds. przeprowadzenia głosowania w obwodzie Nr 1 w Pogorzeli

Zarządzenie Nr 13/2014 Wójta Gminy Przeworsk z dnia 02 maja 2014 roku

XI BIELSKIE TEATRALIA WYNIKI REGIONALNEGO KONKURSU WIEDZY O TEATRZE

Akademickie Mistrzostwa Śląska w Tenisie Stołowym 2017/2018. IV edycja Katowice, r.

szkoła podstawowa rok szkolny 2019/2020

HARMONOGRAM EGZAMINÓW Z KWALIFIKACJI ETAP PRAKTYCZNY czerwiec 2018r. Z.04 Świadczenie usług opiekuńczych osobie chorej i niesamodzielnej (120 minut)

Załącznik nr 10 do uchwały UKR nr 2/2019 z r.

Wyniki egzaminu gimnazjalnego:

Rok akad. 2009/2010 Semestr 2. Lista studentów I roku studiów stacjonarnych II stopnia kierunku fizjoterapia GRUPA A-1 - DFU10001

Wyniki z zawodów Biegowe Grand Prix Biegam Bo Lubię Polską Wieś :--:--:-- Joanna Wejkuć 2009 Nr :--:--:-- Lidia Krzemińska 2007 Nr 162

Jakub Cisło ( ) Michał Cisło ( ) Wojciech Cisło ( ) Władysława Cisło OŜóg Edward OŜóg

ZARZĄDZENIE NR 48/15 BURMISTRZA MSZCZONOWA. z dnia 12 sierpnia 2015 r. w sprawie powołania członków obwodowych komisji do spraw referendum

Skład osobowy Obwodowej Komisji Wyborczej Nr 1 w Muszynie powołanej na wybory samorządowe zarządzone na dzień 16 listopada 2014 r.

XLVIII Konkurs o Tytuł Mistrza Warszawy i Mazowsza w MnO 2015 Kategoria TU Aktualizacja: r.

Lista uczniów zakwalifikowanych do drugiego etapu Konkursu z Biologii

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Technikum Nr 1 w Myszkowie. Język Polski poziom podstawowy Sala Gimnastyczna godz. 9.00:

WYBORY DO RADY GMINY. PROTOKÓŁ Z WYBORÓW do Rady Gminy Czernichów

Rok akad. 2010/2011 Semestr 2. Lista studentów I roku studiów stacjonarnych I stopnia kierunku Fizjoterapia Grupa 240-A1.

semestr 1 zarządzanie i inżynieria produkcji studia pierwszego stopnia studia stacjonarne 2017/2018 Grupa: S1ZP-AU01 Lp Nazwisko Imię 1 Antczak

I Mistrzostwa Zabrza o Puchar Prezydenta Miasta i Tygodnik Nowiny Zabrzańskie

j. angielski poziom podstawowy czwartek 9 maja 2013r. godzina 9 00

Data: r. Rok Ak.: 2016/17

Adam Przepiórkowski. Korpus IPI PAN. wersja wstępna INSTYTUT PODSTAW INFORMATYKI PAN

Regaty Otwarcia Sezonu Tychy 14 Kwiecień 2013

Mistrzostwa Gminy Wielka Wieś Zawody w Narciarstwie Alpejskim Gigant Kluszkowce

ARCHITEKTURA I URBANISTYKA dr Gruszka Jacek

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

Rok akad. 2010/2011 Semestr 4. Lista studentów II roku studiów stacjonarnych II stopnia kierunku Fizjoterapia Grupa 44U-A1.

PUCHAR LWA 2015 ZŁOTY GROŃ

Transkrypt:

to iest Elektroniczny Korpus Textow Polſkich z XVII i XVIII w. (do 1772 r.) KORBEUSZ W Wárßáwie, dniá 18. Iunii A.D. MMXVIII

Podstawowe dane projektu KORBEUSZ Tytuł: Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Kryptonim: KorBa (Korpus Barokowy). Finansowanie: Narodowy Program Rozwoju Humanistyki MNiSW. Okres finansowania: 26.03.2013-25.03.2018. Budżet: 900 000 PLN. Jednostka koordynująca: Instytut Języka Polskiego PAN. Współpraca: Zespół Inżynierii Lingwistycznej IPI PAN. Planowana objętość: 12 mln segmentów. Planowana objętość podkorpusu znakowanego ręcznie: 0,5 mln segmentów. Planowana forma udostępniania: on-line dla użytkowników zalogowanych bez ograniczeń, dla użytkowników niezalogowanych niewielkie ograniczenia ilościowe (albo przeszukiwanych źródeł, albo udostępnianych wyników).

Najważniejsze założenia projektu KORBEUSZ Różnorodność tekstów zapewniająca jak największą reprezentatywność chronologiczną, geograficzną, genologiczną, tematyczną itp. Bogate metadane powiązane z tekstami: dane bibliograficzne, charakterystyka stylistyczno-genologiczna, charakterystyka tematyczna, charakterystyka socjolingwistyczna i geolingwistyczna. Dostęp do transliteracji i transkrypcji. Szczegółowe znakowanie struktury tekstu. Znakowanie wszystkich wtrętów obcych, z podziałem na języki. Oznakowanie morfosyntaktyczne (w części ręczne, w części automatyczne).

Charakter projektu KORBEUSZ Projekt miał charakter heterogeniczny. Zadania o charakterze filologicznym: wybór reprezentatywnych tekstów z epoki, opracowanie zasad transliteracji i transkrypcji, przeniesienie tekstów na nośnik elektroniczny, opracowanie systemu znaczników różnego rodzaju, opatrzenie tekstów szczegółowymi metadanymi itp. Zadania o charakterze informatycznym: stworzenie narzędzi informatycznych służących do gromadzenia, przetwarzania, przeszukiwania i prezentowania tekstów zawartych w korpusie, modyfikacja narzędzi już istniejących, stworzonych na potrzeby korpusów tekstów współczesnych.

Zespół 3 x K Kierownik projektu: Włodzimierz Gruszczyński Koordynatorka: Renata Bronikowska Prace koncepcyjne: Dorota Adamiec Anna Andrzejczuk Renata Bronikowska Włodzimierz Gruszczyński Witold Kieraś Małgorzata B. Majewska Maciej Ogrodniczuk Adam Przepiórkowski Marcin Woliński

Zespół skryptorzy Anna Alfut Agnieszka Adamiec Dorota Adamiec Anna Arendt Alicja Bielak Laura Bielak Renata Bronikowska Katarzyna Bury Maciej Bury Jolanta Czajkowska Julia Domitrak Mirella Gliwińska Zuzanna Głuszczak Jolanta Gomółka Izabela Jagielska Klaudia Jovanovska Ewa Karasińska-Gajo Magdalena Kołodziejczyk Wojciech Kordyzon Anna Krasowska Katarzyna Kryńska Agnieszka Łodzińska Małgorzata Maciejewska Magdalena Majdak Olga Makarova Ewelina Mantorska Emanuel Modrzejewski Wiesław Morawski Małgorzata Pachulska Aldona Przyborska-Szulc Paweł Siemieniak Dawid Siwicki Paulina Wdowska Emilia Zdankiewicz Anna Żółtak

Zespół anotatorzy Dorota Adamiec Renata Bronikowska Włodzimierz Gruszczyński Piotr Janas Matylda Kozłowska Dawid Lipiński Magdalena Majdak Emanuel Modrzejewski Wiesław Morawski Izabela Pawlak Ewelina Pędzich Marcin Podlaski Aldona Przyborska-Szulc Ewa Rodek Paulina Rosalska Aleksandra Wieczorek Sebastian Żurowski

Zespół inne prace filologiczne Dorota Adamiec Renata Bronikowska Włodzimierz Gruszczyński Witold Kieraś Monika Kresa Paweł Kupiszewski Małgorzata B. Majewska Wiesław Morawski Aldona Przyborska-Szulc Prace pomocnicze indeks SXVII Mateusz Adamczyk Ewa Balicka Dagmara Banasiak Agata Hącia Aleksandra Wieczorek

Zespół informatycy, programiści Bartłomiej Borek Zbigniew Gawłowicz Piotr Janas Witold Kieraś Łukasz Kobyliński Jakub Kostrzewa Dorota Komosińska Katarzyna Krasnowska-Kieraś Michał Lenart Maciej Ogrodniczuk Katarzyna Streich Jan Szejko Michał Wasiluk Aleksander Zabłocki Bartosz Zaborowski Mateusz Żółtak

Instytucje i osoby, które nas wspierały Biblioteka Wolne Lektury Cyfrowa Biblioteka Narodowa Polona Zespół Bibliotek Cyfrowych Poznańskiego Centrum Superkomputerowo-Sieciowego prof. dr hab. Janusz S. Bień Iwona Maciejewska prof. dr hab. Wacław Walecki i wydawnictwo Collegium Columbinum Katarzyna Zawilska Wojciech Żółtak Dziękujemy!

Obecny stan korpusu KORBEUSZ 718 tekstów o łącznej długości 10,97 mln słów, co daje prawie 13,5 mln segmentów w rozumieniu NKJP. Wszystkie teksty mają dokładne metryczki. Wszystkie teksty mają oznakowaną strukturę i oznaczone słowa w językach obcych. Niektóre teksty wymagają ciągle korekty. Działają następujące narzędzia: Wczytywacz, Transkryber, Anotatornia 2, Korbeusz, czyli postarzony Morfeusz, Wyszukiwarka MTAS (zmodyfikowana).

System znaczników morfosyntaktycznych, to jest TAGSET

Klasy fleksyjne różnice w stosunku do NKJP NKJP KorBa Leksem Fleksem Ozn. Przykład Fleksem Ozn. Przykład Rzeczownik rzeczownik forma depr. subst depr królowie króle Rzeczownik subst królowie, wilcy, anioły, anieli Liczebnik przymiotnikowy Liczebnik przysłówkowy liczebnik przymiotnikowy adjnum drugi, dwukrotny, dwojaki, samowtóry liczebnik przysłówkowy advnum dwukrotnie, dwojako, dwakroć, samowtór Przymiotnik przymiotnik przymiotnik poprzyimkowy przymiotnik przyprzymiot. przymiotnik predykatywny adj adjp adja adjc polski polsku polsko wesół przymiotnik przymiotnik odm. niezłożona przymiotnik przyprzymiot. adj adjb adja dobry, zdrowego; zdrów, gwałtownę, polsku; angielsko, ziemno Czasownik forma przeszła BYĆ forma BYĆ jako składnik cz. przyszłego aglutynant aoryst. imiesłów przym. czyn. odmiana niezłożona imiesłów bierny odmiana niezłoż. plusq fut agltaor pactb ppasb był będzie -(e)ch, -(e)chmy będęcy, jadęcy umęczon, ukrzyżowan

Znaczniki gramatyczne różnice w stosunku do NKJP Wprowadzenie liczby podwójnej (du). Zmiany w nazwach i kryteriach ustalania podrodzajów męskich (manim1 i manim2). Wprowadzenie rodzajów przymnogich (p1, p2) Wprowadzenie trzeciej wartości kategorii aspektu (biasp). Rezygnacja z kategorii akomodacyjności form liczebników.

Wszystkie formy dawnej liczby podwójnej znakujemy jako du. Nawet jeśli forma rzeczownika o końcówce typowej dla liczby podwójnej łączy się z przymiotnikiem w liczbie mnogiej, to i tak uznajemy ją za formę dualis, np. we frazie (robił to) swoimi starymi rękoma formę rękoma znakujemy jako du:inst, chociaż przymiotnik starymi znakujemy jako pl:inst:f:pos. Kategorie gramatyczne: liczba Liczba: (3 wartości) pojedyncza sg niewiasta podwójna du M. B. W. (dwa) szczyta, męża; (dwie) robocie, ręce, świecy; (dwie) ście, plecy D. Msc. (dwu) panu, królu; (dwu) kopu, niedzielu; (dwu) latu, pokoleniu C.N. (dwiema) mężoma, zakonoma; (dwiema) niewiastama, rzeczoma; (dwiema) latoma, plecoma mnoga pl niewiasty

Kategorie gramatyczne: rodzaj W ustalaniu rodzaju rzeczowników w języku średniopolskim nie mogą pomóc konteksty diagnostyczne, które stosowane były w czasie anotacji NKJP, ponieważ anotatorzy nie mają kompetencji językowej w zakresie języka średniopolskiego. Przypisujemy rodzaj poszczególnym formom, nie zwracając uwagi na to, że w konsekwencji różne formy potencjalnie tego samego leksemu mogą mieć przypisany różny rodzaj. Jeśli byłyby to formy rzeczywiście tego samego leksemu, to wartości kategorii rodzaju, które im zostały przypisane, muszą być niesprzeczne (uzgadnialne), np.: m i mnanim albo f.n.p1.p2 i n.

Kategorie gramatyczne: rodzaj Rodzaj przypisujemy poszczególnym formom, nie zawsze znając formę podstawową. Tryb przypisywania rodzaju powinien był być następujący: formom leksemów znanych anotatorowi i zgodnym ze współczesną normą przypisujemy rodzaj wg intuicji; formom, do których są różne podpowiedzi, przypisujemy wartość wspólną, np. formie alarmami, na podstawie podpowiedzi z lematami ALARM, ALARMA, ALARMO przypisujemy wartość rodzaju 0, a lemat alarm*: subst:pl:inst:0; formom nieznanych leksemów, do których jest jedna podpowiedź, przypisujemy interpretację z podpowiedzi.

Rodzaj Rodzaj nieznany/ wspólny m.f.n.p1.p2 (tymi) narańczagami (lemat NARAŃCZAG*) (tymi) rożynkami (lemat ROŻYN*) (o tych) franbugach (lemat FRANBUG*) niemęski f.n.p1.p2 (tych) suden (lemat SUDN*) nieżeński m.n (na tym) darniu (lemat DAR*) nienijaki m.f (to jest) adwena (lemat ADWENA) m.n.p2 emolumenta (lemat EMOLUMENT*) męski uogólniony m (to jest) detryment (lemat DETRYMENT) (temu) forytarzowi (lemat FORYTARZ) indycentowi (lemat INDYCENT) męski nieżywotny mnanim stół, dom, cebrzyk (nie widział) purgansu (lemat PURGANS) (na) purgans (lemat PURGANS) manim.p2 (widzę) temperamenta (lemat TEMPERAMENT*) męski żywotny manim baranek, babsztyl, (to był) assawoła (lemat ASSAWOŁA) męski żywotny jak osob. manim1 (srodzy) tygrysowie (lemat TYGRYS) (groźni) narodowie, inszy narodowie planetowie (lemat PLANET*) (wszytkie zwierzęta lwi i niedźwiedzie, pardzi, psi, smocy (lematy: LEW, NIEDŹWIEDŹ, PARD*, PIES, SMOK) (widzi) subalternów (lemat SUBALTEREN*) (prowadzono) słoniów męski żywotny jak nieosob. manim2.p2 (zwojował) Węgry i Pomorczyki, (korzenić) schysmatyki i heretyki, żeński f stuła, kobiety, (przeciw) anginie (lemat ANGINA) na pułnocney eluardzie (lemat BELUARDA) nijaki n dziecko, okno, co, (uczynili) bando (lemat BANDO) przymnogi p1 (jadą owi) Państwo, osob. królestwo (jedli) przymnogi p2 (grać w) arcaby (lemat ARCABY)

Kategorie gramatyczne: rodzaj męski żywotny założenia opisu Wiele rzeczowników rodzaju manim może mieć dwie konkurencyjne formy pl:nom, np.: (te) lwy, ptaki, anioły, pany, chłopy, (ci) lwowie, ptacy, anieli aniołowie, panowie, chłopi. Formom tym przypisujemy odpowiednio rodzaj m i manim1. Jeżeli w pl:nom następuje neutralizacja tego typu form, np. (ci i te) gospodarze, formę tekstową znakujemy jako pl:nom:m, chyba że uzgadnia się z formą w rodzaju manim1, np. z formami typu ci, wielcy, byli.

Kategorie gramatyczne: rodzaj męski żywotny praktyka anotacyjna Forma wilcy w podkorpusie ręcznie anotowanym wystąpiła 7 razy. Rodzaj manim1 został jej przypisany 1 raz; Rodzaj m został jej przypisany 6 razy. Forma wilcy w podkorpusie anotowanym automatycznie wystąpiła 92 razy. Rodzaju manim1 tager nie przypisał ani razu. We frazie wilcy drapieżni forma przymiotnika jest systematycznie znakowana jako manim1.

KorBa2

Elektroniczny Korpus Tekstów Polskich XVII i XVIII w. perspektywy W marcu 2018 r. złożony został powtórnie wniosek o sfinansowanie kontynuacji projektu przez NPRH. Tytuł projektu: Rozbudowa Elektronicznego Korpusu Tekstów Polskich XVII i XVIII w. i jego integracja z Elektronicznym słownikiem języka polskiego XVII i XVIII w. Okres finansowania: 2019-2024. Jednostka koordynująca: IJP PAN. Kryptonim: KorBa2. Współpraca: Zespół Inżynierii Lingwistycznej IPI PAN. Zespół w znacznym stopniu ten sam, co w I etapie. KORBEUSZ

Cele nowego projektu: Rozbudowa Elektronicznego Korpusu Tekstów Polskich XVII i XVIII w. (do 1772 r.) utworzonego w I etapie projektu i przekształcenie go w Elektroniczny Korpus Tekstów Polskich XVII i XVIII w.: uzupełnienie korpusu o teksty od 1772 r. do końca XVIII w., dodanie nowych tekstów do korpusu już istniejącego: ważne teksty, które zostały włączone we fragmentach, zwiększenie liczby tekstów z początków XVIII w., większe zrównoważenie stylistyczne. Łączne powiększenie objętości korpusu o 12 mln segmentów. Udoskonalenie narzędzi informatycznych obsługujących korpus: transkrybera, analizatora morfologicznego (dostosowanie tagsetu do tekstów z końca XVIII w.), tagera. Integracja korpusu z Elektronicznym słownikiem języka polskiego XVII i XVIII w. stworzenie narzędzi do automatycznej ekstrakcji danych i wspomagających wybór najlepszych przykładów. Częściowa integracja z NKJP stworzenie możliwości przeszukiwania materiału współczesnego i z innych epok. Przeprowadzenie analiz lingwistycznych materiału zawartego w korpusie: syntaktycznych, fleksyjnych i semantyczno-leksykalnych. KORBEUSZ

Teraz przy zákończeńiu tey przemowy wßyscy authorowie, vniżony pokłon oddáiąc, J.W.W.Mćiom Pańiom y Panom za ich wysłuchánie z gorącą attencyą pokorńie dźiękuią y życzą J.W.W.Mćiom zupełney obfitośći wßelákiego ßczęśćia. KORBEUSZ W Wárßáwie, dies 18 Iunii A.D. CIƆCIƆXVIII