Tworzenie korpusu tekstów dawnych a korpusu tekstów współczesnych: różnice teoretyczne i warsztatowe

Podobne dokumenty
Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk

Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki

Doświadczenia z prac nad Korpusem tekstów polskich z XVII i XVIII wieku

KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN

KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)

Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego

Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN

Zautomatyzowane tworzenie korpusów błędów dla języka polskiego

Elektroniczny korpus tekstów polskich z XVII i XVIII wieku (do 1772 roku) prezentacja projektu badawczego

WŁODZIMIERZ GRUSZCZYŃSKI, DOROTA ADAMIEC, MACIEJ OGRODNICZUK

Indukcja reguł gramatyki j. polskiego

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

1 Narzędzia przetwarzania 2 tekſtów hiſtorycznych

FILOLOGIA POLSKA studia stacjonarne pierwszego stopnia rok akademicki 2015/2016

O dystrybucji nieakcentowanych form poprzyimkowych na podstawie Korpusu IPI PAN p.1

Instrukcja korzystania z wyszukiwarki do Elektronicznego Korpusu Tekstów Polskich z XVII i XVIII wieku (do 1772 r.)

Instrukcja korzystania z wyszukiwarki korpusowej w Korpusomacie

NAKŁADKA KORPUSOWA (NKJP, KORBA) OPARTA O TRADYCYJNĄ KLASYFIKACJĘ CZĘŚCI MOWY. Emanuel Modrzejewski.

FILOLOGIA POLSKA studia stacjonarne pierwszego stopnia rok akademicki 2018/2019

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

3 sem. ćw.lab./ćw.prow. w jęz. obcym/ semin.dypl. ECTS w. ćw. ćw. A. Moduły przedmiotowe kształcenia ogólnego

Wykaz skrótów 17. Grafia pierwszej edycji Księgi Syracha wobec druków z pierwszej połowy XVI wieku 19. Grafia pierwszej edycji Księgi Syracha 21

Adam Przepiórkowski. Korpus IPI PAN. wersja wstępna INSTYTUT PODSTAW INFORMATYKI PAN

5. FLEKSJA IMIENNA. 1. Rzeczownik i jego kategorie fleksyjne. 2. Liczba

FILOLOGIA POLSKA studia stacjonarne pierwszego stopnia rok akademicki 2016/2017

Program warsztatów CLARIN-PL

DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki

ćw.lab./ćw.prow. w jęz. obcym/ semin.dypl. ECTS w. ćw. ćw. A. Moduły przedmiotowe kształcenia ogólnego, w tym ogólnouczelniane

WK, FN-1, semestr letni 2010 Korpusy tekstów w lingwistyce. Wyrażenia regularne. Cz. I

FILOLOGIA POLSKA studia stacjonarne pierwszego stopnia rok akademicki 2017/2018

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Spis treści Wstęp 1. Językoznawstwo sądowe

EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO W KLASIE VII PODRĘCZNIK MEINE DEUTSCHTOUR ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA NIEMIECKIEGO W SZKOLE PODSTAWOWEJ NR 11 W JAWORZNIE NA PODSTAWIE PODRĘCZNIKA MEINE DEUTSCHTOUR 3

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

Specjalizacja tekstologiczno-edytorska

II ROK/1. stopnia Specjalność: język polski z edukacją kulturową (specjalizacja nauczycielska) Lp. nazwa przedmiotu rodzaj zajęć

Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku

System znaczników morfosyntaktycznych w korpusie IPI PAN

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Lokalizacja Oprogramowania

A. Moduły przedmiotowe kształcenia ogólnego. B. Moduły przedmiotowe kierunkowe

PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2016/2017 JĘZYK POLSKI

Przedmiotowy system oceniania z języków obcych: j. angielski, j. niemiecki, j. włoski, j. hiszpański, j. rosyjski

PROGRAM STUDIÓW. zaliczenie ustne aktywność na zajęciach FP2_W02, FP2_W10, FP2_W11 FP2_U01, FP2_U05, FP2_U08. egzamin, zaliczenie ustne

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

JĘZYK NIEMIECKI - ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

SPRAWNOŚĆ MÓWIENIA SPRAWNOŚĆ PISANIA GRAMATYKA I SŁOWNICTWO

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE MEINE DEUTSCHTOUR KL.II gimnazjum

A. Moduły kierunkowe

EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018

OPIS MODUŁU (PRZEDMIOTU)

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY Z JĘZYKA NIEMIECKIEGO Nauczyciel prowadzący: mgr Agnieszka Krzeszowiak, mgr Teresa Jaśkowska

INSTYTUT FILOLOGII SŁOWIAŃSKIEJ MINIMUM PROGRAMOWE na rok akad. 2010/2011 dla studentów MISH Studia pierwszego stopnia. Forma Zal./ Punkty ECTS ROK I

Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018. Kryteria Oceniania

Wymagania edukacyjne na poszczególne oceny z języka niemieckiego MEINE DEUTSCHTOUR 3 OCENA CELUJĄCA GRAMATYKA I SŁOWNICTWO SPRAWNOŚĆ PISANIA

OCENA CELUJĄCA INNE UMIEJĘTNOŚCI I FORMY ROZUMIENIE TEKSTU SPRAWNOŚĆ MÓWIENIA SPRAWNOŚĆ PISANIA GRAMATYKA I SŁOWNICTWO

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE Z JĘZYKA NIEMIECKIEGO DLA KLAS I III POZIOM PODSTAWOWY I ROZSZERZONY

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

System Korekty Tekstu Polskiego

FILOLOGIA POLSKA STUDIA STACJONARNE I STOPNIA PLAN STUDIÓW W ROKU AKADEMICKIM 2014/2015. Ćwiczenia (semestr) Forma zaliczenia. 30 (1) Zal.

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018

PROGRAM STUDIÓW FP2_W02, FP2_W10, FP2_W11. zaliczenie ustne. aktywność na zajęciach FP2_U01, FP2_U05, FP2_U08. egzamin, zaliczenie ustne

EFEKTY UCZENIA SIĘ JĘZYKOZNAWSTWO. Filologia włoska - I stopień PODSTAWY JĘZYKOZNAWSTWA

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2014/2015

Wymagania programowe i kryteria oceniania w sferze wiadomości i umiejętności przedmiotowych z języka niemieckiego Rok szkolny 2010/2011

KRYTERIA OCEN Z JĘZYKA FRANCUSKIEGO NA ROK SZKOLNY 2015/2016

KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLAS TRZECICH ODDZIAŁÓW GIMNAZJALNYCH

Metodyka nauczania języka polskiego jako obcego

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Kryteria wymagań na poszczególne oceny do podręcznika Meine Deutschtour do języka niemieckiego do klasy VII

Problem normy językowej w leksykografii historycznej

OCENA CELUJĄCA SPRAWNOŚĆ PISANIA

Opisy przedmiotów ECTS dla specjalności filologia angielska forma stacjonarna

PRZEDMIOTOWE ZASADY OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLASY 7 W ROKU SZKOLNYM 2017/2018. PODRĘCZNIK Meine Deutschtour.

OCENA CELUJĄCA SPRAWNOŚĆ PISANIA

Załącznik Nr 4. Standardy nauczania dla kierunku studiów: filologia STUDIA MAGISTERSKIE I. WYMAGANIA OGÓLNE

g i m n a z j a l n e g o w h u m a n i s t y c z n e j

1. Zasady oceniania na lekcji j. niemieckiego są zgodne z zasadami wewnątrzszkolnego oceniania zawartymi w Statucie Szkoły.

OCENA CELUJĄCA SPRAWNOŚĆ PISANIA

Wykaz przedmiotów objętych egzaminami i zaliczeniami w roku akademickim 2014/2015. Rok I, semestr I

Włodzimierz Gruszczyński. Instytut Języka Polskiego PAN Korpusy Diachroniczne Polszczyzny Katowice, kwietnia 2017 r.

SPRAWNOŚĆ MÓWIENIA SPRAWNOŚĆ PISANIA GRAMATYKA I SŁOWNICTWO

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO KLASA

OCENIANIE WYPOWIEDZI PISEMNYCH

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

Przedmiotowy system oceniania z języka niemieckiego

Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015

System Korekty Tekstu Polskiego

OCENA CELUJĄCA ROZUMIENIE TEKSTU SPRAWNOŚĆ GRAMATYKA INNE UMIEJĘTNOŚCI I SŁUCHANEGO/ MÓWIENIA SPRAWNOŚĆ PISANIA

Spis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa

SZCZEGÓŁOWE KRYTERIA OCEN KLASYFIKACYJNYCH. Prezentowane poniżej kryteria ogólne dotyczą oceniania na koniec etapu edukacyjnego w klasach 6-8

Transkrypt:

Tworzenie korpusu tekstów dawnych a korpusu tekstów współczesnych: różnice teoretyczne i warsztatowe (na przykładzie Korpusu tekstów polskich XVII-XVIII wieku) W. Gruszczyński R. Bronikowska IJP PAN

Porównywane korpusy współczesny NKJP, czyli Narodowy Korpus Języka Polskiego ogólnie znany, niewymagający prezentacji, obecnie nierozbudowywany(?). historyczny KORBA, czyli Korpus tekstów polskich XVII i XVIII wieku (do 1772 r.) jeszcze nieznany, wymaga krótkiej prezentacji, jeszcze niedostępny publicznie, intensywnie rozbudowywany.

KORBA podstawowe dane Projekt badawczy Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Kryptonim: KORBA (KORpus BArokowy) Finansowanie projektu: Narodowy Program Rozwoju Humanistyki na lata: 2013-2018 Jednostka koordynująca: IJP PAN Współpraca: IPI PAN Kierownik: W. Gruszczyński Koordynator: R. Bronikowska

Wielkość korpusu Korpus współczesny (NKJP) Pełny korpus 1800M segmentów, w tym: podkorpus zrównoważony: 300M segmentów; ręcznie znakowany podkorpus (v2): 1,2M segmentów; korpus Słownika frekwencyjnego: 0,5M. Korpus historyczny (KORBA) Planowana objętość: minimum 12M segmentów Planowana objętość ręcznie znakowanego podkorpusu: 0,5M segmentów. Planowana rozbudowa w ramach grantu DARIAH.

Wielkość podobnych korpusów zagranicznych Korpusy współczesne Czeski KN SYN: >1300M: podkorpus zrównoważony: 100M słów; Słowacki KN: >829M Chorwacki KN: >101M (?) Korpus Współczesnego Języka Serbskiego: 112M. Bułgarski KN: 1200M Rosyjski (z podkorpusem historycznym): 149M Brytyjski KN (BNC): 100M Niemiecki KN: 1900M Korpusy historyczne Serbski (KSJ): 11M Hiszpański (Corpus del Español): 100M słów (zasięg czasowy: 1200-1900 r. ) Szwedzki: 1,2M (1520-1850 r.) Corpus of Historical American English (COHA): 406M (zasięg czasowy 1810-2000)

Synchronia vs. diachronia Korpus współczesny (NKJP) teksty z relatywnie krótkiego okresu: po 1990: 80% tekstów, 1945-90: 15% tekstów, przed 1945: 5% tekstów; z założenia nadreprezentacja tekstów współczesnych; teksty zestandaryzowane pod względem ortograficznym i gramatycznym (dawniejsze według współczesnych wydań). Korpus historyczny (KORBA) teksty z relatywnie długiego okresu, którego poszczególne części powinny być reprezentowane równomiernie (proporcjonalnie): 1601-1650, 1651-1700, 1701-1750, 1751-1772. teksty ze wszystkich podokresów w zasadzie w ortografii oryginalnej.

Synchronia vs. diachronia Korpus współczesny (NKJP) Brak znaczników i narzędzi umożliwiających śledzenie zmian językowych, zwłaszcza gramatycznych; Brak zrównoważenia chronologicznego uniemożliwia dokonywanie porównań frekwencji tych samych jednostek w różnych okresach. Korpus historyczny (KORBA) Dzięki dokładnym metadanym tekstów i ich zrównoważeniu chronologicznemu możliwe będzie śledzenie zmian ilościowych różnych form gramatycznych i leksemów w poszczególnych podokresach.

Cele korpusów NKJP Badania prowadzone wszystkimi metodami językoznawstwa korpusowego: corpus illustrated (1), corpus based (2), corpus driven (3). W zakresie gramatyki przewaga badań metodą 1. i 2. Badania leksykalne jako podstawa leksykografii metodą 2., może też 3. (WSJP?) KORBA Docelowo powinny dominować badania metodą corpus driven, ponieważ brak innych źródeł wiedzy o badanym systemie językowym, w szczególności brak możliwości introspekcji. W leksykografii (e-sxvii) zdecydowanie metoda corpus driven.

Użytkownicy (adresaci) korpusów NKJP Językoznawstwo polonistyczne: leksykografia (głównie WSJP) gramatyka opisowa kultura języka! stylistyka/pragmatyka językoznawstwo statystyczne. Inżynieria językowa dane wykorzystywane często w innych projektach KORBA Językoznawstwo polonistyczne: leksykografia (e-sxvii) gramatyka historyczna onomastyka historyczna chronologia (datowanie) słów. Edytorstwo dawnych tekstów. Literaturoznawstwo.

Typy tekstów i ich dostępność NKJP Relatywnie łatwy dostęp do wszelkiego typu tekstów współczesnych. Jedyny, ale wielki problem to prawa autorskie! KORBA Rękopisy, starodruki z epoki: najbardziej wiarygodne, zwykle niedostępne w tekstowej formie elektronicznej, drogie w pozyskiwaniu. Wydania z XIX, XX, XXI w.: mało wiarygodne (ortografia, gramatyka), czasem dostępne w formie elektronicznej, wielu dotyczy ograniczenie z powodu prawa autorskiego. Edycje internetowe (mało wiarygodne). Brak tekstów mówionych.

Sposoby pozyskiwania tekstów NKJP Pozyskiwanie wersji elektronicznej książek i czasopism; skanowanie i OCR tekstów pisanych niedostępnych w wersji elektronicznej; nagrywanie tekstów mówionych i ich transkrypcja. KORBA transliteracja (przepisywanie) starodruków i rękopisów; pozyskiwanie wersji elektronicznej lub skanowanie i OCR tekstów dawnych wydanych współcześnie; postarzanie tekstów wydanych współcześnie (doprowadzanie ich do postaci wiernie odwzorowującej oryginał).

Etapy pracy przy transkrypcji tekstu redaktor: prześlij skryptorowi redaktor: odbierz skryptorowi skryptor: zatwierdź redaktor: prześlij do korekty redaktor: oznacz jako gotowy Nowy Przepisywany W redakcji W korekcie Gotowy skryptor: wczytaj tekst redaktor: prześlij skryptorowi do poprawki korektor: odeślij po korekcie redaktor: odbierz korektorowi redaktor: usuń tekst redaktor: przywróć do redakcji Usunięty autor: M. Ogrodniczuk

Wczytywacz tekstów ułatwia przekazywanie tekstów między redaktorem a skryptorem; wychwytuje błędy w znakowaniu; konwertuje tekst na format XML (zgodny z TEI); sporządza raporty dotyczące liczby tekstów i słów należących do danej kategorii; wyszukuje zadany ciąg liter we wczytanych tekstach.

Informacje o statusie tekstów

Metryczka tekstu

Raporty

Wyszukiwarka

Reprezentatywność korpusu - możliwości NKJP NKJP ma być reprezentatywny w zakresie recepcji tekstów; w praktyce jest to tylko pewne przybliżenie: arbitralne decyzje dotyczące udziału w korpusie tekstów mówionych i internetowych; wątpliwości dotyczące interpretacji źródeł statystycznych; reprezentatywność tylko pod względem kanału przekazu i stylistyki tekstu. KORBA jeszcze większe trudności w zastosowaniu kryterium reprezentatywności: brak tekstów mówionych; tylko część tekstów barokowych zachowanych do naszych czasów; trudności w pozyskaniu tekstów (rękopisy); mało danych statystycznych o czytelnictwie w epoce; niewielka dostępność tekstów najbardziej popularnych (kalendarze).

Reprezentatywność korpusu - cele NKJP KORBA ważnym celem korpusu w korpusie historycznym współczesnego jest ważniejsze jest zgromadzenie odzwierciedlenie świadomości tekstów maksymalnie językowej przeciętnego zróżnicowanych pod względem użytkownika danego języka. stylistycznym, tematycznym, chronologicznym i regionalnym; dążenie do zachowania reprezentatywności korpusu może utrudniać osiągnięcie tego celu.

Zróżnicowanie tekstów NKJP zapewnienie dużego zróżnicowania stylistycznorodzajowego tekstów; mniejszą wagę przywiązuje się do zróżnicowania tematycznego, chronologicznego i geograficznego. KORBA dążenie do zapewnienia maksymalnej różnorodności tekstów: stylistyczno-rodzajowa (umożliwia badanie języka poszczególnych gatunków i genrów mowy); tematyczna (umożliwia badanie słownictwa specjalistycznego); chronologiczna (umożliwia badanie zmian językowych); geograficzna (umożliwia badanie języka poszczególnych regionów ówczesnej Polski).

Ortograficzna reprezentacja tekstów NKJP W zasadzie wszystkie teksty zgromadzone w korpusie mają tę samą ortografię (możliwe subtelne różnice, niemające większego wpływu na wyniki wyszukiwania). KORBA Teksty transliterowane zachowują ortografię oryginałów (wysoce niekonsekwentną): konieczność automatycznej transkrypcji i przechowywania w korpusie w dwóch zrównoleglonych wersjach. Teksty pozyskane z wydań późniejszych mają ortografię XIXi XX-wieczną: część jest postarzanych i będzie miała dwie wersje, część tylko w jednej (współczesnej) ortografii.

Zakres znakowania Znakowanie w NKJP Administracyjne: szczegółowe metadane, ale tylko niewielka ich część jest dostępna dla zewnętrznego użytkownika. Strukturalne: ubogie, niedostępne dla użytkownika zewnętrznego; Językowe: brak. Morfosyntaktyczne: oryginalny, niestandardowy tagset. Semantyczne, składniowe, onomastyczne: w podkorpusie 1M. Znakowanie w KORBie Administracyjne: szczegółowe metadane, czyli metryczka tekstu (por. wcześniejszy slajd), wszystkie będą dostepne dla użytkowników. Strukturalne: bogate paginacja, części dzieła, kustosze, metatekst itp. Językowe: oznakowanie segmentów z języków innych niż polski. Morfosyntaktyczne problem doboru tzw. tagsetu. Semantyczne, składniowe nieplanowane. Onomastyczne: może w podkorpusie 1M.

Znaczniki gramatyczne porównanie z NKJP Liczba: (3 wartości) pojedyncza sg niewiasta podwójna du niewieście mnoga pl niewiasty Przypadek: (7 wartości) mianownik nom woda dopełniacz gen wody celownik dat wodzie biernik acc wodę narzędnik inst wodą miejscownik loc wodzie wołacz voc wodo Rodzaj: (5 wartości) dodane co z tym? męski osobowy (?) m1 papież, kto, wujostwo męski zwierzęcy m2 baranek, walc, babsztyl męski rzeczowy m3 stół żeński f stuła nijaki n dziecko, okno, co, skrzypce, spodnie przymnogi osobowy p1 wujostwo przymnogi nieosobowy p2 skrzypce, spodnie dodane

Znaczniki gramatyczne (cd.) porównanie z NKJP Osoba: (3 wartości) pierwsza pri bredzę druga sec bredzisz trzecia ter bredzi Stopień: (3 wartości) równy pos cudny wyższy com cudniejszy najwyższy sup najcudniejszy Aspekt: (2 wartości) niedokonany imperf iść dodane dokonany perf zajść niedok./dok. im/perf aresztować Zanegowanie: (2 wartości) niezanegowana aff pisanie, czytanego zanegowana neg niepisanie, nieczytanego

Znaczniki gramatyczne (cd.) porównanie z NKJP Akcentowość: (2 wartości) akcentowana akc jego, niego, tobie nieakcentowana nakc go, -ń, ci Poprzyimkowość: (2 wartości) co z poprzyimkowa praep niego, -ń tym? niepoprzyimkowa npraep jego, go Akomodacyjność: (2 wartości) uzgadniająca congr dwaj, pięcioma rządząca rec dwóch, dwu, pięciorgiem Aglutynacyjność: (2 wartości) nieaglutynacyjna nagl niósł aglutynacyjna agl niosł- Wokaliczność: (2 wartości) wokaliczna wok -em niewokaliczna nwok -m Kropkowalność: (2 wartości) z następującą kropką pun tzn. bez następującej kropki npun wg co z tym?

KORBA a NKJP KORBA docelowo ma być podkorpusem NKJP. Nie będzie w pełni zgodna metodologicznie. Nowy Poliqarp będzie dostosowany do potrzeb KORB-y.

PERSPEKTYWY Współpraca z projektami dotyczącymi fleksji historycznej: R. Górski, M. Eder (IJP PAN) M. Woliński et al. (IPI PAN)

Dziękujemy za uwagę!