Komputerowa weryfikacja gramatyki Świdzińskiego
|
|
- Jakub Michalik
- 7 lat temu
- Przeglądów:
Transkrypt
1 Marcin Woliński Komputerowa weryfikacja gramatyki Świdzińskiego 12 maja 2005 j INSTYTUT PODSTAW INFORMATYKI POLSKIEJ AKADEMII NAUK ul. J. K. Ordona 21, Warszawa
2 Automatyczna analiza składniowa Niniejsza praca dotyczy automatycznej analizy składniowej wypowiedzeń w języku polskim. Celem automatycznej analizy składniowej jest sprawdzenie, czy wypowiedzenie (dane jako napis) jest akceptowane przez daną gramatykę formalną, i określenie jego struktury.
3 Automatyczna analiza składniowa Niniejsza praca dotyczy automatycznej analizy składniowej wypowiedzeń w języku polskim. Celem automatycznej analizy składniowej jest sprawdzenie, czy wypowiedzenie (dane jako napis) jest akceptowane przez daną gramatykę formalną, i określenie jego struktury. W wypadku niejednoznaczności interpretacji powinny zostać określone wszystkie struktury mogące odpowiadać danemu wypowiedzeniu.
4 Gramatyka Świdzińskiego (GFJP) Marek Świdziński Gramatyka formalna języka polskiego Wydawnictwa Uniwersytetu Warszawskiego, 1992 stworzona przez lingwistę możliwość realizacji komputerowej nie była celem Autora składnia powierzchniowa (bez semantyki) największa i najbardziej szczegółowa gramatyka formalna polszczyzny (460 reguł)
5 Cel pracy efektywna realizacja komputerowa pełnej gramatyki Świdzińskiego, weryfikacja opisu zbadanie zgodności reguł z intencjami Autora (wyrażonymi poprzez podanie zestawu zdań, które powinny być akceptowane/nieakceptowane).
6 Program Świgra Zasadniczym wynikiem pracy jest napisany przeze mnie program komputerowy Świgra. Program ten, zrealizowany w Prologu, jest analizatorem składniowym działającym według reguł gramatyki Świdzińskiego.
7 Formalizm gramatyczny Gramatyki metamorficzne prologowy formalizm gramatyczny zaproponowany przez Colmerauera: Alain Colmerauer Metamorphosis grammars W: L. Bolc (ed.), Natural Language Communication with Computers. Lecture Notes in Computer Science 63. Springer-Verlag 1978, pp Obecnie bardziej znany w wariancie Definite Clause Grammars (DCG).
8 Przykładowe reguły zr(wf, A, C, T, Rl, O, Neg0, I, Z) (r8) zsz(wf, A, C, T, Rl, O, Neg, I, Z), przec, spoj(rc, Oz, ni), zsz(wf, A1, C1, T1, Rl1, 3, Neg1, ni, Z), { równe(z, [byxx, choćby, czyżby, gdyby, jakby, jakoby, żeby]), oblneg(oz, Neg0, Neg, Neg1) }. znakkońca(p) [? ]. morfagl(f, Rl, O) [F ], { słow(f, morfagl, Rl, O) }. (int1) (jel1)
9 Analiza morfologiczna Analizator składniowy nie pracuje na wypowiedzeniu w formie napisu, ale na jego wstępnie zinterpretowanej postaci podzielonej na segmenty, które zostały zanalizowane morfologicznie (fleksyjnie).
10 Analiza morfologiczna Analizator składniowy nie pracuje na wypowiedzeniu w formie napisu, ale na jego wstępnie zinterpretowanej postaci podzielonej na segmenty, które zostały zanalizowane morfologicznie (fleksyjnie). Ściślej rzecz biorąc, każdemu segmentowi przypisywane są wszystkie możliwe interpretacje jako wykładnika pewnych form pewnych leksemów.
11 Analizator morfologiczny Morfeusz W programie Świgra wstępne przetwarzanie tekstu wykonuje analizator morfologiczny Morfeusz, także mojego autorstwa. Program operuje systemem znaczników opracowanym na potrzeby Korpusu IPI PAN. Dane lingwistyczne pochodzą z prac Tokarskiego i Saloniego. Dane są reprezentowane w postaci automatów skończonych. Nie jest wykonywana analiza kontekstu (program nie jest tzw. tagerem).
12 Analizator morfologiczny Morfeusz Wynik analizy morfologicznej jest reprezentowany w postaci grafu acyklicznego: wierzchołki odpowiadają pozycjom w tekście (pomiędzy segmentami), krawędzie są etykietowane interpretacjami morfologicznymi. Ala AL subst:sg:gen.acc:m1 ma MIEĆ fin:sg:ter:imperf kota KOT subst:sg:gen.acc:m2 Ala ALA subst:sg:nom:f ma MÓJ adj:sg:nom:f:pos kota KOTA subst:sg:nom:f.. interp
13 Analiza morfologiczna a GFJP W gramatyce Świdzińskiego brak reguł opisujących część jednostek najniższego poziomu (realizowanych przez pojedyncze słowa). Dopisałem około 50 reguł gramatycznych (ponad 30 dla form czasownikowych).
14 Analiza składniowa Problemy uniemożliwiające bezpośrednią realizację GFJP jako gramatyki metamorficznej: rozszerzenie formalizmu o permutacje, niektóre z warunków, którymi opatrzone są reguły gramatyczne, wymagały przeformułowania w celu zapewnienia ich poprawnego obliczania, jałowa rekursja (cykle złożone z nieterminali, które można dowolnie przepisywać na siebie wzajemnie), reguły opisujące zdanie elementarne wymagały daleko idącej reinterpretacji. Zmiany wprowadzałem w taki sposób, aby nie naruszyć lingwistycznej warstwy opisu.
15 Algorytm analizy składniowej Prologowe sformułowanie algorytmu analizy składniowej w programie Świgra jest mojego autorstwa. Stosowana jest analiza wstępująca (dla polskiego bardziej efektywna od zstępującej). Analizator buduje upakowany las analiz (pozwalający przechować wykładniczą liczbę drzew w wielomianowej pamięci). Reguły gramatyki są kompilowane do klauzul programu (a nie interpretowane w czasie wykonania).
16 Algorytm analizy składniowej Mój algorytm jest bardziej efektywny niż algorytm Matsumoto (BUP, Matsumoto 1983), który nie zabezpiecza przed wielokrotnym wykonywaniem pewnych obliczeń. W porównaniu z typowym analizatorem tablicowym w moim algorytmie krawędzie nieaktywne są ukryte w stosie wywołań procedur i znikają, gdy nie są już potrzebne (mniejsze zapotrzebowanie na pamięć). Mój algorytm ma gorsze pesymistyczne oszacowanie złożoności czasowej (O(n k+1 ), gdzie k jest największą długością prawej strony reguły) niż analizator tablicowy (O(n 3 )). Stosunkowo prosto można to jednak poprawić.
17 Przykładowe drzewo analizy wypowiedzenie zr(os, nd, ter, ozn, żeń/poj, 3, nie, ni, np, 0) ze(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], nie, ni, np, br, 4) fw(np(mian), 1, nd, ter, żeń/poj, 3, nie, ni, np) knoatr(mian, żeń/poj, 3, nie, ni, np, rzecz, 5) fpt(mian, żeń/poj, row, 2, ni, np, zaim, 0) zaimprzym(ten, mian, żeń/poj) Ta TEN knoink(mian, żeń/poj, 3, nie, ni, np, rzecz, 4) formarzecz(mian, żeń/poj) poza POZA ff(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 1, nie, ni, np, br) kweneg(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 1, nie, ni, np) partykula(nie) nie NIE kweink(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 1, ni, np) formaczas1(n, os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 1) wychodzi WYCHODZIĆ znakkonca(np)!! (w1) (r1) (e5) (wy1) (no27) (pt1) (jel6) (no40) (n rz) (fi1) (we21e) (jel2) (we26) (n cz4) (int2)
18 Inne drzewo dla tego samego zdania wypowiedzenie zr(os, nd, ter, ozn, żeń/poj, 3, tak, ni, np, 0) ze(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], tak, ni, np, br, 4) fw(np(mian), 0, nd, ter, żeń/poj, 3, tak, ni, np) fw1(np(mian), 0, nd, ter, żeń/poj, 3, tak, ni, np) zaimprzym(ten, mian, żeń/poj) Ta TEN fl(nd, ter, żeń/poj, 3, tak, ni, np) fpm(poza, bier, tak, ni, np, os) przyimek(poza, bier) poza POZA fno(bier, nmo/mno, 3, tak, ni, np, os, 0) zaimos(bier, nmo/mno, 3) nie ON ff(os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 0, tak, ni, np, br) formaczas1(n, os, nd, ter, ozn, żeń/poj, 3, [np(mian)], 0) wychodzi WYCHODZIĆ znakkonca(np)!! (w1) (r1) (e5) (wy4) (wy8) (jel6) (lu1) (pm1) (jel3) (no1) (n zo3) (fi1) (n cz4) (int2)
19 Wyniki eksperymentów poprawnych niepoprawnych akc. nieakc. akc. nieakc. liczba przykładów % 9% 23% 77% przeciętnie drzew przeciętny czas (s) 0,26 0,36 0,20 0,15 przec. l. kroków Wyniki przetworzenia 660 zdań ilustrujących książkę Świdzińskiego. Czas mierzony na komputerze z procesorem Pentium 1,8 GHz pod systemem Linux. Długości zdań wynoszą 3 do 27 segmentów (ponad połowa w zakresie 7 16).
20 Przykład akceptowanego zdania niepoprawnego * Ona nie czytała książkę.
21 Przykład akceptowanego zdania niepoprawnego (?) *? Ona nie czytała książkę. Ona nie czytała godzinę.
22 Podsumowanie Gramatyka Świdzińskiego okazała się poddawać realizacji komputerowej. Uzyskany program komputerowy wykazuje dużą zgodność z intencjami Autora GFJP. Konieczne ulepszenia gramatyki: frazy liczebnikowe, koordynacja wewnątrz fraz (rzeczownikowych, przymiotnikowych,... ), ograniczenie liczby nadmiarowych drzew (frazy luźne!).
23 Podsumowanie Opracowany przeze mnie algorytm analizy dla gramatyk metamorficznych zapewnia efektywne przetwarzanie zdań polskich. Zawarte w programie Świgra środowisko obliczeniowe dla gramatyk logicznych można wykorzystać z innymi gramatykami tego typu. Niebagatelne znaczenie dla wygody eksperymentów z gramatykami ma gotowy moduł analizy morfologicznej i przejrzysta postać graficzna uzyskiwanych drzew analizy. W zestawieniu z bogatym repertuarem konstrukcji składniowych uwzględnionym w gramatyce Świdzińskiego otwiera to interesujące możliwości automatycznego przetwarzania tekstów polskich.
Jak się nie zgubić w lesie, czyli o wynikach analizy składniowej według gramatyki Świdzińskiego
Marcin Woliński Warszawa Jak się nie zgubić w lesie, czyli o wynikach analizy składniowej według gramatyki Świdzińskiego Niniejszy tekst stanowi skromny przyczynek do lingwistyki dendrologicznej. Zdaję
Bardziej szczegółowoKomputerowa weryfikacja gramatyki Świdzińskiego
INSTYTUT PODSTAW INFORMATYKI POLSKIEJ AKADEMII NAUK Marcin Woliński Komputerowa weryfikacja gramatyki Świdzińskiego Rozprawa doktorska przygotowana pod kierunkiem dr. hab. Janusza S. Bienia, prof. UW i
Bardziej szczegółowoMorfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Bardziej szczegółowoSpis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa
Spis treści -1 LXIII Zjazd PTJ, Warszawa 16-17.09.2003 Pomor, Humor Morfeusz SIAT Poliqarp Holmes Kryteria wyboru Robert Wołosz Marcin Woliński Adam Przepiórkowski Michał Rudolf Niebieska gramatyka Saloni,
Bardziej szczegółowoProgramowanie komputerów
Programowanie komputerów Wykład 1-2. Podstawowe pojęcia Plan wykładu Omówienie programu wykładów, laboratoriów oraz egzaminu Etapy rozwiązywania problemów dr Helena Dudycz Katedra Technologii Informacyjnych
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoKonstrukcje werbalne z aż w gramatyce Świdzińskiego
Konstrukcje werbalne z aż w gramatyce Świdzińskiego Janusz S. Bień 23 lutego 2000 24 marca 2003 1 Wstęp Przedstawione w tytule zagadnienie jest bardzo wąskie. W niniejszym artykule stanowi ono przede wszystkim
Bardziej szczegółowoDefinicje. Algorytm to:
Algorytmy Definicje Algorytm to: skończony ciąg operacji na obiektach, ze ściśle ustalonym porządkiem wykonania, dający możliwość realizacji zadania określonej klasy pewien ciąg czynności, który prowadzi
Bardziej szczegółowoAlgorytm poprawny jednoznaczny szczegółowy uniwersalny skończoność efektywność (sprawność) zmiennych liniowy warunkowy iteracyjny
Algorytm to przepis; zestawienie kolejnych kroków prowadzących do wykonania określonego zadania; to uporządkowany sposób postępowania przy rozwiązywaniu zadania, problemu, z uwzględnieniem opisu danych
Bardziej szczegółowoPosłowie redaktora. 1 Konwencje notacyjne
Posłowie redaktora Kiedy 10 lipca 1978 r. odbywała się obrona pracy doktorskiej Szpakowicza, wydawało się, że praca ta stanowi tylko pierwszy krok do formalnego opisu składniowego języka polskiego i wkrótce
Bardziej szczegółowoEGZAMIN MATURALNY 2012 INFORMATYKA
Centralna Komisja Egzaminacyjna EGZAMIN MATURALNY 2012 INFORMATYKA POZIOM PODSTAWOWY Kryteria oceniania odpowiedzi MAJ 2012 2 Zadanie 1. a) (0 2) Egzamin maturalny z informatyki CZĘŚĆ I Obszar standardów
Bardziej szczegółowoWydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O
Bardziej szczegółowoJęzyki programowania zasady ich tworzenia
Strona 1 z 18 Języki programowania zasady ich tworzenia Definicja 5 Językami formalnymi nazywamy każdy system, w którym stosując dobrze określone reguły należące do ustalonego zbioru, możemy uzyskać wszystkie
Bardziej szczegółowoZa pierwszy niebanalny algorytm uważa się algorytm Euklidesa wyszukiwanie NWD dwóch liczb (400 a 300 rok przed narodzeniem Chrystusa).
Algorytmy definicja, cechy, złożoność. Algorytmy napotykamy wszędzie, gdziekolwiek się zwrócimy. Rządzą one wieloma codziennymi czynnościami, jak np. wymiana przedziurawionej dętki, montowanie szafy z
Bardziej szczegółowo1. Analiza algorytmów przypomnienie
1. Analiza algorytmów przypomnienie T.H. Cormen, C.E. Leiserson, R.L. Rivest, C. Stein Wprowadzenie do algorytmów, rozdziały 1-4 Wydawnictwa naukowo-techniczne (2004) Jak mierzyć efektywność algorytmu?
Bardziej szczegółowoJAKIEGO RODZAJU NAUKĄ JEST
JAKIEGO RODZAJU NAUKĄ JEST INFORMATYKA? Computer Science czy Informatyka? Computer Science czy Informatyka? RACZEJ COMPUTER SCIENCE bo: dziedzina ta zaistniała na dobre wraz z wynalezieniem komputerów
Bardziej szczegółowoWprowadzenie do złożoności obliczeniowej
problemów Katedra Informatyki Politechniki Świętokrzyskiej Kielce, 16 stycznia 2007 problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów Plan wykładu 1 2 algorytmów 3 4 5 6 problemów problemów
Bardziej szczegółowoObliczenia inspirowane Naturą
Obliczenia inspirowane Naturą Wykład 01 Modele obliczeń Jarosław Miszczak IITiS PAN Gliwice 05/10/2016 1 / 33 1 2 3 4 5 6 2 / 33 Co to znaczy obliczać? Co to znaczy obliczać? Deterministyczna maszyna Turinga
Bardziej szczegółowoBadania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle
Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,
Bardziej szczegółowoZłożoność obliczeniowa zadania, zestaw 2
Złożoność obliczeniowa zadania, zestaw 2 Określanie złożoności obliczeniowej algorytmów, obliczanie pesymistycznej i oczekiwanej złożoności obliczeniowej 1. Dana jest tablica jednowymiarowa A o rozmiarze
Bardziej szczegółowoWstęp do Językoznawstwa
Wstęp do Językoznawstwa Prof. Nicole Nau UAM, IJ, Językoznawstwo Komputerowe Dziesiąte zajęcie 08.12.2015 Składnia: Co bada? Jak bada? Konstrukcja składniowa a) ciąg (zespół) form wyrazowych związanych
Bardziej szczegółowoInformatyka I. Wykład 3. Sterowanie wykonaniem programu. Instrukcje warunkowe Instrukcje pętli. Dr inż. Andrzej Czerepicki
Informatyka I Wykład 3. Sterowanie wykonaniem programu. Instrukcje warunkowe Instrukcje pętli Dr inż. Andrzej Czerepicki Politechnika Warszawska Wydział Transportu 2018 Operacje relacji (porównania) A
Bardziej szczegółowo3. Podaj elementy składowe jakie powinna uwzględniać definicja informatyki.
1. Podaj definicję informatyki. 2. W jaki sposób można definiować informatykę? 3. Podaj elementy składowe jakie powinna uwzględniać definicja informatyki. 4. Co to jest algorytm? 5. Podaj neumanowską architekturę
Bardziej szczegółowo1 Narzędzia przetwarzania 2 tekſtów hiſtorycznych
1 Narzędzia przetwarzania 2 tekſtów hiſtorycznych Marcin Wolińſki, Witold Kieraś, Dorota Komo ńska, Emanuel Modrzejewſki Zespół Inżynieriey Lingw tyczney In ytut Pod aw Informatyki Polſkiey Akademii Nauk
Bardziej szczegółowoINFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE
Studia podyplomowe dla nauczycieli INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE Przedmiot JĘZYKI PROGRAMOWANIA DEFINICJE I PODSTAWOWE POJĘCIA Autor mgr Sławomir Ciernicki 1/7 Aby
Bardziej szczegółowoKORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN, Instytut Podstaw Informatyki PAN Podstawowe informacje o projekcie
Bardziej szczegółowoElektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki
Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
Bardziej szczegółowoEGZAMIN MATURALNY 2011 INFORMATYKA
Centralna Komisja Egzaminacyjna w Warszawie EGZAMIN MATURALNY 2011 INFORMATYKA POZIOM ROZSZERZONY MAJ 2011 2 Zadanie 1. a) (0 1) Egzamin maturalny z informatyki poziom rozszerzony CZĘŚĆ I Obszar standardów
Bardziej szczegółowoSemantyka i Weryfikacja Programów - Laboratorium 3
Semantyka i Weryfikacja Programów - Laboratorium 3 Modelowanie układów mikroprocesorowych - część II Wykonywanie całego programu Cały program wykonywany jest przez funkcję intpprog. Jedynym argumentem
Bardziej szczegółowoWizualizacja wyników analizy syntaktycznej
Janusz S. Bień Wizualizacja wyników analizy syntaktycznej Reprezentacja struktur syntaktycznych za pomocą wykresów nazywanych technicznie grafami ma długą tradycję. Najczęściej stosuje się drzewa, czyli
Bardziej szczegółowoAlgorytm. a programowanie -
Algorytm a programowanie - Program komputerowy: Program komputerowy można rozumieć jako: kod źródłowy - program komputerowy zapisany w pewnym języku programowania, zestaw poszczególnych instrukcji, plik
Bardziej szczegółowoPodstawy programowania. Wykład: 13. Rekurencja. dr Artur Bartoszewski -Podstawy programowania, sem 1 - WYKŁAD
Podstawy programowania Wykład: 13 Rekurencja 1 dr Artur Bartoszewski -Podstawy programowania, sem 1 - WYKŁAD Podstawy programowania Rekurencja - pojęcie 2 Rekurencja - pojęcie Rekurencja (rekursja) wywołanie
Bardziej szczegółowoGramatyki regularne i automaty skoczone
Gramatyki regularne i automaty skoczone Alfabet, jzyk, gramatyka - podstawowe pojcia Co to jest gramatyka regularna, co to jest automat skoczony? Gramatyka regularna Gramatyka bezkontekstowa Translacja
Bardziej szczegółowoImię, nazwisko, nr indeksu
Imię, nazwisko, nr indeksu (kod) (9 punktów) Wybierz 9 z poniższych pytań i wybierz odpowiedź tak/nie (bez uzasadnienia). Za prawidłowe odpowiedzi dajemy +1 punkt, za złe -1 punkt. Punkty policzymy za
Bardziej szczegółowoINFORMATYKA POZIOM ROZSZERZONY
EGZAMIN MATURALNY W ROKU SZKOLNYM 2015/2016 FORMUŁA DO 2014 ( STARA MATURA ) INFORMATYKA POZIOM ROZSZERZONY ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ MIN-R1, R2 MAJ 2016 Uwaga: Akceptowane są wszystkie odpowiedzi
Bardziej szczegółowoINFORMATYKA POZIOM ROZSZERZONY
EGZAMIN MATURALNY W ROKU SZKOLNYM 2015/2016 FORMUŁA DO 2014 ( STARA MATURA ) INFORMATYKA POZIOM ROZSZERZONY ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ MIN-R1, R2 MAJ 2016 Uwaga: Akceptowane są wszystkie odpowiedzi
Bardziej szczegółowoWłodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)
Bardziej szczegółowoProgramowanie w Logice Gramatyki metamorficzne. Przemysław Kobylański na podstawie [CM2003] i [SS1994]
Programowanie w Logice Gramatyki metamorficzne Przemysław Kobylański na podstawie [CM2003] i [SS1994] Gramatyki bezkontekstowe Gramatyką bezkontekstową jest uporządkowana czwórka G = Σ, N, S, P, gdzie
Bardziej szczegółowoprawda symbol WIEDZA DANE komunikat fałsz liczba INFORMACJA (nie tyko w informatyce) kod znak wiadomość ENTROPIA forma przekaz
WIEDZA prawda komunikat symbol DANE fałsz kod INFORMACJA (nie tyko w informatyce) liczba znak forma ENTROPIA przekaz wiadomość Czy żyjemy w erze informacji? TAK Bo używamy nowego rodzaju maszyn maszyn
Bardziej szczegółowoMarek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997
1 Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997 SPIS TREŚCI WSTĘP... 1 WYKŁAD 1: WPROWADZENIE DO JĘZYKOZNAWSTWA
Bardziej szczegółowoOPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU
Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU Nazwa
Bardziej szczegółowoAnaliza semantyczna. Gramatyka atrybutywna
Analiza semantyczna Do przeprowadzenia poprawnego tłumaczenia, oprócz informacji na temat składni języka podlegającego tłumaczeniu, translator musi posiadać możliwość korzystania z wielu innych informacji
Bardziej szczegółowoMetody Kompilacji Wykład 8 Analiza Syntaktyczna cd. Włodzimierz Bielecki WI ZUT
Metody Kompilacji Wykład 8 Analiza Syntaktyczna cd Analiza Syntaktyczna Wstęp Parser dostaje na wejściu ciąg tokenów od analizatora leksykalnego i sprawdza: czy ciąg ten może być generowany przez gramatykę.
Bardziej szczegółowo10. Translacja sterowana składnią i YACC
10. Translacja sterowana składnią i YACC 10.1 Charakterystyka problemu translacja sterowana składnią jest metodą generacji przetworników tekstu języków, których składnię opisano za pomocą gramatyki (bezkontekstowej)
Bardziej szczegółowoAUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Bardziej szczegółowoSkładnia rachunku predykatów pierwszego rzędu
Początek Gramatyka Kwantyfikatory Poprawność Logika obliczeniowa Instytut Informatyki Początek Gramatyka Kwantyfikatory Poprawność Plan wykładu 1 Na (dobry) początek Zrozumieć słowa Oswoić znaki 2 Gramatyka
Bardziej szczegółowoMatematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Gramatyki bezkontekstowe I Gramatyką bezkontekstową
Bardziej szczegółowoEGZAMIN MATURALNY 2013 INFORMATYKA
Centralna Komisja Egzaminacyjna EGZAMIN MATURALNY 2013 INFORMATYKA POZIOM PODSTAWOWY Kryteria oceniania odpowiedzi MAJ 2013 2 Egzamin maturalny z informatyki CZĘŚĆ I Zadanie 1. a) (0 2) Obszar standardów
Bardziej szczegółowoLingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Bardziej szczegółowoEGZAMIN MATURALNY 2013 INFORMATYKA
Centralna Komisja Egzaminacyjna EGZAMIN MATURALNY 2013 INFORMATYKA POZIOM PODSTAWOWY Kryteria oceniania odpowiedzi MAJ 2013 2 CZĘŚĆ I Zadanie 1. a) (0 2) Obszar standardów Opis wymagań Analiza liczby wykonywanych
Bardziej szczegółowoAnaliza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki
Analiza leksykalna 1 Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych (tokenów)
Bardziej szczegółowoGramatyki wykorzystywane w analizie języka naturalnego Ciekawe zastosowania
Gramatyki wykorzystywane w analizie języka naturalnego Ciekawe zastosowania Anna Sikora Janusz Głowiak Gramatyka W zakres gramatyki wchodzą: Leksykologia
Bardziej szczegółowoMetoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.
Plan Procedura decyzyjna Reguły α i β - algorytm Plan Procedura decyzyjna Reguły α i β - algorytm Logika obliczeniowa Instytut Informatyki 1 Procedura decyzyjna Logiczna konsekwencja Teoria aksjomatyzowalna
Bardziej szczegółowoArchitektura komputerów
Architektura komputerów Tydzień 5 Jednostka Centralna Zadania realizowane przez procesor Pobieranie rozkazów Interpretowanie rozkazów Pobieranie danych Przetwarzanie danych Zapisanie danych Główne zespoły
Bardziej szczegółowoMatematyczne podstawy informatyki Mathematical Foundations of Computational Sciences. Matematyka Poziom kwalifikacji: II stopnia
Nazwa przedmiotu: Kierunek: Rodzaj przedmiotu: obowiązkowy dla wszystkich specjalności Rodzaj zajęć: wykład, ćwiczenia Matematyczne podstawy informatyki Mathematical Foundations of Computational Sciences
Bardziej szczegółowoJęzyki formalne i automaty Ćwiczenia 1
Języki formalne i automaty Ćwiczenia Autor: Marcin Orchel Spis treści Spis treści... Wstęp teoretyczny... 2 Wprowadzenie do teorii języków formalnych... 2 Gramatyki... 5 Rodzaje gramatyk... 7 Zadania...
Bardziej szczegółowo11 Probabilistic Context Free Grammars
11 Probabilistic Context Free Grammars Ludzie piszą i mówią wiele rzeczy, a ich wypowiedzi mają zawsze jakąś określoną strukture i regularność. Celem jest znalezienie i wyizolowanie tego typu struktur.
Bardziej szczegółowoJęzyki formalne i automaty Ćwiczenia 8
Języki formalne i automaty Ćwiczenia 8 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Konwersja NFA do DFA... 2 Minimalizacja liczby stanów DFA... 4 Konwersja automatu DFA do
Bardziej szczegółowoGRAMATYKI BEZKONTEKSTOWE
GRAMATYKI BEZKONTEKSTOWE PODSTAWOWE POJĘCIE GRAMATYK Przez gramatykę rozumie się pewien układ reguł zadający zbiór słów utworzonych z symboli języka. Słowa te mogą być i interpretowane jako obiekty językowe
Bardziej szczegółowoMetoda generowania typowych scenariuszy awaryjnych w zakładach dużego i zwiększonego ryzyka - ExSysAWZ
Metoda generowania typowych scenariuszy awaryjnych w zakładach dużego i zwiększonego ryzyka - ExSysAWZ A.S. Markowski, M. Pietrzykowski, R.J. Żyłła Politechnika Łódzka Katedra Inżynierii Bezpieczeństwa
Bardziej szczegółowoOgólne wymagania na poszczególne oceny z języka niemieckiego
Ogólne wymagania na poszczególne oceny z języka niemieckiego Celujący: - uczeń posiada wiadomości i umiejętności określone programem nauczania oraz wiedzę wykraczającą poza program nauczania języka na
Bardziej szczegółowoProjektowanie. Projektowanie mikroprocesorów
WYKŁAD Projektowanie mikroprocesorów Projektowanie układ adów w cyfrowych - podsumowanie Algebra Boole a Bramki logiczne i przerzutniki Automat skończony System binarny i reprezentacja danych Synteza logiczna
Bardziej szczegółowoParsery LL(1) Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki
Parsery LL() Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy generacyjnej (zstępującej, top-down) symbol początkowy już terminale wyprowadzenie lewostronne pierwszy od lewej
Bardziej szczegółowoMetody numeryczne Wykład 4
Metody numeryczne Wykład 4 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Metody skończone rozwiązywania
Bardziej szczegółowoBank częściowo ujednoznacznionych struktur LFG
Bank częściowo ujednoznacznionych struktur LFG Katarzyna Krasnowska 1 Witold Kieraś 1,2 1 IPI PAN 2 IJP UW 7 października 2013 Katarzyna Krasnowska Witold Kieraś Bank struktur LFG 7 października 2013 1
Bardziej szczegółowoModele Obliczeń. Wykład 1 - Wprowadzenie. Marcin Szczuka. Instytut Matematyki, Uniwersytet Warszawski
Modele Obliczeń Wykład 1 - Wprowadzenie Marcin Szczuka Instytut Matematyki, Uniwersytet Warszawski Wykład fakultatywny w semestrze zimowym 2014/2015 Marcin Szczuka (MIMUW) Modele Obliczeń 2014/2015 1 /
Bardziej szczegółowoWstęp do Informatyki dla bioinformatyków
Wstęp do Informatyki dla bioinformatyków Wykład 1. Wstęp do Wstępu Bartek Wilczyński bartek@mimuw.edu.pl Po pierwsze - Formalności 2 kolokwia (po 15 pkt) początek XI i koniec XII Dwa programy zaliczeniowe:
Bardziej szczegółowoElektrotechnika I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Niestacjonarne (stacjonarne / niestacjonarne)
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Informatyka 2 Nazwa modułu w języku angielskim Computer science 2 Obowiązuje
Bardziej szczegółowooperacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.
Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie
Bardziej szczegółowoTablice (jedno i wielowymiarowe), łańcuchy znaków
Tablice (jedno i wielowymiarowe), łańcuchy znaków wer. 8 z drobnymi modyfikacjami! Wojciech Myszka Katedra Mechaniki i Inżynierii Materiałowej 2017-04-07 09:35:32 +0200 Zmienne Przypomnienie/podsumowanie
Bardziej szczegółowoTechnologia informacyjna Algorytm Janusz Uriasz
Technologia informacyjna Algorytm Janusz Uriasz Algorytm Algorytm - (łac. algorithmus); ścisły przepis realizacji działań w określonym porządku, system operacji, reguła komponowania operacji, sposób postępowania.
Bardziej szczegółowoKARTA PRZEDMIOTU. M2/2/7 w języku polskim Gramatyka opisowa 2 w języku angielskim Descriptive grammar 2 USYTUOWANIE PRZEDMIOTU W SYSTEMIE STUDIÓW
Kod przedmiotu Nazwa przedmiotu KARTA PRZEDMIOTU M2/2/7 w języku polskim Gramatyka opisowa 2 w języku angielskim Descriptive grammar 2 USYTUOWANIE PRZEDMIOTU W SYSTEMIE STUDIÓW Kierunek studiów Forma studiów
Bardziej szczegółowoBudowa Mikrokomputera
Budowa Mikrokomputera Wykład z Podstaw Informatyki dla I roku BO Piotr Mika Podstawowe elementy komputera Procesor Pamięć Magistrala (2/16) Płyta główna (ang. mainboard, motherboard) płyta drukowana komputera,
Bardziej szczegółowoEfektywna analiza składniowa GBK
TEORETYCZNE PODSTAWY INFORMATYKI Efektywna analiza składniowa GBK Rozbiór zdań i struktur zdaniowych jest w wielu przypadkach procesem bardzo skomplikowanym. Jego złożoność zależy od rodzaju reguł produkcji
Bardziej szczegółowoRozdział 8 PROGRAMOWANIE SIECIOWE
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 8 PROGRAMOWANIE SIECIOWE 8.2. Ćwiczenia komputerowe Ćwiczenie 8.1 Wykorzystując
Bardziej szczegółowoKorpusowe badania składniowe
derwojed@uw.edu.pl Sesja korpusowa 16 lipca 2009 r. 1 Wstęp: korpus tekstów 2 A. Wierzbicka, System składniowy prozy polskiego renesansu 3 M. Świdziński, Własności składniowe wypowiedników polskich 4 M.
Bardziej szczegółowoMatematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Informacje podstawowe 1. Konsultacje: pokój
Bardziej szczegółowo1. Liczby i w zapisie zmiennoprzecinkowym przedstawia się następująco
1. Liczby 3456.0012 i 0.000076235 w zapisie zmiennoprzecinkowym przedstawia się następująco a) 0.34560012 10 4 i 0.76235 10 4 b) 3.4560012 10 3 i 7.6235 10 5 c) 3.4560012 10 3 i 7.6235 10 5 d) po prostu
Bardziej szczegółowoJak napisać program obliczający pola powierzchni różnych figur płaskich?
Część IX C++ Jak napisać program obliczający pola powierzchni różnych figur płaskich? Na początku, przed stworzeniem właściwego kodu programu zaprojektujemy naszą aplikację i stworzymy schemat blokowy
Bardziej szczegółowoWprowadzenie do składni
Uniwersytet Kardynała Stefana Wyszyńskiego 1 Przedmiot składni i jej miejsce w systemie języka 2 3 Hierarchia jednostek języka nielinearne linearne (liniowe) cechy dystynktywne semantyczne dystynktywne,
Bardziej szczegółowoChomsky. Syntactic Structures
Chomsky. Syntactic Structures język: instrument wyrażania znaczeń twórczy charakter zdolności językowych język kompetencja i korpus wykonanie poddawanie idealizacji surowych danych intuicja rodzimego użytkownika
Bardziej szczegółowoAlgorytmy i struktury danych. Drzewa: BST, kopce. Letnie Warsztaty Matematyczno-Informatyczne
Algorytmy i struktury danych Drzewa: BST, kopce Letnie Warsztaty Matematyczno-Informatyczne Drzewa: BST, kopce Definicja drzewa Drzewo (ang. tree) to nieskierowany, acykliczny, spójny graf. Drzewo może
Bardziej szczegółowoNarzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Bardziej szczegółowoZadania badawcze prowadzone przez Zakład Technik Programowania:
Zadania badawcze prowadzone przez Zakład Technik Programowania: - Opracowanie metod zrównoleglania programów sekwencyjnych o rozszerzonym zakresie stosowalności. - Opracowanie algorytmów obliczenia tranzytywnego
Bardziej szczegółowoXQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Bardziej szczegółowoPoprawność semantyczna
Poprawność składniowa Poprawność semantyczna Poprawność algorytmu Wypisywanie zdań z języka poprawnych składniowo Poprawne wartościowanie zdań języka, np. w języku programowania skutki wystąpienia wyróżnionych
Bardziej szczegółowoAproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Bardziej szczegółowoProgramowanie deklaratywne
Programowanie deklaratywne Artur Michalski Informatyka II rok Plan wykładu Wprowadzenie do języka Prolog Budowa składniowa i interpretacja programów prologowych Listy, operatory i operacje arytmetyczne
Bardziej szczegółowoń óź óź Ę ć Ą Ą ó Ę ć ć Ł Ś Ł Ą ź ó Ź ź ń ó ź ź ź ó ó ź ź ź ź ó ć ź ó ć ó Ź ź ń Ę ó Ź ź ź Ę ź ó Ź ź ź Ź ź ń Ą Ą Ę Ą Ę ć Ą Ą Ę Ą Ź Ą ź Ł Ę Ł ó ź ć ć Ę Źó ó ó ź Ś Ą ź ó ó ń ź Ę ó Ą Ś ź ó Ę ó ź ó ź ź ź ź
Bardziej szczegółowoAlgorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące.
Algorytmy Równoległe i Rozproszone Część X - Algorytmy samostabilizujące. Łukasz Kuszner pokój 209, WETI http://www.sphere.pl/ kuszner/ kuszner@sphere.pl Oficjalna strona wykładu http://www.sphere.pl/
Bardziej szczegółowoEGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA
EGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA POZIOM ROZSZERZONY FORMUŁA DO 2014 ( STARA MATURA ) ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ MIN-R1,R2 MAJ 2018 Uwaga: Akceptowane są wszystkie odpowiedzi
Bardziej szczegółowoUwaga: Akceptowane są wszystkie odpowiedzi merytorycznie poprawne i spełniające warunki zadania.
Uwaga: Akceptowane są wszystkie odpowiedzi merytorycznie poprawne i spełniające warunki zadania. Część I Zadanie 1.1. (0 2) Wymagania ogólne Wymagania szczegółowe po testowanie rozwiązania (5.7.). strategia
Bardziej szczegółowoGramatyka opisowa języka polskiego Kod przedmiotu
Gramatyka opisowa języka polskiego - opis przedmiotu Informacje ogólne Nazwa przedmiotu Gramatyka opisowa języka polskiego Kod przedmiotu 09.3-WH-FiP-GOP-1-K-S14_pNadGen0FA8C Wydział Kierunek Wydział Humanistyczny
Bardziej szczegółowoWymagania edukacyjne. Opracowano na podstawie planu wynikowego nauczania języka włoskiego w szkole ponadgimnazjalnej na
Wymagania edukacyjne Opracowano na podstawie planu wynikowego nauczania języka włoskiego w szkole ponadgimnazjalnej na podstawie metody nauczania Nuovo Progetto Italiano 1 wydawnictwa EDILINGUA Poziom
Bardziej szczegółowoPorównanie czasu wykonania wybranych przekształceń przestrzennych dla programów GIS: ArcGIS i QGIS
Porównanie czasu wykonania wybranych przekształceń przestrzennych dla programów GIS: ArcGIS i QGIS 25.06.2019 r. mgr inż. Justyna Dębicka Przekształcenia W ramach eksperymentu wybrano 3 przekształcenia
Bardziej szczegółowoALGORYTMY I PROGRAMY
ALGORYTMY I PROGRAMY Program to ciąg instrukcji, zapisanych w języku zrozumiałym dla komputera. Ten ciąg instrukcji realizuje jakiś algorytm. Algorytm jest opisem krok po kroku jak rozwiązać problem, czy
Bardziej szczegółowoAlgorytm - pojęcie algorytmu, sposób zapisu, poziom szczegółowości, czynności proste i strukturalne. Pojęcie procedury i funkcji.
Algorytm - pojęcie algorytmu, sposób zapisu, poziom szczegółowości, czynności proste i strukturalne. Pojęcie procedury i funkcji. Maria Górska 9 stycznia 2010 1 Spis treści 1 Pojęcie algorytmu 3 2 Sposób
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE DIAGNOSTYKĘ MEDYCZNĄ Kierunek: Inżynieria Biomedyczna Rodzaj przedmiotu: obowiązkowy moduł specjalności informatyka medyczna Rodzaj zajęć: wykład, projekt
Bardziej szczegółowoZ punktu widzenia kognitywisty: język naturalny
Z punktu widzenia kognitywisty: język naturalny Wykład III: Język: od syntaktyki do semantyki (od gramatyki do znaczeń) Gramatyka struktur frazowych GSF to drugi, mocniejszy z trzech modeli opisu języka
Bardziej szczegółowo