Jajem, tyjesz, wyjecie czyli Dlaczego dialog z komputerem jest taki trudny?



Podobne dokumenty
2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

Przetwarzanie języka w praktyce. przykładzie problemu rozstrzygania wieloznaczności

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Języki programowania zasady ich tworzenia

Open Access w technologii językowej dla języka polskiego

Logika dla socjologów Część 2: Przedmiot logiki

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Przetwarzanie języka naturalnego (NLP)

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)

Internet Semantyczny i Logika II

Zastosowanie Wikipedii w przetwarzaniu języka naturalnego

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Lokalizacja Oprogramowania

3. Podaj elementy składowe jakie powinna uwzględniać definicja informatyki.

Strukturalizacja otoczenia agentów: ontologie, CYC, sieci semantyczne

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

AUTOMATYKA INFORMATYKA

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Wprowadzenie do teorii systemów ekspertowych

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Wprowadzenie. Teoria automatów i języków formalnych. Literatura (1)

Ontologie, czyli o inteligentnych danych

Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu.

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

Wstęp do logiki. Kto jasno i konsekwentnie myśli, ściśle i z ładem się wyraża,

Wprowadzenie do składni

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy

WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO W KLASIE IV w Szkole Podstawowej nr 42 z Oddziałami Integracyjnymi w roku szkolnym 2018/2019

Wprowadzenie do logiki Język jako system znaków słownych

Załącznik Nr 4. odniesienie do obszarowych efektów kształcenia w KRK. kierunkowe efekty kształceniaopis WIEDZA

Filozofia z elementami logiki Język jako system znaków słownych część 2

Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty. Literatura

USPRAWNIANIE CZYTANIA U UCZNIÓW DYSLEKTYCZNYCH

WYMAGANIA PROGRAMOWE DLA KLASY IV SZKOŁY PODSTAWOWEJ Z PRZEDMIOTU JĘZYK POLSKI NA ROK SZKOLNY 2014/2015

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Logika. dr Agnieszka Figaj

Elementy kognitywistyki II: Sztuczna inteligencja

KIERUNKOWE EFEKTY KSZTAŁCENIA

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

Kryteria ocen z języka polskiego dla klasy V szkoły podstawowej

Spis treści tomu pierwszego

SZTUCZNA INTELIGENCJA

JAKIEGO RODZAJU NAUKĄ JEST

Egzamin Gimnazjalny z WSiP MAJ 2015 Analiza wyników próbnego egzaminu gimnazjalnego Część humanistyczna z zakresu języka polskiego Klasa 1

Kultura logicznego myślenia

Niko 2 Przedmiotowy System Oceniania

2

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Tłumaczenie maszynowe. Zasady działania. Autorzy: Josef van Genabith (DFKI), Krzysztof Łoboda (Uniwersytet Jagielloński)

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol

Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki

HLT_12 Warszawa. Lingwistyka matematyczna w Katedrze Elektroniki AGH

Praca magisterska Jakub Reczycki. Opiekun : dr inż. Jacek Rumiński. Katedra Inżynierii Biomedycznej Wydział ETI Politechnika Gdańska

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Rozdział VII. Znaczenie logiki dla prawa i pracy prawnika Zadania i odpowiedzi 20

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

KRYTERIA OCEN Z JĘZYKA POLSKIEGO DLA UCZNIÓW KLAS IV ZGODNE Z PROGRAMEM NAUCZANIA JĘZYKA POLSKIEGO SŁOWA NA START W KLASIE IV i VI SZKOŁY PODSTAWOWEJ.

Reprezentacja wiedzy ontologie, logiki deskrypcyjne

Podejście obiektowe - podstawowe pojęcia

3 grudnia Sieć Semantyczna

Programowanie komputerów

Festiwal Myśli Abstrakcyjnej, Warszawa, Czy SZTUCZNA INTELIGENCJA potrzebuje FILOZOFII?

Alan M. TURING. Matematyk u progu współczesnej informatyki

Semantyka rachunku predykatów

KRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V

Internet Semantyczny. Logika opisowa

JĘZYK POLSKI WYMAGANIA EDUKACYJNE KLASA V

Narzędzia AI. Jakub Wróblewski Pokój SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)

Ocenę wyższą otrzymuje uczeń, który spełnia wszystkie wymagania pozytywnych ocen niższych.

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

JĘZYK Wiesław Gdowicz

I. Umiejscowienie kierunku w obszarze/obszarach kształcenia wraz z uzasadnieniem:

Klasyfikacja tradycyjna Klasyfikacja Zygmunta Saloniego Przykład analizy. Części mowy. Anna Kozłowska. Uniwersytet Kardynała Stefana Wyszyńskiego

ZAJĘCIA DLA DZIECI Z TRUDNOŚCIAMI W CZYTANIU I PISANIU ( MARZEC / KWIECIEŃ )

Reguły gry zaliczenie przedmiotu wymaga zdania dwóch testów, z logiki (za ok. 5 tygodni) i z filozofii (w sesji); warunkiem koniecznym podejścia do

Semantic primitivesi ich konfiguracje w różnych językach

Reprezentacja wiedzy i wnioskowanie: wprowadzenie, sieci semantyczne, ramy

Ocena celująca: Ocena bardzo dobra: WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DLA KLASY I. 1. Uczeń:

Słowa jako zwierciadło świata

System Korekty Tekstu Polskiego

Kategorie gramatyczne polszczyzny

Wstęp do Językoznawstwa

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67

Definicje. Algorytm to:

Eksploracja Zasobów Internetu

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji. 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

WSTĘP ZAGADNIENIA WSTĘPNE

Transkrypt:

Jajem, tyjesz, wyjecie czyli Dlaczego dialog z komputerem jest taki trudny? Aleksander Pohl http://apohllo.pl Katedra Informatyki, Akademia Górniczo-Hutnicza SFI 8. marca 2008

Plan prezentacji Lingwistyka komputerowa Wstęp Fleksja Semantyka

Plan prezentacji Lingwistyka komputerowa Wstęp Fleksja Semantyka

Kilka słów o mnie :-) Zapalony programista Rubiego Entuzjasta lingwistyki komputerowej Obecnie pracuję głównie w projekcie: Polska Platforma Bezpieczeństwa Wewnętrznego (używamy Javy :-/) http://apohllo.pl

Test Turinga Alan Turing w 1950 roku sformułował słynny test, który mógłby dać odpowiedź na pytanie: Czy maszyna jest inteligenta?. Podstawowa idea: ludzka inteligencja przejawia się w dialogu Jeśli komunikujac się z komputerem w języku naturalnym nie jesteśmy w stanie zorientować się, że mamy do czynienia z maszyna, to możemy uznać, że jest on inteligentny. Do dziś żaden system nie przeszedł testu Turinga.

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Lingwistyka komputerowa obszar wiedzy na przecięciu językoznawstwa i sztucznej inteligencji rozwiazanie problemów językowych na potrzeby: komunikacji człowieka z maszyna np. interfejs w języku polskim do bazy danych o filmach maszynowego tłumaczenie tekstów jeden z pierwszych problemów LK: tłumaczenie z rosyjskiego na angielski ekstrakcji informacji np. śledzenie informacji prasowych dotyczacych nowych wdzianek Dody wyszukiwania informacji np. użycie zamiast słów kluczowych pytań, opisu pożadanego rezultatu automatycznej akwizycji wiedzy np. robot kuchenny czytajacy ksiażkę kulinarna

Problemy lingwistyki komputerowej 1 rozpoznawanie mowy/pisma przekształcanie ciagu dźwięków/obrazu na litery/wyrazy/zdania synteza mowy przekształcanie napisów w dźwięki analiza morfologiczna przyporzadkowanie słowom ich kategorii gramatycznej (np. koń M l. p., r. męski żywotny) ujednoznacznianie sensu przyporzadkowanie słowu pojęcia (np. zamek określenie czy chodzi o zamek jako budowlę, czy zamek w drzwiach) analiza syntaktyczna rozpoznanie gramatycznej struktury zdania, zachodzacych w nim zwiazków

Problemy lingwistyki komputerowej 1 rozpoznawanie mowy/pisma przekształcanie ciagu dźwięków/obrazu na litery/wyrazy/zdania synteza mowy przekształcanie napisów w dźwięki analiza morfologiczna przyporzadkowanie słowom ich kategorii gramatycznej (np. koń M l. p., r. męski żywotny) ujednoznacznianie sensu przyporzadkowanie słowu pojęcia (np. zamek określenie czy chodzi o zamek jako budowlę, czy zamek w drzwiach) analiza syntaktyczna rozpoznanie gramatycznej struktury zdania, zachodzacych w nim zwiazków

Problemy lingwistyki komputerowej 1 rozpoznawanie mowy/pisma przekształcanie ciagu dźwięków/obrazu na litery/wyrazy/zdania synteza mowy przekształcanie napisów w dźwięki analiza morfologiczna przyporzadkowanie słowom ich kategorii gramatycznej (np. koń M l. p., r. męski żywotny) ujednoznacznianie sensu przyporzadkowanie słowu pojęcia (np. zamek określenie czy chodzi o zamek jako budowlę, czy zamek w drzwiach) analiza syntaktyczna rozpoznanie gramatycznej struktury zdania, zachodzacych w nim zwiazków

Problemy lingwistyki komputerowej 1 rozpoznawanie mowy/pisma przekształcanie ciagu dźwięków/obrazu na litery/wyrazy/zdania synteza mowy przekształcanie napisów w dźwięki analiza morfologiczna przyporzadkowanie słowom ich kategorii gramatycznej (np. koń M l. p., r. męski żywotny) ujednoznacznianie sensu przyporzadkowanie słowu pojęcia (np. zamek określenie czy chodzi o zamek jako budowlę, czy zamek w drzwiach) analiza syntaktyczna rozpoznanie gramatycznej struktury zdania, zachodzacych w nim zwiazków

Problemy lingwistyki komputerowej 1 rozpoznawanie mowy/pisma przekształcanie ciagu dźwięków/obrazu na litery/wyrazy/zdania synteza mowy przekształcanie napisów w dźwięki analiza morfologiczna przyporzadkowanie słowom ich kategorii gramatycznej (np. koń M l. p., r. męski żywotny) ujednoznacznianie sensu przyporzadkowanie słowu pojęcia (np. zamek określenie czy chodzi o zamek jako budowlę, czy zamek w drzwiach) analiza syntaktyczna rozpoznanie gramatycznej struktury zdania, zachodzacych w nim zwiazków

Problemy lingwistyki komputerowej 2 rozpoznawanie obiektów nazwanych właściwa interpretacja nazw własnych i ich skrótów (np. Rzeczpospolita Polska, Polska, RP) rozpoznawanie wyrażeń koekstensywnych wykrywanie wyrażeń odnoszacych się do tych samych obiektów (np. Leo kupił Volkswagena. On lubi niemieckie samochody. ) tłumaczenie słów/wyrażeń wybór właściwego tłumaczenia spośród wielu możliwych Jadę samochodem. I drive a car. Jadę rowerem. I ride a bicycle.

Problemy lingwistyki komputerowej 2 rozpoznawanie obiektów nazwanych właściwa interpretacja nazw własnych i ich skrótów (np. Rzeczpospolita Polska, Polska, RP) rozpoznawanie wyrażeń koekstensywnych wykrywanie wyrażeń odnoszacych się do tych samych obiektów (np. Leo kupił Volkswagena. On lubi niemieckie samochody. ) tłumaczenie słów/wyrażeń wybór właściwego tłumaczenia spośród wielu możliwych Jadę samochodem. I drive a car. Jadę rowerem. I ride a bicycle.

Problemy lingwistyki komputerowej 2 rozpoznawanie obiektów nazwanych właściwa interpretacja nazw własnych i ich skrótów (np. Rzeczpospolita Polska, Polska, RP) rozpoznawanie wyrażeń koekstensywnych wykrywanie wyrażeń odnoszacych się do tych samych obiektów (np. Leo kupił Volkswagena. On lubi niemieckie samochody. ) tłumaczenie słów/wyrażeń wybór właściwego tłumaczenia spośród wielu możliwych Jadę samochodem. I drive a car. Jadę rowerem. I ride a bicycle.

Problemy lingwistyki komputerowej 3 analiza semantyczna interpretacja zdania w pewny języku formalnym (np. logice predykatów, logice deskryptywnej), odniesienie wyrażeń do rzeczywistości pozajęzykowej analiza dyskursu uwzględniania pragmatycznych aspektów komunikacji (np. dostosowanie komunikatów do zasobu słownictwa użytkownika) synteza zdań tworzenie zdań na podstawie elementarnych danych, notacji logicznej

Problemy lingwistyki komputerowej 3 analiza semantyczna interpretacja zdania w pewny języku formalnym (np. logice predykatów, logice deskryptywnej), odniesienie wyrażeń do rzeczywistości pozajęzykowej analiza dyskursu uwzględniania pragmatycznych aspektów komunikacji (np. dostosowanie komunikatów do zasobu słownictwa użytkownika) synteza zdań tworzenie zdań na podstawie elementarnych danych, notacji logicznej

Problemy lingwistyki komputerowej 3 analiza semantyczna interpretacja zdania w pewny języku formalnym (np. logice predykatów, logice deskryptywnej), odniesienie wyrażeń do rzeczywistości pozajęzykowej analiza dyskursu uwzględniania pragmatycznych aspektów komunikacji (np. dostosowanie komunikatów do zasobu słownictwa użytkownika) synteza zdań tworzenie zdań na podstawie elementarnych danych, notacji logicznej

Plan prezentacji Lingwistyka komputerowa Wstęp Fleksja Semantyka

Wstęp Trójkat semiotyczny

Wstęp Właściwie brak jednoznaczności. Przykład znany wszystkim informatykom: Jak porównujemy liczby całkowite? a == 10 Jak porównujemy liczby rzeczywiste? a == 10.0 Nie! a 10.0 DELTA Pojedyncza liczba rzeczywista w zapisie binarnym reprezentuje przedział liczb rzeczywistych. Pojedynczy znak może być zinterpretowany na wiele sposobów, może reprezentować różne pojęcia a przez to różne odniesienia.

Wstęp Właściwie brak jednoznaczności. Przykład znany wszystkim informatykom: Jak porównujemy liczby całkowite? a == 10 Jak porównujemy liczby rzeczywiste? a == 10.0 Nie! a 10.0 DELTA Pojedyncza liczba rzeczywista w zapisie binarnym reprezentuje przedział liczb rzeczywistych. Pojedynczy znak może być zinterpretowany na wiele sposobów, może reprezentować różne pojęcia a przez to różne odniesienia.

Wstęp Właściwie brak jednoznaczności. Przykład znany wszystkim informatykom: Jak porównujemy liczby całkowite? a == 10 Jak porównujemy liczby rzeczywiste? a == 10.0 Nie! a 10.0 DELTA Pojedyncza liczba rzeczywista w zapisie binarnym reprezentuje przedział liczb rzeczywistych. Pojedynczy znak może być zinterpretowany na wiele sposobów, może reprezentować różne pojęcia a przez to różne odniesienia.

Wstęp Źródła wieloznaczności przetworzenie obrazu/dźwięku na tekst fleksja wyrażenia złożone struktura syntaktyczna homonimia tłumaczenie

Wstęp Obraz/dźwięk tekst rozpoznanie fonemów np. głoski dźwięczne i bezdźwięczne: p/b, t/d, etc. rozpoznanie końca wyrazu: jajem / ja jem? tyjesz / ty jesz? wyjecie / wy jecie? zapis ortograficzny čarny czarny može może / morze? Rozwiazanie: ukryte modele Markowa (Hidden Markov Models). Przykład zastosowania: interfejs głosowy komputera Mac (niestety tylko w języku angielskim).

Wstęp Obraz/dźwięk tekst rozpoznanie fonemów np. głoski dźwięczne i bezdźwięczne: p/b, t/d, etc. rozpoznanie końca wyrazu: jajem / ja jem? tyjesz / ty jesz? wyjecie / wy jecie? zapis ortograficzny čarny czarny može może / morze? Rozwiazanie: ukryte modele Markowa (Hidden Markov Models). Przykład zastosowania: interfejs głosowy komputera Mac (niestety tylko w języku angielskim).

Wstęp Obraz/dźwięk tekst rozpoznanie fonemów np. głoski dźwięczne i bezdźwięczne: p/b, t/d, etc. rozpoznanie końca wyrazu: jajem / ja jem? tyjesz / ty jesz? wyjecie / wy jecie? zapis ortograficzny čarny czarny može może / morze? Rozwiazanie: ukryte modele Markowa (Hidden Markov Models). Przykład zastosowania: interfejs głosowy komputera Mac (niestety tylko w języku angielskim).

Wstęp Obraz/dźwięk tekst rozpoznanie fonemów np. głoski dźwięczne i bezdźwięczne: p/b, t/d, etc. rozpoznanie końca wyrazu: jajem / ja jem? tyjesz / ty jesz? wyjecie / wy jecie? zapis ortograficzny čarny czarny može może / morze? Rozwiazanie: ukryte modele Markowa (Hidden Markov Models). Przykład zastosowania: interfejs głosowy komputera Mac (niestety tylko w języku angielskim).

Wstęp Obraz/dźwięk tekst rozpoznanie fonemów np. głoski dźwięczne i bezdźwięczne: p/b, t/d, etc. rozpoznanie końca wyrazu: jajem / ja jem? tyjesz / ty jesz? wyjecie / wy jecie? zapis ortograficzny čarny czarny može może / morze? Rozwiazanie: ukryte modele Markowa (Hidden Markov Models). Przykład zastosowania: interfejs głosowy komputera Mac (niestety tylko w języku angielskim).

Fleksja Fleksja W językach fleksyjnych (np. polskim) słowa odmieniaja się przez osoby, czasy, liczby, rodzaje, przypadki, stopnie: jeść: ja jem, ty jesz, on/ona/ono je, my jemy, wy jecie, oni jedza,... (45 form) kot: M. kot, D. kota, C. kotu, B. kota, N. kotem, Ms. kocie, W. kocie,... dobry: r.m., st. równy M. dobry, D. dobrego,... r.m., st. wyższy M. lepszy, D. lepszego,... r.ż., st. równy M. dobra, D. dobrej,... bardzo: st. równy bardzo, st. wyższy bardziej, st. najwyższy najbardziej

Fleksja Fleksja W językach fleksyjnych (np. polskim) słowa odmieniaja się przez osoby, czasy, liczby, rodzaje, przypadki, stopnie: jeść: ja jem, ty jesz, on/ona/ono je, my jemy, wy jecie, oni jedza,... (45 form) kot: M. kot, D. kota, C. kotu, B. kota, N. kotem, Ms. kocie, W. kocie,... dobry: r.m., st. równy M. dobry, D. dobrego,... r.m., st. wyższy M. lepszy, D. lepszego,... r.ż., st. równy M. dobra, D. dobrej,... bardzo: st. równy bardzo, st. wyższy bardziej, st. najwyższy najbardziej

Fleksja Fleksja W językach fleksyjnych (np. polskim) słowa odmieniaja się przez osoby, czasy, liczby, rodzaje, przypadki, stopnie: jeść: ja jem, ty jesz, on/ona/ono je, my jemy, wy jecie, oni jedza,... (45 form) kot: M. kot, D. kota, C. kotu, B. kota, N. kotem, Ms. kocie, W. kocie,... dobry: r.m., st. równy M. dobry, D. dobrego,... r.m., st. wyższy M. lepszy, D. lepszego,... r.ż., st. równy M. dobra, D. dobrej,... bardzo: st. równy bardzo, st. wyższy bardziej, st. najwyższy najbardziej

Fleksja Fleksja W językach fleksyjnych (np. polskim) słowa odmieniaja się przez osoby, czasy, liczby, rodzaje, przypadki, stopnie: jeść: ja jem, ty jesz, on/ona/ono je, my jemy, wy jecie, oni jedza,... (45 form) kot: M. kot, D. kota, C. kotu, B. kota, N. kotem, Ms. kocie, W. kocie,... dobry: r.m., st. równy M. dobry, D. dobrego,... r.m., st. wyższy M. lepszy, D. lepszego,... r.ż., st. równy M. dobra, D. dobrej,... bardzo: st. równy bardzo, st. wyższy bardziej, st. najwyższy najbardziej

Fleksja Fleksja W językach fleksyjnych (np. polskim) słowa odmieniaja się przez osoby, czasy, liczby, rodzaje, przypadki, stopnie: jeść: ja jem, ty jesz, on/ona/ono je, my jemy, wy jecie, oni jedza,... (45 form) kot: M. kot, D. kota, C. kotu, B. kota, N. kotem, Ms. kocie, W. kocie,... dobry: r.m., st. równy M. dobry, D. dobrego,... r.m., st. wyższy M. lepszy, D. lepszego,... r.ż., st. równy M. dobra, D. dobrej,... bardzo: st. równy bardzo, st. wyższy bardziej, st. najwyższy najbardziej

Fleksja Opis morfologiczny i forma podstawowa Podstawowy problem: dla danej formy znaleźć jej opis morfologiczny oraz formę podstawową:»szli przez ciemny las«biernik liczby pojedynczej przymiotnika ciemny»spotkali czarownicę z kotem«narzędnik liczby pojedynczej rzeczownika kot»nie czekajac odrzekł: Ja biorę czarownicę a ty kota. «imiesłów współczesny czasownika czekać Rozwiazanie: wykorzystanie stemmera, stworzenie słownika fleksyjnego

Fleksja Opis morfologiczny i forma podstawowa Podstawowy problem: dla danej formy znaleźć jej opis morfologiczny oraz formę podstawową:»szli przez ciemny las«biernik liczby pojedynczej przymiotnika ciemny»spotkali czarownicę z kotem«narzędnik liczby pojedynczej rzeczownika kot»nie czekajac odrzekł: Ja biorę czarownicę a ty kota. «imiesłów współczesny czasownika czekać Rozwiazanie: wykorzystanie stemmera, stworzenie słownika fleksyjnego

Fleksja Opis morfologiczny i forma podstawowa Podstawowy problem: dla danej formy znaleźć jej opis morfologiczny oraz formę podstawową:»szli przez ciemny las«biernik liczby pojedynczej przymiotnika ciemny»spotkali czarownicę z kotem«narzędnik liczby pojedynczej rzeczownika kot»nie czekajac odrzekł: Ja biorę czarownicę a ty kota. «imiesłów współczesny czasownika czekać Rozwiazanie: wykorzystanie stemmera, stworzenie słownika fleksyjnego

Fleksja Słownik fleksyjny języka polskiego

Fleksja Fleksja wieloznaczność Czy to wystarczy?»wyjecie jak wyjce afrykańskie!«forma podstawowa wyć»zanim wyjecie wszystko z talerza, umyjcie ręce.«forma podstawowa wyjeść Jednej formie można przypisać wiele form podstawowych.»zjadłem dziś dwa jaja.«biernik liczby mnogiej rzeczownika jajo»nikt nie mógł znaleźć skradzionego jaja Fabergé.«dopełniacz liczby pojedynczej rzeczownika jajo Jednej formie można przyporzadkować wiele opisów morfologicznych.

Fleksja Fleksja wieloznaczność Czy to wystarczy?»wyjecie jak wyjce afrykańskie!«forma podstawowa wyć»zanim wyjecie wszystko z talerza, umyjcie ręce.«forma podstawowa wyjeść Jednej formie można przypisać wiele form podstawowych.»zjadłem dziś dwa jaja.«biernik liczby mnogiej rzeczownika jajo»nikt nie mógł znaleźć skradzionego jaja Fabergé.«dopełniacz liczby pojedynczej rzeczownika jajo Jednej formie można przyporzadkować wiele opisów morfologicznych.

Fleksja Fleksja wieloznaczność Czy to wystarczy?»wyjecie jak wyjce afrykańskie!«forma podstawowa wyć»zanim wyjecie wszystko z talerza, umyjcie ręce.«forma podstawowa wyjeść Jednej formie można przypisać wiele form podstawowych.»zjadłem dziś dwa jaja.«biernik liczby mnogiej rzeczownika jajo»nikt nie mógł znaleźć skradzionego jaja Fabergé.«dopełniacz liczby pojedynczej rzeczownika jajo Jednej formie można przyporzadkować wiele opisów morfologicznych.

Fleksja Fleksja interpretacje Dla zdania: Nie ma rzeczy bardziej zwykłej i naturalnej niż to, że ludzie, którzy maja roszczenie, iż odkryli jakaś rzecz nową w świecie filozofii i nauk, sugeruja innym, by chwalili ich własne systemy, osławiajac jednocześnie wszystkie te, które powstały wcześniej. otrzymujemy 120960 kombinacj!

Fleksja Rozwiazanie i zastosowania Nie ma prostej odpowiedzi na pytanie jak rozwiazać powyższe problemy. Można wyróżnić dwa podejścia: morfosyntaktyczne wykorzystanie morfosyntaktycznych opisów słów występujacych w kontekście danego słowa semantyczne wykorzystanie relacji semantycznych zachodzacych pomiędzy danym słowem a innymi słowami w jego kontekście Zastosowania: wyszukiwarka Google od 2007 roku uwzględnia fleksję języka polskiego, framework Ruby on Rails zna fleksję języka angielskiego.

Fleksja Rozwiazanie i zastosowania Nie ma prostej odpowiedzi na pytanie jak rozwiazać powyższe problemy. Można wyróżnić dwa podejścia: morfosyntaktyczne wykorzystanie morfosyntaktycznych opisów słów występujacych w kontekście danego słowa semantyczne wykorzystanie relacji semantycznych zachodzacych pomiędzy danym słowem a innymi słowami w jego kontekście Zastosowania: wyszukiwarka Google od 2007 roku uwzględnia fleksję języka polskiego, framework Ruby on Rails zna fleksję języka angielskiego.

Fleksja Rozwiazanie i zastosowania Nie ma prostej odpowiedzi na pytanie jak rozwiazać powyższe problemy. Można wyróżnić dwa podejścia: morfosyntaktyczne wykorzystanie morfosyntaktycznych opisów słów występujacych w kontekście danego słowa semantyczne wykorzystanie relacji semantycznych zachodzacych pomiędzy danym słowem a innymi słowami w jego kontekście Zastosowania: wyszukiwarka Google od 2007 roku uwzględnia fleksję języka polskiego, framework Ruby on Rails zna fleksję języka angielskiego.

Fleksja Rozwiazanie i zastosowania Nie ma prostej odpowiedzi na pytanie jak rozwiazać powyższe problemy. Można wyróżnić dwa podejścia: morfosyntaktyczne wykorzystanie morfosyntaktycznych opisów słów występujacych w kontekście danego słowa semantyczne wykorzystanie relacji semantycznych zachodzacych pomiędzy danym słowem a innymi słowami w jego kontekście Zastosowania: wyszukiwarka Google od 2007 roku uwzględnia fleksję języka polskiego, framework Ruby on Rails zna fleksję języka angielskiego.

Semantyka Semantyka Semantyka to dział językoznawstwa, który koncentruje się na badaniu znaczenia wyrażeń języka. Jak można opisać znaczenie słów? za pomoca definicji w języku naturalnym lub formalnym: jajko 1.»żeńska komórka rozrodcza ptaka, zwykle kury, zawierajaca białko i żółtko, otoczone skorupka, wykorzystywana jako produkt spożywczy«1 za pomoca relacji semantycznych np. hipernimii, hiponimii, holonimii, meronimii, synonimii, sprawstwa, etc.: jajko hipernimy: komórka, meronimy: żółtko, białko,... 1 Uniwersalny słownik języka polskiego Wydawnictwo Naukowe PWN, Warszawa 2003.

Semantyka Semantyka Semantyka to dział językoznawstwa, który koncentruje się na badaniu znaczenia wyrażeń języka. Jak można opisać znaczenie słów? za pomoca definicji w języku naturalnym lub formalnym: jajko 1.»żeńska komórka rozrodcza ptaka, zwykle kury, zawierajaca białko i żółtko, otoczone skorupka, wykorzystywana jako produkt spożywczy«1 za pomoca relacji semantycznych np. hipernimii, hiponimii, holonimii, meronimii, synonimii, sprawstwa, etc.: jajko hipernimy: komórka, meronimy: żółtko, białko,... 1 Uniwersalny słownik języka polskiego Wydawnictwo Naukowe PWN, Warszawa 2003.

Semantyka Semantyka Semantyka to dział językoznawstwa, który koncentruje się na badaniu znaczenia wyrażeń języka. Jak można opisać znaczenie słów? za pomoca definicji w języku naturalnym lub formalnym: jajko 1.»żeńska komórka rozrodcza ptaka, zwykle kury, zawierajaca białko i żółtko, otoczone skorupka, wykorzystywana jako produkt spożywczy«1 za pomoca relacji semantycznych np. hipernimii, hiponimii, holonimii, meronimii, synonimii, sprawstwa, etc.: jajko hipernimy: komórka, meronimy: żółtko, białko,... 1 Uniwersalny słownik języka polskiego Wydawnictwo Naukowe PWN, Warszawa 2003.

Semantyka Semantyka wieloznaczność I»Kupiłem wczoraj akcje warte 100 tysięcy.«akcja jako papier wartościowy»akcja tej ksiażki rozwijała się niemrawo.«akcja jako fabuła Czysta homonimia jeden wyraz (w znaczeniu leksemu) posiadajacy wiele znaczeń»lekarz zalecił podanie zastrzyku.lekarka zaleciła podanie zastrzyku.«dwa wyrazy posiadajace (niemal) identyczne znaczenie.

Semantyka Semantyka wieloznaczność I»Kupiłem wczoraj akcje warte 100 tysięcy.«akcja jako papier wartościowy»akcja tej ksiażki rozwijała się niemrawo.«akcja jako fabuła Czysta homonimia jeden wyraz (w znaczeniu leksemu) posiadajacy wiele znaczeń»lekarz zalecił podanie zastrzyku.lekarka zaleciła podanie zastrzyku.«dwa wyrazy posiadajace (niemal) identyczne znaczenie.

Semantyka Rozwiazanie Można wyróżnić dwa podejścia: statystyczne wykorzystanie algorytmów automatycznego uczenia do wyekstrahowania zwiazków semantycznych na podstawie dużego korpusu tekstów. Wady: żaden korpus nie jest idealny, konieczne jest ręczne oznaczenie sensu wszystkich słów w korpusie symboliczne stworzenie słownika zawierajacego relacje semantyczne lub definicje formalne Wady: czasochłonność, brak zgodności co do tego, które relacje powinny być uwzględnione

Semantyka Rozwiazanie Można wyróżnić dwa podejścia: statystyczne wykorzystanie algorytmów automatycznego uczenia do wyekstrahowania zwiazków semantycznych na podstawie dużego korpusu tekstów. Wady: żaden korpus nie jest idealny, konieczne jest ręczne oznaczenie sensu wszystkich słów w korpusie symboliczne stworzenie słownika zawierajacego relacje semantyczne lub definicje formalne Wady: czasochłonność, brak zgodności co do tego, które relacje powinny być uwzględnione

Semantyka Rozwiazanie cd. Słowniki semantyczne: WordNet najbardziej znany słownik semantyczny języka angielskiego. Na jego podstawie tworzone sa słowniki dla innych języków, np. polskiego Słowosieć Zalety: liczba słów, uwzględnienie wyrażeń złożonych i nazw własnych. Wady: brak pokrycia w korpusie tekstów, brak relacji syntagmatycznych. Przykład: egg hypernyms: ovum, egg cell; hyponyms: nit, spawn, roe,... FrameNet słownik zawierajacy opis sytuacji i czynności. Na razie nie doczekał się ostatecznej wersji.

Semantyka Rozwiazanie cd. Słowniki semantyczne: WordNet najbardziej znany słownik semantyczny języka angielskiego. Na jego podstawie tworzone sa słowniki dla innych języków, np. polskiego Słowosieć Zalety: liczba słów, uwzględnienie wyrażeń złożonych i nazw własnych. Wady: brak pokrycia w korpusie tekstów, brak relacji syntagmatycznych. Przykład: egg hypernyms: ovum, egg cell; hyponyms: nit, spawn, roe,... FrameNet słownik zawierajacy opis sytuacji i czynności. Na razie nie doczekał się ostatecznej wersji.

Semantyka Rozwiazanie cd. Słowniki semantyczne: WordNet najbardziej znany słownik semantyczny języka angielskiego. Na jego podstawie tworzone sa słowniki dla innych języków, np. polskiego Słowosieć Zalety: liczba słów, uwzględnienie wyrażeń złożonych i nazw własnych. Wady: brak pokrycia w korpusie tekstów, brak relacji syntagmatycznych. Przykład: egg hypernyms: ovum, egg cell; hyponyms: nit, spawn, roe,... FrameNet słownik zawierajacy opis sytuacji i czynności. Na razie nie doczekał się ostatecznej wersji.

Semantyka Słownik semantyczny języka polskiego Słownik semantyczny języka polskiego zintegrowany z SFJP

Semantyka Semantyka wieloznaczność II Czy to wystarczy?»i saw clouds flying over Zurich.Widziałem chmury lecace nad Zurychem.I saw buildings flying over Zurich.Widziałem budynki lecac nad Zurychem.«Tylko na podstawie wiedzy zdroworozsadkowej można właściwie przetłumaczyć powyższe przykłady. Rozwiazanie: wykorzystanie Cyc lub Sumo.

Semantyka Semantyka wieloznaczność II Czy to wystarczy?»i saw clouds flying over Zurich.Widziałem chmury lecace nad Zurychem.I saw buildings flying over Zurich.Widziałem budynki lecac nad Zurychem.«Tylko na podstawie wiedzy zdroworozsadkowej można właściwie przetłumaczyć powyższe przykłady. Rozwiazanie: wykorzystanie Cyc lub Sumo.

Semantyka Semantyka wieloznaczność II Czy to wystarczy?»i saw clouds flying over Zurich.Widziałem chmury lecace nad Zurychem.I saw buildings flying over Zurich.Widziałem budynki lecac nad Zurychem.«Tylko na podstawie wiedzy zdroworozsadkowej można właściwie przetłumaczyć powyższe przykłady. Rozwiazanie: wykorzystanie Cyc lub Sumo.

Semantyka Semantyka wieloznaczność II Czy to wystarczy?»i saw clouds flying over Zurich.Widziałem chmury lecace nad Zurychem.I saw buildings flying over Zurich.Widziałem budynki lecac nad Zurychem.«Tylko na podstawie wiedzy zdroworozsadkowej można właściwie przetłumaczyć powyższe przykłady. Rozwiazanie: wykorzystanie Cyc lub Sumo.

Semantyka Cyc?

Semantyka Sumo?

Semantyka Ontologie EnCYClopedia Suggested Upper Merged Ontology Ontologia (w informatyce) to formalna specyfikacja konceptualizacji wybranej dziedziny wiedzy: pojęcia indywidua relacje funkcje reguły

Semantyka Ontologie EnCYClopedia Suggested Upper Merged Ontology Ontologia (w informatyce) to formalna specyfikacja konceptualizacji wybranej dziedziny wiedzy: pojęcia indywidua relacje funkcje reguły

Semantyka Ontologie cd. Cyc oraz Sumo stanowia formalizację zdroworozsadkowej wiedzy obejmujacej najbardziej ogólne własności świata. CloudInSky Mt: UniversalVocabularyMt isa: SpatiallyDisjointObjectType ExistingObjectType Mt: TopicMt isa: WeatherObjects-Weather-Topic genls: Outdoors-ExposedToWeather CloudlikeObject Opaque Airborne TopAndBottomSidedObject

Semantyka Ontologie cd. Cyc oraz Sumo stanowia formalizację zdroworozsadkowej wiedzy obejmujacej najbardziej ogólne własności świata. CloudInSky Mt: UniversalVocabularyMt isa: SpatiallyDisjointObjectType ExistingObjectType Mt: TopicMt isa: WeatherObjects-Weather-Topic genls: Outdoors-ExposedToWeather CloudlikeObject Opaque Airborne TopAndBottomSidedObject

Semantyka Zastosowania hakia.com semantic search Prawdziwe Web 2.0 (języki RDF, OWL) Moduł dla Lucene bazujacy na WordNecie uwzględnienie synonimów Cycorp wykorzystuje Cyc m.in. integrowania heterogenicznych baz danych, inteligentnego wyszukiwania informacji, rozproszonego AI, analizowania bezpieczeństwa sieci komputerowych ABB ścisła kontrola procesu wytwarzania transformatorów

Semantyka Zasoby WordNet wordnet.princeton.edu FrameNet framenet.icsi.berkeley.edu Słownik fleksyjny języka polskiego winnie.ics.agh.edu.pl/proj_uk/sfjp/index.html Słownik semantyczny języka polskiego (demo) wierzba.wzks.uj.edu.pl/ dernow/smddemo OpenCyc www.opencyc.org SUMO www.ontologyportal.org Strona Włodzisława Ducha www.is.umk.pl/ duch/ir.html

Semantyka Źródła Obrazek Cyc Everything You Always Wanted To Know About Sex ;-) Obrazek Sumo http://fallingsky.blogs.com Obrazek Nobody knows shoes http://hackety.org/press/nks-17.html

Semantyka