Metody nadzorowane w ujednoznacznianiu sensów s lów korpusu ekonomicznego
|
|
- Kajetan Muszyński
- 8 lat temu
- Przeglądów:
Transkrypt
1 Metody nadzorowane w ujednoznacznianiu sensów s lów korpusu ekonomicznego Lukasz Kobyliński Instytut Podstaw Informatyki Polskiej Akademii Nauk ul. J. K. Ordona 21, Warszawa 21 listopada 2011 Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
2 Na czym polega zadanie? Projekt NEKST zadanie 1 podzadanie 1.4 przeglad i przystosowanie do jezyka polskiego metod uczenia nadzorowanego w zastosowaniu do automatycznego ujednoznaczniania sensów s lów, podzadanie 1.5 przygotowanie zasobów niezb ednych do trenowania i testowania algorytmów w Z1.4. Dodatkowe za lożenia trenowanie i testowanie metod odbywa si e na korpusie dziedzinowym o tematyce ekonomicznej. ostateczna metoda ujednoznaczniania powinna wykorzystywać formalizm, wyrażajacy regu ly ujednoznaczniania sensów s lów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
3 Plan 1 Zasoby S lownik hase l ekonomicznych Korpus tekstów 2 Automatyczne ujednoznacznianie Analiza danych Metody uczenia maszynowego Metody regu lowe Wykorzystanie zewn etrznych zasobów lingwistycznych do poprawy skuteczności metod uczenia maszynowego 3 Podsumowanie wyników Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
4 Zasoby S lownik hase l ekonomicznych S lownik hase l ekonomicznych Opracowano s lownik 52 hase l z dziedziny ekonomicznej agent[n] akcja[n] baza[n] cena[n] dochód[n] efekt[n] firma[n] fundusz[n] gospodarka[n] granica[n] inwestycja[n] jednostka[n] kontrola[n] koszt[n] linia[n] ochrona[n] opcja[n] pieniadz[n] podatek[n] podstawa[n] polityka[n] pomoc[n] post epowanie[n] praca[n] prawo[n] projekt[n] punkt[n] rachunek[n] rynek[n] rzad[n] sad[n] si la[n] spó lka[n] stan[n] stopa[n] stopień[n] system[n] środek[n] świadczenie[n] ubezpieczenie[n] udzia l[n] umowa[n] unia[n] wartość[n] warunek[n] zasada[n] zmiana[n] zysk[n] czarny[a] specjalny[a] wolny[a] z loty[a] Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
5 Zasoby S lownik hase l ekonomicznych S lownik hase l ekonomicznych Statystyki s lownika 52 has la najmniejsza liczba sensów: 2 najwieksza liczba sensów: 6 suma liczby sensów: 188 średnia liczba sensów: 3,62 średnia liczba definicji każdego sensu: 2,78 Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
6 Zasoby Korpus tekstów Korpus dane źród lowe Korpus NKJP econo wybrano paragrafy, które dotycza dziedziny ekonomicznej liczba segmentów: Rozk lad liczby hase l ze s lownika w korpusie Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
7 Zasoby Korpus tekstów Korpus dane źród lowe Korpus GPW (raporty gie ldowe) dodano anotacje morfosyntaktyczna za pomoca TAKIPI 1.8 liczba segmentów: Rozk lad liczby hase l ze s lownika w korpusie Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
8 Korpus dane źród lowe Zasoby Korpus tekstów Korpus Wiki econo wybrano artyku ly, które dotycza dziedziny ekonomicznej dodano anotacje morfosyntaktyczna za pomoca TAKIPI 1.8 liczba segmentów: Rozk lad liczby hase l ze s lownika w korpusie Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
9 Zasoby Korpus tekstów Korpus Wiki econo pozyskanie Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
10 Zasoby Korpus Wiki econo przyk lad Korpus tekstów Przyk lad Rynek pierwotny rynek kapita lowy, na którym nastepuje sprzedaż nowych papierów wartościowych bezpośrednio przez emitenta akcji i obligacji dopuszczonych do obrotu przez Komisje Nadzoru Finansowego. Cene papierów wartościowych w tym wypadku ustala emitent, czyli instytucja wystawiajaca akcje lub obligacje we w lasnym imieniu. Emisja i zakup papierów wartościowych na rynku pierwotnym odbywa sie za pośrednictwem domów maklerskich lub banków prowadzacych dzia lalność maklerska. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
11 Korpus Wiki econo Zasoby Korpus tekstów Korpus zosta l uzyskany poprzez: wybranie kategorii ekonomicznych najwyższego rzedu, dodanie kategorii potomnych, które również by ly ekonomiczne, pobranie wszystkich artyku lów z wynikowej listy kategorii, usuniecie z nich fragmentów poza g lówna treścia artyku lu (odnośniki, bibliografia, inne jezyki, itp.) za pomoca biblioteki jwpl, przetworzenie za pomoca TaKIPI 1.8, przekonwertowanie do formatu TEI, ostateczna lista kategorii obejmowa la 81 kategorii i ok stron (artyku lów), dane pochodza z końca kwietnia Kategorie wyjściowe: Ekonomia, Ekonometria, Makroekonomia, Polityka cenowa, Mikroekonomia, Mi edzynarodowe stosunki gospodarcze, Problemy ekonomiczne, Rynki, Rachunkowość, Finanse, Prawo gospodarcze, Gospodarka, Handel, Produkcja, Us lugi. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
12 Korpus anotacja Automatyczne ujednoznacznianie Analiza danych Przebieg anotacji wykorzystane narz edzie AnotEk, te same transze przypisywane sa do dwóch anotatorów, w przypadku konfliktu anotacji, transza wraca do anotatorów z prośba o skomentowanie podjetej decyzji, transze skomentowane trafiaja do superanotatora, który przypisuje anotacje ostateczna. Podzi ekowania Lukasz Sza lkiewicz SuperAnotator, Izabela Will utworzenie pierwszej wersji s lownika, wszyscy anotatorzy. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
13 Analiza danych Wyniki anotacji korpusów Korpus NKJP econo zaanotowano segmentów. Korpus GPW zaanotowano segmentów. Korpus WIKI econo zaanotowano segmentów. L acznie zaanotowano segmentów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
14 Analiza danych Wyniki anotacji korpusów Korpus NKJP econo zaanotowano segmentów. Korpus GPW zaanotowano segmentów. Korpus WIKI econo zaanotowano segmentów. L acznie zaanotowano segmentów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
15 Analiza danych Wyniki anotacji korpusów Korpus NKJP econo zaanotowano segmentów. Korpus GPW zaanotowano segmentów. Korpus WIKI econo zaanotowano segmentów. L acznie zaanotowano segmentów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
16 Analiza danych Wyniki anotacji korpusów Korpus NKJP econo zaanotowano segmentów. Korpus GPW zaanotowano segmentów. Korpus WIKI econo zaanotowano segmentów. L acznie zaanotowano segmentów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
17 Analiza danych Wyniki anotacji korpusów (2) Oczekiwane rezultaty metod automatycznych pomi edzy dolnym a górnym ograniczeniem ograniczenie dolne MFS (Most Frequent Sense), ograniczenie górne ITA (Inter-Annotator Agreement). Statystyki korpusu Korpus NKJP econo MFS = 77,65%, ITA = 91,97%. Korpus GPW MFS = 94,31%, ITA = 96,82%. Korpus WIKI econo MFS = 74,76%, ITA = 90,58%. L acznie MFS = 81,80%, ITA = 93,25%. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
18 Analiza danych Wyniki anotacji korpusów (2) Oczekiwane rezultaty metod automatycznych pomi edzy dolnym a górnym ograniczeniem ograniczenie dolne MFS (Most Frequent Sense), ograniczenie górne ITA (Inter-Annotator Agreement). Statystyki korpusu Korpus NKJP econo MFS = 77,65%, ITA = 91,97%. Korpus GPW MFS = 94,31%, ITA = 96,82%. Korpus WIKI econo MFS = 74,76%, ITA = 90,58%. L acznie MFS = 81,80%, ITA = 93,25%. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
19 Analiza danych Wyniki anotacji korpusów (2) Oczekiwane rezultaty metod automatycznych pomi edzy dolnym a górnym ograniczeniem ograniczenie dolne MFS (Most Frequent Sense), ograniczenie górne ITA (Inter-Annotator Agreement). Statystyki korpusu Korpus NKJP econo MFS = 77,65%, ITA = 91,97%. Korpus GPW MFS = 94,31%, ITA = 96,82%. Korpus WIKI econo MFS = 74,76%, ITA = 90,58%. L acznie MFS = 81,80%, ITA = 93,25%. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
20 Analiza danych Wyniki anotacji korpusów (2) Oczekiwane rezultaty metod automatycznych pomi edzy dolnym a górnym ograniczeniem ograniczenie dolne MFS (Most Frequent Sense), ograniczenie górne ITA (Inter-Annotator Agreement). Statystyki korpusu Korpus NKJP econo MFS = 77,65%, ITA = 91,97%. Korpus GPW MFS = 94,31%, ITA = 96,82%. Korpus WIKI econo MFS = 74,76%, ITA = 90,58%. L acznie MFS = 81,80%, ITA = 93,25%. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
21 Analiza danych Wyniki anotacji korpusów (2) Oczekiwane rezultaty metod automatycznych pomi edzy dolnym a górnym ograniczeniem ograniczenie dolne MFS (Most Frequent Sense), ograniczenie górne ITA (Inter-Annotator Agreement). Statystyki korpusu Korpus NKJP econo MFS = 77,65%, ITA = 91,97%. Korpus GPW MFS = 94,31%, ITA = 96,82%. Korpus WIKI econo MFS = 74,76%, ITA = 90,58%. L acznie MFS = 81,80%, ITA = 93,25%. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
22 Metody uczenia maszynowego Metody uczenia maszynowego Przebadanie metod uczenia maszynowego, uzyskujacych najlepsze wyniki dla jezyka angielskiego wykorzystujemy implementacje znanych metod uczenia maszynowego i narz edzia WSDDE do przeprowadzenia eksperymentów, budujemy klasyfikatory dla każdego ujednoznacznianego has la, określamy skuteczność klasyfikacji w podejściu 10CV (dziesi eciokrotna walidacja krzyżowa), dla każdego has la przegladamy przestrzeń metod określenia istotności atrybutów, metod klasyfikacji oraz parametrów reprezentacji danych (np. wielkości okna). Rezultat istotna poprawa wyniku wzgl edem MFS (wyboru najcz estszego sensu). Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
23 Metody uczenia maszynowego Zastosowanie metod uczenia maszynowego reprezentacja danych W jaki sposób reprezentować ujednoznaczniane has lo w pewnym kontekście za pomoca wektora cech liczbowych? Przyk lad P lacac np. z lotówke za kilogram sprowadzonego miesa, przetwarzajac go wraz z innym obniży ly sobie koszty surowca, a wiec zwiekszy ly swoje dochody. wystepowanie s lów w dużym oknie wokó l has la, p lacić cena z lotówka moralność kilogram przetwarzać wyst epowanie s lów na pewnej pozycji, w niewielkiej odleg lości od has la, wyst epowanie form gramatycznych w niewielkiej odleg lości od has la, forma gramatyczna has la. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
24 Metody uczenia maszynowego Zastosowanie metod uczenia maszynowego reprezentacja danych W jaki sposób reprezentować ujednoznaczniane has lo w pewnym kontekście za pomoca wektora cech liczbowych? Przyk lad P lacac np. z lotówke za kilogram sprowadzonego miesa, przetwarzajac go wraz z innym obniży ly sobie koszty surowca, a wiec zwiekszy ly swoje dochody. wyst epowanie s lów w dużym oknie wokó l has la, wystepowanie s lów na pewnej pozycji, w niewielkiej odleg lości od has la, obniżyć-2 obniżyć-1 siebie-1 surowiec+1 praca wyst epowanie form gramatycznych w niewielkiej odleg lości od has la, forma gramatyczna has la. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
25 Metody uczenia maszynowego Zastosowanie metod uczenia maszynowego reprezentacja danych W jaki sposób reprezentować ujednoznaczniane has lo w pewnym kontekście za pomoca wektora cech liczbowych? Przyk lad P lacac np. z lotówke za kilogram sprowadzonego miesa, przetwarzajac go wraz z innym obniży ly sobie koszty surowca, a wiec zwiekszy ly swoje dochody. wyst epowanie s lów w dużym oknie wokó l has la, wyst epowanie s lów na pewnej pozycji, w niewielkiej odleg lości od has la, wystepowanie form gramatycznych w niewielkiej odleg lości od has la, praet-2 subst-1 adj-1 subst forma gramatyczna has la. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
26 Metody uczenia maszynowego Zastosowanie metod uczenia maszynowego reprezentacja danych W jaki sposób reprezentować ujednoznaczniane has lo w pewnym kontekście za pomoca wektora cech liczbowych? Przyk lad P lacac np. z lotówke za kilogram sprowadzonego miesa, przetwarzajac go wraz z innym obniży ly sobie koszty surowca, a wiec zwiekszy ly swoje dochody. wyst epowanie s lów w dużym oknie wokó l has la, wyst epowanie s lów na pewnej pozycji, w niewielkiej odleg lości od has la, wyst epowanie form gramatycznych w niewielkiej odleg lości od has la, forma gramatyczna has la. subst pl dat acc Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
27 Eksperymenty wst epne Metody uczenia maszynowego Istotnie wp lywaja na wynik klasyfikacji (leksem praca): liczba wykorzystanych atrybutów (d lugość wektora cech), szerokość okna, w którym badamy wyst epowanie s lów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
28 Metody uczenia maszynowego Eksperymenty wst epne Istotnie wp lywaja na wynik klasyfikacji (leksem praca): liczba wykorzystanych atrybutów (d lugość wektora cech), szerokość okna, w którym badamy wyst epowanie s lów. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
29 Metody uczenia maszynowego Wnioski z eksperymentów na pojedynczych has lach Wnioski ogólne dla każdego has la optymalny dobór atrybutów i ich liczby jest inny, metody trzeba uczyć indywidualnie dla każdego has la, zwi ekszanie liczby atrybutów poprawia wyniki, do pewnej wartości granicznej, dobre rezultaty daja metody bayesowskie. Najlepsze uśrednionione wyniki uzyskano: wykorzystujac formy bazowe s lów w analizowanym oknie, biorac pod uwage wystepowanie s lów oraz form gramatycznych bezpośrednio przed i po haśle ujednoznacznianym, uwzgledniaj ac interpretacje morfosyntaktyczna has la ujednoznacznianego. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
30 Metody uczenia maszynowego Wnioski z eksperymentów na pojedynczych has lach Wnioski ogólne dla każdego has la optymalny dobór atrybutów i ich liczby jest inny, metody trzeba uczyć indywidualnie dla każdego has la, zwi ekszanie liczby atrybutów poprawia wyniki, do pewnej wartości granicznej, dobre rezultaty daja metody bayesowskie. Najlepsze uśrednionione wyniki uzyskano: wykorzystujac formy bazowe s lów w analizowanym oknie, biorac pod uwage wystepowanie s lów oraz form gramatycznych bezpośrednio przed i po haśle ujednoznacznianym, uwzgledniaj ac interpretacje morfosyntaktyczna has la ujednoznacznianego. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
31 Metody uczenia maszynowego Wyniki Otrzymane wyniki skuteczności klasyfikacji (vs MFS) korpus NKJP econo acc = 90,37%, dla 46 hase l poprawa wyniku korpus GPW acc = 99,13%, dla 36 hase l poprawa wyniku korpus Wiki econo acc = 90,38%, dla 49 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
32 Metody uczenia maszynowego Wyniki Otrzymane wyniki skuteczności klasyfikacji (vs MFS) korpus NKJP econo acc = 90,37%, dla 46 hase l poprawa wyniku korpus GPW acc = 99,13%, dla 36 hase l poprawa wyniku korpus Wiki econo acc = 90,38%, dla 49 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
33 Metody uczenia maszynowego Wyniki Otrzymane wyniki skuteczności klasyfikacji (vs MFS) korpus NKJP econo acc = 90,37%, dla 46 hase l poprawa wyniku korpus GPW acc = 99,13%, dla 36 hase l poprawa wyniku korpus Wiki econo acc = 90,38%, dla 49 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
34 Metody uczenia maszynowego Wnioski z eksperymentów Skuteczność metod klasyfikacji uzyskana dok ladność dla każdej z metod, przedzia l maksymalnej skuteczności przetestowanych metod, liczba zwyci estw poszczególnych metod. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
35 Metody uczenia maszynowego Wnioski z eksperymentów Skuteczność metod klasyfikacji uzyskana dok ladność dla każdej z metod, przedzia l maksymalnej skuteczności przetestowanych metod, liczba zwyci estw poszczególnych metod. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
36 Metody uczenia maszynowego Wnioski z eksperymentów Skuteczność metod klasyfikacji uzyskana dok ladność dla każdej z metod, przedzia l maksymalnej skuteczności przetestowanych metod, liczba zwyciestw poszczególnych metod. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
37 Metody uczenia maszynowego Wnioski z eksperymentów Wp lyw liczby atrybutów w uj eciu ogólnym: liczba wykorzystanych atrybutów (d lugość wektora cech), liczba zwyciestw metody, wykorzystujacej poszczególne liczby cech. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
38 Metody uczenia maszynowego Wnioski z eksperymentów Wp lyw liczby atrybutów w uj eciu ogólnym: liczba wykorzystanych atrybutów (d lugość wektora cech), liczba zwyciestw metody, wykorzystujacej poszczególne liczby cech. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
39 Metody regu lowe Automatyczne ujednoznacznianie Metody regu lowe Metody wykorzystujace jezyk regu lowy w projekcie NEKST zaplanowano wykorzystanie formalizmu w postaci logiki pierwszego rzedu, umożliwiajacego wyrażanie regu l klasyfikacyjnych, s luż acych do ujednoznaczniania sensów s lów. Wykorzystanie regu l asocjacyjnych do klasyfikacji wśród przyk ladów treningowych szukamy regu l asocjacyjnych, których nast epnikiem jest etykieta klasy (numer sensu), zbiór znalezionych regu l, posortowanych wzgledem zaufania (odsetek pasujaych do poprzednika regu ly przyk ladów w zbiorze treningowym, dla których regu la jest prawdziwa) stanowi klasyfikator, podczas klasyfikacji przyk ladu ze zbioru testowego przegladamy regu ly w klasyfikatorze od pierwszej do ostatniej i przypisujemy mu klase pierwszej pasujacej regu ly. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
40 Metody regu lowe Rozszerzenie metody regu lowej Uwzglednianie krotności wystapień poszczególnych leksemów w kontekście zwiekszenie skuteczności metody regu lowej poprzez odkrywanie klasyfikacyjnych regu l asocjacyjnych z elementami powtarzajacymi sie. korpus MFS ITA CAR rcar NKJP econo 77,65% 91,97% 84,14% 85,16% GPW 94,31% 96,82% 97,26% 97,86% Przyk lad pl KFG=0 pos+1 SFG2=0 noun-1 SFG2=1 noun+1 SFG2=0 ZNACZENIE=praca.2 miejsce TFG=2 noun-1 SFG2=1 noun+1 SFG2=0 ZNACZENIE=praca.2 Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
41 Wykorzystanie zasobów zewn etrznych Wykorzystanie zewn etrznych zasobów lingwistycznych do poprawy skuteczności metod uczenia maszynowego Problem algorytmiczna metoda dezambiguacji sensów jest zbyt silnie zwiazana z konkretnymi leksemami decyzja podejmowana jest na podstawie dok ladnie tych s lów, które wystepuj a w tekście, brak konkretnego leksemu w zbiorze treningowym uniemożliwia podjecie prawid lowej decyzji w zbiorze testowym, cz lowiek analizuje kontekst i uogólnia wystepuj ace w nim s lowa, aby stwierdzić jaki jest jego sens. Przyk lad Cena jednego kilograma maki wynosi... Cena 1 kg kaszy wynosi... Jaka by la wówczas cena funta pszenicy? Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
42 Wykorzystanie zasobów zewn etrznych Wykorzystanie zewn etrznych zasobów lingwistycznych do poprawy skuteczności metod uczenia maszynowego Pomys l wykorzystać funkcj e podobieństwa semantycznego do rozszerzenia kontekstów s lów dezambiguowanych o leksemy podobne dażymy do tego, żeby konkretne leksemy zamienić na ogólne pojecia, funkcje podobieństwa semantycznego umożliwiaja wygenerowanie nowych kontekstów na podstawie istniejacych w zbiorze treningowym, co przek lada sie na potencjalnie lepsze wytrenowanie metod uczenia maszynowego. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
43 Wykorzystanie zasobów zewn etrznych Funkcje podobieństwa semantycznego Funkcje odzworowujace pary leksemów w liczbe rzeczywista W W R, liczba określa stopień podobieństwa pomi edzy leksemami. Funkcje oparte na zasoboach ustrukturalizowanych niezbedny zasób typu WordNet z duża liczba relacji, stopień podobieństwa miedzy leksemami określany na podstawie stopnia powiazania w grafie WordNetu, np. jako odwrotność odleg lości najkrótszej ścieżki pomiedzy nimi. Funkcje oparte na korpusie tekstowym stopień podobieństwa mi edzy leksemami określany na podstawie cz estości ich wspó lwyst epowania w korpusie, dla j ezyka polskiego: RWF (Piasecki et al., 2007): korpus IPI PAN, korpus Rzeczpospolitej oraz dokumentów internetowych. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
44 Wykorzystanie zasobów zewn etrznych Korpusowa funkcja podobieństwa semantycznego Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
45 Wykorzystanie zasobów zewn etrznych Wykorzystanie funkcji do rozszerzenia wektora cech p lacić cena z lotówka moralność kilogram przetwarzać kilogram kg kilo tona gram przetwarzać Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
46 Wykorzystanie zasobów zewn etrznych Wyniki Otrzymane wyniki skuteczności klasyfikacji metodami uczenia nadzorowanego z użyciem FPS (vs bez użycia FPS i MFS) korpus NKJP acc = 91,73%, dla 22 hase l poprawa wyniku korpus GPW acc = 99,28%, dla 10 hase l poprawa wyniku po l aczone korpusy acc = 97,52%, dla 19 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
47 Wykorzystanie zasobów zewn etrznych Wyniki Otrzymane wyniki skuteczności klasyfikacji metodami uczenia nadzorowanego z użyciem FPS (vs bez użycia FPS i MFS) korpus NKJP acc = 91,73%, dla 22 hase l poprawa wyniku korpus GPW acc = 99,28%, dla 10 hase l poprawa wyniku po l aczone korpusy acc = 97,52%, dla 19 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
48 Wykorzystanie zasobów zewn etrznych Wyniki Otrzymane wyniki skuteczności klasyfikacji metodami uczenia nadzorowanego z użyciem FPS (vs bez użycia FPS i MFS) korpus NKJP acc = 91,73%, dla 22 hase l poprawa wyniku korpus GPW acc = 99,28%, dla 10 hase l poprawa wyniku po l aczone korpusy acc = 97,52%, dla 19 hase l poprawa wyniku Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
49 Podsumowanie wyników Podsumowanie wyników Wytworzone oprogramowanie edytor s lownika sensów, narz edzie do anotacji korpusu tekstowego sensami ze s lownika, narz edzie do dezambiguacji (do końca roku). Wytworzone zasoby tekstowe s lownik sensów, korpus tekstowy z dziedziny ekonomicznej, anotowany tekstami s lów, sk ladajacy sie z podkorpusów NKJP econo, GPW i Wiki econo. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
50 Podsumowanie wyników Podsumowanie wyników Otrzymane wyniki eksperymentalne metoda bazowa przypisanie s lowom wieloznacznym najcz estszego sensu, uczenie maszynowe (1) statystyczne metody klasyfikacji na korpusie podzielonym zgodniem z metodyka 10CV, uczenie maszynowe (2) klasyfikator regu lowy z rozszerzeniem o elementy powtarzajace sie. uczenie maszynowe (3) wykorzystanie zasobów lingwistycznych do poprawy skuteczności dezambiguacji. Lukasz Kobyliński (IPI PAN) Metody ujednoznaczniania sensów s lów 21 listopada / 31
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Statystyka w analizie i planowaniu eksperymentu
29 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Statystyka w analizie i planowaniu eksperymentu
31 marca 2014 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim
Motywacja Zastosowanie metod statystycznych do problemu ujednoznaczniania struktury zdania w języku polskim Seminarium IPI PAN, 03.01.2011 Outline Motywacja 1 Motywacja Poziomy anotacji Równoważność dystrybucyjna
Statystyka w analizie i planowaniu eksperymentu
22 marca 2011 Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Jeden przyk lad... czyli dlaczego warto wybrać MIESI.
Jeden przyk lad... czyli dlaczego warto wybrać MIESI. Micha l Ramsza Szko la G lówna Handlowa Micha l Ramsza (Szko la G lówna Handlowa) Jeden przyk lad... czyli dlaczego warto wybrać MIESI. 1 / 13 Dlaczego
Statystyka w analizie i planowaniu eksperymentu
23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja
Rachunek zdań - semantyka. Wartościowanie. ezyków formalnych. Semantyka j. Logika obliczeniowa. Joanna Józefowska. Poznań, rok akademicki 2009/2010
Logika obliczeniowa Instytut Informatyki Poznań, rok akademicki 2009/2010 1 formu l rachunku zdań Wartościowanie i sta le logiczne Logiczna równoważność 2 Model formu ly Formu la spe lniona Formu la spe
czyli co można poprawić w NKJP?
Dażenie do idea lu, czyli co można poprawić w NKJP? Lukasz Kobyliński Lukasz Sza lkiewicz Instytut Podstaw Informatyki Polskiej Akademii Nauk ul. J. K. Ordona 21, 01-237 Warszawa 7 stycznia 2013 L. Kobyliński,
Statystyka w analizie i planowaniu eksperymentu lista nr 7
Statystyka w analizie i planowaniu eksperymentu lista nr 7 1 B l edy pomiaru Wskutek niedoskona lości przyrzadów jak również niedoskona lości naszych zmys lów - wszystkie pomiary sa dokonywane z określonym
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Wyk lad 3 Wyznaczniki
1 Określenie wyznacznika Wyk lad 3 Wyznaczniki Niech A bedzie macierza kwadratowa stopnia n > 1 i niech i, j bed a liczbami naturalnymi n Symbolem A ij oznaczać bedziemy macierz kwadratowa stopnia n 1
WYK LAD 2: PODSTAWOWE STRUKTURY ALGEBRAICZNE, PIERWIASTKI WIELOMIANÓW, ROZK LAD FUNKCJI WYMIERNEJ NA U LAMKI PROSTE
WYK LAD 2: PODSTAWOWE STRUKTURY ALGEBRAICZNE, PIERWIASTKI WIELOMIANÓW, ROZK LAD FUNKCJI WYMIERNEJ NA U LAMKI PROSTE Definicja 1 Algebra abstrakcyjna nazywamy teorie, której przedmiotem sa dzia lania na
Jak matematyka pomaga w wyszukiwanie wzorca
Jak matematyka pomaga w wyszukiwanie wzorca Artur Jeż 28 września 2011 Artur Jeż Matematyka i wyszukiwanie wzorca 28 IX 2011 1 / 18 Wiek nauki Artur Jeż Matematyka i wyszukiwanie wzorca 28 IX 2011 2 /
Uproszczony dowod twierdzenia Fredricksona-Maiorany
Uproszczony dowod twierdzenia Fredricksona-Maiorany W. Rytter Dla uproszczenia rozważamy tylko teksty binarne. S lowa Lyndona sa zwartymi reprezentacjami liniowymi s lów cyklicznych. Dla s lowa x niech
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Zastosowanie Robotów. Ćwiczenie 6. Mariusz Janusz-Bielecki. laboratorium
Zastosowanie Robotów laboratorium Ćwiczenie 6 Mariusz Janusz-Bielecki Zak lad Informatyki i Robotyki Wersja 0.002.01, 7 Listopada, 2005 Wst ep Do zadań inżynierów robotyków należa wszelkie dzia lania
Projekty Zaliczeniowe Laboratorium Sieci Komputerowych
Projekty Zaliczeniowe Laboratorium Sieci Komputerowych Rok Akademicki 2015/2016 Micha l Kalewski, Lukasz Piatkowski Revision : 2.2 Spis treści 1 Proponowane tematy projektów zaliczeniowych 1 1.1 Uwagi...............................
Ćwiczenie nr 520: Metody interpolacyjne planowania ruchu manipulatorów
Zak lad Podstaw Cybernetyki i Robotyki PWr, Laboratorium Robotyki, C-3, 010 Ćwiczenie nr 520: Metody interpolacyjne planowania ruchu manipulatorów 1 Wst ep Celem ćwiczenia jest zapoznanie studentów z metodami
PoliTa multitager morfosyntaktyczny dla j. ezyka polskiego
PoliTa multitager morfosyntaktyczny dla j ezyka polskiego Lukasz Kobyliński Instytut Podstaw Informatyki Polskiej Akademii Nauk ul. Jana Kazimierza 5, 01-248 Warszawa, Poland 3.03.2014 Lukasz Kobyliński
Automatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług
Uniwersytet Ekonomiczny w Poznaniu Wydział Informatyki i Gospodarki Elektronicznej Katedra Informatyki Ekonomicznej Streszczenie rozprawy doktorskiej Automatyczne przetwarzanie recenzji konsumenckich dla
Analiza zrekonstruowanych śladów w danych pp 13 TeV
Analiza zrekonstruowanych śladów w danych pp 13 TeV Odtwarzanie rozk ladów za pomoc a danych Monte Carlo Jakub Cholewiński, pod opiek a dr hab. Krzysztofa Woźniaka 31 lipca 2015 r. Jakub Cholewiński, pod
Oddzia lywania miedzycz. jony molekularne lub atomy. edzy A i B:
Notatki do wyk ladu XIII Oddzia lywania miedzycz asteczkowe A i B zamknietopow lokowe czasteczki, jony molekularne lub atomy. Energia oddzia lywania E oddz mi edzy A i B: E oddz = E AB (E A + E B ) ()
Statystyka w analizie i planowaniu eksperymentu
19 kwietnia 2011 Testy dla dwóch grup 1 Analiza danych dla dwóch grup: test t-studenta dla dwóch grup sparowanych; test t-studenta dla dwóch grup niezależnych (jednakowe wariancje) test Z dla dwóch grup
Uczenie nienadzorowane
Uczenie nienadzorowane Nadzorowane, klasyfikacja: Nienadzorowane, analiza skupień (clustering): Zbiór uczacy: { (x 1 1,x1 2 ),c1, (x 2 1,x2 2 ),c2,... (x N 1,xN 2 ),cn } Zbiór uczacy: { (x 1 1,x1 2 ),
Zastosowanie Robotów. Ćwiczenie 4. Mariusz Janusz-Bielecki. laboratorium
Zastosowanie Robotów laboratorium Ćwiczenie 4 Mariusz Janusz-Bielecki Zak lad Informatyki i Robotyki Wersja 0.001.00, 11 Listopada, 2005 Wst ep Do zadań inżynierów robotyków należa wszelkie dzia lania
Plan wyk ladu. Kodowanie informacji. Systemy addytywne. Definicja i klasyfikacja. Systemy liczbowe. prof. dr hab. inż.
Plan wyk ladu Systemy liczbowe Poznań, rok akademicki 2008/2009 1 Plan wyk ladu 2 Systemy liczbowe Systemy liczbowe Systemy pozycyjno-wagowe y 3 Przeliczanie liczb Algorytm Hornera Rozwini ecie liczby
Metody klasyfikacji danych - część 1 p.1/24
Metody klasyfikacji danych - część 1 Inteligentne Usługi Informacyjne Jerzy Dembski Metody klasyfikacji danych - część 1 p.1/24 Plan wykładu - Zadanie klasyfikacji danych - Przeglad problemów klasyfikacji
Wyk lad 4 Warstwy, dzielniki normalne
Wyk lad 4 Warstwy, dzielniki normalne 1 Warstwy grupy wzgl edem podgrupy Niech H bedzie podgrupa grupy (G,, e). W zbiorze G wprowadzamy relacje l oraz r przyjmujac, że dla dowolnych a, b G: a l b a 1 b
Grupy i cia la, liczby zespolone
Rozdzia l 1 Grupy i cia la, liczby zespolone Dla ustalenia uwagi, b edziemy używać nast epuj acych oznaczeń: N = { 1, 2, 3,... } - liczby naturalne, Z = { 0, ±1, ±2,... } - liczby ca lkowite, W = { m n
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Niestacjonarne Kod kierunku: 06.
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Techniczny obowiązuje studentów rozpoczynających studia w roku akademickim 201/2016 Kierunek studiów: Zarządzanie i inżynieria
Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki
Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y
20PLN dla pierwszych 50 sztuk oraz 15PLN dla dalszych. Zysk ze sprzedaży biurka wynosi 40PLN dla pierwszych 20 sztuk oraz 50PLN dla dalszych.
Z1. Sformu lować model dla optymalnego planowania produkcji w nast epujacych warunkach: Wytwórca mebli potrzebuje określić, ile sto lów, krzese l i biurek powinien produkować, aby optymalnie wykorzystać
WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3
WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3 Definicja 1 Przestrzenia R 3 nazywamy zbiór uporzadkowanych trójek (x, y, z), czyli R 3 = {(x, y, z) : x, y, z R} Przestrzeń
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Organizacja zaj. Organizacja zaj. et i oprogramowanie. szeregowanie zadań, Interfejsy i komunikacja. Systemy wieloprocesorowe. sztuczna inteligencja,
Kontakt Dyżury dla studentów prof. dr hab. inż. Joanna Józefowska Instytut Informatyki Politechnika Poznańska wtorek godz. 14.00-15.00 p. 436WE ul. Piotrowo 3a tel. 0-61 6652369 jjozefowska@cs.put.poznan.pl
Pochodne cz ¾astkowe i ich zastosowanie.
Pochodne cz ¾astkowe i ich zastosowanie. Adam Kiersztyn Lublin 2013 Adam Kiersztyn () Pochodne cz ¾astkowe i ich zastosowanie. maj 2013 1 / 18 Zanim przejdziemy do omawiania pochodnych funkcji wielu zmiennych
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego Dorota Adamiec Instytut Języka Polskiego PAN Elektroniczny
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014. Forma studiów: Stacjonarne Kod kierunku: 06.
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Techniczny obowiązuje studentów rozpoczynających studia w roku akademickim 201/201 Kierunek studiów: Zarządzanie i inżynieria
Wyk lad 7 Baza i wymiar przestrzeni liniowej
Wyk lad 7 Baza i wymiar przestrzeni liniowej 1 Baza przestrzeni liniowej Niech V bedzie przestrzenia liniowa. Powiemy, że podzbiór X V jest maksymalnym zbiorem liniowo niezależnym, jeśli X jest zbiorem
Aproksymacja kraw. Od wielu lokalnych cech (edge elements) do spójnej, jednowymiarowej. epnej aproksymacji
Aproksymacja kraw edzi Od wielu lokalnych cech (edge elements) do spójnej, jednowymiarowej cechy (edge). Różne podejścia: szukanie w pobliżu wst epnej aproksymacji transformacja Hough a. Wiedza o obiektach:
Normy wektorów i macierzy
Rozdzia l 3 Normy wektorów i macierzy W tym rozdziale zak ladamy, że K C. 3.1 Ogólna definicja normy Niech ψ : K m,n [0, + ) b edzie przekszta lceniem spe lniaj acym warunki: (i) A K m,n ψ(a) = 0 A = 0,
Przyk ladowe Zadania z MSG cz
mgr Leszek Wincenciak, Katedra Makroekonomii i Teorii Handlu Zagranicznego Przyk ladowe Zadania z MSG cz eść handlowa 1. W modelu Ricardo mamy do czynienia z dwoma krajami prowadzacymi wymiane handlowa.
Architektura systemów komputerowych
Architektura systemów komputerowych Grzegorz Mazur Zak lad Metod Obliczeniowych Chemii Uniwersytet Jagielloński 12 kwietnia 2011 Grzegorz Mazur (ZMOCh UJ) Architektura systemów komputerowych 12 kwietnia
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Systemy decyzyjne Wyk lad 4: Drzewa decyzyjne
Systemy decyzyjne Wyk lad 4: Outline Wprowadzenie 1 Wprowadzenie 2 Problem brakujacych wartości 3 Co to jest drzewo decyzyjne Jest to struktura drzewiasta, w której wez ly wewnetrzne zawieraja testy na
SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ. Ewa Madalińska. na podstawie prac:
SYSTEM DIAGNOSTYCZNY OPARTY NA LOGICE DOMNIEMAŃ Ewa Madalińska na podstawie prac: [1] Lukaszewicz,W. (1988) Considerations on Default Logic: An Alternative Approach. Computational Intelligence, 44[1],
Paradygmaty programowania. Paradygmaty programowania
Paradygmaty programowania Paradygmaty programowania Dr inż. Andrzej Grosser Cz estochowa, 2013 2 Spis treści 1. Zadanie 2 5 1.1. Wprowadzenie.................................. 5 1.2. Wskazówki do zadania..............................
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Ekonomiczny obowiązuje studentów rozpoczynających studia w roku akademickim 201/201 Kierunek studiów: Ekonomia Forma studiów:
Niezmienniki i pó lniezmienniki w zadaniach
Niezmienniki i pó lniezmienniki w zadaniach Krzysztof Che lmiński Wydzia l Matematyki i Nauk Informacyjnych Politechnika Warszawska MiNI-Akademia Matematyki Warszawa, 2 marca, 2013 Na czym polega metoda
Drzewa decyzyjne. Nguyen Hung Son. Nguyen Hung Son () DT 1 / 34
Drzewa decyzyjne Nguyen Hung Son Nguyen Hung Son () DT 1 / 34 Outline 1 Wprowadzenie Definicje Funkcje testu Optymalne drzewo 2 Konstrukcja drzew decyzyjnych Ogólny schemat Kryterium wyboru testu Przycinanie
Wprowadzenie do uczenia maszynowego
Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017 Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
Technologie Informacyjne
Systemy Uczące się Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 16, 2017 1 Wprowadzenie 2 Uczenie nadzorowane 3 Uczenie bez nadzoru 4 Uczenie ze wzmocnieniem Uczenie się - proces
Software Achitecture Document Pó l-internetowy System Obs lugi Turystyki Gminnej
Software Achitecture Document Pó l-internetowy System Obs lugi Turystyki Gminnej Edyta Agnieszka Luty 236090 Bartosz Dabrowski 235954 Piotr Minakowski 234523 Piotr Broda 212720 17 maja 2007 SPIS TREŚCI
po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)
Stan czastki określa funkcja falowa Ψ zależna od wspó lrzȩdnych określaj acych po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x) Wartości funkcji
Rotacje i drgania czasteczek
Rotacje i drgania czasteczek wieloatomowych Gdy znamy powierzchnie energii potencjalnej V( R 1, R 2,..., R N ) to możemy obliczyć poziomy energetyczne czasteczki. Poziomy te sa w ogólności efektem: rotacji
Statystyka w analizie i planowaniu eksperymentu
10 marca 2014 Zmienna losowa - wst ep Przeprowadzane w praktyce badania i eksperymenty maja bardzo różnorodny charakter, niemniej jednak wiaż a sie one z rejestracja jakiś sygna lów (danych). Moga to być
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Wyk lad 12. (ii) najstarszy wspó lczynnik wielomianu f jest elementem odwracalnym w P. Dowód. Niech st(f) = n i niech a bedzie
1 Dzielenie wielomianów Wyk lad 12 Ważne pierścienie Definicja 12.1. Niech P bedzie pierścieniem, który może nie być dziedzina ca lkowitości. Powiemy, że w pierścieniu P [x] jest wykonalne dzielenie z
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Stacjonarne Kod kierunku: 12.
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Zdrowia obowiązuje studentów rozpoczynających studia w roku akademickim 201/2016 Kierunek studiów: Ratownictwo medyczne Profil:
Statystyka w analizie i planowaniu eksperymentu
31 marca 2014 Problemy cz lowieka za szafa Cz lowiek za szafa rzuca razy moneta. Może on rzucać : 1 moneta symetryczna; 2 moneta, która ma or la z dwu stron. Zadania 1 Wymyśl procedure pozwalajac a stwierdzić
Wyk lad 14 Cia la i ich w lasności
Wyk lad 4 Cia la i ich w lasności Charakterystyka cia la Określenie cia la i w lasności dzia lań w ciele y ly omówione na algerze liniowej. Stosujac terminologie z teorii pierścieni możemy powiedzieć,
po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)
Stan czastki określa funkcja falowa Ψ zależna od wspó lrzȩdnych określaj acych po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x) Wartości funkcji
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN, Instytut Podstaw Informatyki PAN Podstawowe informacje o projekcie
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego
Uruchamianie SNNS. Po uruchomieniu. xgui & lub snns & pojawia si e okno. programu. Symulator sztucznych sieci neuronowych SNNS 1
Uruchamianie SNNS Ca ly pakiet SNNS sk lada si e z programu interfejsu graficznego xgui, oraz z szeregu programów sk ladowych: analyze isnns netlearn snnsbat batchman linknets netperf td_bignet convert2snns
Stany atomu wieloelektronowego o określonej energii. być przypisywane elektrony w tym stanie atomu.
Notatki do wyk ladu VI Stany atomu wieloelektronowego o określonej energii. Konfiguracja elektronowa atomu - zbiór spinorbitali, wykorzystywanych do konstrukcji funkcji falowej dla danego stanu atomu;
Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera
Wyk lad 7 Metoda eliminacji Gaussa Wzory Cramera Metoda eliminacji Gaussa Metoda eliminacji Gaussa polega na znalezieniu dla danego uk ladu a x + a 2 x 2 + + a n x n = b a 2 x + a 22 x 2 + + a 2n x n =
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Ekonomiczny obowiązuje studentów rozpoczynających studia w roku akademickim 201/201 Kierunek studiów: Ekonomia Forma studiów:
Statystyka w analizie i planowaniu eksperymentu
21 marca 2011 Zmienna losowa - wst ep Przeprowadzane w praktyce badania i eksperymenty maja bardzo różnorodny charakter, niemniej jednak wiaż a sie one z rejestracja jakiś sygna lów (danych). Moga to być
Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.
Rozdzia l 11 Przestrzenie Euklidesowe 11.1 Definicja, iloczyn skalarny i norma Definicja 11.1 Przestrzenia Euklidesowa nazywamy par e { X K,ϕ }, gdzie X K jest przestrzenia liniowa nad K, a ϕ forma dwuliniowa
Gramatyka generatywno-transformacyjna
Uniwersytet Kardyna la Stefana Wyszyńskiego 1 Noam Chomsky twórca gramatyki generatywno-transformacyjnej 2 Noam Chomsky cz lowiek-instytucja uczeń Zelliga Harrisa, profesor Massachusetts Institute of Technology
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015. Przedmioty podstawowe
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Ekonomiczny obowiązuje studentów rozpoczynających studia w roku akademickim 20/20 Kierunek studiów: e-administracja Forma studiów:
w modelu równowagi Zaawansowana Makroekonomia: Pieniadz 1 Model z ograniczeniem CIA Krzysztof Makarski Wprowadzenie Wst ep Model z pieniadzem.
Zaawansowana Makroekonomia: Pieniadz w modelu równowagi ogólnej Krzysztof Makarski Model z ograniczeniem CIA Wprowadzenie Wst ep Model z pieniadzem. Ocena modelu Optymalna polityka pieni eżna Koszty nieoptymalnej
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018 Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5 Dodatkowe za lożenie
i elektronów w czasteczkach (laboratoryjnym) operator Hamiltona dla czasteczki dwuatomowej (jadra 2M b a i b; m -masa elektronu e 2 r ij
Notatki do wyk ladu IX Rozdzielenie ruchu jader i elektronów w czasteczkach W dowolnym uk ladzie wspó lrzednych (laboratoryjnym) operator Hamiltona dla czasteczki dwuatomowej (jadra a i b)ma postać: Ĥ
Wyk lad 7: Drzewa decyzyjne dla dużych zbiorów danych
Wyk lad 7: Drzewa decyzyjne dla dużych zbiorów danych Funkcja rekurencyjna buduj drzewo(u, dec, T): 1: if (kryterium stopu(u, dec) = true) then 2: T.etykieta = kategoria(u, dec); 3: return; 4: end if 5:
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Niestacjonarne Kod kierunku: 11.
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Karta przedmiotu Instytut Techniczny obowiązuje studentów rozpoczynających studia w roku akademickim 0/06 Kierunek studiów: Informatyka Profil: Ogólnoakademicki
Grzegorz Mazur. Zak lad Metod Obliczeniowych Chemii UJ. 14 marca 2007
Zak lad Metod Obliczeniowych Chemii UJ 14 marca 2007 Rzad 1 Zamiast wst epu 2 Rzad Notacja dużego O Notacja Ω Notacja Θ 3 S lowniczek Rzad Algorytm W matematyce oraz informatyce to skończony, uporzadkowany
Drzewa AVL definicje
Drzewa AVL definicje Uporzadkowane drzewo binarne jest drzewem AVL 1, jeśli dla każdego wez la różnica wysokości dwóch jego poddrzew wynosi co najwyżej 1. M D S C H F K Z typowe drzewo AVL minimalne drzewa
RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych
1 RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA Spis pojȩċ teoretycznych 1. Podstawowe pojȩcia: doświadczenie losowe, zdarzenie elementarne, zdarzenie losowe, przestrzeń zdarzeń elementarnych, zbiór zdarzeń
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2016/2017. Forma studiów: Stacjonarne Kod kierunku: 022
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Instytut Języków Obcych Karta przedmiotu obowiązuje studentów rozpoczynających studia w roku akademickim 2016/2017 Kierunek studiów: Filologia Profil: Praktyczny
Organizacja systemu plików
Organizacja systemu plików organizacja logiczna pliku: rekordy o sta lej lub zmiennej d lugości np. w systemie Unix typowo pliki zorganizowane sa jako sekwencje bajtów, zatem sa to rekordy o sta lej d
Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2015/2016. Forma studiów: Stacjonarne Kod kierunku: 06.
Państwowa Wyższa Szko la Zawodowa w Nowym Sa czu Instytut Techniczny Karta przedmiotu obowiązuje studentów rozpoczynających studia w roku akademickim 201/2016 Kierunek studiów: Zarządzanie i inżynieria
Techniki uczenia maszynowego nazwa przedmiotu SYLABUS
Techniki uczenia maszynowego nazwa SYLABUS Obowiązuje od cyklu kształcenia: 2014/20 Część A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej studiów Poziom kształcenia Profil studiów
Rachunek lambda CBN i CBV
P. Urzyczyn: Materia ly do wyk ladu z semantyki 1 Rachunek lambda CBN i CBV Rachunek lambda czesto uważamy za abstrakcyjny jezyk programowania funkcyjnego. Jednak ewaluacja wyrażenia w rzeczywistych jezykach
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania
1 Rozk ad normalny. Szczególnym przypadkiem jest standardowy rozk ad normalny N (0; 1), wartości
Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Podstawy statystyki matematycznej Adam Kiersztyn 2 godziny lekcyjne 2011-10-23 8.20-9.50 1 Rozk ad normalny Jednym z najwa
Wyk lad 2 Podgrupa grupy
Wyk lad 2 Podgrupa grupy Definicja 2.1. Pod grupy (G,, e) nazywamy taki podzbiór H G, że e H, h 1 H dla każdego h H oraz h 1 h 2 H dla dowolnych h 1, h 2 H. Jeśli H jest grupy G, to bedziemy pisali H G.
Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska
Zarządzanie projektami wykład 1 dr inż. Agata Klaus-Rosińska 1 DEFINICJA PROJEKTU Zbiór działań podejmowanych dla zrealizowania określonego celu i uzyskania konkretnego, wymiernego rezultatu produkt projektu
Zadania. kwiecień 2009. Ćwiczenia IV. w laściwe dla rotatora sztywnego hetoronuklearnej moleku ly. Rozwiazanie E JM = 2 J(J + 1).
kwiecień 9 Ćwiczenia IV Zadania Zadanie Obliczyć kanoniczna sum e statystyczna funkcj e podzia lu, energi e swobodna i ciep lo w laściwe dla rotatora sztywnego hetoronuklearnej moleku ly Rozwiazanie :
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego
Algorytm określania symetrii czasteczek
O czym to b Podzi 21 września 2007 O czym to b O czym to b Podzi 1 2 3 O czym to b Podzi W lasności symetrii hamiltonianu: zmniejszenie z lożoności obliczeń i wymagań pami eciowych, utrzymanie tożsamościowych
Modelowanie rynków finansowych
Zaj ecia 2 8 października, 2012 Plan zaj eć 1 Czym nie b edziemy si e zajmować - finanse behawioralne 2 Autokorelacja mi edzy stopami zwrotu Efekt kalendarza Efekt wielkości firmy 3 Pu lapka reprezentatywności
Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej
Indeks odwzorowania zmiennej zespolonej wzgl edem krzywej zamkni etej 1. Liczby zespolone - konstrukcja Hamiltona 2. Homotopia odwzorowań na okr egu 3. Indeks odwzorowania ciag lego wzgledem krzywej zamknietej