Eksploracja Zasobów Internetu

Wielkość: px
Rozpocząć pokaz od strony:

Download "Eksploracja Zasobów Internetu"

Transkrypt

1

2 Wstępne przetwarzanie tekstów jest silnie uzależnione od języka tekstu (jednak można wyróżnić standardowe etapy)

3 document accents, spacing, etc. stopwords noun groups stemming automatic or manual indexing structure recognition structure full text index terms

4

5

6

7

8

9

10

11

12

13

14

15 wyodrębnienie jednostek leksykalnych stanowiących potencjalnie słowa w języku naturalnym lub inne hasła, które mogą być przydatne z punktu widzenia wyszukiwania

16 wyodrębnienie jednostek leksykalnych stanowiących potencjalnie słowa w języku naturalnym lub inne hasła, które mogą być przydatne z punktu widzenia wyszukiwania

17 When Google encounters a hyphen ( ) in a query term, e.g., [ ], it searches for: the term with the hyphen, e.g., the term without the hyphen, e.g., the term with the hyphen replaced by a space, e.g., e mail [ ] matches , e mail, and [ e mail ] matches and e mail

18

19

20

21

22

23

24 Ściśle mówiąc: Lematyzacja odkrywa formy podstawowe (słownikowe) wyrazów Stemming (hasłowanie) wyodrębnia rdzenie wyrazów

25 Ściśle mówiąc: Lematyzacja odkrywa formy podstawowe (słownikowe) wyrazów Stemming (hasłowanie) wyodrębnia rdzenie wyrazów Wiele stemmerów nie zapewnia tego, iż tworzone przez nie ciągi liter to rzeczywiste rdzenie wyrazów (lecz hasła) Algorytmy hasłowania w odróżnieniu od lematyzacji nie zwracają (zazwyczaj) informacji gramatycznej i przyjmują na wejściu tylko pojedyncze wyrazy. Mogą natomiast zwracać więcej niż jeden stem i zazwyczaj nie są oparte o słowniki

26 Podział: Stemmery specjalizowane do zastosowań lingwistycznych (generowane rdzenie powinny rzeczywiście odpowiadać rdzeniom w rozumieniu lingwistyki) Stemmery specjalizowane do zastosowań IR (szybkość działania jest zwykle cechą kluczową)

27 W zastosowaniach IR wystarczy by dla wszystkich wyrazów należących do danego leksemu otrzymać taki sam rdzeń, a jeszcze lepiej: sprowadzić formy wyrazowe pochodzące od jednego leksemu do tego samego hasła, oraz oddzielić formy wyrazowe pochodzących od różnych leksemów przez sprowadzanie do różnych haseł, przy zachowaniu wydajnego (szybkiego) przetwarzania bardzo dużych zbiorów tekstowych.

28 W zastosowaniach IR zamiana wszystkich wyrazów w kolekcji na rdzenie (faza wstępnego przetwarzania) zamiana wyrazów zapytania użytkownika na rdzenie (faza wyszukiwania)

29

30

31

32

33

34

35 W języku polskim, zależnie od części mowy, można wyróżnić odmianę przez:

36 W języku polskim, zależnie od części mowy, można wyróżnić odmianę przez: przypadki (tj. mianownik, dopełniacz, celownik, biernik, narzędnik, miejscownik i wołacz), rodzaje (męski, żeński, nijaki, (nie)/męskoosobowy), liczby (pojedynczą i mnogą), osoby (pierwszą: ja, my; drugą: ty, wy; trzecią: on, ona, ono, oni, one), czasy (przeszły, teraźniejszy, przyszły), tryby (oznajmujący, przypuszczający, rozkazujący), strony (czynną, bierną, zwrotną).

37 Homonimia występuje na różnych poziomach: morfologii (np. dam może być formą czasownika dać lub dopełniaczem liczby mnogiej rzeczownika dama ), słownictwa (np. rola, która może być aktorską lub uprawną), składni (np. zdrada przyjaciela może oznaczać zarówno fakt, że przyjaciel zdradził, jak i to, że został zdradzony).

38 Homonimia występuje na różnych poziomach: morfologii (np. dam może być formą czasownika dać lub dopełniaczem liczby mnogiej rzeczownika dama ), słownictwa (np. rola, która może być aktorską lub uprawną), składni (np. zdrada przyjaciela może oznaczać zarówno fakt, że przyjaciel zdradził, jak i to, że został zdradzony). Polisemia dotyczy wieloznaczności wielu znaczeń tego samego leksemu, a nie różnych leksemów ( zamek w drzwiach, a w spodniach)

39

40

41

42 Pierwszy skuteczny algorytm dla angielskiego - Lovin s stemmer (1968) stemmer jednoprzebiegowy, wykorzystujący tablicę 250 możliwych podstawień końcówek oraz dodatkowy etap postprocessingu był projektowany jako uniwersalny Najpopularniejszy stemmer Porter s stemmer (1971), specjalizowany dla IR, wieloprzebiegowy, nie generuje poprawnych językowo rdzeni Inne: Krovets (1993) trójprzebiegowy stemmer wyłącznie fleksyjny, Dawson (1974) poprawiona wersja stemmera Lovins, zawiera tablicę 1200 podstawień, Lancaster aka Paice/Husk (1990) stemmer oparty na dopasowywaniu reguł, nie ma ograniczenia na liczbę kroków podstawień

43 Lovin s należy do algorytmów zamiany końcówek (ang. suffix stripping algorithms) dwuetapowy Pierwszy etap to dopasowanie najdłuższych z 294 końcówek i sprawdzenie warunków przejścia (było ich 29) do drugiego etapu dla tych końcówek pojedynczo, od pierwszej (najdłuższej) dopasowanej Drugi etap polegał na zastosowaniu wszystkich transformacji (łącznie było ich 35), które dopasowały się końcówką do wyrazu zmodyfikowanego (przez usunięcie najdłuższej pasującej końcówki spełniającej warunek przejścia) na etapie pierwszym

44 Lovin s stemmer Przykład: wyraz nationally w etapie pierwszym dopasowuje się do końcówki [ationally]. Warunek przejścia dla tej końcówki wymaga, żeby po jej usunięciu pozostał stem o minimum trzech literach, w związku z czym ta końcówka nie może być zastosowana Kolejną dopasowaną końcówką jest [ionally], która jest związana z warunkiem mówiącym, że nie ma dodatkowych wymagań, wiec ta końcówka jest usuwana i stem [nat] przechodzi do kolejnego etapu W drugim etapie żadna transformacja nie może być zastosowana, więc zwracany jest stem [nat]

45 Pomysł Portera polegał na tym, żeby formom odmienionym zamieniać przyrostki (ang. suffix) Dodatkowo dokonuje się to wieloprzebiegowo możliwe było wiele następujących po sobie zamian przyrostków dla jednego słowa Te zamiany zostały szczegółowo zdefiniowane i opisane zarówno rodzaj zamiany, warunki zajścia tej zamiany, jak i kolejność możliwych zamian Są to takie operacje, jak: obcięcie końcówki [ ], [ s] np. w wyrazie students lub student s zamiana końcówki [ied] na końcówkę [ies] (jeśli przed [ied] jest więcej niż jedna litera) lub [ie] (w przeciwnym razie) np. w wyrazach cried i tied

46

47

48

49

50

51

52

53

54

55

56

57 Za: D. Weiss, 2001

58 Podejścia słownikowe wystarczy utrzymywać słownik zawierający dpowiednio dużą liczbę wyrazów i sprawdzać w nim od jakiego leksemu pochodzi dana forma odmieniona (możliwe wielokrotne dopasowania)

59 Podejścia heurystyczne opierają się na jakiejś transformacji algorytmicznej, zwracającej mniej lub bardziej unikalny token (dla wszystkich form danego leksemu). Czasem tym tokenem może być lemat danego wyrazu, czasem rdzeń, czy stem lub tzw. hasło. Algorytmy takie nie weryfikują własnych wyników przez skonfrontowanie ich ze słownikiem poprawnych form

60 Podejścia heurystyczne Przykładowymi rodzajami elementarnych transformacji pozwalającymi na przetransformowanie wyrazu odmienionego w odpowiednik lematu mogą być: odcinanie końcówek (przyrostków i/lub przedrostków), zamiana(y) końcówek (przyrostków i/lub przedrostków), operacje na pojedynczych znakach (zamiana, wstawienie, usunięcie), operacje na większych jednostkach (sylaby, ciągi kilkuliterowe np. 2-gramy, 3-gramy itd.)

61 Podejścia mieszane (hybrydowe) Algorytmy te charakteryzuje możliwość korzystania ze słownika z jednoczesnym stosowaniem reguł transformacji, które szacują lematy dla słów spoza tego słownika Jeśli tylko algorytm stosujący podejście słownikowe dokonuje jakiegoś szacowania dla nieznanych mu form wyrazowych (spoza słownika) to można go nazwać hybrydowym

62 Algorytmy słownikowe mogą zapewniać poprawność wyników bazując na słowniku poprawnych form

63 Algorytmy słownikowe mogą zapewniać poprawność wyników bazując na słowniku poprawnych form Jednak słownik nie musi być słownikiem poprawnych form (lematów). Może zawierać informacje, które tylko te lematy opisują np. zbiór możliwych czteroliterowych ciągów, z których mogą składać się lematy

64 Algorytmy słownikowe mogą zapewniać poprawność wyników bazując na słowniku poprawnych form Jednak słownik nie musi być słownikiem poprawnych form (lematów). Może zawierać informacje, które tylko te lematy opisują np. zbiór możliwych czteroliterowych ciągów, z których mogą składać się lematy Algorytmy regułowe i hybrydowe dają wyniki przybliżone (pewne jedynie dla zwróconych wyrazów, których potwierdzenie znajdują w słowniku, z którego korzystają)

65 Lematyzatory dla języka polskiego Morfeusz (analizator morfologiczny) Marcina Wolińskiego Oferuje słownikowe metody hasłowania i oznaczania części mowy (ang. POS-Tagging) SAM-95 (analizator morfologiczny) Krzysztofa Szafrana Lametyzator Dawida Weissa oprócz lematów zwraca on równieź informację gramatyczną (dla wyrazów ze słownika Ispell, które taką informację mają) Stempel Andrzeja Białeckiego algorytm regułowy Stempelator Dawida Weissa połączenie Lametyzatora z algorytmem Stempel (algorytm hybrydowy) TaKIPI Macieja Piaseckiego, Grzegorza Godlewskiego, Adama Radziszewskiego, Bartosza Brody i Adama Wardyńskiego Przyporządkowuje opis morfo-syntaktyczny do wyrazów w zdaniu i określa znaczenia poszczególnych wyrazów LEMOT Tomasza Dragosza algorytm hybrydowy stworzony na potrzeby lematyzacji słów pozasłownikowych

66 Lematyzatory dla języka polskiego Morfeusz W zasadzie jest to analizator morfologiczny oznaczający też części mowy (ang. POS-Tagging).W opisie programu autor Marcin Woliński specjalnie odróżnia jego cel od hasłowania Program udostępniany bezpłatnie jedynie do zastosowań naukowo-badawczych. Działa na zasadzie algorytmów słownikowych nie znajduje form podstawowych dla nieznanych sobie wyrazów. Opiera się na pracach Zygmunta Saloniego Morfeusz ma postać biblioteki dynamicznej skompilowanej dla systemów Linux i Windows. Można z niego korzystać w programach w języku C, C++, PERL, Prolog, a przy zastosowaniu odpowiednich modułów Java, czy Python Szczegóły i dokładne zasady działania programu (w szczególności liczba lematów i form wyrazowych w słowniku i sposób przeglądania słownika) nie są znane

67 Lematyzatory dla języka polskiego Lametyzator Dawida Weissa jest narzędziem do lematyzacji. Posługuje się słownikiem form wyrazowych (ispell), więc jest podejściem słownikowym Program powstał w 2003 roku jako całkowicie bezpłatne narzędzie. Oprócz lematów zwraca on również informację gramatyczną (dla wyrazów z używanego słownika, które taką informację posiadają) Słownik, z jakiego korzysta, to lista par <wyraz, lemat> (z opcjonalną informacją gramatyczną) która została skompresowana do postaci automatu o skończonej liczbie stanów (ang. FSA) dzięki programom Jana Daciuka Lametyzator jest napisany w języku Java. Od 2006 roku jest dystrybuowany jako biblioteka w ramach projektu Morfologik

68 Automat skończony (ang. Finite State Automaton, FSA) to struktura, która składa się z węzłów i przejść między nimi. W szczególności przejścia te mogą być znakami, dzięki czemu można zarówno umieścić w FSA dowolny ciąg znaków, a przechodząc po kolejnych węzłach, dokonać sprawdzenia czy dany wyraz jest zapisany w FSA O(n) Automat skończony ma również tę zaletę, że daje dosyć dobry współczynnik kompresji przykładowo lista par zajmująca w postaci pliku tekstowego (.txt) 44 megabajty kompresuje się do około 1,5 megabajta

69 Lematyzatory dla języka polskiego Stempel Andrzeja Białeckiego dystrybuowany jest na licencji wolnego oprogramowania. Jest regułowym algorytmem hasłowania W odróżnieniu od Lametyzatora i Morfeusza zwraca dla jednego wyrazu zawsze pojedynczy stem Napisany w języku Java opiera się na operacjach usunięcia ciągu znaków, wstawienia znaku lub zamiany znaku. Bazuje na tabeli słów, dla których został utworzony zbiór operacji potrzebnych do przetransformowania słowa do lematu (ang. patch-commands). Do utworzenia tabeli słów posłużył słownik ispell, Wzbogacony korpus słownika frekwencyjnego, elektroniczna wersja Biblii Tysiąclecia oraz Analizator morfologiczny SAM w wersji 3.4 użyty jako lematyzator do wyznaczania lematów dla wyrazów ze zbiorów tekstów, które nie podawały takiej informacji Algorytm może korzystać z wcześniej stworzonego zbioru reguł, który autor utworzył z listy słów i ich lematów. W ten sposób algorytm nauczył się na pewnym zbiorze słów reguł, które stosował podczas hasłowania

70 Lematyzatory dla języka polskiego Stempelator powstały w 2005 r. oparty jest na pomyśle Dawida Weissa, żeby połączyć własny algorytm (Lametyzator) z algorytmem Stempel. Przykład prostego podejścia hybrydowego. Polega na tym, że dla danego wyrazu zwraca albo poprawny lemat (jeden lub więcej), który Lametyzator znajduje w swoim słowniku, albo jeśli nic nie znajdzie stem otrzymany przez hasłowanie algorytmem Stempel Algorytm ten podobnie jak Lametyzator jest całkowicie darmowym i ogólnodostępnym rozwiązaniem włączonym w bibliotekę projektu Morfologik

71

72

73

74

75

76

77

78

79 np. mamałyga : [mamałyg], [mamałyga], [mamałygi], [mamałyo], [mamałygać], [mamałye]

80 np. mamałyga : [mamałyg], [mamałyga]

81 np. mamałyga : [mamałyg], [mamałyga]

82 #uje #ować*5658:#ywać*1245:#iwać*318:#ać*10: np. głoduje :[głodować], [głodywać], [głodiwać], [głodać] ale na podstawie słowa hoduje można dodać podstawienia (reguły) [uje] - [ować], [duje] - [dować], [oduje] - [odować], [hoduje] - [hodować] dla głoduje dopasuje się wydłużona końcówka [oduje] - [odować] preferowane są najpierw reguły pełnej zamiany (np. jestem na być ), a następnie reguły zamiany jak najdłuższej końcówki

83

84

85

86

87

88

89

90

91 ad 4.(wybór jednostek indeksujących) automatyczna selekcja np. rzeczowników lub fraz rzeczownikowych ma na celu wyłonienie jednostek indeksujących o jak największej semantyce. W przypadku fraz jednostki indeksujące przestają być pojedynczymi słowami kluczowymi. Frazy rzeczownikowe mogą być identyfikowane automatycznie jako zbiory rzeczowników oddalonych od siebie w tekście o nie więcej niż zadaną liczbę pozycji (np. 3) lub z wykorzystaniem informacji lingwistycznej

92 ad 4.(wybór jednostek indeksujących) automatyczna selekcja np. rzeczowników lub fraz rzeczownikowych ma na celu wyłonienie jednostek indeksujących o jak największej semantyce. W przypadku fraz jednostki indeksujące przestają być pojedynczymi słowami kluczowymi. Frazy rzeczownikowe mogą być identyfikowane automatycznie jako zbiory rzeczowników oddalonych od siebie w tekście o nie więcej niż zadaną liczbę pozycji (np. 3) lub z wykorzystaniem informacji lingwistycznej Potencjalny problem: konieczność kosztownej analizy semantycznej POS tagging (ang. Part Of Speech tagging), np.: N - proper nouns; X - function words including articles and prepositions extended biword - any string of terms of the form NX*N renegotiation of the constitution renegotiation constitution N X X N NN

93 ad 5.(budowa tezaurusa) w najprostszej formie słownik taki składa się z: utworzonej jednorazowo (z góry) listy słów istotnych w danej dziedzinie, list słów związanych ze słowami listy powyżej (często są to po prostu listy synonimów) W ogólnym przypadku słownik taki może zawierać jednostki bardziej złożone niż słowa (np. frazy) i organizować je jednocześnie w hierarchiczną strukturę kategorii

94 Metody opracowania słownika: Słowniki ręcznie utrzymywane przez edytorów MeSH - WordNet itp. Słowniki tworzone automatycznie (na zasadzie obserwacji współwystępowania słów) por. modele IR: model fuzzy Analiza zapytań użytkowników wyszukiwarek (query log mining)

95 Możliwe zastosowania: - wyłonienie jednostek indeksujących - wspomaganie użytkownika w formułowaniu zapytań - tzw. query expansion, query narrowing

96 Rozszerzanie zapytań (ang. query expansion) Dodawanie do zapytania podobnych słów Cel: poprawa kompletności (recall) odpowiedzi systemu IR Często realizowane bez udziału użytkownika Adresuje problem synonimów, ale nie polisemii słów

97 Zawężanie zapytań (ang. query narrowing, query refinement) Sugerowanie użytkownikowi (kilku) wariantów bardziej szczegółowych zapytań (podpowiadanie dodatkowych słów) Cel: poprawa precyzji (precision) odpowiedzi systemu IR Użytkownik wybiera czy skorzystać z podpowiedzi /i której Adresuje zarówno problem synomimów jak i polisemii

Eksploracja Zasobów Internetu

Eksploracja Zasobów Internetu document accents, spacing, etc. stopwords noun groups stemming automatic or manual indexing structure recognition structure full text index terms When Google encounters a hyphen ( ) in a query term, e.g.,

Bardziej szczegółowo

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Nr Tytuł Przykład Str.

Nr Tytuł Przykład Str. Spis treści Nr Tytuł Przykład Str. 1. Bezokolicznik Ӏ Pytania bezokolicznika:?? Zakończenia bezokolicznika -, -, - 10 2. Czasowniki niedokonane i dokonane Użycie postaci czasowników Nieregularne formy

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search dr hab. inż. Miłosz Kadziński dr inż. Irmina Masłowska {milosz.kadzinski, irmina.maslowska}@cs.put.poznan.pl ECTS Politechnika Poznańska

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search dr hab. inż. Miłosz Kadziński dr inż. Irmina Masłowska {milosz.kadzinski, irmina.maslowska}@cs.put.poznan.pl ECTS Politechnika Poznańska

Bardziej szczegółowo

Marcin Miłkowski IFiS PAN

Marcin Miłkowski IFiS PAN Morfologik Marcin Miłkowski IFiS PAN koordynator pl.openoffice.org Adres projektu: morfologik.blogspot.com Morfologik Trzy składniki projektu: Automatycznie generowany słownik form wyrazowych Reguły korektora

Bardziej szczegółowo

Wykaz skrótów 17. Grafia pierwszej edycji Księgi Syracha wobec druków z pierwszej połowy XVI wieku 19. Grafia pierwszej edycji Księgi Syracha 21

Wykaz skrótów 17. Grafia pierwszej edycji Księgi Syracha wobec druków z pierwszej połowy XVI wieku 19. Grafia pierwszej edycji Księgi Syracha 21 Słowo wstępne 11 Wykaz skrótów 17 Grafia pierwszej edycji Księgi Syracha wobec druków z pierwszej połowy XVI wieku 19 Grafia pierwszej edycji Księgi Syracha 21 Grafia pierwszej edycji Księgi Syracha wobec

Bardziej szczegółowo

1 Podstawy c++ w pigułce.

1 Podstawy c++ w pigułce. 1 Podstawy c++ w pigułce. 1.1 Struktura dokumentu. Kod programu c++ jest zwykłym tekstem napisanym w dowolnym edytorze. Plikowi takiemu nadaje się zwykle rozszerzenie.cpp i kompiluje za pomocą kompilatora,

Bardziej szczegółowo

Gramatyka. języka rosyjskiego z ćwiczeniami

Gramatyka. języka rosyjskiego z ćwiczeniami Gramatyka języka rosyjskiego z ćwiczeniami Autor Dorota Dziewanowska Projekt graficzny okładki i strony tytułowej Krzysztof Kiełbasiński Ilustracje Maja Chmura (majachmura@wp.pl) Krzysztof Kiełbasiński

Bardziej szczegółowo

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O

Bardziej szczegółowo

Poznajemy różne formy rzeczownika odmieniamy rzeczownik przez przypadki

Poznajemy różne formy rzeczownika odmieniamy rzeczownik przez przypadki Poznajemy różne formy rzeczownika odmieniamy rzeczownik przez przypadki 1. Cele lekcji a) Wiadomości Uczeń: podaje definicję rzeczownika, zna pojęcie deklinacji, wymienia wszystkie przypadki rzeczownika,

Bardziej szczegółowo

Lokalizacja Oprogramowania

Lokalizacja Oprogramowania mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji

Bardziej szczegółowo

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne: WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji

Bardziej szczegółowo

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji

Bardziej szczegółowo

Spis treści 5. Spis treści. Przedmowa Przedmowa do wydania II Część pierwsza MORFOLOGIA

Spis treści 5. Spis treści. Przedmowa Przedmowa do wydania II Część pierwsza MORFOLOGIA Spis treści 5 Spis treści Przedmowa... 13 Przedmowa do wydania II... 14 Część pierwsza MORFOLOGIA 1. RZECZOWNIK... 17 1.1. Podział rzeczowników... 17 1.2. Rodzaj... 17 1.2.1. Rodzaj męsko-żeński... 18

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

SPIS TREŚCI. Spis treści Wstęp Wykaz skrótów, symboli i terminów gramatycznych MIANOWNIK

SPIS TREŚCI. Spis treści Wstęp Wykaz skrótów, symboli i terminów gramatycznych MIANOWNIK 5 SPIS TREŚCI Spis treści... 5-12 Wstęp... 13-14 Wykaz skrótów, symboli i terminów gramatycznych... 15-16 MIANOWNIK... 17-65 TABELA prezentująca końcówki fleksyjne rzeczowników... 17 RZECZOWNIK, PRZYMIOTNIK...

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016

Bardziej szczegółowo

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

Wyszukiwanie informacji

Wyszukiwanie informacji Wyszukiwanie informacji jak dobrze pytad Google? - podstawowe zasady formułowania dobrych zapytao - narzędzia Google dla ukrytego internetu - przygotował Marek Skibicki Podstawowe zapytanie Możemy poszukiwad

Bardziej szczegółowo

Przetwarzanie Języka Naturalnego dr inż. Krzysztof Rzecki. Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż.

Przetwarzanie Języka Naturalnego dr inż. Krzysztof Rzecki. Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż. Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż. Krzysztof Rzecki Literatura: W. Lubaszewski, Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu, AGH Kraków 2009. Kłopotek

Bardziej szczegółowo

Wymagania edukacyjne z języka polskiego w klasie VI Szkoły Podstawowej nr 1 im. Jana Pawła II w Czerwionce - Leszczynach

Wymagania edukacyjne z języka polskiego w klasie VI Szkoły Podstawowej nr 1 im. Jana Pawła II w Czerwionce - Leszczynach Wymagania edukacyjne z języka polskiego w klasie VI Szkoły Podstawowej nr 1 im. Jana Pawła II w Czerwionce - Leszczynach 1 I. Ocena celująca Ocenę celującą otrzymuje uczeń, którego wiedza znacznie wykracza

Bardziej szczegółowo

1 Układy równań liniowych

1 Układy równań liniowych II Metoda Gaussa-Jordana Na wykładzie zajmujemy się układami równań liniowych, pojawi się też po raz pierwszy macierz Formalną (i porządną) teorią macierzy zajmiemy się na kolejnych wykładach Na razie

Bardziej szczegółowo

Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN

Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Lekcja V I.3.7 I.3.8 I.3.9

Lekcja V I.3.7 I.3.8 I.3.9 Lekcja V I.3.7 I.3.8 I.3.9 Fleksja Dział gramatyki zajmujący się odmianą wyrazów. Budowa wyrazu: TEMAT FLEKSYJNY + KOŃCÓWKA Deklinacja L. poj. M. dom Ø C. dom - owi Koniugacja 1. Grzebię 2. Grzebiesz 3.

Bardziej szczegółowo

AUTOMATYKA INFORMATYKA

AUTOMATYKA INFORMATYKA AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów

Bardziej szczegółowo

Optimizing Programs with Intended Semantics

Optimizing Programs with Intended Semantics Interaktywna optymalizacja programów 26 kwietnia 2010 Spis treści Spis treści Wstęp Omówienie zaproponowanego algorytmu na przykładzie Wewnętrzna reprezentacja reguł dotyczących optymalizacji Wybrane szczegóły

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra

Bardziej szczegółowo

System Korekty Tekstu Polskiego

System Korekty Tekstu Polskiego Wnioski Grzegorz Szuba System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Rozszerzenie pracy - uproszczona

Bardziej szczegółowo

Użycie Visual Basic for Applications ("VBA")

Użycie Visual Basic for Applications (VBA) Użycie Visual Basic for Applications ("VBA") Przegląd SEE z modułem VBA Developer SEE używa języka programowania Visual Basic for Applications (VBA) pozwalającego tworzyć krótkie programy zwane "makrami".

Bardziej szczegółowo

Analiza danych tekstowych i języka naturalnego

Analiza danych tekstowych i języka naturalnego Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach

Bardziej szczegółowo

baton OR mars 282,000,000 241,000,000 baton OR mars 283,000,000 WYSZUKIWANIE BOOLOWSKIE

baton OR mars 282,000,000 241,000,000 baton OR mars 283,000,000 WYSZUKIWANIE BOOLOWSKIE WYSZUKIWANIE BOOLOWSKIE Wyszukiwanie boolowskie jest rozszerzeniem wyszukiwania prostego (opartego o słowa kluczowe) o operatory logiczne: AND, OR, NOT oraz ich kombinację. Większośd modeli wyszukiwania

Bardziej szczegółowo

Podstawy Informatyki. Algorytmy i ich poprawność

Podstawy Informatyki. Algorytmy i ich poprawność Podstawy Informatyki Algorytmy i ich poprawność Błędy Błędy: językowe logiczne Błędy językowe Związane ze składnią języka Wykrywane automatycznie przez kompilator lub interpreter Prosty sposób usuwania

Bardziej szczegółowo

1. Opis merytoryczny

1. Opis merytoryczny WNIOSEK O PORTFOLIO: Opracowanie koncepcji wielojęzycznych generatorów gramatycznych pełniących rolę narzędzi informatycznych typu Machine-Aided Human Translation Autorzy: Mirosław Gajer, Zbigniew Handzel,

Bardziej szczegółowo

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE Studia podyplomowe dla nauczycieli INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE Przedmiot JĘZYKI PROGRAMOWANIA DEFINICJE I PODSTAWOWE POJĘCIA Autor mgr Sławomir Ciernicki 1/7 Aby

Bardziej szczegółowo

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki Analiza leksykalna 1 Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych (tokenów)

Bardziej szczegółowo

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego Praca Magisterska Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń Lingwistycznych zbudowanego przez robota internetowego dla języka polskiego Marcin A. Gadamer Promotor: dr Adrian

Bardziej szczegółowo

Programowanie w języku C++ Grażyna Koba

Programowanie w języku C++ Grażyna Koba Programowanie w języku C++ Grażyna Koba Kilka definicji: Program komputerowy to ciąg instrukcji języka programowania, realizujący dany algorytm. Język programowania to zbiór określonych instrukcji i zasad

Bardziej szczegółowo

Wykład 6 Kategorie morfologiczne

Wykład 6 Kategorie morfologiczne Wykład 6 Kategorie morfologiczne Pojęcie kategoria jest nieostre, obciążone w dziejach myśli filozoficznej i językoznawczej wieloznacznością. Wskutek tego trudne jest do zdefiniowania. Pojęcie to wywodzi

Bardziej szczegółowo

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6 Zawartość Wstęp... 1 Instalacja... 2 Konfiguracja... 2 Uruchomienie i praca z raportem... 6 Wstęp Rozwiązanie przygotowane z myślą o użytkownikach którzy potrzebują narzędzie do podziału, rozkładu, rozbiórki

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK NIEMIECKI Klasa I technikum i liceum

PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK NIEMIECKI Klasa I technikum i liceum ZESPÓŁ PRZEDMIOTOWY ZESPÓŁ SZKÓŁ TECHNICZNO-INFORMATYCZNYCH JĘZYKÓW OBCYCH W GLIWICACH PRZEDMIOTOWY SYSTEM OCENIANIA JĘZYK NIEMIECKI Klasa I technikum i liceum GRAMATYKA CZASOWNIK - odmiana czasowników

Bardziej szczegółowo

Tajemnice skutecznego wyszukiwania na przykładzie

Tajemnice skutecznego wyszukiwania na przykładzie Tajemnice skutecznego wyszukiwania na przykładzie Przeglądarka program otwierający wrota Internetu Wyszukiwarka a przeglądarka Wyszukiwarka program pozwalający wyszukiwać linki do stron WWW Kilka podstawowych

Bardziej szczegółowo

Wykład XII. optymalizacja w relacyjnych bazach danych

Wykład XII. optymalizacja w relacyjnych bazach danych Optymalizacja wyznaczenie spośród dopuszczalnych rozwiązań danego problemu, rozwiązania najlepszego ze względu na przyjęte kryterium jakości ( np. koszt, zysk, niezawodność ) optymalizacja w relacyjnych

Bardziej szczegółowo

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o. STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów

Bardziej szczegółowo

Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne

Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne Propozycja rozszerzenia składni zapytań programu Poliqarp o elementy statystyczne Aleksander Buczyński 2006.06.26 Poliqarp - stan obecny Zwracane są kolejne konteksty wystąpień ciągów segmentów pasujących

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl

Bardziej szczegółowo

Hot Potatoes. Zdania z lukami Przyporządkowanie. Tworzy spis wszystkich zadań. Krzyżówki

Hot Potatoes. Zdania z lukami Przyporządkowanie. Tworzy spis wszystkich zadań. Krzyżówki Hot Potatoes Zdania z lukami Przyporządkowanie Tworzy spis wszystkich zadań Quizy Krzyżówki Rozsypanki Pakiet Hot Potatoes jest zestawem sześciu narzędzi, kreatorów testów, stworzonym przez Zespół Badawczo-

Bardziej szczegółowo

43. Narzędnik Liczba mnoga

43. Narzędnik Liczba mnoga TREŚĆ Sto. Wstęp f 1. Mowa. Język ojczysty. Języki słowiańskie i indoeuropejskie. 3 f 2. 3. Gramatyka Narzecza i język literacki. 4 5 Głosownia I. Głoski i ich powstawanie 4. Glos ludzki, narządy głosowe,

Bardziej szczegółowo

Reprezentacja dokumentów tekstowych w modelu przestrzeni wektorowej

Reprezentacja dokumentów tekstowych w modelu przestrzeni wektorowej POLITECHNIKA WARSZAWSKA WYDZIAŁ ELEKTRONIKI I TECHNIK INFORMACYJNYCH INSTYTUT INFORMATYKI Rok akademicki 2004/2005 PRACA DYPLOMOWA MAGISTERSKA Michał Kosmulski Reprezentacja dokumentów tekstowych w modelu

Bardziej szczegółowo

Wymagania edukacyjne niezbędne do uzyskania śródrocznych ocen klasyfikacyjnych z języka niemieckiego w klasie VII-ej w roku szkolnym 2017/2018

Wymagania edukacyjne niezbędne do uzyskania śródrocznych ocen klasyfikacyjnych z języka niemieckiego w klasie VII-ej w roku szkolnym 2017/2018 Wymagania edukacyjne niezbędne do uzyskania śródrocznych ocen klasyfikacyjnych z języka niemieckiego w klasie VII-ej w roku szkolnym 2017/2018 OCENA NIEDOSTATECZNA wystawiana jest wtedy, kiedy uczeń mimo

Bardziej szczegółowo

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU

Hurtownie danych. Przetwarzanie zapytań. http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Hurtownie danych Przetwarzanie zapytań. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur ZAPYTANIA NA ZAPLECZU Magazyny danych operacyjnych, źródła Centralna hurtownia danych Hurtownie

Bardziej szczegółowo

Open Access w technologii językowej dla języka polskiego

Open Access w technologii językowej dla języka polskiego Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika

Bardziej szczegółowo

Narzędzia do pisania. Korektor pisowni i korektor gramatyczny

Narzędzia do pisania. Korektor pisowni i korektor gramatyczny Narzędzia do pisania Word oferuje wiele narzędzi ułatwiających pracę. Jedne służą do łatwego znalezienia i poprawienia błędów, inne pomagają nadać właściwą formę dokumentom przygotowanym do publikacji.

Bardziej szczegółowo

Programowanie komputerów

Programowanie komputerów Programowanie komputerów Wykład 1-2. Podstawowe pojęcia Plan wykładu Omówienie programu wykładów, laboratoriów oraz egzaminu Etapy rozwiązywania problemów dr Helena Dudycz Katedra Technologii Informacyjnych

Bardziej szczegółowo

Zasady programowania Dokumentacja

Zasady programowania Dokumentacja Marcin Kędzierski gr. 14 Zasady programowania Dokumentacja Wstęp 1) Temat: Przeszukiwanie pliku za pomocą drzewa. 2) Założenia projektu: a) Program ma pobierać dane z pliku wskazanego przez użytkownika

Bardziej szczegółowo

SQL - Structured Query Language -strukturalny język zapytań SQL SQL SQL SQL

SQL - Structured Query Language -strukturalny język zapytań SQL SQL SQL SQL Wprowadzenie do SQL SQL - Structured Query Language -strukturalny język zapytań Światowy standard przeznaczony do definiowania, operowania i sterowania danymi w relacyjnych bazach danych Powstał w firmie

Bardziej szczegółowo

POZYCJONOWANIE STRONY SKLEPU

POZYCJONOWANIE STRONY SKLEPU . Wszystko O Pozycjonowaniu I Marketingu. >>>POZYCJONOWANIE STRON LEGNICA POZYCJONOWANIE STRONY SKLEPU >>>WIĘCEJ

Bardziej szczegółowo

Wyrażenie wewnątrz nawiasów jest atomem (rozpatrujemy je jako całość).

Wyrażenie wewnątrz nawiasów jest atomem (rozpatrujemy je jako całość). Wyrażenia regularne pełnią istotną rolę w PHP. Umożliwiają one opisywanie i przetwarzanie długich ciągów znaków. Dzieje się to na zasadzie porównania danego ciągu znaków z określonym wzorem, ułożonym przez

Bardziej szczegółowo

Perl a XML. Narzędzia informatyczne w językoznawstwie. Generowanie danych XML - Przykład. Generowanie danych XML. Perl - Przetwarzanie XML

Perl a XML. Narzędzia informatyczne w językoznawstwie. Generowanie danych XML - Przykład. Generowanie danych XML. Perl - Przetwarzanie XML Perl a XML Narzędzia informatyczne w językoznawstwie Perl - Przetwarzanie XML Marcin Junczys-Dowmunt junczys@amu.edu.pl Zakład Logiki Stosowanej http://www.logic.amu.edu.pl 31 modułów w CPAN zawiera w

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

Współczesne moduły automatycznego sprawdzania pisowni dla języka polskiego i angielskiego

Współczesne moduły automatycznego sprawdzania pisowni dla języka polskiego i angielskiego Współczesne moduły automatycznego sprawdzania pisowni dla języka polskiego i angielskiego Tomasz Jach Zakopane, 2008 r. 1 Wstęp W pracy przedstawiono proces sprawdzania poprawności słów dla języka polskiego

Bardziej szczegółowo

Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0

Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0 Słowem wstępu Część rodziny języków XSL Standard: W3C XSLT 1.0-1999 razem XPath 1.0 XSLT 2.0-2007 Trwają prace nad XSLT 3.0 Problem Zakładane przez XML usunięcie danych dotyczących prezentacji pociąga

Bardziej szczegółowo

Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim

Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim dr Agnieszka Kowalska Pełnomocnik Rektora ds. wprowadzenia systemu antyplagiatowego w Uniwersytecie Jagiellońskim Otwarty

Bardziej szczegółowo

Program warsztatów CLARIN-PL

Program warsztatów CLARIN-PL W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19

Bardziej szczegółowo

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK OPIS MODUŁU KSZTAŁCENIA (SYLABUS) I. Informacje ogólne 1. Nazwa modułu kształcenia: JĘZYKOZNAWSTWO OGÓLNE 2. Kod modułu kształcenia: 08-KODM-JOG 3. Rodzaj modułu kształcenia: OBLIGATORYJNY 4. Kierunek

Bardziej szczegółowo

Algorytmy przeszukiwania

Algorytmy przeszukiwania Algorytmy przeszukiwania Przeszukiwanie liniowe Algorytm stosowany do poszukiwania elementu w zbiorze, o którym nic nie wiemy. Aby mieć pewność, że nie pominęliśmy żadnego elementu zbioru przeszukujemy

Bardziej szczegółowo

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13

Bardziej szczegółowo

Kategorie gramatyczne polszczyzny

Kategorie gramatyczne polszczyzny Uniwersytet Kardynała Stefana Wyszyńskiego 1 Pojęcie kategorii gramatycznej 2 3 Pojęcie kategorii gramatycznej i jej wartości Kategoria gramatyczna swoisty (stały, regularny, obligatoryjny) podział zbioru

Bardziej szczegółowo

Metody Kompilacji Wykład 1 Wstęp

Metody Kompilacji Wykład 1 Wstęp Metody Kompilacji Wykład 1 Wstęp Literatura: Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman: Compilers: Princiles, Techniques, and Tools. Addison-Wesley 1986, ISBN 0-201-10088-6 Literatura: Alfred V. Aho,

Bardziej szczegółowo

Interpretacja Raportu badania pracy w Otwartym Systemie Antyplagiatowym (OSA)

Interpretacja Raportu badania pracy w Otwartym Systemie Antyplagiatowym (OSA) Interpretacja Raportu badania pracy w Otwartym Systemie Antyplagiatowym (OSA) Uwagi ogólne Raport nie wskazuje jednoznacznie plagiatu System antyplagiatowy stanowi jedynie narzędzie wspomagające ocenę

Bardziej szczegółowo

Podstawy Kompilatorów

Podstawy Kompilatorów Podstawy Kompilatorów Laboratorium 3 Uwaga: Do wykonania poniższych zadań związanych z implementacją niezbędny jest program LEX oraz kompilator. Dla środowiska Linux mogą to być: Darmowa wersja generatora

Bardziej szczegółowo

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości

Bardziej szczegółowo

Primo wyszukiwarka naukowa

Primo wyszukiwarka naukowa Primo wyszukiwarka naukowa Wyszukiwarka Primo to uniwersalne narzędzie do jednoczesnego przeszukiwania wszystkich zasobów bibliotecznych, zarówno tradycyjnych jak i elektronicznych. Pozwala szybko dotrzeć

Bardziej szczegółowo

OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) / k, 1, II. prof. dr hab. Andrzej S. Dyszak

OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) / k, 1, II. prof. dr hab. Andrzej S. Dyszak Nazwa przedmiotu Kod przedmiotu OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) 09.03.20/ k, 1, II Humanistyczny Instytut/Katedra Instytut Filologii Polskiej i Kulturoznawstwa Specjalność/specjalizacja

Bardziej szczegółowo

Biblioteka Wirtualnej Nauki

Biblioteka Wirtualnej Nauki Biblioteka Wirtualnej Nauki BAZA EBSCO EBSCO Publishing oferuje użytkownikom w Polsce dostęp online do pakietu podstawowego baz danych w ramach projektu Electronic Information for Libraries Direct eifl

Bardziej szczegółowo

Wyszukiwanie w repozytoriach tekstowych w języku polskim

Wyszukiwanie w repozytoriach tekstowych w języku polskim Wyszukiwanie w repozytoriach tekstowych w języku polskim Maciej Klubiński Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, ul. Nowowiejska 15/19, 00-665 Warszawa M.Klubinski@stud.elka.pw.edu.pl

Bardziej szczegółowo

Tydzień 8 Podręcznik Zeszyt Ćwiczeń Funkcje Językowe Gramatyka Pisanie Poniedziałek Zeszyt Ćwiczeń Co lubisz robić? Czym się interesujesz?

Tydzień 8 Podręcznik Zeszyt Ćwiczeń Funkcje Językowe Gramatyka Pisanie Poniedziałek Zeszyt Ćwiczeń Co lubisz robić? Czym się interesujesz? Tydzień 8 Podręcznik Zeszyt Ćwiczeń Funkcje Językowe Gramatyka Pisanie Poniedziałek Zeszyt Ćwiczeń 18-22 Co lubisz robić? Czym się interesujesz? Koniugacje: -m, -sz., -ę, -esz, -ę, - Opis rodziny i siebie.

Bardziej szczegółowo

Personalizacja oraz treści dynamiczne w szablonach

Personalizacja oraz treści dynamiczne w szablonach Personalizacja oraz treści dynamiczne w szablonach Kraków 20 maja 2010 Uwagi ogólne Wszystkie tagi w postaci: $$nazwa_pola_dodatkowego$$ $$filtr:nazwa_pola$$ $$if:nazwa_pola$$ $$endif$$ $$wyrażenie_czasowe$$

Bardziej szczegółowo

kompleksowe oprogramowanie do zarządzania procesem spawania

kompleksowe oprogramowanie do zarządzania procesem spawania kompleksowe oprogramowanie do zarządzania procesem spawania Jeżeli w Twojej firmie: Wykonujesz różne prace wykorzystując różne technologie spawalnicze? Tracisz mnóstwo czasu na ręczne prowadzenie dokumentacji?

Bardziej szczegółowo

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Wymagania edukacyjne z języka polskiego. dla klasy III gimnazjum

Wymagania edukacyjne z języka polskiego. dla klasy III gimnazjum Wymagania edukacyjne z języka polskiego dla klasy III gimnazjum PO UKOŃCZENIU KLASY III UCZEŃ POWINIEN UMIEĆ : -wyróżnić czasowniki w formie osobowej i nieosobowej, określić formy gramatyczne, odmienić

Bardziej szczegółowo

Kontenery i iteratory. Wykorzystanie kontenerów w praktyce.

Kontenery i iteratory. Wykorzystanie kontenerów w praktyce. Instrukcja laboratoryjna nr 2 Programowanie w języku C 2 (C++ poziom zaawansowany) Kontenery i iteratory. Wykorzystanie kontenerów w praktyce. dr inż. Jacek Wilk-Jakubowski mgr inż. Maciej Lasota dr inż.

Bardziej szczegółowo

Wyszukiwanie tekstów

Wyszukiwanie tekstów Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły

Bardziej szczegółowo

Analiza znaczeniowa sterowana składnią

Analiza znaczeniowa sterowana składnią S e ISA(e, Czytanie) Czytający(e, Ola) Czytany(e, Książka) NP VP N.Ola V.czyta NP N.książkę W jaki sposób przenieść znaczenie pojedynczych słów ze słownika w odpowiednie miejsca w reprezentacji zdania?

Bardziej szczegółowo

Instrukcja obsługi archiwów zabezpieczonych hasłem. ( na przykładzie oprogramowania 7-Zip )

Instrukcja obsługi archiwów zabezpieczonych hasłem. ( na przykładzie oprogramowania 7-Zip ) Instrukcja obsługi archiwów zabezpieczonych hasłem. ( na przykładzie oprogramowania 7-Zip ) Do utworzenia zabezpieczonego archiwum użyjemy oprogamowania 7-Zip z paru powodów. Oprogramowanie to jest darmowym

Bardziej szczegółowo

Funkcjonalność słów kluczowych pozwala na przypisanie zestawu słów do wykładowców, grup i sal, w celach wyszukiwania danych.

Funkcjonalność słów kluczowych pozwala na przypisanie zestawu słów do wykładowców, grup i sal, w celach wyszukiwania danych. Słowa kluczowe... 1 Wprowadzenie... 1 Słowa kluczowe- przedmioty... 1 Słowa kluczowe- grupy... 4 Słowa kluczowe- wykładowcy i przedmioty... 4 Słowa kluczowe To rozszerzenie dostępne jest dla użytkowników,

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

KATEGORIA OBSZAR WIEDZY

KATEGORIA OBSZAR WIEDZY Moduł 3 - Przetwarzanie tekstów - od kandydata wymaga się zaprezentowania umiejętności wykorzystywania programu do edycji tekstu. Kandydat powinien wykonać zadania o charakterze podstawowym związane z

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej

Bardziej szczegółowo

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław

Bardziej szczegółowo

Full Text Search. Study Group Tomasz Libera

Full Text Search. Study Group Tomasz Libera Full Text Search Study Group 70-461 Tomasz Libera BIO SQL Server Developer Członek Zarządu Stowarzyszenia PLSSUG Założyciel i lider krakowskiego oddziału Organizator i prelegent konferencji SQLDay, SQL

Bardziej szczegółowo

Zadanie analizy leksykalnej

Zadanie analizy leksykalnej Analiza leksykalna 1 Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Przykład: We: COST := ( PRICE + TAX ) * 0.98 Wy: id 1 := ( id 2 + id 3 ) * num 4 Tablica symboli:

Bardziej szczegółowo

X-CONTROL -FUNKCJONALNOŚCI

X-CONTROL -FUNKCJONALNOŚCI X-CONTROL -FUNKCJONALNOŚCI X-CONTROL FUNKCJONALNOŚCI* *Funkcjonalności zostały omówione w kolejności logicznej. Kolejność na pulpicie; patrz widok powyżej, została zaplanowana dla wygody użytkownika. 1.

Bardziej szczegółowo