Wyszukiwanie dokumentów/informacji
|
|
- Agnieszka Świderska
- 7 lat temu
- Przeglądów:
Transkrypt
1 Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie informacji (ang. information retrieval) jest bardziej ogólnym pojęciem dokumenty mogą być multimedialne, wyszukiwanie dotyczy także metadanych itd. Wyłuskiwanie informacji (ang. information extraction) polega na wypełnianiu formularzy z polami typu kto, gdzie, kiedy, jak, za ile itp. na podstawie informacji w zapisanych w języku naturalnym w dokumentach. Wyszukiwanie dokumentów często poprzedza wyszukiwanie informacji, a także odpowiadanie na pytania. Najpierw chcemy wiedzieć, gdzie jest informacja, potem ją analizujemy. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (208 / 222)
2 Model przestrzeni wektorowej Jest to przykład bardziej ogólnego modelu worka słów (ang. bag of words) modelu, w którym znaczenie dokumentu wynika ze złożenia znaczeń występujących w nich słów. Kolejność słów i kontekst ich występowania nie ma znaczenia. Zbiory słów reprezentowane są przez wektory w przestrzeni wielowymiarowej jeden wymiar to jedno słowo.. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (209 / 222)
3 Model przestrzeni wektorowej Dokumenty i zapytanie opisywane są przez wektory wag słów. W najprostszym podejściu elementy wektora są równe 1, gdy dane słowo występuje w dokumencie, 0 w przeciwnym przypadku. dj = (t 1,j, t 2,j,..., t N,j ) qk = (t 1,k, t 2,k,..., t N,k ) sim( q k, d j ) =. Nauczyciele akademiccy mogą otrzymywać za osiągnięcia naukowe, dydaktyczne lub organizacyjne albo za całokształt dorobku nagrody rektora oraz nagrody ministra właściwego do. spraw szkolnictwa wyższego. N t i,k t i,j = q k d j i=1 0 agentura 0 akademia 1 akademicki 0 akord 0 aktywista 0 alarm 1 albo 0 alert Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (210 / 222)
4 Model przestrzeni wektorowej Wagi można ulepszyć zastępując je np. częstością użycia danego słowa w danym dokumencie/zapytaniu. Otrzymujemy wówczas: dj = (w 1,j, w 2,j,..., w N,j ) qk = (w 1,k, w 2,k,..., w N,k ), sim( q k, d j ) = N w i,k w i,j = k q d j gdzie w i,j jest wagą (tu równą częstości) słowa i w dokumencie j.. Nauczyciele akademiccy zatrudnieni w uczelni wojskowej, uczelni służb państwowych, uczelni artystycznej, uczelni morskiej 2 nagrody lub uczelni medycznej mogą otrzymywać 5 uczelnia za osiągnięcia naukowe, dydaktyczne lub organizacyjne albo za całokształt dorobku 4 w nagrody rektora oraz nagrody właściwego ministra wskazanego w art. 33 ust. 2, na 2 za zasadach. i w trybie określonych w ust i=1 Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (211 / 222)
5 Model przestrzeni wektorowej Wagi będące częstościami użycie słów w dokumencie kładą zbyt wielki nacisk na liczbę wystąpień. Im dłuższy dokument, tym ważniejszy. Dlatego wektor wag słów poddaje się normalizacji dzieląc wagi przez jego długość, N czyli przez i=1 w2 i. Wówczas podobieństwo: sim( q k, d j ) = N i=1 t i,k t i,j N N i=1 q2 i i=1 d2 i = qk d j q k d j jest cosinusem kąta między wektorami jednostkowymi zapytania i dokumentu (lub dwóch dokumentów). Jeśli jest równe jeden, to dokumenty sa identyczne, jeśli zero niezależne (prostopadłe). Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (212 / 222)
6 Model przestrzeni wektorowej Częstość użycia poszczególnych słów w danym dokumencie nie oddaje ich wagi. Słowa, które występują w wielu dokumentach są mniej ważne niż te, które występują w nielicznych. Waga odwróconej częstotliwości występowania w dokumentach (ang. inverse document frequency) jest zdefiniowana jako: idf i = log( N n i ) gdzie n i to liczba dokumentów, w których występuje słowo i, a N to całkowita liczba dokumentów w zbiorze. Połączenie tej wagi z wagą częstości występowania słowa w dokumencie daje nam: w i,j = tf i,j idf i Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (213 / 222)
7 Wagi zapytania Zapytania na ogół wcale nie przypominają dokumentów. Dlatego do obliczania wagi występującej w nich słów lepiej jest używać innych algorytmów. Salton i Bukley polecają następujący wzór, w którym max j tf j,k oznacza częstość występowania najczęstszego słowa w zapytaniu k: ( w i,k = tf ) i,k idf i max i tf j,k Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (214 / 222)
8 Wybór indeksowanych słów Najczęściej występujące w dokumentach (i zapytaniach) słowa (ang. stop words) mają niewielki wpływ (z powodu małej wagi) na znalezienie dokumentu, natomiast zajmują miejsce w plikach indeksowych, dlatego się je z tych plików usuwa. Dla zapytań w języku angielskim lematyzacja (sprowadzenie formy odmienionej słowa do wyrazu hasłowego) często nie poprawia jakości wyszukiwania (bywa wręcz odwrotnie). Jednak dla języków z bogatą fleksją, a więc dla języków słowiańskich, lematyzacja pozwala na zwiększenie kompletności wyszukiwania i na wydatne zmniejszenie objętości plików indeksowych. Dla języków aglutynacyjnych jest wręcz konieczna. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (215 / 222)
9 Wykorzystanie informacji zwrotnej Prosimy użytkownika o zaznaczenie tych z dokumentów przedstawionych mu jako odpowiedź na zapytanie, które uznaje za związane z zapytaniem. Następnie tworzymy nowe zapytanie używając innych wag. Chcemy odepchnąć wektor zapytania od niewłaściwych dokumentów w stronę tych właściwych. Uzyskujemy to przez dodanie uśrednione wektora dla właściwych dokumentów i odjęcie uśrednionego wektora dla dokumentów niewłaściwych. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (216 / 222)
10 Wykorzystanie informacji zwrotnej Niech q i reprezentuje wektor wag oryginalnego zapytania, R liczbę dokumentów dotyczących pytania, S liczbę dokumentów niezwiązanych z pytaniem. Niech γ i β przyjmują wartości należące do przedziału < 0, 1 > oraz γ + β = 1. Wówczas: q i+1 = q i + β R R rj γ S Salton i Buckley osiągnęli dobre wyniki dla wartości β = 0.75 i γ = j=1 S k=1 sk Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (217 / 222)
11 Rozszerzenie zapytania Oryginalne pytanie można rozszerzyć używając słownika wyrazów bliskoznacznych (ang. thesaurus). Zamiast stosować zwykły słownik wyrazów bliskoznacznych, można taki utworzyć samodzielnie poprzez grupowanie słów (ang. term clustering). Można to zrobić jednokrotnie dla całego zbioru dokumentów lub na podstawie dokumentów uznanych przez użytkownika za związane z pytaniem. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (218 / 222)
12 Dodatkowe materiały nt. wyszukiwania dokumentów/informacji Dobrym źródłem są oba wymienione we wstępie podręczniki oraz materiały serii konferencji MUC (dostępne przez ACL Anthology). Poza tym:.1 Gerard Salton, James Allan, Chris Buckley, Amit Singhal, Automatic Analysis, Theme Generation, and Summarization of Machine-Readable Texts, Science, vol. 264, 3 June Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, Stefan Büttcher, Charles L. A. Clarke, Gordon V. Cormack, Information Retrieval. Implementing and Evaluating Search Engines, MIT Press, Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (219 / 222)
13 Miary (1/2) Kompletność (ang. recall) jest miarą tego, jak wiele istotnych danych zostało wyłuskanych z tekstu: Kompletność = Liczba prawidłowych odp. dostarczonych przez system Liczba możliwych prawidłowych odp. w tekście Dokładność (ang. precision, accuracy) jest miarą poprawności odpowiedzi dostarczonych przez system: Dokładność = Liczba prawidłowych odp. dostarczonych przez system Liczba odp. dostarczonych przez system Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (220 / 222)
14 Miary (2/2) Miara F (ang. F-measure, F-score) łączy kompletność z dokładnością (β jest parametrem): Miara F = (β2 + 1) Dokładność Kompletność β 2 Dokładność + Kompletność Pokrycie (ang. coverage) to udział elementów, dla których system udzielił odpowiedzi (poprawnej lub nie), w ogólnej ich liczbie: Pokrycie = Liczba elementów, dla których system może dostarczyć odp. Liczba wszystkich elementów Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (221 / 222)
15 Przykłady miar prawda system 1 V,N V,N 2 V V,N 3 V,A V,N 4 V,N N 5 N V 6 V,N,A V,N 7 A - kompletność = 7/(7+4) 63.64% dokładność = 7/(7+3) = 70.0% pokrycie = 6/ % β 1/2 1 2 F 245/357 98/ / % 66.67% 64.81% Dla ostatniego elementu system nie mógł zostać zastosowany. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 8. Wyszukiwanie dokumentów/informacji (222 / 222)
Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
Wyszukiwanie tekstów
Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły
Bazy dokumentów tekstowych
Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1
Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search Irmina Masłowska irmina.maslowska@cs.put.poznan.pl www.cs.put.poznan.pl/imaslowska/wipi/ Document representation Document representation
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search dr hab. inż. Miłosz Kadziński dr inż. Irmina Masłowska {milosz.kadzinski, irmina.maslowska}@cs.put.poznan.pl Document representation
Wstęp do przetwarzania języka naturalnego
Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013 Section 1 Przypomnienie Bag of words model Podejście Przypomnienie
Eksploracja złożonych typów danych Text i Web Mining
Eksploracja złożonych typów danych Text i Web Mining Jerzy Stefanowski Instytut Informatyki Politechniki Poznańskiej Wykład AiED, Poznań 2002 Co będzie? Eksploracja danych tekstowych Wyszukiwanie informacji
Architektury Usług Internetowych. Wyszukiwanie usług w systemie BeesyCluster
Architektury Usług Internetowych laboratorium nr 6: Wyszukiwanie usług w systemie BeesyCluster Jakub Kuryłowicz, dr inż. Paweł Czarnul jakub.kurylowicz@eti.pg.gda.pl, pczarnul@eti.pg.gda.pl Katedra Architektury
Model zaszumionego kanału
W X kanal Y W^ koder dekoder p(y x) Oryginalna praca Shannona polegała na poszukiwaniu takiego kodowania, które umożliwiało ustalenie nadmiarowości informacji w taki sposób, żeby na wyjściu można było
Systemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Hybrydowa metoda rekomendacji dokumentów w środowisku hipertekstowym
Hybrydowa metoda rekomendacji dokumentów w środowisku hipertekstowym Paweł Szołtysek 09 listopada 2009 1/46 metod metod 2/46 metod 199 stron, 2 cytowania własne 7rozdziałów Promotor: NT Nguyen 3/46 metod
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Metody indeksowania dokumentów tekstowych
Metody indeksowania dokumentów tekstowych Paweł Szołtysek 21maja2009 Metody indeksowania dokumentów tekstowych 1/ 19 Metody indeksowania dokumentów tekstowych 2/ 19 Czym jest wyszukiwanie informacji? Wyszukiwanie
O szukaniu sensu w stogu siana
O szukaniu sensu w stogu siana Algorytmy grupowania wyników z wyszukiwarek internetowych i propozycje ich ulepszenia przy wykorzystaniu wiedzy lingwistycznej. Dawid Weiss Instytut Informatyki Politechnika
Grupowanie danych. Wprowadzenie. Przykłady
Grupowanie danych str. 1 Wprowadzenie Celem procesu grupowania jest podział zbioru obiektów, fizycznych lub abstrakcyjnych, na klasy obiektów o podobnych cechach, nazywane klastrami lub skupieniami Klaster
27.03.2014 Warszawa. Indeksowanietreściwteoriipraktyce. warsztaty
27.03.2014 Warszawa Indeksowanietreściwteoriipraktyce warsztaty Rosnąca liczba informacji cyfrowej uniemożliwia osobiste zapoznanie się z każdym ważnym czy chociażby przydatnym dokumentem. W celu ułatwienia
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Technologie Informacyjne
Przygotowanie danych Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności December 5, 2016 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne Dane tabelaryczne ID data
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Od CAQDAS do Text Miningu Nowe techniki w analizie danych jakościowych
http://dx.doi.org/10.18778/7969-549-2.10 Grzegorz Bryda Krzysztof Tomanek Uniwersytet Jagielloński Od CAQDAS do Text Miningu Nowe techniki w analizie danych jakościowych Streszczenie. Celem artykułu jest
REGULAMIN przyznawania nauczycielom akademickim nagród Rektora Politechniki Opolskiej
Załącznik do uchwały nr 321 Senatu Politechniki Opolskiej z dnia 22.04.2015 r. REGULAMIN przyznawania nauczycielom akademickim nagród Rektora Politechniki Opolskiej Na podstawie art. 155 ust. 1, 4 i 6
Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
Multiwyszukiwarka EBSCO Discovery Service - przewodnik
Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Główną Uniwersytetu Medycznego w Poznaniu. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
STYPENDIA DOKTORANCKIE
Zasady punktacji i oceny uczestników studiów trzeciego stopnia (doktoranckich), które służą procedurze przyznawania stypendiów doktoranckich oraz zwiększeń stypendiów doktoranckich z dotacji podmiotowej
W poszukiwaniu sensu w świecie widzialnym
W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały
REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI KRAKOWSKIEJ NAUCZYCIELOM AKADEMICKIM
Załącznik nr 1 do uchwały nr 59/o/06/2010 REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI KRAKOWSKIEJ NAUCZYCIELOM AKADEMICKIM 1 Rektor przyznaje nauczycielom akademickim nagrody za: 1. oryginalne i
REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI KRAKOWSKIEJ NAUCZYCIELOM AKADEMICKIM (Tekst jednolity)
Załącznik nr do uchwały senatu nr 2/o/0/20 z dnia 2 kwietnia 20 r. REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI KRAKOWSKIEJ NAUCZYCIELOM AKADEMICKIM (Tekst jednolity) Rektor przyznaje nauczycielom
Poprawianie pisowni. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 6. Korekta pisowni: odległość Levenshteina (166 / 188)
Poprawianie pisowni Błędna pisownia może być powodowana przez różne czynniki: błędy w przekazywaniu sygnałów do mięśni odpowiedzialnych za ruch palców (literówki, np litreówki); nieznajomość pisowni słów
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
ZARZĄDZENIE NR 20/2014
ZARZĄDZENIE NR 20/2014 Rektora Akademii Wychowania Fizycznego im. Bronisława Czecha w Krakowie z dnia 30 maja 2014 roku w sprawie wprowadzenia w życie Regulaminu przyznawania wyróżnień honorowych przez
REPREZENTACJA I WYSZUKIWANIE DOKUMENTÓW TEKSTOWYCH W BAZACH DANYCH
STUDIA INFORMATICA 2009 Volume 30 Number 2A (83) Jakub CIEŚLEWICZ, Adam PELIKANT Politechnika Łódzka, Instytut Mechatroniki i Systemów Informatycznych REPREZENTACJA I WYSZUKIWANIE DOKUMENTÓW TEKSTOWYCH
OPTYMALIZACJA SCHEMATU WAŻENIA TERMINÓW DLA MODELU WEKTOROWEGO TERM FREQUENCY OPTIMIZATION FOR THE VECTOR SPACE MODEL
ARTUR IEWIAROWSKI * OPTYMALIZACJA SCHEMATU WAŻEIA TERMIÓW DLA MODELU WEKTOROWEGO TERM FREQUECY OPTIMIZATIO FOR THE VECTOR SPACE MODEL Streszczenie Abstract Artykuł opisuje wybrane metody ważenia terminów
TEXT MINING W ANALIZIE ZBIORÓW PUBLIKACJI NAUKOWYCH TEXT MINING IN ANALYSIS OF SCIENTIFIC PUBLICATIONS
ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2017 Seria: ORGANIZACJA I ZARZĄDZANIE z. 114 Nr kol. 1993 Marcin WYSKWARSKI Politechnika Śląska Wydział Organizacji i Zarządzania marcin.wyskwarski@polsl.pl TEXT MINING
Zarządzenie Nr 115/2012. Rektora Uniwersytetu Jana Kochanowskiego w Kielcach. z dnia 20 grudnia 2012 r.
Zarządzenie Nr 115/2012 Rektora Uniwersytetu Jana Kochanowskiego w Kielcach z dnia 20 grudnia 2012 r. w sprawie wprowadzenia Regulaminu parametryzacji działalności naukowej nauczycieli akademickich oraz
1 Zbiory i działania na zbiorach.
Matematyka notatki do wykładu 1 Zbiory i działania na zbiorach Pojęcie zbioru jest to pojęcie pierwotne (nie definiuje się tego pojęcia) Pojęciami pierwotnymi są: element zbioru i przynależność elementu
Macierze. Rozdział Działania na macierzach
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:
Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza
Analiza znaczeniowa sterowana składnią
S e ISA(e, Czytanie) Czytający(e, Ola) Czytany(e, Książka) NP VP N.Ola V.czyta NP N.książkę W jaki sposób przenieść znaczenie pojedynczych słów ze słownika w odpowiednie miejsca w reprezentacji zdania?
ARKUSZ OCENY OKRESOWEJ NAUCZYCIELA AKADEMICKIEGO ZATRUDNIONEGO NA STANOWISKU DYDAKTYCZNYM ...
ARKUSZ OCENY OKRESOWEJ NAUCZYCIELA AKADEMICKIEGO ZATRUDNIONEGO NA STANOWISKU DYDAKTYCZNYM Imię, nazwisko i tytułu/stopień naukowy nauczyciela... Data rozpoczęcia pracy w PWSZ w Elblągu Instytut. Zajmowane
Nowy wymiar jakości danych w ubezpieczeniach. Wojciech Partyka
Nowy wymiar jakości danych w ubezpieczeniach Wojciech Partyka Znaczenie jakości danych Wymiana danych z podmiotami zewnętrznymi Integracja systemów informatycznych Zapewnienie możliwości uczestniczenia
Indeksowanie full text search w chmurze
Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji
Regulamin w sprawie zasad i trybu przyznawania nagród Rektora nauczycielom akademickim w Szkole Głównej Gospodarstwa Wiejskiego w Warszawie
Załącznik do Uchwały nr 79-2012/2013 Senatu SGGW z dnia 24 czerwca 2013 roku Regulamin w sprawie zasad i trybu przyznawania nagród Rektora nauczycielom akademickim w Szkole Głównej Gospodarstwa Wiejskiego
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,
1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości
Multiwyszukiwarka EBSCO Discovery Service przewodnik
Multiwyszukiwarka EBSCO Discovery Service to narzędzie zapewniające łatwy i skuteczny dostęp do wszystkich źródeł elektronicznych Biblioteki Uczelnianej (prenumerowanych i Open Access) za pośrednictwem
Przetwarzanie Języka Naturalnego dr inż. Krzysztof Rzecki. Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż.
Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż. Krzysztof Rzecki Literatura: W. Lubaszewski, Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu, AGH Kraków 2009. Kłopotek
UKŁADY RÓWNAŃ LINIOWYCH -Metody dokładne
UKŁADY RÓWNAŃ LINIOWYCH -Metody dokładne Układy równań liniowych Rozpatruje się układ n równań liniowych zawierających n niewiadomych: a + a +... + ann b a + a +... + ann b... an + an+... + annn bn który
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
Stosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q
Zaawansowane metody numeryczne
Wykład 10 Rozkład LU i rozwiązywanie układów równań liniowych Niech będzie dany układ równań liniowych postaci Ax = b Załóżmy, że istnieją macierze L (trójkątna dolna) i U (trójkątna górna), takie że macierz
Elementy inteligencji obliczeniowej
Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego
Dydaktyka matematyki (II etap edukacyjny) II rok matematyki Semestr letni 2018/2019 Ćwiczenia nr 7
Dydaktyka matematyki (II etap edukacyjny) II rok matematyki Semestr letni 2018/2019 Ćwiczenia nr 7 Zadanie domowe 0 = 4 4 + 4 4, 2 = 4: 4 + 4: 4, 3 = 4 4: 4 4, 4 = 4 4 : 4 + 4, 6 = 4 + (4 + 4): 4, 7 =
UCHWAŁA NR 5/2010 SENATU KOLEGIUM KARKONOSKIEGO W JELENIEJ GÓRZE z dnia 22 lutego 2010 roku
UCHWAŁA NR 5/2010 SENATU KOLEGIUM KARKONOSKIEGO W JELENIEJ GÓRZE z dnia 22 lutego 2010 roku w sprawie: zmian w Uchwale nr 19/2009 Senatu Kolegium Karkonoskiego z dnia 25 maja 2009 roku w sprawie ustalenia
OCENIANIE WYPOWIEDZI PISEMNYCH
1 OCENIANIE WYPOWIEDZI PISEMNYCH KRYTERIA OCENIANIA: KRÓTKI TEKST UŻYTKOWY DŁUŻSZY TEKST UŻYTKOWY WYPOWIEDŹ PISEMNA Przedstawiony materiał zawiera szczegółowe uwagi dotyczące oceniania prac pisemnych z
3. Macierze i Układy Równań Liniowych
3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x
Procedura weryfikacji prac licencjackich, inżynierskich i magisterskich przez Uczelniany System Antyplagiatowy
Zał. do ZW 5/2018 Procedura weryfikacji prac licencjackich, inżynierskich i magisterskich przez Uczelniany System Antyplagiatowy 1 1. Procedurze weryfikacji prac licencjackich, inżynierskich i magisterskich,
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Stany równoważne Stany p i q są równoważne,
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych
Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych Piotr Modliński Wydział Geodezji i Kartografii PW 13 stycznia 2012 P. Modliński, GiK PW Rozw.
Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych
Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska Istniejące systemy - Google Istniejące systemy - Google
Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i,j) (i = 1,,n;j = 1,,m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F = R lub F = C, nazywamy macierzą (rzeczywistą, gdy F
WZÓR SPRAWOZDANIA Z OCENY OKRESOWEJ PRACOWNIKA NAUKOWO-DYDAKTYCZNEGO ORAZ PRACOWNIKA DYDAKTYCZNEGO NA WYDZIALE.UKSW W ROKU AKADEMICKIM..
Załącznik nr 1 do Zarządzenia nr 28/2013 Rektora UKSW z dnia 17 maja 2013r. WZÓR SPRAWOZDANIA Z OCENY OKRESOWEJ PRACOWNIKA NAUKOWO-DYDAKTYCZNEGO ORAZ PRACOWNIKA DYDAKTYCZNEGO NA WYDZIALE.UKSW W ROKU AKADEMICKIM..
REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI ŁÓDZKIEJ NAUCZYCIELOM AKADEMICKIM
Uchwała Nr 8/2009 Senatu Politechniki Łódzkiej z dnia 28 października 2009 roku REGULAMIN PRZYZNAWANIA NAGRÓD REKTORA POLITECHNIKI ŁÓDZKIEJ NAUCZYCIELOM AKADEMICKIM 1 1. Regulamin opracowano na podstawie
Uchwała nr 89 (2008/2009) Senatu Uniwersytetu Ekonomicznego w Poznaniu z dnia 24 kwietnia 2009 roku
Uchwała nr 89 (2008/2009) Senatu Uniwersytetu Ekonomicznego w Poznaniu z dnia 24 kwietnia 2009 roku ============================================================== Członkowie Senatu w głosowaniu jawnym,
L A TEX krok po kroku
L A TEX krok po kroku Imię i nazwisko Spis treści 1 Sekcja pierwsza 1 1.1 Lista numerowana.......................... 1 2 Wymagania podstawowe 2 2.1 Lista numerowana.......................... 2 3 Troszkę
Zwiększenie udziału osób dorosłych w kształceniu w zakresie narzędzi informatycznych i technologii NITKA
Załącznik nr 1 do Regulaminu Zwiększenie udziału osób dorosłych w kształceniu w zakresie narzędzi informatycznych i technologii NITKA Zadanie nr 9 Staże i szkolenia w wiodących zagranicznych i krajowych
a 11 a a 1n a 21 a a 2n... a m1 a m2... a mn x 1 x 2... x m ...
Wykład 15 Układy równań liniowych Niech K będzie ciałem i niech α 1, α 2,, α n, β K. Równanie: α 1 x 1 + α 2 x 2 + + α n x n = β z niewiadomymi x 1, x 2,, x n nazywamy równaniem liniowym. Układ: a 21 x
Zarządzenie 46/2011/2012 Rektora Uniwersytetu Kazimierza Wielkiego z dnia 28 lutego 2012 r.
Zarządzenie 46/2011/2012 Rektora Uniwersytetu Kazimierza Wielkiego z dnia 28 lutego 2012 r. w sprawie wdrożenia Wytycznych dla rad wydziałów w zakresie dokumentacji programów kształcenia dla studiów pierwszego
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Pracownicy Uniwersytetu Śląskiego w Katowicach będący nauczycielami akademickimi mogą otrzymywać nagrody Rektora, zwane dalej nagrodami.
Załącznik do uchwały nr 376 Senatu UŚ z dnia 28 maja 2019 r. Uchwała nr 94 Senatu Uniwersytetu Śląskiego w Katowicach z dnia 25 kwietnia 2017 r. w sprawie Regulaminu przyznawania nagród Rektora dla nauczycieli
Znaczenie słowa. N szkoła {Szkoła}
Znaczenie słowa N szkoła {Szkoła} Czytałem pańską książkę w szkole. Tego lata koło szkoły urządzono boisko. Szkołę jazdy żem przeszedł! Od razu widać, z jakiej szkoły wyszedł, pismak. Spór o historyczną
ZARZĄDZENIE NR 32 Rektora Uniwersytetu Przyrodniczego w Lublinie z dnia 16 czerwca 2017 r.
ZARZĄDZENIE NR 32 Rektora Uniwersytetu Przyrodniczego w Lublinie z dnia 16 czerwca 2017 r. w sprawie zasad i trybu przyznawania i wypłacania stypendiów doktoranckich w Uniwersytecie Przyrodniczym w Lublinie
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
1. Grupowanie Algorytmy grupowania:
1. 1.1. 2. 3. 3.1. 3.2. Grupowanie...1 Algorytmy grupowania:...1 Grupowanie metodą k-średnich...3 Grupowanie z wykorzystaniem Oracle Data Miner i Rapid Miner...3 Grupowanie z wykorzystaniem algorytmu K-Means
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Wojskowa Akademia Techniczna
Zarejestrowano 2018-03-05 12:18:20 przez Baranowski Waldemar wat\baranowswald Wojskowa Akademia Techniczna 800000079746 WEW/PRN/00009/2018 2018-03-05 Zarządzenie Rektora Wojskowej Akademii Technicznej
Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek
Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek Cel projektu Celem projektu jest przygotowanie systemu wnioskowania, wykorzystującego wybrane algorytmy sztucznej inteligencji; Nabycie
Uchwała nr 155/2016 Senatu Uniwersytetu Medycznego im. Karola Marcinkowskiego w Poznaniu z dnia 28 września 2016 roku
Uchwała nr 155/2016 Senatu Uniwersytetu Medycznego im. Karola Marcinkowskiego w Poznaniu z dnia 28 września 2016 roku w sprawie ustalenia Regulaminu Nagród Rektora dla Nauczycieli Akademickich Senat działając
Zarządzenie Rektora Uniwersytetu im. Adama Mickiewicza w Poznaniu
Tekst ujednolicony zarządzenia Rektora UAM w sprawie zasad składania i archiwizacji prac dyplomowych z wykorzystaniem systemu Archiwum Prac Dyplomowych (APD) oraz wzoru oświadczenia o samodzielnym napisaniu
b) Ministra właściwego do spraw wewnętrznych - w odniesieniu do uczelni służb państwowych;
Załącznik nr 4 do Regulaminu ustalania wysokości, przyznawania i wypłacania świadczeń pomocy materialnej oraz stypendium doktoranckiego dla uczestników studiów doktoranckich Akademii Muzycznej im. Stanisława
Komisja oceniająca 2. Cele programu stypendialnego 3. Warunki i kryteria przyznawania stypendiów
Regulamin przyznawania pomocy materialnej dla studentów uczelni wyższych z Opola wykazujących się znaczącymi osiągnięciami - Program Stypendialny pn. Stypendia Prezydenta Miasta Opola przyjęty uchwałą
Oświadczenia pracownicze
Oświadczenia pracownicze MATERIAŁ ZE SPOTKANIA NOWE ZASADY EWALUACJI NAUKI W POLSCE" WARSZAWA, 21 LISTOPADA 2018 R. www.konstytucjadlanauki.gov.pl www.facebook.com/mnisw 3 rodzaje oświadczeń Oświadczenie
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze Polsko-Japońska Wyższa Szkoła Technik Komputerowych Katedra Informatyki Stosowanej Spis treści Spis treści 1 Wektory
Zgłoszenie udziału w projekcie
Zgłoszenie udziału w projekcie I. Forma wsparcia, którego dotyczy zgłoszenie Program Priorytet Działanie Poddziałanie Beneficjent Projekt Forma wsparcia Uczelnia przyjmująca Edycja Program Operacyjny Kapitał
Metoda list prostych Wykład II. Agnieszka Nowak - Brzezińska
Metoda list prostych Wykład II Agnieszka Nowak - Brzezińska Wprowadzenie Przykładowa KW Inna wersja KW Wyszukiwanie informacji Metoda I 1. Przeglądamy kolejne opisy obiektów i wybieramy te, które zawierają
Wykład 6. Metoda eliminacji Gaussa: Eliminacja z wyborem częściowym Eliminacja z wyborem pełnym
1 Wykład 6 Metoda eliminacji Gaussa: Eliminacja z wyborem częściowym Eliminacja z wyborem pełnym ELIMINACJA GAUSSA Z WYBOREM CZĘŚCIOWYM ELEMENTÓW PODSTAWOWYCH 2 Przy pomocy klasycznego algorytmu eliminacji
Uchwała Nr Senatu Uniwersytetu Medycznego we Wrocławiu z dnia 17 grudnia 2014r.
Uchwała Nr 1463 Senatu Uniwersytetu Medycznego we Wrocławiu z dnia 17 grudnia 2014r. w sprawie kryteriów, jakie musi uzyskać nauczyciel akademicki aby ubiegać się o stanowisko w Uniwersytecie Medycznym
ROZPORZĄDZENIE MINISTRA NAUKI I SZKOLNICTWA WYŻSZEGO 1) z dnia 14 września 2011 r.
Dziennik Ustaw Nr 214 12421 Poz. 1271 1271 ROZPORZĄDZENIE MINISTRA NAUKI I SZKOLNICTWA WYŻSZEGO 1) z dnia 14 września 2011 r. w sprawie szczegółowych warunków i trybu przyznawania oraz wypłacania doktorantom
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Wydział Psychologii i Nauk Humanistycznych Informacje nt. realizacji praktyk zawodowych Filologia angielska Wstęp Program praktyk zawodowych funkcjonujący
Zarządzenie nr 17 Rektora Uniwersytetu Przyrodniczego w Lublinie z dnia 16 kwietnia 2018 r.
Zarządzenie nr 17 Rektora Uniwersytetu Przyrodniczego w Lublinie z dnia 16 kwietnia 2018 r. w sprawie zasad i trybu przyznawania i wypłacania stypendiów doktoranckich w Uniwersytecie Przyrodniczym w Lublinie
Rozwiązywanie układów równań liniowych
Rozwiązywanie układów równań liniowych Marcin Orchel 1 Wstęp Jeśli znamy macierz odwrotną A 1, to możęmy znaleźć rozwiązanie układu Ax = b w wyniku mnożenia x = A 1 b (1) 1.1 Metoda eliminacji Gaussa Pierwszy
System EwOs. Ewidencja Osiągnięć. nauczycieli akademickich Uniwersytetu im. Adama Mickiewicza w Poznaniu. Pierwsze kroki
System EwOs Ewidencja Osiągnięć nauczycieli akademickich Uniwersytetu im. Adama Mickiewicza w Poznaniu Pierwsze kroki Spis treści Cel tworzenia systemu... 1 Logowanie do systemu... 2 Wybór kontekstu pracy...