Wstęp do przetwarzania języka naturalnego
|
|
- Kamila Marcinkowska
- 7 lat temu
- Przeglądów:
Transkrypt
1 Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013
2 Section 1 Przypomnienie
3 Bag of words model
4 Podejście Przypomnienie Na dotychczasowych wykładach - probabilistyczne Od teraz - geometryczne
5 Section 2
6 Dla ustalenia uwagi Załóżmy, że rozważamy problem stworzenia wyszukiwarki, tzn. mamy pewną bazę dokumentów (niekoniecznie stron), oraz użytkownika, który wpisuje jakąś frazę. Chcemy przedstawić mu najlepszy dokument (albo posortowaną listę najlepszych dokumentów).
7 Problem wyszukiwania Mając dane zapytanie q wyszukaj najlepszy dokument d z puli D
8 Problem wyszukiwania jest to istotnie różne od sprawdzania, czy q jako zdanie, należy do jakiegoś modelu języka zadanego przez okreslony dokument d przede wszystkim D jest duże, wiec musimy mieć bardzo wydajną metodę (zarówno pamięciowo jak i obliczeniowo) zapytania bardzo rzadko są zdaniami to, co nas tak na prawdę interesuje to sens, potrzeba, która doprowadziła do wpisania q, nie zaś samo q
9 Reprezentacja binarna (set of words) φ( Ala ma kota. Ala lubi też psy ) = {Ala, ma, kota., lubi.tez, psy}
10 Jaccard coefficient Własności: J(A, A) = 1 J(A, B) = J(A, B) = 0 A B = A B A B A i B mogą być dowolnej (różnej) długości J(A, B) [0, 1]
11 Jaccard coefficient J(A, B) = A B A B J(φ( Ala ma kota ), φ( Ala ma psa )) = = {Ala, ma, kota} {Ala, ma, psa} {Ala, ma, kota} {Ala, ma, psa} = {Ala, ma} {Ala, ma, kota, psa} = 2 4
12 Jaccard coefficient Nie bierze pod uwagę częstotliwości wystąpień słów Normalizacja przez sumę mnogościową nie jest najlepsza
13 Set of words Przypomnienie
14 Bag of words Przypomnienie
15 Bag of words - reprezentacja wektorowa φ(antony and Cleopatra) = [157, 4, 232, 0, 57, 2, 2] N 7
16 Term frequency Przypomnienie Term frequency Częstotliwością termu (term frequency, tf) t w dokumencie d nazywamy liczbę wystąpień t w d i oznaczamy przez tf t,d tf t,d = count(t, d) = #{i : d[i] = t}
17 Term frequency - zastosowania i problemy Można wykorzystywać do mierzenia na ile dany dokument odzwierciedla zapytanie w wyszukiwarce, tzn.: score(q, d) = tf t,d t q Jeśli szukamy hasła dog, to dokument zawierający 100 słów dog będzie 100 razy lepszy niż ten zawierający jedno słówko dog Wraz ze wzrostem częstotliwości występowania termu powinna wzrastać ocena, ale na pewno nie liniowo!
18 Log term frequency w t,d = { 1 + log(tft,d ), if tf t,d > 0 0, otherwise
19 Log term frequency w t,d = { 1 + log(tft,d ), if tf t,d > 0 0, otherwise score(q, d) = w t,d = t q t q d 1 + log(tf t,d )
20 Log term frequency tf t,d w t,d sow
21 Document frequency weighting Rzadkie słowa są bardziej informatywne, niż częste np. jeśli szukamy zapytaniem William Shakespeare, to zdecydowanie większą wagę należy poświęcić stronom, które zawierają term Shakespeare (35,000,000 wyników w Google) niż stronom zawierającym William (281,000,000 wyników w Google). bardziej skrajnie - szukając danych o muszce owocówce ( używając zapytania melanogaster fly ) ważniejsze są strony o konkretnym gatunku ( drosophila melanogaster - 1,410,000 wyników) niż te o muchach ogólnie (188,000,000)
22 Document frequency Document frequency Częstotliwością termu (Document frequency, df) t w zbiorze dokumentów nazywamy liczbę dokumentów w których wystepuje t i oznaczamy przez df t df t = d D min{1, tf t,d } = #{d D : tf t,d > 0}
23 Document frequency Document frequency jest miarą nieinformatywności termu Chcąc mieć informatywności musimy ten obiekt odwrócić
24 Inverse Document frequency ( ) N idf t = log dft gdzie N = #D to liczba dokumentów
25 Inverse Document frequency df t idf t (N = 100)
26 tf-idf weighting Przypomnienie ( ) N tf.idf t,d = (1 + log(tf t,d )) log }{{} dft }{{} tf - trafność idf - normalizacja score(q, d) = t q d tf.idf t,d
27 tf-idf Przypomnienie
28 tf-idf Przypomnienie
29 tf-idf Przypomnienie document x y z Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Rysunek: VSM na bazie utworów Szekspira
30 VSM Przypomnienie Vector Space Model mamy V wymiarową przestrzeń rzeczywistą każdy term to wymiar przestrzeni (oś) dokumenty to punkty (wektory) w tej przestrzeni bardzo wysoko wymiarowa przestrzeń bardzo rzadkie wektory
31 VSM w wyszukiwaniu Mając dane zapytanie q wyszukaj najlepszy dokument d z puli D zapytania również można potraktować jak dokumenty i wyrazić je w naszym VSM dokumenty można posortować wg. trafności trafność = bliskość wektorów = odwrotność odległości
32 Co to jest bliskość wektorów?
33 Section 3
34 Odłegłość między dwoma wektorami mamy dokumenty d i wyrażone jako wektory w R V, nazwijmy je x i interesuje nas znalezienie funkcji f, takiej, że: f (x i, x j ) = 0 gdy x i = x j f (x i, x j ) = f (x j, x i ) f (x i, x j ) > f (x i, x k ) gdy x k jest bardziej podobne do x i niż x j
35 Odległość między dwoma wektorami Norma euklidesowa różnicy wektorów f (x i, x j ) = x i x j
36 Odległość między dwoma wektorami f (x i, x j ) = x i x j f (q, d 2 ) = q d 2 > q d 1 = f (q, d 1 ) f (q, d 2 ) = q d 2 > q d 3 = f (q, d 3 )
37 Odległość między dwoma wektorami Wyobraźmy sobie sytuację, gdzie mamy dokument d będący konkatenacją dokumentu d z samym sobą Semantycznie te dwa dokumenty mają tę samą informację Odległość euklidesowa może być dowolnie duża
38 Odległość między dwoma wektorami Wyobraźmy sobie sytuację, gdzie mamy dokument d będący konkatenacją dokumentu d z samym sobą Semantycznie te dwa dokumenty mają tę samą informację Odległość euklidesowa może być dowolnie duża Idea: używajmy kąta zamiast odległości
39 Liczenie kąta między wektorami w wysoko wymiarowej przestrzeni Prosta obserwacja, nastepujące działania są równoważne Sortowanie dokumentów po malejącym kącie między nimi Sortowanie dokumentów po rosnącym kosinusie kąta między nimi
40 Kosinus kąta Przypomnienie
41 Kosinus kąta przy tfidf t, d : tf.idf t,d 0 (x i, x j ) [0, 90 ] cos( (x i, x j )) [0, 1]
42 Kosinus kąta Przypomnienie cos(x, y) = x i y to wektory tf.idf x y x y = V V i=1 x 2 i i=1 x iy i V i=1 y i 2 cos(x, y) to kosinus kąta między nimi lub czasem podobieństwo kosinusowe (cosine similarity) tych wektorów gdyby x i y były jednostkowe, to wystarczyłoby liczyć iloczyn skalarny
43 Znormalizowana reprezentacja VSM
44 Proces porównywania dokumentów - klasyczna wersja VSM 1 Policz tfidf t,d dla każdego dokumentu i każdego termu 2 Zapisz reprezentację VSM każdego dokumentu korzystając z tfidf 3 Znormalizuj każdy z wektorów (podziel go przez jego normę) 4 W przypadku potrzeby porównania dwóch dokumentów - policz iloczyn skalarny pomiędzy ich reprezentacjami
45 Generalizacje tfidf tzw. SMART notation: ddd.qqq ltc.ltc (omówiony przed chwilą) lnc.ltc (popularne podejście)
46 Czy to jedyna możliwość? Jest wiele innych, używanych do analizy tekstu metryk, m.in. Korelacja Pearsona Uśredniona dywergencja Kullbacka-Leiblera
47 Korelacja Pearsona Rysunek: Współczynnik korelacji Pearsona - wikipedia r xy = (xi x)(y i ȳ) (xi x) 2 (yi ȳ) 2
48 Korelacja Pearsona Rysunek: Współczynnik korelacji Pearsona - wikipedia r xy = (xi x)(y i ȳ) (xi x) 2 (yi ȳ) 2 r xy = cos(x x, y ȳ)
49 Dywergencja KL Przypomnienie D KL (P Q) = P(x) log ( ) P(x) dx Q(x)
50 Dywergencja KL Przypomnienie D KL (P Q) = D KL (x y) = t ( ) P(x) P(x) log dx Q(x) ) w t,x log ( wt,x w t,y
51 Dywergencja KL Przypomnienie D KL (P Q) = D KL (x y) = t ( ) P(x) P(x) log dx Q(x) ) w t,x log ( wt,x w t,y D JS (P Q) = D KL(P P+Q 2 ) + D KL (Q P+Q 2 ) 2
52 Klastrowanie dokumentów - Purity Na podstawie Similarity Measures for Text Document Clustering - Anna Huang (University of Waikato)
53 Klastrowanie dokumentów - Entropia Na podstawie Similarity Measures for Text Document Clustering - Anna Huang (University of Waikato)
54 Kolejny wykład Przypomnienie Klasyfikacja oparta o miary podobieństwa i model VSM Zaawansowany model VSM - Latent Semantic Analysis (LSA)
55 Plan WPJN Przypomnienie 19 XII - [W] Podstawowa klasyfikacja oparta o VSM i LSA 22 XII - [Cw] Zasady projektu 4 3 I - [Cw] Deadline projektu 3 8 I - [W] Maszyna Wektorów Nośnych 16 I - [W] Zaawansowane funkcje jądra 19 I - [Cw] Ostateczny deadline projektu 4 23 I - [W] State of the art NLP
Wstęp do przetwarzania języka naturalnego. Wykład 11 Maszyna Wektorów Nośnych
Wstęp do przetwarzania języka naturalnego Wykład 11 Wojciech Czarnecki 8 stycznia 2014 Section 1 Przypomnienie Wektoryzacja tfidf Przypomnienie document x y z Antony and Cleopatra 5.25 1.21 1.51 Julius
Bardziej szczegółowoWydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Bardziej szczegółowoZaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
Bardziej szczegółowoWyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search dr hab. inż. Miłosz Kadziński dr inż. Irmina Masłowska {milosz.kadzinski, irmina.maslowska}@cs.put.poznan.pl Document representation
Bardziej szczegółowoWstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja
Wstęp do przetwarzania języka naturalnego Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wojciech Czarnecki 8 stycznia 2014 Section 1 Wektoryzacja tfidf document x y z Antony and Cleopatra 5.25 1.21
Bardziej szczegółowoWyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search Irmina Masłowska irmina.maslowska@cs.put.poznan.pl www.cs.put.poznan.pl/imaslowska/wipi/ Document representation Document representation
Bardziej szczegółowocx cx 1,cx 2,cx 3,...,cx n. Przykład 4, 5
Matematyka ZLic - 07 Wektory i macierze Wektorem rzeczywistym n-wymiarowym x x 1, x 2,,x n nazwiemy ciąg n liczb rzeczywistych (tzn odwzorowanie 1, 2,,n R) Zbiór wszystkich rzeczywistych n-wymiarowych
Bardziej szczegółowoAgnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Bardziej szczegółowoCo wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoKlasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Bardziej szczegółowoWykład 9. Matematyka 3, semestr zimowy 2011/ listopada 2011
Wykład 9. Matematyka 3, semestr zimowy 2011/2012 4 listopada 2011 W trakcie poprzedniego wykładu zdefiniowaliśmy pojęcie k-kowektora na przestrzeni wektorowej. Wprowadziliśmy także iloczyn zewnętrzny wielokowektorów
Bardziej szczegółowoTEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Bardziej szczegółowoWyszukiwanie tekstów
Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły
Bardziej szczegółowoZadania z algebry liniowej Iloczyn skalarny, przestrzenie euklidesowe
Zadania z algebry liniowej Iloczyn skalarny, przestrzenie euklidesowe Definicja 1 (Iloczyn skalarny). Niech V będzie rzeczywistą przestrzenią liniową. Iloczynem skalarnym w przestrzeni V nazywamy funkcję
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoWyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
Bardziej szczegółowoBazy dokumentów tekstowych
Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe
Bardziej szczegółowoWyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Bardziej szczegółowoWyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Bardziej szczegółowoEksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1
Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia
Bardziej szczegółowo1 Przestrzeń liniowa. α 1 x α k x k = 0
Z43: Algebra liniowa Zagadnienie: przekształcenie liniowe, macierze, wyznaczniki Zadanie: przekształcenie liniowe, jądro i obraz, interpretacja geometryczna. Przestrzeń liniowa Już w starożytności człowiek
Bardziej szczegółowoSIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa
SIMR 06/07, Analiza, wykład, 07-0- Przestrzeń wektorowa Przestrzeń wektorowa (liniowa) - przestrzeń (zbiór) w której określone są działania (funkcje) dodawania elementów i mnożenia elementów przez liczbę
Bardziej szczegółowoLista. Przestrzenie liniowe. Zadanie 1 Sprawdź, czy (V, +, ) jest przestrzenią liniową nadr :
Lista Przestrzenie liniowe Zadanie 1 Sprawdź, czy (V, +, ) jest przestrzenią liniową nadr : V = R[X], zbiór wielomianów jednej zmiennej o współczynnikach rzeczywistych, wraz ze standardowym dodawaniem
Bardziej szczegółowoText mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Bardziej szczegółowoIloczyn skalarny, wektorowy, mieszany. Ortogonalność wektorów. Metoda ortogonalizacji Grama-Schmidta. Małgorzata Kowaluk semestr X
Iloczyn skalarny, wektorowy, mieszany. Ortogonalność wektorów. Metoda ortogonalizacji Grama-Schmidta. Małgorzata Kowaluk semestr X ILOCZYN SKALARNY Iloczyn skalarny operator na przestrzeni liniowej przypisujący
Bardziej szczegółowoCo to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem.
1 Wektory Co to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem. 1.1 Dodawanie wektorów graficzne i algebraiczne. Graficzne - metoda równoległoboku. Sprowadzamy wektory
Bardziej szczegółowoEmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Bardziej szczegółowoPrzestrzeń unitarna. Jacek Kłopotowski. 23 października Katedra Matematyki i Ekonomii Matematycznej SGH
Katedra Matematyki i Ekonomii Matematycznej SGH 23 października 2018 Definicja iloczynu skalarnego Definicja Iloczynem skalarnym w przestrzeni liniowej R n nazywamy odwzorowanie ( ) : R n R n R spełniające
Bardziej szczegółowoGeometria Lista 0 Zadanie 1
Geometria Lista 0 Zadanie 1. Wyznaczyć wzór na pole równoległoboku rozpiętego na wektorach u, v: (a) nie odwołując się do współrzędnych tych wektorów; (b) odwołując się do współrzędnych względem odpowiednio
Bardziej szczegółowoSystemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Bardziej szczegółowoWykład 16. P 2 (x 2, y 2 ) P 1 (x 1, y 1 ) OX. Odległość tych punktów wyraża się wzorem: P 1 P 2 = (x 1 x 2 ) 2 + (y 1 y 2 ) 2
Wykład 16 Geometria analityczna Przegląd wiadomości z geometrii analitycznej na płaszczyźnie rtokartezjański układ współrzędnych powstaje przez ustalenie punktu początkowego zwanego początkiem układu współrzędnych
Bardziej szczegółowo2 1 3 c c1. e 1, e 2,..., e n A= e 1 e 2...e n [ ] M. Przybycień Matematyczne Metody Fizyki I
Liniowa niezależno ność wektorów Przykład: Sprawdzić czy następujące wektory z przestrzeni 3 tworzą bazę: e e e3 3 Sprawdzamy czy te wektory są liniowo niezależne: 3 c + c + c3 0 c 0 c iei 0 c + c + 3c3
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowo3. Iloczyn zewnętrzny w ogólności nie jest przemienny, ale zachodzi wzór:
2 Iloczyn zewnętrzny jest łączny, tzn: (α β) γ α (β γ) 3 Iloczyn zewnętrzny w ogólności nie jest przemienny, ale zachodzi wzór: α β ( 1) kl β α Dowód: Punkt (1) wynika łatwo z definicji Dowód punktu (2)
Bardziej szczegółowoWykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Bardziej szczegółowoEksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Bardziej szczegółowoGrupowanie danych. Wprowadzenie. Przykłady
Grupowanie danych str. 1 Wprowadzenie Celem procesu grupowania jest podział zbioru obiektów, fizycznych lub abstrakcyjnych, na klasy obiektów o podobnych cechach, nazywane klastrami lub skupieniami Klaster
Bardziej szczegółowoAlgorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
Bardziej szczegółowobaton OR mars 282,000,000 241,000,000 baton OR mars 283,000,000 WYSZUKIWANIE BOOLOWSKIE
WYSZUKIWANIE BOOLOWSKIE Wyszukiwanie boolowskie jest rozszerzeniem wyszukiwania prostego (opartego o słowa kluczowe) o operatory logiczne: AND, OR, NOT oraz ich kombinację. Większośd modeli wyszukiwania
Bardziej szczegółowoInformacja o przestrzeniach Hilberta
Temat 10 Informacja o przestrzeniach Hilberta 10.1 Przestrzenie unitarne, iloczyn skalarny Niech dana będzie przestrzeń liniowa X. Załóżmy, że każdej parze elementów x, y X została przyporządkowana liczba
Bardziej szczegółowoKierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I Sylabus modułu: Wstęp do algebry liniowej i geometrii analitycznej (03-M01N-12-WALG)
Bardziej szczegółowoZadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:
Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza
Bardziej szczegółowoWstęp do Modelu Standardowego
Wstęp do Modelu Standardowego Plan (Uzupełnienie matematyczne II) Abstrakcyjna przestrzeń stanów Podstawowe własności Iloczyn skalarny amplitudy prawdopodobieństwa Operatory i ich hermitowskość Wektory
Bardziej szczegółowoZadania egzaminacyjne
Rozdział 13 Zadania egzaminacyjne Egzamin z algebry liniowej AiR termin I 03022011 Zadanie 1 Wyznacz sumę rozwiązań równania: (8z + 1 i 2 2 7 iz 4 = 0 Zadanie 2 Niech u 0 = (1, 2, 1 Rozważmy odwzorowanie
Bardziej szczegółowoWykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.
Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. pytania teoretyczne:. Co to znaczy, że wektory v, v 2 i v 3
Bardziej szczegółowoZastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
Bardziej szczegółowoPODSTAWY RACHUNKU WEKTOROWEGO
Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Adam Wosatko Ewa Pabisek Skalar Definicja Skalar wielkość fizyczna (lub geometryczna)
Bardziej szczegółowoRachunek wektorowy - wprowadzenie. dr inż. Romuald Kędzierski
Rachunek wektorowy - wprowadzenie dr inż. Romuald Kędzierski Graficzne przedstawianie wielkości wektorowych Długość wektora jest miarą jego wartości Linia prosta wyznaczająca kierunek działania wektora
Bardziej szczegółowoKierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I Sylabus modułu: Wstęp do algebry liniowej i geometrii analitycznej A (03-M01S-12-WALGA)
Bardziej szczegółowoKMO2D. Kolizje między-obiektowe w 2D
KMO2D Kolizje między-obiektowe w 2D I. Wstęp 3 lata temu na temat kolizji nie miałem żadnego pojęcia. Przyszedł jednak czas, gdy postanowiłem napisać pierwszą porządną grę i pojawił się, wtedy problem.
Bardziej szczegółowoRozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład
Rozdział 1 Wektory losowe 1.1 Wektor losowy i jego rozkład Definicja 1 Wektor X = (X 1,..., X n ), którego każda współrzędna jest zmienną losową, nazywamy n-wymiarowym wektorem losowym (krótko wektorem
Bardziej szczegółowoZadania z Analizy Funkcjonalnej I Które z poniższych przestrzeni metrycznych są przestrzeniami unormowanymi?
Zadania z Analizy Funkcjonalnej I - 1 1. Które z poniższych przestrzeni metrycznych są przestrzeniami unormowanymi?. a) X = R, x = arctg x ; b) X = R n, d(x, y) = x 1 y 1 + x 2 y 2 + max i 3 x i y i ;
Bardziej szczegółowoAlgebra liniowa. 1. Macierze.
Algebra liniowa 1 Macierze Niech m oraz n będą liczbami naturalnymi Przestrzeń M(m n F) = F n F n będącą iloczynem kartezjańskim m egzemplarzy przestrzeni F n z naturalnie określonymi działaniami nazywamy
Bardziej szczegółowo3 1 + i 1 i i 1 2i 2. Wyznaczyć macierze spełniające własność komutacji: [A, X] = B
1. Dla macierzy a) A = b) A = c) A = d) A = 3 1 + i 1 i i i 0 i i 0 1 + i 1 i 0 0 0 0 1 0 1 0 1 + i 1 i Wyznaczyć macierze spełniające własność komutacji: A, X = B. Obliczyć pierwiaski z macierzy: A =
Bardziej szczegółowoPrzestrzeń algorytmów klastrowania
20 listopada 2008 Plan prezentacji 1 Podstawowe pojęcia Przykłady algorytmów klastrowania 2 Odległość algorytmów klastrowania Odległość podziałów 3 Dane wejściowe Eksperymenty Praca źródłowa Podstawowe
Bardziej szczegółowoStatystyczna analiza danych
Statystyczna analiza danych Korelacja i regresja Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/30 Ostrożnie z interpretacją p wartości p wartości zależą od dwóch rzeczy
Bardziej szczegółowoZłożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to
Złożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to wprowadzili J. Hartmanis i R. Stearns. Najczęściej przez zasób rozumie się czas oraz pamięć dlatego
Bardziej szczegółowoWykład 5. Ker(f) = {v V ; f(v) = 0}
Wykład 5 Niech f : V W będzie przekształceniem liniowym przestrzeni wektorowych Wtedy jądrem przekształcenia nazywamy zbiór tych elementów z V, których obrazem jest wektor zerowy w przestrzeni W Jądro
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowodr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;
Wykłady 8 i 9 Pojęcia przestrzeni wektorowej i macierzy Układy równań liniowych Elementy algebry macierzy dodawanie, odejmowanie, mnożenie macierzy; macierz odwrotna dr Mariusz Grządziel 15,29 kwietnia
Bardziej szczegółowoSylabus do programu kształcenia obowiązującego od roku akademickiego 2012/13
Sylabus do programu kształcenia obowiązującego od roku akademickiego 2012/13 (1) Nazwa Algebra liniowa z geometrią (2) Nazwa jednostki prowadzącej Instytut Matematyki przedmiot (3) Kod () Studia Kierunek
Bardziej szczegółowoAlgebra liniowa z geometrią
Algebra liniowa z geometrią Maciej Czarnecki 15 stycznia 2013 Spis treści 1 Geometria płaszczyzny 2 1.1 Wektory i skalary........................... 2 1.2 Macierze, wyznaczniki, układy równań liniowych.........
Bardziej szczegółowoKwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 8 Transformaty i kodowanie cz. 2. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 8 Transformaty i kodowanie cz. 2 Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS
Bardziej szczegółowoEstymacja gęstości prawdopodobieństwa metodą selekcji modelu
Estymacja gęstości prawdopodobieństwa metodą selekcji modelu M. Wojtyś Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Wisła, 7 grudnia 2009 Wstęp Próba losowa z rozkładu prawdopodobieństwa
Bardziej szczegółowoZadanie 1 Przygotuj algorytm programu - sortowanie przez wstawianie.
Sortowanie Dane wejściowe: ciąg n-liczb (kluczy) (a 1, a 2, a 3,..., a n 1, a n ) Dane wyjściowe: permutacja ciągu wejściowego (a 1, a 2, a 3,..., a n 1, a n) taka, że a 1 a 2 a 3... a n 1 a n. Będziemy
Bardziej szczegółowoNotatki do wykładu Geometria Różniczkowa I
Notatki do wykładu Geometria Różniczkowa I Katarzyna Grabowska, KMMF 17 listopada 2013 1 Wielokowektory i wieloformy na powierzchni Poprzedni wykład zakończyliśmy na sformułowaniu następującego faktu:
Bardziej szczegółowo1 Podstawowe oznaczenia
Poniżej mogą Państwo znaleźć skondensowane wiadomości z wykładu. Należy je traktować jako przegląd pojęć, które pojawiły się na wykładzie. Materiały te nie są w pełni tożsame z tym co pojawia się na wykładzie.
Bardziej szczegółowo1 Formy hermitowskie. GAL (Informatyka) Wykład - formy hermitowskie. Paweł Bechler
GAL (Informatyka) Wykład - formy hermitowskie Wersja z dnia 23 stycznia 2014 Paweł Bechler 1 Formy hermitowskie Niech X oznacza przestrzeń liniową nad ciałem K. Definicja 1. Funkcję φ : X X K nazywamy
Bardziej szczegółowoRozwiązywanie równań nieliniowych
Rozwiązywanie równań nieliniowych Marcin Orchel 1 Wstęp Przykłady wyznaczania miejsc zerowych funkcji f : f(ξ) = 0. Wyszukiwanie miejsc zerowych wielomianu n-tego stopnia. Wymiar tej przestrzeni wektorowej
Bardziej szczegółowoPrzestrzenie liniowe
Rozdział 4 Przestrzenie liniowe 4.1. Działania zewnętrzne Niech X oraz F będą dwoma zbiorami niepustymi. Dowolną funkcję D : F X X nazywamy działaniem zewnętrznym w zbiorze X nad zbiorem F. Przykład 4.1.
Bardziej szczegółowo1 Rozwiązywanie układów równań. Wyznaczniki. 2 Wektory kilka faktów użytkowych
Rozwiązywanie układów równań. Wyznaczniki. 2 Wektory kilka faktów użytkowych 2. Wektory. 2.. Wektor jako n ka liczb W fizyce mamy do czynienia z pojęciami lub obiektami o różnym charakterze. Są np. wielkości,
Bardziej szczegółowoBlok V: Ciągi. Różniczkowanie i całkowanie. c) c n = 1 ( 1)n n. d) a n = 1 3, a n+1 = 3 n a n. e) a 1 = 1, a n+1 = a n + ( 1) n
V. Napisz 4 początkowe wyrazy ciągu: Blok V: Ciągi. Różniczkowanie i całkowanie a) a n = n b) a n = n + 3 n! c) a n = n! n(n + ) V. Oblicz (lub zapisz) c, c 3, c k, c n k dla: a) c n = 3 n b) c n = 3n
Bardziej szczegółowoW naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.
1. Podstawy matematyki 1.1. Geometria analityczna W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora. Skalarem w fizyce nazywamy
Bardziej szczegółowoFUNKCJE LICZBOWE. Na zbiorze X określona jest funkcja f : X Y gdy dowolnemu punktowi x X przyporządkowany jest punkt f(x) Y.
FUNKCJE LICZBOWE Na zbiorze X określona jest funkcja f : X Y gdy dowolnemu punktowi x X przyporządkowany jest punkt f(x) Y. Innymi słowy f X Y = {(x, y) : x X oraz y Y }, o ile (x, y) f oraz (x, z) f pociąga
Bardziej szczegółowoRodzinę spełniającą trzeci warunek tylko dla sumy skończonej nazywamy ciałem (algebrą) w zbiorze X.
1 σ-ciała Definicja 1.1 (σ - ciało) σ - ciałem (σ - algebrą) w danym zbiorze X (zwanym przestrzenią) nazywamy rodzinę M pewnych podzbiorów zbioru X, spełniającą trzy warunki: 1 o M; 2 o jeśli A M, to X
Bardziej szczegółowoIloczyn skalarny. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 10. wykład z algebry liniowej Warszawa, grudzień 2013
Iloczyn skalarny Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 10. wykład z algebry liniowej Warszawa, grudzień 2013 Mirosław Sobolewski (UW) Warszawa, grudzień 2013 1 / 14 Standardowy
Bardziej szczegółowoWstęp do przetwarzania języka naturalnego. Wykład 13 Podsumowanie i spojrzenie w przyszłość
Wstęp do przetwarzania języka naturalnego Wykład 13 Podsumowanie i spojrzenie w przyszłość Wojciech Czarnecki 22 stycznia 2014 Section 1 Zarys kursu Wyrażenia regularne Zarys kursu Wyrażenia regularne
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich
Bardziej szczegółowoAnaliza funkcjonalna 1.
Analiza funkcjonalna 1. Wioletta Karpińska Semestr letni 2015/2016 0 Bibliografia [1] Banaszczyk W., Analiza matematyczna 3. Wykłady. (http://math.uni.lodz.pl/ wbanasz/am3/) [2] Birkholc A., Analiza matematyczna.
Bardziej szczegółowoZajęcia nr 1 (1h) Dwumian Newtona. Indukcja. Zajęcia nr 2 i 3 (4h) Trygonometria
Technologia Chemiczna 008/09 Zajęcia wyrównawcze. Pokazać, że: ( )( ) n k k l = ( n l )( n l k l Zajęcia nr (h) Dwumian Newtona. Indukcja. ). Rozwiązać ( ) ( równanie: ) n n a) = 0 b) 3 ( ) n 3. Znaleźć
Bardziej szczegółowoAnaliza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Bardziej szczegółowoAlgebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań
Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań Przekształcenia liniowe, diagonalizacja macierzy 1. Podano współrzędne wektora v w bazie B. Znaleźć współrzędne tego wektora w bazie B, gdy: a) v = (1,
Bardziej szczegółowoSztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Wykład 10 Mapa cech Kohonena i jej modyfikacje - uczenie sieci samoorganizujących się - kwantowanie wektorowe
Bardziej szczegółowoEndomorfizmy liniowe
Endomorfizmy liniowe Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 8. wykład z algebry liniowej Warszawa, listopad 2011 Mirosław Sobolewski (UW) Warszawa, listopad 2011 1 / 16 Endomorfizmy
Bardziej szczegółowoA,B M! v V ; A + v = B, (1.3) AB = v. (1.4)
Rozdział 1 Prosta i płaszczyzna 1.1 Przestrzeń afiniczna Przestrzeń afiniczna to matematyczny model przestrzeni jednorodnej, bez wyróżnionego punktu. Można w niej przesuwać punkty równolegle do zadanego
Bardziej szczegółowoZagadnienia brzegowe dla równań eliptycznych
Temat 7 Zagadnienia brzegowe dla równań eliptycznych Rozważmy płaski obszar R 2 ograniczony krzywą. la równania Laplace a (Poissona) stawia się trzy podstawowe zagadnienia brzegowe. Zagadnienie irichleta
Bardziej szczegółowoOPISY PRZESTRZENNE I PRZEKSZTAŁCENIA
OPISY PRZESTRZENNE I PRZEKSZTAŁCENIA Wprowadzenie W robotyce przez pojęcie manipulacji rozumiemy przemieszczanie w przestrzeni przedmiotów i narzędzi za pomocą specjalnego mechanizmu. W związku z tym pojawia
Bardziej szczegółowo19 Własności iloczynu skalarnego: norma, kąt i odległość
19 Własności iloczynu skalarnego: norma, kąt i odległość Załóżmy, że V jest przestrzenią liniową z iloczynem skalarnym.,.. Definicja 19.1 Normą (długością) wektora v V nazywamy liczbę v = v, v. Uwaga 1
Bardziej szczegółowoMechanika. Wykład 2. Paweł Staszel
Mechanika Wykład 2 Paweł Staszel 1 Przejście graniczne 0 2 Podstawowe twierdzenia o pochodnych: pochodna funkcji mnożonej przez skalar pochodna sumy funkcji pochodna funkcji złożonej pochodna iloczynu
Bardziej szczegółowoRozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
Bardziej szczegółowoW. Guzicki Zadanie IV z Informatora Maturalnego poziom rozszerzony 1
W. Guzicki Zadanie IV z Informatora Maturalnego poziom rozszerzony 1 Zadanie IV. Dany jest prostokątny arkusz kartony o długości 80 cm i szerokości 50 cm. W czterech rogach tego arkusza wycięto kwadratowe
Bardziej szczegółowoRachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne
Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne 5.0 Definicje Katarzyna Rybarczyk-Krzywdzińska Wprowadzenie Przykład 1 Bolek, Lolek i Tola wstąpili do kasyna. (A) Bolek postawił na czerwone, (B)
Bardziej szczegółowoR n jako przestrzeń afiniczna
R n jako przestrzeń afiniczna Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 11. wykład z algebry liniowej Warszawa, grudzień 2014 Mirosław Sobolewski (UW) Warszawa, grudzień 2014 1
Bardziej szczegółowoPodstawy Informatyki. Sprawność algorytmów
Podstawy Informatyki Sprawność algorytmów Sprawność algorytmów Kryteria oceny oszczędności Miara złożoności rozmiaru pamięci (złożoność pamięciowa): Liczba zmiennych + liczba i rozmiar struktur danych
Bardziej szczegółowoGeometria analityczna - przykłady
Geometria analityczna - przykłady 1. Znaleźć równanie ogólne i równania parametryczne prostej w R 2, któr przechodzi przez punkt ( 4, ) oraz (a) jest równoległa do prostej x + 5y 2 = 0. (b) jest prostopadła
Bardziej szczegółowoZadania do wykonania. Rozwiązując poniższe zadania użyj pętlę for.
Zadania do wykonania Rozwiązując poniższe zadania użyj pętlę for. 1. apisz program, który przesuwa w prawo o dwie pozycje zawartość tablicy 10-cio elementowej liczb całkowitych tzn. element t[i] dla i=2,..,9
Bardziej szczegółowoPrawdopodobieństwo i statystyka
Wykład IV: 27 października 2014 Współczynnik korelacji Brak korelacji a niezależność Definicja współczynnika korelacji Współczynnikiem korelacji całkowalnych z kwadratem zmiennych losowych X i Y nazywamy
Bardziej szczegółowoKompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny
Bardziej szczegółowo