Wstęp do przetwarzania języka naturalnego
|
|
- Kamila Marcinkowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013
2 Section 1 Przypomnienie
3 Bag of words model
4 Podejście Przypomnienie Na dotychczasowych wykładach - probabilistyczne Od teraz - geometryczne
5 Section 2
6 Dla ustalenia uwagi Załóżmy, że rozważamy problem stworzenia wyszukiwarki, tzn. mamy pewną bazę dokumentów (niekoniecznie stron), oraz użytkownika, który wpisuje jakąś frazę. Chcemy przedstawić mu najlepszy dokument (albo posortowaną listę najlepszych dokumentów).
7 Problem wyszukiwania Mając dane zapytanie q wyszukaj najlepszy dokument d z puli D
8 Problem wyszukiwania jest to istotnie różne od sprawdzania, czy q jako zdanie, należy do jakiegoś modelu języka zadanego przez okreslony dokument d przede wszystkim D jest duże, wiec musimy mieć bardzo wydajną metodę (zarówno pamięciowo jak i obliczeniowo) zapytania bardzo rzadko są zdaniami to, co nas tak na prawdę interesuje to sens, potrzeba, która doprowadziła do wpisania q, nie zaś samo q
9 Reprezentacja binarna (set of words) φ( Ala ma kota. Ala lubi też psy ) = {Ala, ma, kota., lubi.tez, psy}
10 Jaccard coefficient Własności: J(A, A) = 1 J(A, B) = J(A, B) = 0 A B = A B A B A i B mogą być dowolnej (różnej) długości J(A, B) [0, 1]
11 Jaccard coefficient J(A, B) = A B A B J(φ( Ala ma kota ), φ( Ala ma psa )) = = {Ala, ma, kota} {Ala, ma, psa} {Ala, ma, kota} {Ala, ma, psa} = {Ala, ma} {Ala, ma, kota, psa} = 2 4
12 Jaccard coefficient Nie bierze pod uwagę częstotliwości wystąpień słów Normalizacja przez sumę mnogościową nie jest najlepsza
13 Set of words Przypomnienie
14 Bag of words Przypomnienie
15 Bag of words - reprezentacja wektorowa φ(antony and Cleopatra) = [157, 4, 232, 0, 57, 2, 2] N 7
16 Term frequency Przypomnienie Term frequency Częstotliwością termu (term frequency, tf) t w dokumencie d nazywamy liczbę wystąpień t w d i oznaczamy przez tf t,d tf t,d = count(t, d) = #{i : d[i] = t}
17 Term frequency - zastosowania i problemy Można wykorzystywać do mierzenia na ile dany dokument odzwierciedla zapytanie w wyszukiwarce, tzn.: score(q, d) = tf t,d t q Jeśli szukamy hasła dog, to dokument zawierający 100 słów dog będzie 100 razy lepszy niż ten zawierający jedno słówko dog Wraz ze wzrostem częstotliwości występowania termu powinna wzrastać ocena, ale na pewno nie liniowo!
18 Log term frequency w t,d = { 1 + log(tft,d ), if tf t,d > 0 0, otherwise
19 Log term frequency w t,d = { 1 + log(tft,d ), if tf t,d > 0 0, otherwise score(q, d) = w t,d = t q t q d 1 + log(tf t,d )
20 Log term frequency tf t,d w t,d sow
21 Document frequency weighting Rzadkie słowa są bardziej informatywne, niż częste np. jeśli szukamy zapytaniem William Shakespeare, to zdecydowanie większą wagę należy poświęcić stronom, które zawierają term Shakespeare (35,000,000 wyników w Google) niż stronom zawierającym William (281,000,000 wyników w Google). bardziej skrajnie - szukając danych o muszce owocówce ( używając zapytania melanogaster fly ) ważniejsze są strony o konkretnym gatunku ( drosophila melanogaster - 1,410,000 wyników) niż te o muchach ogólnie (188,000,000)
22 Document frequency Document frequency Częstotliwością termu (Document frequency, df) t w zbiorze dokumentów nazywamy liczbę dokumentów w których wystepuje t i oznaczamy przez df t df t = d D min{1, tf t,d } = #{d D : tf t,d > 0}
23 Document frequency Document frequency jest miarą nieinformatywności termu Chcąc mieć informatywności musimy ten obiekt odwrócić
24 Inverse Document frequency ( ) N idf t = log dft gdzie N = #D to liczba dokumentów
25 Inverse Document frequency df t idf t (N = 100)
26 tf-idf weighting Przypomnienie ( ) N tf.idf t,d = (1 + log(tf t,d )) log }{{} dft }{{} tf - trafność idf - normalizacja score(q, d) = t q d tf.idf t,d
27 tf-idf Przypomnienie
28 tf-idf Przypomnienie
29 tf-idf Przypomnienie document x y z Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Rysunek: VSM na bazie utworów Szekspira
30 VSM Przypomnienie Vector Space Model mamy V wymiarową przestrzeń rzeczywistą każdy term to wymiar przestrzeni (oś) dokumenty to punkty (wektory) w tej przestrzeni bardzo wysoko wymiarowa przestrzeń bardzo rzadkie wektory
31 VSM w wyszukiwaniu Mając dane zapytanie q wyszukaj najlepszy dokument d z puli D zapytania również można potraktować jak dokumenty i wyrazić je w naszym VSM dokumenty można posortować wg. trafności trafność = bliskość wektorów = odwrotność odległości
32 Co to jest bliskość wektorów?
33 Section 3
34 Odłegłość między dwoma wektorami mamy dokumenty d i wyrażone jako wektory w R V, nazwijmy je x i interesuje nas znalezienie funkcji f, takiej, że: f (x i, x j ) = 0 gdy x i = x j f (x i, x j ) = f (x j, x i ) f (x i, x j ) > f (x i, x k ) gdy x k jest bardziej podobne do x i niż x j
35 Odległość między dwoma wektorami Norma euklidesowa różnicy wektorów f (x i, x j ) = x i x j
36 Odległość między dwoma wektorami f (x i, x j ) = x i x j f (q, d 2 ) = q d 2 > q d 1 = f (q, d 1 ) f (q, d 2 ) = q d 2 > q d 3 = f (q, d 3 )
37 Odległość między dwoma wektorami Wyobraźmy sobie sytuację, gdzie mamy dokument d będący konkatenacją dokumentu d z samym sobą Semantycznie te dwa dokumenty mają tę samą informację Odległość euklidesowa może być dowolnie duża
38 Odległość między dwoma wektorami Wyobraźmy sobie sytuację, gdzie mamy dokument d będący konkatenacją dokumentu d z samym sobą Semantycznie te dwa dokumenty mają tę samą informację Odległość euklidesowa może być dowolnie duża Idea: używajmy kąta zamiast odległości
39 Liczenie kąta między wektorami w wysoko wymiarowej przestrzeni Prosta obserwacja, nastepujące działania są równoważne Sortowanie dokumentów po malejącym kącie między nimi Sortowanie dokumentów po rosnącym kosinusie kąta między nimi
40 Kosinus kąta Przypomnienie
41 Kosinus kąta przy tfidf t, d : tf.idf t,d 0 (x i, x j ) [0, 90 ] cos( (x i, x j )) [0, 1]
42 Kosinus kąta Przypomnienie cos(x, y) = x i y to wektory tf.idf x y x y = V V i=1 x 2 i i=1 x iy i V i=1 y i 2 cos(x, y) to kosinus kąta między nimi lub czasem podobieństwo kosinusowe (cosine similarity) tych wektorów gdyby x i y były jednostkowe, to wystarczyłoby liczyć iloczyn skalarny
43 Znormalizowana reprezentacja VSM
44 Proces porównywania dokumentów - klasyczna wersja VSM 1 Policz tfidf t,d dla każdego dokumentu i każdego termu 2 Zapisz reprezentację VSM każdego dokumentu korzystając z tfidf 3 Znormalizuj każdy z wektorów (podziel go przez jego normę) 4 W przypadku potrzeby porównania dwóch dokumentów - policz iloczyn skalarny pomiędzy ich reprezentacjami
45 Generalizacje tfidf tzw. SMART notation: ddd.qqq ltc.ltc (omówiony przed chwilą) lnc.ltc (popularne podejście)
46 Czy to jedyna możliwość? Jest wiele innych, używanych do analizy tekstu metryk, m.in. Korelacja Pearsona Uśredniona dywergencja Kullbacka-Leiblera
47 Korelacja Pearsona Rysunek: Współczynnik korelacji Pearsona - wikipedia r xy = (xi x)(y i ȳ) (xi x) 2 (yi ȳ) 2
48 Korelacja Pearsona Rysunek: Współczynnik korelacji Pearsona - wikipedia r xy = (xi x)(y i ȳ) (xi x) 2 (yi ȳ) 2 r xy = cos(x x, y ȳ)
49 Dywergencja KL Przypomnienie D KL (P Q) = P(x) log ( ) P(x) dx Q(x)
50 Dywergencja KL Przypomnienie D KL (P Q) = D KL (x y) = t ( ) P(x) P(x) log dx Q(x) ) w t,x log ( wt,x w t,y
51 Dywergencja KL Przypomnienie D KL (P Q) = D KL (x y) = t ( ) P(x) P(x) log dx Q(x) ) w t,x log ( wt,x w t,y D JS (P Q) = D KL(P P+Q 2 ) + D KL (Q P+Q 2 ) 2
52 Klastrowanie dokumentów - Purity Na podstawie Similarity Measures for Text Document Clustering - Anna Huang (University of Waikato)
53 Klastrowanie dokumentów - Entropia Na podstawie Similarity Measures for Text Document Clustering - Anna Huang (University of Waikato)
54 Kolejny wykład Przypomnienie Klasyfikacja oparta o miary podobieństwa i model VSM Zaawansowany model VSM - Latent Semantic Analysis (LSA)
55 Plan WPJN Przypomnienie 19 XII - [W] Podstawowa klasyfikacja oparta o VSM i LSA 22 XII - [Cw] Zasady projektu 4 3 I - [Cw] Deadline projektu 3 8 I - [W] Maszyna Wektorów Nośnych 16 I - [W] Zaawansowane funkcje jądra 19 I - [Cw] Ostateczny deadline projektu 4 23 I - [W] State of the art NLP
Wstęp do przetwarzania języka naturalnego. Wykład 11 Maszyna Wektorów Nośnych
Wstęp do przetwarzania języka naturalnego Wykład 11 Wojciech Czarnecki 8 stycznia 2014 Section 1 Przypomnienie Wektoryzacja tfidf Przypomnienie document x y z Antony and Cleopatra 5.25 1.21 1.51 Julius
Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search dr hab. inż. Miłosz Kadziński dr inż. Irmina Masłowska {milosz.kadzinski, irmina.maslowska}@cs.put.poznan.pl Document representation
Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja
Wstęp do przetwarzania języka naturalnego Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wojciech Czarnecki 8 stycznia 2014 Section 1 Wektoryzacja tfidf document x y z Antony and Cleopatra 5.25 1.21
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search
Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search Irmina Masłowska irmina.maslowska@cs.put.poznan.pl www.cs.put.poznan.pl/imaslowska/wipi/ Document representation Document representation
cx cx 1,cx 2,cx 3,...,cx n. Przykład 4, 5
Matematyka ZLic - 07 Wektory i macierze Wektorem rzeczywistym n-wymiarowym x x 1, x 2,,x n nazwiemy ciąg n liczb rzeczywistych (tzn odwzorowanie 1, 2,,n R) Zbiór wszystkich rzeczywistych n-wymiarowych
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Co wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Wykład 9. Matematyka 3, semestr zimowy 2011/ listopada 2011
Wykład 9. Matematyka 3, semestr zimowy 2011/2012 4 listopada 2011 W trakcie poprzedniego wykładu zdefiniowaliśmy pojęcie k-kowektora na przestrzeni wektorowej. Wprowadziliśmy także iloczyn zewnętrzny wielokowektorów
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Wyszukiwanie tekstów
Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły
Zadania z algebry liniowej Iloczyn skalarny, przestrzenie euklidesowe
Zadania z algebry liniowej Iloczyn skalarny, przestrzenie euklidesowe Definicja 1 (Iloczyn skalarny). Niech V będzie rzeczywistą przestrzenią liniową. Iloczynem skalarnym w przestrzeni V nazywamy funkcję
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
Bazy dokumentów tekstowych
Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Wyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1
Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia
1 Przestrzeń liniowa. α 1 x α k x k = 0
Z43: Algebra liniowa Zagadnienie: przekształcenie liniowe, macierze, wyznaczniki Zadanie: przekształcenie liniowe, jądro i obraz, interpretacja geometryczna. Przestrzeń liniowa Już w starożytności człowiek
SIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa
SIMR 06/07, Analiza, wykład, 07-0- Przestrzeń wektorowa Przestrzeń wektorowa (liniowa) - przestrzeń (zbiór) w której określone są działania (funkcje) dodawania elementów i mnożenia elementów przez liczbę
Lista. Przestrzenie liniowe. Zadanie 1 Sprawdź, czy (V, +, ) jest przestrzenią liniową nadr :
Lista Przestrzenie liniowe Zadanie 1 Sprawdź, czy (V, +, ) jest przestrzenią liniową nadr : V = R[X], zbiór wielomianów jednej zmiennej o współczynnikach rzeczywistych, wraz ze standardowym dodawaniem
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Iloczyn skalarny, wektorowy, mieszany. Ortogonalność wektorów. Metoda ortogonalizacji Grama-Schmidta. Małgorzata Kowaluk semestr X
Iloczyn skalarny, wektorowy, mieszany. Ortogonalność wektorów. Metoda ortogonalizacji Grama-Schmidta. Małgorzata Kowaluk semestr X ILOCZYN SKALARNY Iloczyn skalarny operator na przestrzeni liniowej przypisujący
Co to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem.
1 Wektory Co to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem. 1.1 Dodawanie wektorów graficzne i algebraiczne. Graficzne - metoda równoległoboku. Sprowadzamy wektory
EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Przestrzeń unitarna. Jacek Kłopotowski. 23 października Katedra Matematyki i Ekonomii Matematycznej SGH
Katedra Matematyki i Ekonomii Matematycznej SGH 23 października 2018 Definicja iloczynu skalarnego Definicja Iloczynem skalarnym w przestrzeni liniowej R n nazywamy odwzorowanie ( ) : R n R n R spełniające
Geometria Lista 0 Zadanie 1
Geometria Lista 0 Zadanie 1. Wyznaczyć wzór na pole równoległoboku rozpiętego na wektorach u, v: (a) nie odwołując się do współrzędnych tych wektorów; (b) odwołując się do współrzędnych względem odpowiednio
Systemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Wykład 16. P 2 (x 2, y 2 ) P 1 (x 1, y 1 ) OX. Odległość tych punktów wyraża się wzorem: P 1 P 2 = (x 1 x 2 ) 2 + (y 1 y 2 ) 2
Wykład 16 Geometria analityczna Przegląd wiadomości z geometrii analitycznej na płaszczyźnie rtokartezjański układ współrzędnych powstaje przez ustalenie punktu początkowego zwanego początkiem układu współrzędnych
2 1 3 c c1. e 1, e 2,..., e n A= e 1 e 2...e n [ ] M. Przybycień Matematyczne Metody Fizyki I
Liniowa niezależno ność wektorów Przykład: Sprawdzić czy następujące wektory z przestrzeni 3 tworzą bazę: e e e3 3 Sprawdzamy czy te wektory są liniowo niezależne: 3 c + c + c3 0 c 0 c iei 0 c + c + 3c3
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
3. Iloczyn zewnętrzny w ogólności nie jest przemienny, ale zachodzi wzór:
2 Iloczyn zewnętrzny jest łączny, tzn: (α β) γ α (β γ) 3 Iloczyn zewnętrzny w ogólności nie jest przemienny, ale zachodzi wzór: α β ( 1) kl β α Dowód: Punkt (1) wynika łatwo z definicji Dowód punktu (2)
Wykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Grupowanie danych. Wprowadzenie. Przykłady
Grupowanie danych str. 1 Wprowadzenie Celem procesu grupowania jest podział zbioru obiektów, fizycznych lub abstrakcyjnych, na klasy obiektów o podobnych cechach, nazywane klastrami lub skupieniami Klaster
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta
Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta www.michalbereta.pl Sieci radialne zawsze posiadają jedną warstwę ukrytą, która składa się z neuronów radialnych. Warstwa wyjściowa składa
baton OR mars 282,000,000 241,000,000 baton OR mars 283,000,000 WYSZUKIWANIE BOOLOWSKIE
WYSZUKIWANIE BOOLOWSKIE Wyszukiwanie boolowskie jest rozszerzeniem wyszukiwania prostego (opartego o słowa kluczowe) o operatory logiczne: AND, OR, NOT oraz ich kombinację. Większośd modeli wyszukiwania
Informacja o przestrzeniach Hilberta
Temat 10 Informacja o przestrzeniach Hilberta 10.1 Przestrzenie unitarne, iloczyn skalarny Niech dana będzie przestrzeń liniowa X. Załóżmy, że każdej parze elementów x, y X została przyporządkowana liczba
Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I Sylabus modułu: Wstęp do algebry liniowej i geometrii analitycznej (03-M01N-12-WALG)
Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:
Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza
Wstęp do Modelu Standardowego
Wstęp do Modelu Standardowego Plan (Uzupełnienie matematyczne II) Abstrakcyjna przestrzeń stanów Podstawowe własności Iloczyn skalarny amplitudy prawdopodobieństwa Operatory i ich hermitowskość Wektory
Zadania egzaminacyjne
Rozdział 13 Zadania egzaminacyjne Egzamin z algebry liniowej AiR termin I 03022011 Zadanie 1 Wyznacz sumę rozwiązań równania: (8z + 1 i 2 2 7 iz 4 = 0 Zadanie 2 Niech u 0 = (1, 2, 1 Rozważmy odwzorowanie
Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.
Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. pytania teoretyczne:. Co to znaczy, że wektory v, v 2 i v 3
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
PODSTAWY RACHUNKU WEKTOROWEGO
Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Adam Wosatko Ewa Pabisek Skalar Definicja Skalar wielkość fizyczna (lub geometryczna)
Rachunek wektorowy - wprowadzenie. dr inż. Romuald Kędzierski
Rachunek wektorowy - wprowadzenie dr inż. Romuald Kędzierski Graficzne przedstawianie wielkości wektorowych Długość wektora jest miarą jego wartości Linia prosta wyznaczająca kierunek działania wektora
Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Matematyka, studia I stopnia (licencjackie), rok I Sylabus modułu: Wstęp do algebry liniowej i geometrii analitycznej A (03-M01S-12-WALGA)
KMO2D. Kolizje między-obiektowe w 2D
KMO2D Kolizje między-obiektowe w 2D I. Wstęp 3 lata temu na temat kolizji nie miałem żadnego pojęcia. Przyszedł jednak czas, gdy postanowiłem napisać pierwszą porządną grę i pojawił się, wtedy problem.
Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład
Rozdział 1 Wektory losowe 1.1 Wektor losowy i jego rozkład Definicja 1 Wektor X = (X 1,..., X n ), którego każda współrzędna jest zmienną losową, nazywamy n-wymiarowym wektorem losowym (krótko wektorem
Zadania z Analizy Funkcjonalnej I Które z poniższych przestrzeni metrycznych są przestrzeniami unormowanymi?
Zadania z Analizy Funkcjonalnej I - 1 1. Które z poniższych przestrzeni metrycznych są przestrzeniami unormowanymi?. a) X = R, x = arctg x ; b) X = R n, d(x, y) = x 1 y 1 + x 2 y 2 + max i 3 x i y i ;
Algebra liniowa. 1. Macierze.
Algebra liniowa 1 Macierze Niech m oraz n będą liczbami naturalnymi Przestrzeń M(m n F) = F n F n będącą iloczynem kartezjańskim m egzemplarzy przestrzeni F n z naturalnie określonymi działaniami nazywamy
3 1 + i 1 i i 1 2i 2. Wyznaczyć macierze spełniające własność komutacji: [A, X] = B
1. Dla macierzy a) A = b) A = c) A = d) A = 3 1 + i 1 i i i 0 i i 0 1 + i 1 i 0 0 0 0 1 0 1 0 1 + i 1 i Wyznaczyć macierze spełniające własność komutacji: A, X = B. Obliczyć pierwiaski z macierzy: A =
Przestrzeń algorytmów klastrowania
20 listopada 2008 Plan prezentacji 1 Podstawowe pojęcia Przykłady algorytmów klastrowania 2 Odległość algorytmów klastrowania Odległość podziałów 3 Dane wejściowe Eksperymenty Praca źródłowa Podstawowe
Statystyczna analiza danych
Statystyczna analiza danych Korelacja i regresja Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/30 Ostrożnie z interpretacją p wartości p wartości zależą od dwóch rzeczy
Złożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to
Złożoność obliczeniowa algorytmu ilość zasobów komputera jakiej potrzebuje dany algorytm. Pojęcie to wprowadzili J. Hartmanis i R. Stearns. Najczęściej przez zasób rozumie się czas oraz pamięć dlatego
Wykład 5. Ker(f) = {v V ; f(v) = 0}
Wykład 5 Niech f : V W będzie przekształceniem liniowym przestrzeni wektorowych Wtedy jądrem przekształcenia nazywamy zbiór tych elementów z V, których obrazem jest wektor zerowy w przestrzeni W Jądro
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;
Wykłady 8 i 9 Pojęcia przestrzeni wektorowej i macierzy Układy równań liniowych Elementy algebry macierzy dodawanie, odejmowanie, mnożenie macierzy; macierz odwrotna dr Mariusz Grządziel 15,29 kwietnia
Sylabus do programu kształcenia obowiązującego od roku akademickiego 2012/13
Sylabus do programu kształcenia obowiązującego od roku akademickiego 2012/13 (1) Nazwa Algebra liniowa z geometrią (2) Nazwa jednostki prowadzącej Instytut Matematyki przedmiot (3) Kod () Studia Kierunek
Algebra liniowa z geometrią
Algebra liniowa z geometrią Maciej Czarnecki 15 stycznia 2013 Spis treści 1 Geometria płaszczyzny 2 1.1 Wektory i skalary........................... 2 1.2 Macierze, wyznaczniki, układy równań liniowych.........
Kwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Przetwarzanie i transmisja danych multimedialnych. Wykład 8 Transformaty i kodowanie cz. 2. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 8 Transformaty i kodowanie cz. 2 Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS
Estymacja gęstości prawdopodobieństwa metodą selekcji modelu
Estymacja gęstości prawdopodobieństwa metodą selekcji modelu M. Wojtyś Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Wisła, 7 grudnia 2009 Wstęp Próba losowa z rozkładu prawdopodobieństwa
Zadanie 1 Przygotuj algorytm programu - sortowanie przez wstawianie.
Sortowanie Dane wejściowe: ciąg n-liczb (kluczy) (a 1, a 2, a 3,..., a n 1, a n ) Dane wyjściowe: permutacja ciągu wejściowego (a 1, a 2, a 3,..., a n 1, a n) taka, że a 1 a 2 a 3... a n 1 a n. Będziemy
Notatki do wykładu Geometria Różniczkowa I
Notatki do wykładu Geometria Różniczkowa I Katarzyna Grabowska, KMMF 17 listopada 2013 1 Wielokowektory i wieloformy na powierzchni Poprzedni wykład zakończyliśmy na sformułowaniu następującego faktu:
1 Podstawowe oznaczenia
Poniżej mogą Państwo znaleźć skondensowane wiadomości z wykładu. Należy je traktować jako przegląd pojęć, które pojawiły się na wykładzie. Materiały te nie są w pełni tożsame z tym co pojawia się na wykładzie.
1 Formy hermitowskie. GAL (Informatyka) Wykład - formy hermitowskie. Paweł Bechler
GAL (Informatyka) Wykład - formy hermitowskie Wersja z dnia 23 stycznia 2014 Paweł Bechler 1 Formy hermitowskie Niech X oznacza przestrzeń liniową nad ciałem K. Definicja 1. Funkcję φ : X X K nazywamy
Rozwiązywanie równań nieliniowych
Rozwiązywanie równań nieliniowych Marcin Orchel 1 Wstęp Przykłady wyznaczania miejsc zerowych funkcji f : f(ξ) = 0. Wyszukiwanie miejsc zerowych wielomianu n-tego stopnia. Wymiar tej przestrzeni wektorowej
Przestrzenie liniowe
Rozdział 4 Przestrzenie liniowe 4.1. Działania zewnętrzne Niech X oraz F będą dwoma zbiorami niepustymi. Dowolną funkcję D : F X X nazywamy działaniem zewnętrznym w zbiorze X nad zbiorem F. Przykład 4.1.
1 Rozwiązywanie układów równań. Wyznaczniki. 2 Wektory kilka faktów użytkowych
Rozwiązywanie układów równań. Wyznaczniki. 2 Wektory kilka faktów użytkowych 2. Wektory. 2.. Wektor jako n ka liczb W fizyce mamy do czynienia z pojęciami lub obiektami o różnym charakterze. Są np. wielkości,
Blok V: Ciągi. Różniczkowanie i całkowanie. c) c n = 1 ( 1)n n. d) a n = 1 3, a n+1 = 3 n a n. e) a 1 = 1, a n+1 = a n + ( 1) n
V. Napisz 4 początkowe wyrazy ciągu: Blok V: Ciągi. Różniczkowanie i całkowanie a) a n = n b) a n = n + 3 n! c) a n = n! n(n + ) V. Oblicz (lub zapisz) c, c 3, c k, c n k dla: a) c n = 3 n b) c n = 3n
W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.
1. Podstawy matematyki 1.1. Geometria analityczna W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora. Skalarem w fizyce nazywamy
FUNKCJE LICZBOWE. Na zbiorze X określona jest funkcja f : X Y gdy dowolnemu punktowi x X przyporządkowany jest punkt f(x) Y.
FUNKCJE LICZBOWE Na zbiorze X określona jest funkcja f : X Y gdy dowolnemu punktowi x X przyporządkowany jest punkt f(x) Y. Innymi słowy f X Y = {(x, y) : x X oraz y Y }, o ile (x, y) f oraz (x, z) f pociąga
Rodzinę spełniającą trzeci warunek tylko dla sumy skończonej nazywamy ciałem (algebrą) w zbiorze X.
1 σ-ciała Definicja 1.1 (σ - ciało) σ - ciałem (σ - algebrą) w danym zbiorze X (zwanym przestrzenią) nazywamy rodzinę M pewnych podzbiorów zbioru X, spełniającą trzy warunki: 1 o M; 2 o jeśli A M, to X
Iloczyn skalarny. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 10. wykład z algebry liniowej Warszawa, grudzień 2013
Iloczyn skalarny Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 10. wykład z algebry liniowej Warszawa, grudzień 2013 Mirosław Sobolewski (UW) Warszawa, grudzień 2013 1 / 14 Standardowy
Wstęp do przetwarzania języka naturalnego. Wykład 13 Podsumowanie i spojrzenie w przyszłość
Wstęp do przetwarzania języka naturalnego Wykład 13 Podsumowanie i spojrzenie w przyszłość Wojciech Czarnecki 22 stycznia 2014 Section 1 Zarys kursu Wyrażenia regularne Zarys kursu Wyrażenia regularne
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich
Analiza funkcjonalna 1.
Analiza funkcjonalna 1. Wioletta Karpińska Semestr letni 2015/2016 0 Bibliografia [1] Banaszczyk W., Analiza matematyczna 3. Wykłady. (http://math.uni.lodz.pl/ wbanasz/am3/) [2] Birkholc A., Analiza matematyczna.
Zajęcia nr 1 (1h) Dwumian Newtona. Indukcja. Zajęcia nr 2 i 3 (4h) Trygonometria
Technologia Chemiczna 008/09 Zajęcia wyrównawcze. Pokazać, że: ( )( ) n k k l = ( n l )( n l k l Zajęcia nr (h) Dwumian Newtona. Indukcja. ). Rozwiązać ( ) ( równanie: ) n n a) = 0 b) 3 ( ) n 3. Znaleźć
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań
Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań Przekształcenia liniowe, diagonalizacja macierzy 1. Podano współrzędne wektora v w bazie B. Znaleźć współrzędne tego wektora w bazie B, gdy: a) v = (1,
Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Wykład 10 Mapa cech Kohonena i jej modyfikacje - uczenie sieci samoorganizujących się - kwantowanie wektorowe
Endomorfizmy liniowe
Endomorfizmy liniowe Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 8. wykład z algebry liniowej Warszawa, listopad 2011 Mirosław Sobolewski (UW) Warszawa, listopad 2011 1 / 16 Endomorfizmy
A,B M! v V ; A + v = B, (1.3) AB = v. (1.4)
Rozdział 1 Prosta i płaszczyzna 1.1 Przestrzeń afiniczna Przestrzeń afiniczna to matematyczny model przestrzeni jednorodnej, bez wyróżnionego punktu. Można w niej przesuwać punkty równolegle do zadanego
Zagadnienia brzegowe dla równań eliptycznych
Temat 7 Zagadnienia brzegowe dla równań eliptycznych Rozważmy płaski obszar R 2 ograniczony krzywą. la równania Laplace a (Poissona) stawia się trzy podstawowe zagadnienia brzegowe. Zagadnienie irichleta
OPISY PRZESTRZENNE I PRZEKSZTAŁCENIA
OPISY PRZESTRZENNE I PRZEKSZTAŁCENIA Wprowadzenie W robotyce przez pojęcie manipulacji rozumiemy przemieszczanie w przestrzeni przedmiotów i narzędzi za pomocą specjalnego mechanizmu. W związku z tym pojawia
19 Własności iloczynu skalarnego: norma, kąt i odległość
19 Własności iloczynu skalarnego: norma, kąt i odległość Załóżmy, że V jest przestrzenią liniową z iloczynem skalarnym.,.. Definicja 19.1 Normą (długością) wektora v V nazywamy liczbę v = v, v. Uwaga 1
Mechanika. Wykład 2. Paweł Staszel
Mechanika Wykład 2 Paweł Staszel 1 Przejście graniczne 0 2 Podstawowe twierdzenia o pochodnych: pochodna funkcji mnożonej przez skalar pochodna sumy funkcji pochodna funkcji złożonej pochodna iloczynu
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
W. Guzicki Zadanie IV z Informatora Maturalnego poziom rozszerzony 1
W. Guzicki Zadanie IV z Informatora Maturalnego poziom rozszerzony 1 Zadanie IV. Dany jest prostokątny arkusz kartony o długości 80 cm i szerokości 50 cm. W czterech rogach tego arkusza wycięto kwadratowe
Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne
Rachunek Prawdopodobieństwa Rozdział 5. Rozkłady łączne 5.0 Definicje Katarzyna Rybarczyk-Krzywdzińska Wprowadzenie Przykład 1 Bolek, Lolek i Tola wstąpili do kasyna. (A) Bolek postawił na czerwone, (B)
R n jako przestrzeń afiniczna
R n jako przestrzeń afiniczna Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 11. wykład z algebry liniowej Warszawa, grudzień 2014 Mirosław Sobolewski (UW) Warszawa, grudzień 2014 1
Podstawy Informatyki. Sprawność algorytmów
Podstawy Informatyki Sprawność algorytmów Sprawność algorytmów Kryteria oceny oszczędności Miara złożoności rozmiaru pamięci (złożoność pamięciowa): Liczba zmiennych + liczba i rozmiar struktur danych
Geometria analityczna - przykłady
Geometria analityczna - przykłady 1. Znaleźć równanie ogólne i równania parametryczne prostej w R 2, któr przechodzi przez punkt ( 4, ) oraz (a) jest równoległa do prostej x + 5y 2 = 0. (b) jest prostopadła
Zadania do wykonania. Rozwiązując poniższe zadania użyj pętlę for.
Zadania do wykonania Rozwiązując poniższe zadania użyj pętlę for. 1. apisz program, który przesuwa w prawo o dwie pozycje zawartość tablicy 10-cio elementowej liczb całkowitych tzn. element t[i] dla i=2,..,9
Prawdopodobieństwo i statystyka
Wykład IV: 27 października 2014 Współczynnik korelacji Brak korelacji a niezależność Definicja współczynnika korelacji Współczynnikiem korelacji całkowalnych z kwadratem zmiennych losowych X i Y nazywamy
Kompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny