Wykład 10 Skalowanie wielowymiarowe
|
|
- Seweryn Leśniak
- 5 lat temu
- Przeglądów:
Transkrypt
1 Wykład 10 Skalowanie wielowymiarowe Wrocław, r
2 Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów na podstawie podobieństw przedstawienie w przestrzeni r-wymiarowej (r < m) relacji zachodzących między badanymi obiektami Nieformalnie: Celem skalowania wielowymiarowego jest aby w przestrzeni wielowymiarowej obiekty podobne do siebie znajdowały się bliżej, a różne od siebie dalej.
3 Skalowanie wielowymiarowe Założenia: Obiekty tworzą zbiór A, a niepodobieństwa określone na iloczynie kartezjańskim AxA między obiektami i oraz k wynoszą δ ik, tworząc macierz = [δ ik ] nxn, gdzie n jest liczbą obiektów Φ będzie odwzorowaniem zbioru A w zbiór punktów X, gdzie X jest podzbiorem przestrzeni, w której zostaną przedstawione obiekty. Φ(A i ) = x i, przy czym x i jest punktem w przestrzeni r-wymiarowej. d ik oznaczać będzie odległość pomiędzy punktami x i i x k
4 Skalowanie wielowymiarowe Założenia: Obiekty tworzą zbiór A, a niepodobieństwa określone na iloczynie kartezjańskim AxA między obiektami i oraz k wynoszą δ ik, tworząc macierz = [δ ik ] nxn, gdzie n jest liczbą obiektów Φ będzie odwzorowaniem zbioru A w zbiór punktów X, gdzie X jest podzbiorem przestrzeni, w której zostaną przedstawione obiekty. Φ(A i ) = x i, przy czym x i jest punktem w przestrzeni r-wymiarowej. d ik oznaczać będzie odległość pomiędzy punktami x i i x k Głównym zadaniem skalowania wielowymiarowego jest znalezienie takiego odwzorowania Φ, dla którego d ik ˆd ik = f (δ ik ), gdzie ˆd ik jest funkcją regresji między d ik a δ ik.
5 W zależności od typu zmiennych funkcja Φ musi spełniać odpowiednie warunki: zmienne typu skokowego zmienne typu ciągłego δ ik δ i k dˆ ik = d i ˆ k δ ik δ i k l dˆ ik, ˆ u, d i k gdzie < l, u > jest określonym przedziałem zmienne mierzone w skali porządkowej δ ik δ i k d ˆ ik d ˆ i k zmienne mierzone w skali przedziałowej lub ilorazowej ˆ d ik jest liniowo zależne od δ ik, tak że ˆ d ik = a 0 + a 1 δ ik
6 Wielkości ˆd ik są wyznaczane tak, aby minimalizować wartość standaryzowanej sumy kwadratów reszt (ang. Standarized Residual Sum of Squares) (funkcję dopasowania/funkcję stresu) postaci S 2 i,k = (d ik dˆ ik ) 2 i,k d ik 2
7 Znane funkcje dopasowania STRESS SSTRESS S = i,k (d ik dˆ ik ) 2 SS = i,k i,k d 2 ik (dik 2 2 dˆ ik ) 2 Współczynnik Younga S = i,k (d 2 ik 2 dˆ ik ) 2 i,k (d 2 ik )2
8 Znane funkcje dopasowania Współczynnik alienacji Guttmana K = (1 r c ) 2, r c = Miara największej wiarogodności ML = i,k i<k d ikd ˆ ik i<k i<k d 2 ik (log d ik log d ˆ ik ) 2 d ˆ 2 ik
9 Typy skalowania wielowymiarowego klasyczne skalowanie wielowymiarowe metryczne skalowanie wielowymiarowe niemetryczne skalowanie wielowymiarowe
10 Klasyczne skalowanie wielowymiarowe - Analiza składowych głównych algorytm iteracyjny idea - wyznaczenie współrzędnych punktów reprezentujących dane obiekty bezpośrednio na podstawie macierzy niepodobieństw
11 Klasyczne skalowanie wielowymiarowe Niech będzie dany zbiór n punktów w r - wymiarowej przestrzeni euklidesowej, postaci: z zachowaniem założenia: x i = (x i1, x i2,..., x ir ) n x ia = 0, i=1 a = 1,..., r
12 Klasyczne skalowanie wielowymiarowe Niech będzie dany zbiór n punktów w r - wymiarowej przestrzeni euklidesowej, postaci: z zachowaniem założenia: x i = (x i1, x i2,..., x ir ) n x ia = 0, i=1 a = 1,..., r Kwadrat odległości euklidesowej między punktami x i i x k przedstawia zależność d 2 ik = (x i x k ) (x i x k )
13 Klasyczne skalowanie wielowymiarowe Bazując na odległościach dik 2 wyznacza się macierz produktów skalarnych B = b + ik = x i x k, a z tej macierzy szukane współrzędne punktów. b ik = x ix k = 1 ( dik 2 1 n dik 2 1 n dik 2 1 n n 2 n n n 2 + gdzie a ik = 1 2 d 2 ik, a i. = 1 n i=1 k=1 i=1 k=1 = a ik a i. a.k + a.. k a ik, a.k = i a ik, a.. = 1 n 2 i d 2 ik ) k a ik =
14 Klasyczne skalowanie wielowymiarowe Na podstawie macierzy A o elementach a ik otrzymuje się macierz produktów skalarnych B: B = XX = HAH, gdzie X = (X 1, X 2,..., X n ), H = I 1 n 11, gdzie 1 jest wektorem jedynek, a I macierzą identycznościową.
15 Klasyczne skalowanie wielowymiarowe Na podstawie macierzy A o elementach a ik otrzymuje się macierz produktów skalarnych B: B = XX = HAH, gdzie X = (X 1, X 2,..., X n ), H = I 1 n 11, gdzie 1 jest wektorem jedynek, a I macierzą identycznościową. Macierz B jest nieujemnie określoną, symetryczną macierzą rzędu r, ma zatem r nieujemnych wartości własnych oraz n r wartości własnych równych zero.
16 Klasyczne skalowanie wielowymiarowe Można zapisać: B = VΛV, gdzie Λ = diag(λ 1, λ 2,..., λ n ) - diagonalna macierz wartości własnych macierzy B, V = (v 1, v 2,..., v n ) macierzą wektorów własnych odpowiadających wartością własnym znormalizowanym.
17 Klasyczne skalowanie wielowymiarowe Można zapisać: B = VΛV, gdzie Λ = diag(λ 1, λ 2,..., λ n ) - diagonalna macierz wartości własnych macierzy B, V = (v 1, v 2,..., v n ) macierzą wektorów własnych odpowiadających wartością własnym znormalizowanym. Aby uprościć postępowanie wartości własne macierzy B są uszeregowane λ 1 λ 2 λ n 0. Macierz B ma n r zerowych wartości własnych, stąd można ją zapisać jako B = V 1 Λ 1 V 1, gdzie Λ 1 = diag(λ 1, λ 2,..., λ r ), V 1 = (v 1, v 2,..., v r )
18 Klasyczne skalowanie wielowymiarowe Macierz współrzędnych punktów można zapisać jako X = V 1 Λ 1/2 1, gdzie Λ 1/2 1 = diag(λ 1/2 1, λ 1/2 2,..., λ 1/2 r )
19 Klasyczne skalowanie wielowymiarowe Macierz współrzędnych punktów można zapisać jako X = V 1 Λ 1/2 1, gdzie Λ 1/2 1 = diag(λ 1/2 1, λ 1/2 2,..., λ 1/2 r ) Kwadraty odległości w przestrzeni n 1 - wymiarowej między punktami zapisuje się jako n 1 dik 2 = λ a (x ia x ka ) 2 a=1
20 Klasyczne skalowanie wielowymiarowe Przedstawienie obiektów w przestrzeni r - wymiarowej (r < n 1) będzie obarczona błędem (niepodobieństwa między obiektami nie będą równe odległością między odpowiednimi punktami). Suma kwadratów odległości w pełnej przestrzeni wynosi 1 2 n n i=1 k=1 d 2 ik = n n i=1 n 1 x ix = ntrb = n λ a, gdzie trb jest śladem macierzy B. Zostało zaproponowane przez Cox-a i Cox-a, aby za miarę dopasowania punktów w przestrzeni r - wymiarowej do konfiguracji wyjściowej było wyrażenie: ra=1 λ a n 1 a=1 λ a a=1
21 Skalowanie metryczne Założenia - dane ilościowe; zależność pomiędzy odległościami między punktami oraz danymi niepodobieństwami jest funkcyjna. W przypadku klasycznego Jeśli niepodobieństwa nie są odległościami euklidesowymi część wartości własnych może być ujemna. Wówczas nadal można użyć klasycznego skalowania wielowymiarowego, przy czym najmniejsza z rozważanych wartości własnych powinna być dodatnia i większa co do wartości bezwzględnej od największej
22 Skalowanie niemetryczne (porządkowe) opiera się na wyznaczeniu optymalnego porządku pomiędzy odległościami, gdzie nie mają znaczenia wartość odległości, a wyłącznie ich porządek. Założenie: dane składają się zarówno z danych jakościowych jak i ilościowych.
23 Skalowanie niemetryczne (porządkowe) opiera się na wyznaczeniu optymalnego porządku pomiędzy odległościami, gdzie nie mają znaczenia wartość odległości, a wyłącznie ich porządek. Założenie: dane składają się zarówno z danych jakościowych jak i ilościowych. skalowanie niemetryczne Kruskalla skalowanie niemetryczne Sammona
24 Niemetryczne skalowanie wielowymiarowe - metoda gradientowa Cel: wyznaczenie takiego przekształcenia Φ ze zbioru obiektów o zdefiniowanych niepodobieństwach δ ik w zbiór w r-wymiarowej przestrzeni o odległościach między nimi d ik tak aby ˆd ik d ik. Estymatory ˆd ik wyznaczone w taki sposób aby minimalizować wartość funkcji STRESSu S = S T gdzie S = (d ik ˆd ik ) 2, T = i,k i,k d 2 ik
25 Niemetryczne skalowanie wielowymiarowe - metoda gradientowa Metoda Kruskalla - metoda iteracyjna kolejnych przybliżeń
26 Skalowanie wielowymiarowe w pakiecie R 1 Klasyczne skalowanie wielowymiarowe: funkcja cmdscale (pakiet stats) 2 Niemetryczne skalowanie wielowymiarowe: funkcje 1 isomds, sammon (pakiet MASS) 2 metamds (pakiet vegan) 3 Porównywanie wyników skalowania: funkcje 1 procuste (pakiet ade4) 2 procustes (pakiet vegan)
27 Przykład 10.1 Grupie 90 osób dano do przetestowania różne marki jogurtów o tym samym smaku. Respondenci oceniali konkretne cechy produktów. Następnie przeprowadzono porównania parami w wyniku czego otrzymano macierz preferencji przedstawioną poniżej: Nazwa smak wybór smaków pożywność popularność cena dostępność wielkość opak. J D B M A F
28 Przykład 10.1
29 Polecane literatura: B.Zhang and S.N. Srihari Properties of Binary Vector Dissimilarity Measures, 1991 P.I. Good, Resampling Methods. A Practical Guide to Data Analysis, 2005 E.L. Lehmann,Teoria estymacji punktowej, PWN Warszawa 1991 M. Walesiak, E. Gatnar, Statystyczna analiza danych z wykorzystaniem pakietu R, PWN Warszawa 2009
Skalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
Bardziej szczegółowoWykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Bardziej szczegółowoPrawdopodobieństwo i statystyka
Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.
Bardziej szczegółowoStatystyka i eksploracja danych
Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja
Bardziej szczegółowoTabela 1. Macierz preferencji dotycząca pięciu przykładowych produktów (obiektów) i sześciu respondentów
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki ZASTOSOWANIE ANALIZY UNFOLDING W OCENIE PREFERENCJI UCZNIÓW SZKOŁY POLICEALNEJ Streszczenie: W artykule przedstawiono
Bardziej szczegółowoAnaliza składowych głównych idea
Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości
Bardziej szczegółowoWykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Bardziej szczegółowoEkonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Wprowadzenie do modelowania ekonometrycznego Estymator Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 1 Estymator 1 / 16 Agenda 1 Literatura Zaliczenie przedmiotu 2 Model
Bardziej szczegółowoAlgebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań
Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań Przekształcenia liniowe, diagonalizacja macierzy 1. Podano współrzędne wektora v w bazie B. Znaleźć współrzędne tego wektora w bazie B, gdy: a) v = (1,
Bardziej szczegółowoWprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Bardziej szczegółowoTopologia I Wykład 4.
Topologia I Wykład 4. Stefan Jackowski 24 października 2012 Przeciąganie topologii przez rodzinę przekształceń X zbiór. f = {f i : X Y i } i I rodziną przekształceń o wartościach w przestrzeniach topologicznych
Bardziej szczegółowoStatystyka opisowa. Wykład V. Regresja liniowa wieloraka
Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +
Bardziej szczegółowoAnaliza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowo1.1 Klasyczny Model Regresji Liniowej
1.1 Klasyczny Model Regresji Liniowej Klasyczny model Regresji Liniowej jest bardzo użytecznym narzędziem służącym do analizy danych empirycznych. Analiza regresji zajmuje się opisem zależności między
Bardziej szczegółowoIdea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. Principal Components Analysis PCA) jest popularnym używanym narzędziem analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości danych. Jest to metoda nieparametryczna,
Bardziej szczegółowoSymscal: metoda skalowania wielowymiarowego obiektów symbolicznych
Andrzej Dudek, Marcin Pełka Akademia Ekonomiczna we Wrocławiu Symscal: metoda skalowania wielowymiarowego obiektów symbolicznych 1. Wprowadzenie Ideą skalowania wielowymiarowego obiektów symbolicznych
Bardziej szczegółowoRozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania
Bardziej szczegółowoWykład 5 Teoria eksperymentu
Wykład 5 Teoria eksperymentu Wrocław, 22.03.2017r Co to jest teoria eksperymentu? eksperyment - badanie jakiegoś zjawiska polegające na celowym wywołaniu tego zjawiska lub jego zmian oraz obserwacji i
Bardziej szczegółowoRachunek wektorowy - wprowadzenie. dr inż. Romuald Kędzierski
Rachunek wektorowy - wprowadzenie dr inż. Romuald Kędzierski Graficzne przedstawianie wielkości wektorowych Długość wektora jest miarą jego wartości Linia prosta wyznaczająca kierunek działania wektora
Bardziej szczegółowoPodejścia w skalowaniu wielowymiarowym obiektów symbolicznych
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki Podejścia w skalowaniu wielowymiarowym obiektów symbolicznych 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów
Bardziej szczegółowoElementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Bardziej szczegółowoWykład 8 Dane kategoryczne
Wykład 8 Dane kategoryczne Wrocław, 19.04.2017r Zmienne kategoryczne 1 Przykłady zmiennych kategorycznych 2 Zmienne nominalne, zmienne ordynalne (porządkowe) 3 Zmienne dychotomiczne kodowanie zmiennych
Bardziej szczegółowodr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;
Wykłady 8 i 9 Pojęcia przestrzeni wektorowej i macierzy Układy równań liniowych Elementy algebry macierzy dodawanie, odejmowanie, mnożenie macierzy; macierz odwrotna dr Mariusz Grządziel 15,29 kwietnia
Bardziej szczegółowoWażne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Bardziej szczegółowo1. Zbadać liniową niezależność funkcji x, 1, x, x 2 w przestrzeni liniowej funkcji ciągłych na przedziale [ 1, ).
B 2 Suma Zbadać, czy liniowo niezależne wektory u, v, w stanowią bazę przestrzeni liniowej lin { u + 2 v + w, u v + 2 w, 3 u + 5 w } 2 Współrzędne wektora (, 4, 5, 4 ) w pewnej bazie podprzestrzeni U R
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoWłasności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Bardziej szczegółowoKodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,
1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości
Bardziej szczegółowoZaawansowane metody numeryczne
Wykład 11 Ogólna postać metody iteracyjnej Definicja 11.1. (metoda iteracyjna rozwiązywania układów równań) Metodą iteracyjną rozwiązywania { układów równań liniowych nazywamy ciąg wektorów zdefiniowany
Bardziej szczegółowoEksploracja danych - wykład II
- wykład 1/29 wykład - wykład Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Październik 2015 - wykład 2/29 W kontekście odkrywania wiedzy wykład - wykład 3/29 CRISP-DM - standaryzacja
Bardziej szczegółowoEkonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Bardziej szczegółowoWYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 4
Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowoRobert Susmaga. Instytut Informatyki ul. Piotrowo 2 Poznań
... Robert Susmaga Instytut Informatyki ul. Piotrowo 2 Poznań kontakt mail owy Robert.Susmaga@CS.PUT.Poznan.PL kontakt osobisty Centrum Wykładowe, blok informatyki, pok. 7 Wyłączenie odpowiedzialności
Bardziej szczegółowoAnaliza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
Bardziej szczegółowoMet Me ody numer yczne Wykład ykład Dr inż. Mic hał ha Łanc Łan zon Instyt Ins ut Elektr Elektr echn iki echn i Elektrot Elektr echn olo echn
Metody numeryczne Wykład 3 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Pojęcia podstawowe Algebra
Bardziej szczegółowoGeometria Lista 0 Zadanie 1
Geometria Lista 0 Zadanie 1. Wyznaczyć wzór na pole równoległoboku rozpiętego na wektorach u, v: (a) nie odwołując się do współrzędnych tych wektorów; (b) odwołując się do współrzędnych względem odpowiednio
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoStatystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z liniowym zadaniem najmniejszych
Bardziej szczegółowoRozwój usług w wybranych krajach na świecie
Agata SZCZUKOCKA Rozwój usług w wybranych krajach na świecie Sektor usług jest w ostatnich latach najbardziej rozwijającą się dziedziną gospodarki na świecie. Od wielu lat również w Polsce obserwuje się
Bardziej szczegółowoEksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Bardziej szczegółowoRecenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoSPOTKANIE 9: Metody redukcji wymiarów
Wrocław University of Technology SPOTKANIE 9: Metody redukcji wymiarów Piotr Klukowski* Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.wroc.pl 08.12.2015 *Część slajdów pochodzi z prezentacji dr
Bardziej szczegółowoStosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q
Bardziej szczegółowoOznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji
Wykład 11. Metoda najmniejszych kwadratów Szukamy zależności Dane są wyniki pomiarów dwóch wielkości x i y: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Przypuśćmy, że nanieśliśmy je na wykres w układzie
Bardziej szczegółowoSztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335
Sztuczne sieci neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335 Wykład 10 Mapa cech Kohonena i jej modyfikacje - uczenie sieci samoorganizujących się - kwantowanie wektorowe
Bardziej szczegółowoBadania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Bardziej szczegółowo2 1 3 c c1. e 1, e 2,..., e n A= e 1 e 2...e n [ ] M. Przybycień Matematyczne Metody Fizyki I
Liniowa niezależno ność wektorów Przykład: Sprawdzić czy następujące wektory z przestrzeni 3 tworzą bazę: e e e3 3 Sprawdzamy czy te wektory są liniowo niezależne: 3 c + c + c3 0 c 0 c iei 0 c + c + 3c3
Bardziej szczegółowoMATEMATYKA WYKAZ UMIEJĘTNOŚCI WYMAGANYCH NA POSZCZEGÓLNE OCENY DLA KLASY PIERWSZEJ
MATEMATYKA WYKAZ UMIEJĘTNOŚCI WYMAGANYCH NA POSZCZEGÓLNE OCENY 1. LICZBY RZECZYWISTE DLA KLASY PIERWSZEJ 1. Podawanie przykładów liczb: naturalnych, całkowitych, wymiernych, niewymiernych, pierwszych i
Bardziej szczegółowoUkłady równań i równania wyższych rzędów
Rozdział Układy równań i równania wyższych rzędów Układy równań różniczkowych zwyczajnych Wprowadzenie W poprzednich paragrafach zajmowaliśmy się równaniami różniczkowymi y = f(x, y), których rozwiązaniem
Bardziej szczegółowoEstymacja wektora stanu w prostym układzie elektroenergetycznym
Zakład Sieci i Systemów Elektroenergetycznych LABORATORIUM INFORMATYCZNE SYSTEMY WSPOMAGANIA DYSPOZYTORÓW Estymacja wektora stanu w prostym układzie elektroenergetycznym Autorzy: dr inż. Zbigniew Zdun
Bardziej szczegółowoAgnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Bardziej szczegółowo1 Podstawowe oznaczenia
Poniżej mogą Państwo znaleźć skondensowane wiadomości z wykładu. Należy je traktować jako przegląd pojęć, które pojawiły się na wykładzie. Materiały te nie są w pełni tożsame z tym co pojawia się na wykładzie.
Bardziej szczegółowoWYKŁAD 9 METODY ZMIENNEJ METRYKI
WYKŁAD 9 METODY ZMIENNEJ METRYKI Kierunki sprzężone. Metoda Newtona Raphsona daje dobre przybliżenie najlepszego kierunku poszukiwań, lecz jest to okupione znacznym kosztem obliczeniowym zwykle postać
Bardziej szczegółowoRozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Bardziej szczegółowoEksploracyjna analiza danych. Metody rzutowania: analiza składowych głównych oraz skalowanie wielowymiarowe.
Eksploracyjna analiza danych. Metody rzutowania: analiza składowych głównych oraz skalowanie wielowymiarowe. Janusz Dutkowski Przedstawimy tutaj metody stosowane w eksploracyjnej analizie danych z wielowymiarowej
Bardziej szczegółowoANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ
ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ FUNKCJE DWÓCH ZMIENNYCH RZECZYWISTYCH Definicja 1. Niech A będzie dowolnym niepustym zbiorem. Metryką w zbiorze A nazywamy funkcję rzeczywistą
Bardziej szczegółowoMETODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH
Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku
Bardziej szczegółowoAnaliza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Bardziej szczegółowoOptymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Bardziej szczegółowoFormy kwadratowe. Rozdział 10
Rozdział 10 Formy kwadratowe Rozważmy rzeczywistą macierz symetryczną A R n n Definicja 101 Funkcję h : R n R postaci h (x) = x T Ax (101) nazywamy formą kwadratową Macierz symetryczną A występującą w
Bardziej szczegółowoKlasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Bardziej szczegółowoAnaliza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym
Bardziej szczegółowoProgramowanie liniowe
Programowanie liniowe Maciej Drwal maciej.drwal@pwr.wroc.pl 1 Problem programowania liniowego min x c T x (1) Ax b, (2) x 0. (3) gdzie A R m n, c R n, b R m. Oznaczmy przez x rozwiązanie optymalne, tzn.
Bardziej szczegółowoWykład 9 Testy rangowe w problemie dwóch prób
Wykład 9 Testy rangowe w problemie dwóch prób Wrocław, 18 kwietnia 2018 Test rangowy Testem rangowym nazywamy test, w którym statystyka testowa jest konstruowana w oparciu o rangi współrzędnych wektora
Bardziej szczegółowoWYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI
WYDZIAŁ GEOINŻYNIERII, GÓRNICTWA I GEOLOGII KARTA PRZEDMIOTU Nazwa w języku polskim: Statystyka matematyczna Nazwa w języku angielskim: Mathematical Statistics Kierunek studiów (jeśli dotyczy): Górnictwo
Bardziej szczegółowoWSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Bardziej szczegółowoWeryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Bardziej szczegółowoWykład 12 i 13 Macierz w postaci kanonicznej Jordana , 0 A 2
Wykład 12 i 13 Macierz w postaci kanonicznej Jordana Niech A - macierz kwadratowa stopnia n Jak obliczyć np A 100? a 11 0 0 0 a 22 0 Jeśli A jest macierzą diagonalną tzn A =, to Ak = 0 0 a nn Niech B =
Bardziej szczegółowoTeoria popytu. Popyt indywidualny konsumenta
Teoria popytu Popyt indywidualny konsumenta Koszyk towarów Definicja 1 Wektor x=(x 1,x 2,x 3,...,x n ) taki, że x i 0 dla każdego i,w którym i-ta współrzędna oznacza ilość towaru nr i, którą konsument
Bardziej szczegółowoZmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Bardziej szczegółowoWYBÓR GRUP METOD NORMALIZACJI WARTOŚCI ZMIENNYCH W SKALOWANIU WIELOWYMIAROWYM
PRZEGLĄD STATYSTYCZNY R. LXIII ZESZYT 1 2016 MAREK WALESIAK 1 WYBÓR GRUP METOD NORMALIZACJI WARTOŚCI ZMIENNYCH W SKALOWANIU WIELOWYMIAROWYM 1. WPROWADZENIE Normalizację przeprowadza się dla macierzy danych
Bardziej szczegółowoKomputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11; środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
Bardziej szczegółowoWykład 5. Metoda eliminacji Gaussa
1 Wykład 5 Metoda eliminacji Gaussa Rozwiązywanie układów równań liniowych Układ równań liniowych może mieć dokładnie jedno rozwiązanie, nieskończenie wiele rozwiązań lub nie mieć rozwiązania. Metody dokładne
Bardziej szczegółowoKolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w
Metoda Simpleks Jak wiadomo, problem PL z dowolną liczbą zmiennych można rozwiązać wyznaczając wszystkie wierzchołkowe punkty wielościanu wypukłego, a następnie porównując wartości funkcji celu w tych
Bardziej szczegółowoWykład 7: Szeregi liczbowe i potęgowe. S 1 = a 1 S 2 = a 1 + a 2 S 3 = a 1 + a 2 + a 3. a k
Wykład 7: Szeregi liczbowe i potęgowe. Definicja 1. Niech (a n ) - ustalony ciąg liczbowy. Określamy nowy ciąg: S 1 = a 1 S 2 = a 1 + a 2 S 3 = a 1 + a 2 + a 3. S n =. Ciąg sum częściowych (S n ) nazywamy
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoWykład 14. Elementy algebry macierzy
Wykład 14 Elementy algebry macierzy dr Mariusz Grządziel 26 stycznia 2009 Układ równań z dwoma niewiadomymi Rozważmy układ równań z dwoma niewiadomymi: a 11 x + a 12 y = h 1 a 21 x + a 22 y = h 2 a 11,
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoUkłady współrzędnych
Układy współrzędnych Układ współrzędnych matematycznie - funkcja przypisująca każdemu punktowi danej przestrzeni skończony ciąg (krotkę) liczb rzeczywistych zwanych współrzędnymi punktu. Układ współrzędnych
Bardziej szczegółowoLiga zadaniowa Seria I, 2014/2015, Piotr Nayar, Marta Strzelecka
Seria I, 04/05, Piotr Nayar, Marta Strzelecka Pytania dotyczące zadań prosimy kierować do Piotra Nayara na adres: nayar@mimuw.edu.pl. Rozwiązania można przesyłać Marcie Strzeleckiej na adres martast@mimuw.edu.pl,
Bardziej szczegółowoMetody iteracyjne rozwiązywania układów równań liniowych (5.3) Normy wektorów i macierzy (5.3.1) Niech. x i. i =1
Normy wektorów i macierzy (5.3.1) Niech 1 X =[x x Y y =[y1 x n], oznaczają wektory przestrzeni R n, a yn] niech oznacza liczbę rzeczywistą. Wyrażenie x i p 5.3.1.a X p = p n i =1 nosi nazwę p-tej normy
Bardziej szczegółowoUKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH
Transport, studia I stopnia rok akademicki 2011/2012 Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Ewa Pabisek Adam Wosatko Uwagi wstępne Układ liniowych równań algebraicznych można
Bardziej szczegółowoMetoda największej wiarygodności
Rozdział Metoda największej wiarygodności Ogólnie w procesie estymacji na podstawie prób x i (każde x i może być wektorem) wyznaczamy parametr λ (w ogólnym przypadku również wektor) opisujący domniemany
Bardziej szczegółowoZadania z Algebry liniowej 4 Semestr letni 2009
Zadania z Algebry liniowej 4 Semestr letni 2009 Ostatnie zmiany 23.05.2009 r. 1. Niech F będzie podciałem ciała K i niech n N. Pokazać, że niepusty liniowo niezależny podzbiór S przestrzeni F n jest także
Bardziej szczegółowo1 Formy hermitowskie. GAL (Informatyka) Wykład - formy hermitowskie. Paweł Bechler
GAL (Informatyka) Wykład - formy hermitowskie Wersja z dnia 23 stycznia 2014 Paweł Bechler 1 Formy hermitowskie Niech X oznacza przestrzeń liniową nad ciałem K. Definicja 1. Funkcję φ : X X K nazywamy
Bardziej szczegółowoTemperatura w atmosferze (czy innym ośrodku) jako funkcja dł. i szer. geogr. oraz wysokości.
Własności Odległości i normy w Będziemy się teraz zajmować funkcjami od zmiennych, tzn. określonymi na (iloczyn kartezja/nski egzemplarzy ). Punkt należący do będziemy oznaczać jako Przykł. Wysokość terenu
Bardziej szczegółowoTeoretyczne podstawy programowania liniowego
Teoretyczne podstawy programowania liniowego Elementy algebry liniowej Plan Kombinacja liniowa Definicja Kombinacja liniowa wektorów (punktów) x 1, x 2,, x k R n to wektor x R n k taki, że x = i=1 λ i
Bardziej szczegółowoMatematyka wykaz umiejętności wymaganych na poszczególne oceny
Matematyka wykaz umiejętności wymaganych na poszczególne oceny KLASA I 1.Liczby rzeczywiste 1. Podawanie przykładów liczb: naturalnych, całkowitych, wymiernych, niewymiernych, pierwszych i złożonych oraz
Bardziej szczegółowoWykład 7 Teoria eksperymentu
Wykład 7 Teoria eksperymentu Wrocław, 19.04.2017r Układ niekompletnych bloków losowych Zrównoważone niekompletne bloki: Gdy wszystkie porównania wyników są jednakowo ważne należy tak wybrać kombinacje
Bardziej szczegółowoIdea. Analiza składowych głównych Analiza czynnikowa Skalowanie wielowymiarowe Analiza korespondencji Wykresy obrazkowe.
Idea (ang. principal components analysis PCA), zwana również dekompozycją według wartości osobliwych (SVD) lub dekompozycją spektralną, jest popularną techniką redukcji wymiarowości danych(liczby cech).
Bardziej szczegółowoMetody eksploracji danych 2. Metody regresji. Piotr Szwed Katedra Informatyki Stosowanej AGH 2017
Metody eksploracji danych 2. Metody regresji Piotr Szwed Katedra Informatyki Stosowanej AGH 2017 Zagadnienie regresji Dane: Zbiór uczący: D = {(x i, y i )} i=1,m Obserwacje: (x i, y i ), wektor cech x
Bardziej szczegółowo