Analiza Składowych Głównych i Czynnikowa

Wielkość: px
Rozpocząć pokaz od strony:

Download "Analiza Składowych Głównych i Czynnikowa"

Transkrypt

1 Analiza Składowych Głównych i Czynnikowa Agata Weltrowska Paulina Zalewska Wydział FTiMS, 12 kwiecień 2018

2 Wstęp oraz cele Wprowadzenie W jednej ze swoich prac, A.E. Maxwell podaje, że analiza składowych głównych znacznie wzrosła poprzez podjęte w owych czasach próby identyfikacji kryminalistów, które odbywały się za pomocą zbioru cech antropometrycznych. Alphonse Bertillion zaangażował się w rozwiązanie tego problemu pod koniec XIX wieku, napisał w roku 1893 dzieło pod tytułem Identification anthropométrique, w którym przedstawił swoje poglądy.

3 Wstęp oraz cele Wprowadzenie Alphonse Bertillion zaproponował, by posłużyć się dwunastoma różnymi pomiarami ciała dla identyfikacji. Jednakże jego procedura została skrytykowana przez Francisa Galtona, który zauważył, iż niektóre z pomiarów są wysoko ze sobą skorelowane (jak na przykład długość ramienia i nogi), dlatego wykorzystywanie obu cech nie miało większego sensu. Zaproponował on wybór takich cech, które nie będą ze sobą znacznie skorelowane.

4 Wstęp oraz cele Wprowadzenie Pracę nad tym tematem kontynuował Karl Pearson (1901), który na podstawie swoich badań stwierdził, że najlepszymi do wykorzystania pomiarami będą te, które korespondują z pionowymi osiami wielowymiarowej elipsoidy w p-wymiarowej przestrzeni pomiarów. Uważa się, że teoretyczne podstawy analizy składowych głównych zostały wprowadzone właśnie przez Pearsona.

5 Wstęp oraz cele Wprowadzenie W dalszym ciągu metoda była rozwijana przez Harolda Hotellinga (1933), to jego technika wyznaczała główne składowe oraz ładunki składnikowe. Koncepcja analizy składowych głównych była stosowana jako losowy wektor, którą rozwijał Hotelling.

6 Wstęp oraz cele Terminologia Współcześnie spotykamy się z nazwą analiza głównych składowych (z ang. principal component analysis) lub analiza składowych, bądź analiza składnikowa (z ang. component analysis). Czasami można się spotkać z metodą składowych głównych lub techniką, wszystkie te określenia są wymienne.

7 Wstęp oraz cele Cel Celem analizy składowych głównych jest redukcja wymiarowości złożonego zjawiska, a co za tym idzie redukcja danych, jak również badanie korelacji pomiędzy zmiennymi, a także badanie grupowania się, następnie zaklasyfikowanie jednostek do wydzielonych grup.

8 Wstęp oraz cele Przykład Potrzebna jest ocena nowo powstałego towaru na rynku, jakim są czekoladowe babeczki. Aby dowiedzieć się, czy są one wystarczająco smaczne i czy będą lubiane przez smakoszy, warto jest przeprowadzić ankietę, która zawierać będzie różne cechy towaru, między innymi smak, zapach, kolor, konsystencja, czy nawet kolor opakowania. Ankieta ta zawiera 25 pytań, w tym cechy przedstawione wyżej.

9 Wstęp oraz cele Przykład Wykorzystując analizę składowych głównych można sprawdzić, czy jest możliwość wyodrębnienia najważniejszych cech. Zamiana paru zmiennych na jedną ogólną, przebiega następująco: ocena wyglądu = kolor, konsystencja, kolor opakowania Jedna zmienna zastąpi trzy inne.

10 Definicja, model i kryteria Definicja Przypuszczono, że X jest wektorem o p-tej liczbie zmiennych losowych, oraz że wariancja tych zmiennych losowych i struktura kowariancji lub korelacji pomiędzy p-tą liczbą zmiennych są godne zainteresowania. Chyba, że p jest niewielkie, lub struktura jest bardzo prosta, zazwyczaj wtedy nie jest zbyt pomocne proste spoglądanie na wariancję p i wszystkich z 1 2p(p 1) korelacji lub kowariancji. Alternatywne podejście ukazuje kilka ( p) 1 pochodzących zmiennych, które zachowują większość informacji nadanych przez tą wariancję i korelację lub kowariancję. 1 p - oznacza dużo mniejsze niż p

11 Definicja, model i kryteria Definicja Pierwszym krokiem analizy składowych głównych jest spojrzenie na funkcję liniową α T 1 X. Szuka się wektora α 1 takiego, że α = (α 11, α 12,..., α 1p ), oraz: z 1 = α T 1 X = α 11X 1 + α 12 X α 1p X p = p j=1 α 1jX j ma maksimum wariancji.

12 Definicja, model i kryteria Definicja Następnie, rozważa się funkcję liniową z 2 = α2 T X. Funkcja ta jest nieskorelowana z α1 T X oraz ma maksimum wariancji. Wnioskując dalej, k ty etap tej funkcji liniowej wygląda następująco: αk T X, jest również znaleziony, posiada maksimum badanej wariancji będącej nieskorelowanej z α T 1 X, αt 2 X,..., αt k X. αk T X jest k-tą składową główną. Do p tej liczby składowe główne mogą zostać znalezione, w ogólności istnieje nadzieja, że największa z wariancji w X będzie opisywana przez m składowych głównych, gdzie m p.

13 Definicja, model i kryteria Twierdzenie Niech X = (X 1, X 2,..., X p ) T jest wektorem losowym takim, że j (1,p) EX j 2 <. Niech Σ oznacza macierz kowariancji. Wówczas składowe główne z k = αk T X dla k = 1, 2,..., p, gdzie α 1, α 2,..., α p to wektory własne macierzy Σ odpowiadające wartościom własnym λ k takim, że λ 1 > λ 2 >... > λ p. α k została wybrana o długości α T k α k = 1. Ponadto var(z k ) = λ k.

14 Definicja, model i kryteria Interpretacja graficzna Rozważono tutaj przypadek, gdzie p = 2. Korzyścią dla p = 2 jest, oczywiście to, że dane mogą zostać umieszczone na wykresie dokładnie dwuwymiarowym.

15 Definicja, model i kryteria Interpretacja graficzna Wykres składający się z 50 obserwacji dla dwóch zmiennych x 1 i x 2.

16 Definicja, model i kryteria Interpretacja graficzna Wykres składający się z 50 obserwacji z odniesieniem do ich składowych głównych z 1 i z 2.

17 Definicja, model i kryteria Metoda Hotellinga Metoda Hotellinga jest jedną z najczęściej stosowanych procedur uzyskiwania składowych głównych. Powstała w roku Wykorzystuje metodę mnożników Lagrange a maksymalizacji funkcji wielu zmiennych. Przyjmijmy, że punktem wyjścia analizy jest macierz kowariancji S.

18 Definicja, model i kryteria Metoda Hotellinga Rozważmy pierwszą główną składową modelu Y 1 = w 11 X 1 + w 21 X w p1 X p = w 1x gdzie w 1 =[w 11, w 21,..., w p1 ] jest wieszowym wektorem ładunków składnikowych pierwszej głównej składowej, której wariancja wynosi: p p S 2 (Y 1 ) = w j1 w k1 s jk = w 1Sw 1 k=1 j=1

19 Definicja, model i kryteria Metoda Hotellinga Dla funkcji p współczynniki w 11, w 21,..., w p1 muszą być tak dobrane, aby maksymalizowały wariancję przy warunku w 1 = 1. Taki warunek wprowadza ograniczenie na wartości w j1, tak aby długość wektora w, była równa 1, czyli: w 1w 1 = p j=1 w 2 jl = 1 Warunek ten nazywamy warunkiem normalizującym.

20 Definicja, model i kryteria Metoda Hotellinga Normalizacja wektorów odbywa się w następujący sposób: w jl = a jl p j=1 a2 jl (każda współrzędna dzielona jest przez długość wektora) gdzie a jl - elementy wektora własnego a l związanego z l-tą główną składową przed normalizacją

21 Definicja, model i kryteria Metoda Hotellinga Dorozwiązania probleu, czyli określenia wektora współczynników w 1, który by maksymalizował wariancję pierwszej składowej, stosuje się metodę Lagrange a. Mnożnik oznaczony będzie λ 1. Funkcja pomocniczna uwzględniająca ograniczenie zdefiniowana będzie następująco: ϕ = 1 w 1w 1 0.

22 Definicja, model i kryteria Metoda Hotellinga Następnie utworzymy funkcję Lagrange a L(w 1 ) = S 2 (Y 1 ) + λ 1 (1 w 1w 1 ) = w 1Sw 1 + λ 1 (1 w 1w 1 ) zaś obliczoną pochodną względem wektora w 1 przyrównamy do zera L w 1 = 2Sw 1 2λ 1 w 1 = 2(S λ 1 I )w 1 = 0 gdzie I jest macierzą jednostkową p p

23 Definicja, model i kryteria Metoda Hotellinga Poszukiwane współczynniki w 1, muszą spełniać p jednorodnych równań liniowych (S λ 1 I )w 1 = 0 ( ) Ponieważ równaniem nie może być wektor zerowy, to λ 1 musi być liczbą spełniającą równanie wyznacznikowe S λ 1 I w 1 = 0 zatem macierz (S λ 1 I ) musi być macierzą osobliwą.

24 Definicja, model i kryteria Metoda Hotellinga Równanie (*) możemy zapisać: Sw 1 = λ 1 w 1 Wiemy, że λ 1 jest wartością własną macierzy S, zaś wektor w 1 jest związanym z nią wektorem własnym. Mnożąc następnie powyższe równanie lewostronnie przez w 1 i wykorzystując ograniczenie w 1 w 1 = 1, otrzymujemy: w 1Sw 1 = λ 1 w 1w 1 = λ 1 = S 2 (Y 1 )

25 Definicja, model i kryteria Metoda Hotellinga Ponieważ wektor współczynników ma być wybrany tak, aby maksymalizował wariancję S 2 (Y 1 ), to λ 1 musi być największą wartością własną macierzy S. Pierwsza składowa jest zatem w pełni wyznaczona przez parę: wartość własną - wektor własny (λ 1, w 1 ).

26 Definicja, model i kryteria Metoda Hotellinga W podobny sposób znajdujemy pozostałe główne składowe. Postępowanie sprowadza się zatem do znalezienia wartości własnych macierzy S, którymi są pierwiastki równania S λi = 0.

27 Definicja, model i kryteria Metoda Hotellinga Wektory własne odpowiadające poszczególnym wartościom własnym, zgodnie z relacją porządkującą λ 1 λ 2 λ p wyznaczają współczynniki składowych. Następnie dla l = 1, 2,..., p (S λ l I )w l = 0 Jednakże wektory rzadko okazują się unormowane po zastosowaniu powyższych wzorów. Należy zastosować odpowiedni wzór normalizujący.

28 Definicja, model i kryteria Metoda Hotellinga Dla macierzy wariancji S otrzymujemy p par: (λ 1, w 1 ), (λ 2, w 2 ),..., (λ p, w p ). Podsumowując, można powiedzieć, że dla układu p zmiennych X j (j = 1,..., p)i -tą główną składową jest kombinacja liniowa dana równaniem: Y 1 = w 11 X 1 + w 21 X w p1 X p Y 2 = w 12 X 1 + w 22 X w p2 X p... Y m = w 1m X 1 + w 2m X w pm X p o współczynnikach będących elementami wektora własnego macierzy S odpowiadającego I -tej co do wielkości wartości własnej λ l, tej macierzy.

29 Definicja, model i kryteria Kryteria dla liczby składowych Procent wyjaśnianej wariancji Wszystkie składowe główne razem stanowią 100% wariancji. Należy wybrać najmniejsza liczbę składowych głównych, które razem stanowią znaczny procent wariancji (w odniesieniu do sumy wszystkich wariancji), wówczas takowe składowe mogą w zadowalający sposób zastąpić pierwotne zmienne.

30 Definicja, model i kryteria Wygenerowane przez program SAS Enterprise Guide.

31 Definicja, model i kryteria Kryteria dla liczby składowych Kryterium Kaisera Kaiser (1960) Wyodrębnianie istotnych składowych głównych odbywa się to za pomocą interpretowania wysokości pojedynczych wariancji. Kryterium bierze tylko pod uwagę te składowe, których wartość własna przekracza lub jest bliska wartości 1.

32 Definicja, model i kryteria Kryteria dla liczby składowych Wykres osypiska Cattell (1966) Metoda graficzna - wykres liniowy, który przedstawia wartości własne, tempo ich spadku, czyli procentu wyjaśnionej wariancji. Wyznaczanie ilości pozostawionych składowych głównych odbywa się w taki sposób, ze analityk określa miejsce najłagodniejszego spadku, od tego momentu w prawo odrzucane zostają wartości własne, ponieważ reprezentują znikoma część wariancji.

33 Definicja, model i kryteria Oznaczone trzy wartości własne zostały przyjęte, reszta odrzucona. Wygenerowane przez program SAS Enterprise Guide.

34 Definicja, model i kryteria Interpretacja składowych Analiza składowych głównych ma za zadanie wyznaczyć nowe zmienne, tak zwane składowe główne. Interpretacja polega najczęściej na analizie wkładu zmiennych pierwotnych w nowa zmienna. Wkład ten rozumieć należy jako kombinacje liniowa zmiennych pierwotnych. Każda składowa główna wyjaśnia pewna część zmienności zmiennych pierwotnych.

35 Definicja, model i kryteria Zapis składowej głównej (jako kombinacji liniowej) wygląda następująco α 1 X 1 + α 2 X α p X p Jeżeli zostanie on zapisany w następujący sposób gdzie α i1 X i1 + α i2 X i α ip X ip α i1 α i2... α ip dla i j = 1, 2,..., p oraz i j i k gdy j k to wkład budowy składowej głównej wnoszą zmienne X i1, X i2,..., X ip, które uporządkowane są od największego do najmniejszego.

36 Algorytm działania Krok 1: Wstępna analiza, sprawdzenie założeń NORMALNOŚĆ ROZKŁADU Czy dany zbiór jest normalny? Założenie to nie jest konieczne, gdy zbiór zawiera bardzo dużą ilość danych. WIELKOŚĆ PRÓBY Wiarygodność otrzymanych wyników analizy zależy od wielkości próby, która z kolei zależy od siły korelacji między zmiennymi w populacji. Przyjmuje się, że minimalna liczebność próby to 50 obserwacji.

37 Algorytm działania Krok 1: Wstępna analiza, sprawdzenie założeń PUNKTY NIETYPOWE Nietypowe, odstające punkty w zbiorze nie są mile widziane. Zwykle są wynikiem złego pomiaru danych. Wpływają negatywnie na wyniki analizy, mogą nawet sfałszować faktyczne zależności pomiędzy zmiennymi. Najlepszym sposobem by się ich pozbyć, jest wcześniejsze usunięcie je ze zbioru. BRAKI DANYCH Zbiory danych z brakującymi informacjami również nie wpływają pozytywnie na analizę. Dlatego właśnie w sytuacji z brakami danych najlepiej zastąpić je przez średnie lub usunąć przypadki z brakującymi danymi.

38 Algorytm działania Krok 1: Wstępna analiza, sprawdzenie założeń Wygenerowane przez program SAS Enterprise Guide.

39 Algorytm działania Krok 2: Wybór macierzy Należy przyjrzeć się oryginalnym zmiennym. Jeżeli analizowane zmienne będą porównywalne, znaczy to, że będą wyrażone w tych samych jednostkach (będą znormalizowane), wówczas wykorzystuje się macierz kowariancji. Jeżeli jednak zmienne różnią się jednostkami, to najlepszym sposobem jest skorzystanie z macierzy korelacji. Wybór jest bardzo ważny, ponieważ nie zawsze składowe główne otrzymane dla macierzy kowariancji oraz korelacji będą miały takie same wartości.

40 Algorytm działania Krok 2: Wybór macierzy Wygenerowane przez program SAS Enterprise Guide.

41 Algorytm działania Krok 3: Wyznaczenie wartości i wektorów własnych Za pomocą procedury PROC PRINCOMP w programie SAS Enterprise Guide, wygenerowano tabelę wartości własnych macierzy korelacji. Wartości własne są miarą zmienności pierwotnych danych przedstawionych we współrzędnych składowych głównych.

42 Algorytm działania Krok 3: Wyznaczenie wartości i wektorów własnych Wygenerowane przez program SAS Enterprise Guide.

43 Algorytm działania Krok 4: Wybór składowych głównych Procent wyjaśnianej wariancji - trzy pierwsze składowe wyjaśniają 86, 85% wariancji Kryterium Kaisera - dwie pierwsze wartości własne Wykres osypiska - dwie pierwsze składowe

44 Algorytm działania Krok 4: Wybór składowych głównych Wygenerowane przez program SAS Enterprise Guide.

45 Algorytm działania Krok 4: Wybór składowych głównych Poniżej przedstawiono schemat dwóch pierwszych składowych głównych. Obrazuje on nam jak bardzo skorelowane są zmienne ze sobą. Interpretacja: Wykroczenia, które na poniższym schemacie leżą blisko siebie są wysoce ze sobą skorelowane (np. Assault oraz Rape), zaś te które leżą na przeciwko siebie (np. Auto Theft i Murder) są skorelowane ze sobą ujemnie.

46 Algorytm działania Krok 4: Wybór składowych głównych Wygenerowane przez program SAS Enterprise Guide.

47 Algorytm działania Krok 4: Wybór składowych głównych Wygenerowane przez program SAS Enterprise Guide.

48 Algorytm działania Krok 5: Interpretacja i podsumowanie Przedstawiono poniżej dwie nowe zmienne dla zbioru danych. Wyniki zostały zaokrąglone do trzeciego miejsca po przecinku. Y 1 = Murder Rape Robbery Assault Burglary Larceny Auto Theft Y 2 = Murder Rape Robbery Assault Burglary Larceny Auto Theft

49 Wstęp oraz cele Analiza czynnikowa Twórcami głównej koncepcji tej metody są psychologowie Charles Spearman i Louis Leon Thurstone. Spearman wprowadził pojęcie pojedynczego czynnika ogólnego dla wyjaśnienia wyników testów inteligencji. Dopiero Louis Leon Thurstone stworzył podstawy teoretyczne analizy czynnikowej.

50 Wstęp oraz cele Wprowadzenie Analiza czynnikowa jest testem statystycznym, który używany jest, by znaleźć relację pomiędzy wielokrotnie skorelowanymi miarami. Jest to metoda statystyczna używana do opisu zmienności wśród obserwowanych, korelacji zmiennych w zakresie potencjalnie mniejszej liczby nieobserwowanych zmiennych zwanych czynnikami. Obserwowane zmienne są modelowane jako kombinacje liniowe potencjalnych czynników.

51 Wstęp oraz cele Cel Główne cele czynnikowych technik analitycznych to: 1. Identyfikacja ukrytych w zbiorze zmiennych czynników wspólnych, 2. Redukcja wymiarów, 3. Ortogonalizacja przestrzeni, 4. Identyfikacja charakteru zmiennych, 5. Transformacja układu zmiennych, 6. Prezentacja graficzna.

52 Wstęp oraz cele Model analizy czynnikowej Zapis macierzowy X px1 µ px1 = L pxm F mx1 + ɛ px1 Oznaczenia X - wektor wartości obserwowalnych, µ - macierz wartości oczekiwanych X, L - macierz ładunków czynnikowych, F - wektor czynników wspólnych, ɛ - wektor czynników specyficznych.

53 Wstęp oraz cele Założenia Ze względu na dużą liczbę zmiennych nieobserwowalnych należy przyjąć następujące założenia: 1 E(F) = 0, 2 Cov(F) = I, 3 E(ɛ) = 0, 4 Cov(ɛ) = Ψ pxp - macierz diagonalna, 5 Cov(ɛ, F) = E(ɛF ) = 0. Wówczas mamy do czynienia z ortogonalnym modelem czynnikowym.

54 Wstęp oraz cele Macierz kowariancji Macierz kowariancji dla modelu analizy czynnikowej określona jest wzorem: Σ = LL + Ψ Co wynika z następujących obliczeń: Σ = Cov(X ) = E(X µ)(x µ) = = LE(FF )L + E(ɛF )L + LE(F ɛ ) + E(ɛɛ ) = LL + Ψ

55 Wstęp oraz cele Własności Dla ortogonalnego modelu czynnikowego zachodzą własności: Cov(X ) = LL + Ψ Cov(X l, X k ) = l i1 l k l im l km Cov(X, F ) = L, Z tego wynika, że Var(X i ) = σ ii = l 2 i1 + l 2 i l 2 im + Ψ i,

56 Wstęp oraz cele Wariancja Wprowadżmy oznaczenie: hi 2 = li1 2 + l i l im 2. Wówczas możemy wyróżnić: - hi 2 - wariancja wspólna, część całkowitej wariancji, która jest wspólna z innymi zmiennymi. - Ψ i - wariancja specyficzna, czyli część wariancji całkowitej, która jest właściwa tylko tej konkretnej zmiennej. Składowe wariancji X Wariancja X i = wariancja wspólna + wariancja specyficzna

57 Wstęp oraz cele Model czynnikowy X µ = L F + ɛ nie jest unikatowy, co oznacza, że dla dwóch różnych par (L, F ) oraz (ˆL, ˆF ) możemy otrzymać tę samą macierz kowariancji Σ. Uzasadnienie Weźmy dowolną macierz ortogonalną T o wymiarach m m. Wówczas model możemy zapisać jako: X µ = LF + ɛ = LTT F + ɛ = ˆL ˆF + ɛ gdzie ˆL = LT i ˆF = T F. Wtedy zachodzi: E( ˆF ) = T E(F ) = 0 Cov( ˆF ) = T Cov(F )T = T T = I

58 Wstęp oraz cele Oznacza to, że współczynniki F i ˆF oraz L i ˆL generują tę samą macierz kowariancji Σ: Σ = LL + Ψ = ˆLˆL + Ψ W dalszej części prezentacji pokażemy, jak tę niejednoznaczność można wykorzystać do ułatwienia interpretacji wyników uzyskanych w metodzie analizy czynnikowej.

59 Metody estymacji Metody estymacji Rozwiązanie analizy czynnikowej polega na wyznaczeniu układu czynników wspólnych F, dokonuje się tego wykorzystując jedną z podstawowych metod estymacji, do których należą: 1. Metoda głównych składowych, 2. Metoda głównego czynnika, 3. Metoda największej wiarygodności, 4. Metoda centroidalna.

60 Metody estymacji Metoda głównych składowych Zakładamy, że macierz kowariancji Σ jest postaci: gdzie (λ i, e i ) to pary wartości i wektorów własnych dla i = 1, 2,..., p oraz λ 1 λ 2... λ p 0.

61 Metody estymacji Metoda głównych składowych Chociaż przedstawiona analiza macierzy Σ jest poprawna, nie jest ona szczególnie użyteczna w praktyce, ponieważ używa tyle samo wspólnych czynników ile jest zmiennych i nie pozwala na jakąkolwiek wariancję specyficzną Ψ (czyli Ψ i = 0). Preferuje się wzory, które wyjaśniają strukturę kowariancji w odniesieniu do czynników wspólnych.

62 Metody estymacji Metoda głównych składowych Jednym ze sposobów jest pominięcie udziału λ m+1 e m+1 e m λ pe p e p jeżeli ostatnie p m wartości własne są małe. Wówczas otrzymujemy przybliżenie:

63 Metody estymacji Metoda głównych składowych Dodając do tego macierz czynników specyficznych otrzymujemy macierz postaci gdzie Ψ i = σ ii m j=1 l 2 ij.

64 Metody estymacji Metoda głównych składowych Aby móc zastosować tę metodę do zbioru x 1, x 2,..., x n należy odjąć od nich średnią z próby x. Wówczas otrzymujemy następujące obserwacje z macierzą kowariancji S taką samą jak pierwotnych obserwacji.

65 Metody estymacji Metoda głównych składowych Analiza głównego składnika modelu czynnikowego macierzy próbki kowariancji S jest określona za pomocą par złożonych z wartości własnej i wektora własnego: (λ 1, e 1 ), (λ 2, e 2 ),..., (λ p, e p ). Niech m < p będzie liczbą czynników wspólnych. Wówczas macierz przybliżonych ładunków czynnikowych l ij jest postaci: L = [ ˆλ1 ê 1, ˆλ2 ê 2,..., λm ˆ eˆ m ]

66 Metody estymacji Metoda głównych składowych Elementy macierzy S L L na głównej przekątnej tworzą wyestymowane wartości wariancji specyficznej gdzie Ψ i = s ii m j=1 l 2 ij. Wariancja wspólna jest określona wzorem h 2 i = m j=1 l 2 ij = m j=1 ˆλ i ˆ e2 ij

67 Metody estymacji W jaki sposób wybrać liczbę czynników m? Jeżeli liczba czynników wspólnych nie jest określona przez postawione wcześniej założenia, wybór liczby m czynników może opierać się na przybliżonych wartościach własnych tak, jak na czynnikach głównych. Rozważmy macierz residuum S ( L L + Ψ) Diagonalne elementy są zerami i jeśli elementy nie leżące na przekątnej są także małe, możemy przyjąć, że m-czynnikowy model jest poprawny.

68 Metody estymacji Przykład: Dziesięciobój Oznaczenia zmiennych k1 - bieg na 100m, k2 - skok w dal, k3 - pchnięcie kulą, k4 - skok wzwyż, k5 - bieg na 400m, k6 - bieg przez płotki na 100m, k7 - rzut dyskiem, k8 - skok o tyczce, k9 - rzut oszczepem, k10 - bieg na 1000m.

69 Metody estymacji Przykład: Dziesięciobój Macierz korelacji

70 Metody estymacji Przykład: Dziesięciobój Wartości własne Na podstawie kryterium Kaisera, liczba ładunków wynosi 3.

71 Metody estymacji Czynniki Na tej podstawie odczytujemy równania: k1 = 0.696Factor Factor Factor3 k2 = 0.793Factor Factor Factor3...

72 Metody estymacji Metoda największej wiarygodności Jeśli założymy, że czynniki wspólne F i czynniki specyficzne ɛ mają rozkład normalny, to możemy uzyskać estymatory największej wiarygodności ładunków czynnikowych i wariancji specyficznej. Jeśli F j i ɛ j mają rozkład normalny, to obserwacje X j µ = LF j + ɛ j też mają rozkład normalny. Funkcja prawdopodobieństwa wygląda wtedy następująco: i jest zależna od L i Ψ ze wzoru Σ = LL + Ψ.

73 Metody estymacji Metoda największej wiarygodności Ten model nie jest najlepiej zdefiniowany, ze względu na wielokrotność wyboru macierzy L możliwej przez transformacje ortogonalne. Jednoznacznego wyboru L dokonujemy przez nałożenie dodatkowego warunku: = L Ψ 1 L gdzie jest macierzą diagonalną. Estymacje największej wiarygodności ˆL i ˆΨ muszą być uzyskane przez numeryczną maksymalizację prawdopodobieństwa L(µ, Σ).

74 Metody estymacji Przykład: Przestępcy

75 Metody estymacji Przykład: Przestępcy

76 Metody estymacji Przykład: Przestępcy Murder = 0.578Factor Factor 2 Czynnik 1. możemy interpretować jako wskaźnik ogólnej przestępczości, czynnik 2. ma wartości dodatnie dla przestępstw naruszających cudze mienie, a ujemne dla związanych ze zdrowiem i życiem.

77 Rotacja czynnika Rotacja czynników Jak mówiłyśmy wcześniej, macierz ładunków ˆL nie zmienia swoich własności po wymnożeniu jej przez dowolną macierz ortogonalną. Taką transformację utożsamiać można z obrotem osi układu współrzędnych, które w naszym przypadku odpowiadają kolejnym czynnikom F 1,..., F m. Z tego powodu transformację tą nazywamy rotacją czynników.

78 Rotacja czynnika Teoria Jeżeli ˆL jest p m macierzą estymacji ładunków czynnika to ˆL = ˆLT, gdzie TT = T T = I jest macierzą rotacji ładunków wymiaru p m. Ponadto estymacja macierzy kowariancji pozostaje bez zmian, ponieważ: ˆLˆL + ˆΨ = ˆLTT ˆL + ˆΨ = ˆL ˆL + ˆΨ Ponadto nie zmienią się także wariancje specyficzne ˆΨ i i wariancje wspólne ĥ i 2. Dlatego z matematycznego punktu widzenia, nie ma znaczenia którą z macierzy ˆL czy ˆL wykorzystamy w obliczeniach.

79 Rotacja czynnika Teoria Celem rotacji czynników jest uzyskanie macierzy ˆL, która pozwoliłaby na prostą interpretację zależności poszczególnych zmiennych od czynników wspólnych. Najlepiej byłoby, gdyby każda ze zmiennych ma duży ładunek tylko na jednym czynniku i małe ładunki na pozostałych. Zdarza się to bardzo rzadko, dlatego stosujemy rotację macierzy ˆL, dzięki której jesteśmy w stanie otrzymać prostsze w interpretacji wyniki.

80 Rotacja czynnika Teoria Do zilustrowania rotacji posłużymy się przykładem dla dwóch czynników (m = 2). W tym przypadku problem można często rozwiązać graficznie: osie układu współrzędnych oznaczamy przez F 1 i F 2, a pary ładunków (l i1, l i2 ) dla i = 1,..., p traktujemy jako punkty układu. Najprostszym przykładem rotacji jest obrót osi o kąt Φ. Wówczas macierz obrotu T jest postaci

81 Rotacja czynnika Przykład: Studenci Poniżej przedstawiono macierz korelacji wyników egzaminów z 6 przedmiotów (p = 6) dla 220 studentów.

82 Rotacja czynnika Estymujemy ładunki za pomocą metody największej wiarygodności

83 Rotacja czynnika Ładunki na czynniku pierwszym (F 1 ) są dodatnie dla wszystkich zmiennych. Można interpretować go więc jako czynnik ogólnej inteligencji. Ładunki na czynniku drugim (F 2 ) są dodatnie dla przedmiotów humanistycznych, a ujemne dla matematycznych, więc można założyć, że wskazuje on na typ inteligencji (zdolności matematyczne lub humanistyczne).

84 Rotacja czynnika Wykres przedstawia graficzne umiejscowienie punktów (l i1, l i2 ) odpowiadających kolejnych zmiennym na układzie współrzędnych F 1, F 2. Układ współrzędnych obrócono o kąt Φ = 20 tak, aby oś F 1 przechodziła przez punkt 4.

85 Rotacja czynnika Ładunki zmiennych matematycznych są wysokie na F1 i mało istotne na F2. F 1 może być nazwany czynnikiem matematycznych zdolności. Podobnie trzy zmienne testów niematematycznych mają wysokie ładunki na F2 i stosunkowo małe ładunki na F 1. F 2 można być nazwany jako czynnik umiejętności humanistycznych. Wpływ czynnika ogólnej inteligencji rozbił się więc na dwa nowe czynniki umożliwiając bardziej precyzyjną interpretację.

86 Porównanie dwóch metod Analiza składowych głównych orientacja wariancyjna: punktem wyjścia jest zwykła macierz korelacji model zamknięty: uwzględnia się wyłącznie wariancję badanych zmiennych Analiza czynnikowa orientacja kowariancyjna: punktem wyjścia jest zredukowana macierz korelacji lub macierz kowariancji model otwarty: obok wariancji cech uwzględnia się także wariancję nieobjaśnianą (zm. pominięte, losowość obserwacji)

87 Porównanie dwóch metod zmienne pierwotne są liniową funkcją składowych głównych (a główne składowe można przedstawić jako kombinacje liniowe zmiennych pierwotnych) wychodzi się od obserwacji empirycznych, a następnie buduje model teoretyczny celem analizy jest uproszczenie struktury danych każda zmienna pierwotna jest funkcją nieobserwowanych czynników wspólnych i czynnika swoistego buduje się teoretyczny model zjawiska i sprawdza, czy jest zgodny z danymi empirycznymi celem analizy jest identyfikacja ukrytych zmiennych

88 Porównanie dwóch metod Kiedy stosować daną metodę? Analizę Składowych Głównych stosujemy, gdy: 1 nie dysponujemy potencjalnym modelem głębokiej struktury czynników wyjaśniających związki pomiędzy zmiennymi, taki model nie jest celem naszej analizy lub nie chcemy wtłaczać w taki model posiadanych danych empirycznych 2 chcemy wyliczyć nieskorelowane główne składowe w celu zastosowania ich w dalszych analizach wielowymiarowych (np. regresji lub dyskryminacji)

89 Porównanie dwóch metod 3 wiemy, że wariancja specyficzna i wariancja wynikająca z błędu jest niewielka, a także, gdy analizujemy dużo (np. więcej niż 15) skorelowanych zmiennych lub gdy korelacja między zmiennymi jest względnie wysoka 4 celem jest eksploracja, rozpoznanie struktury zbioru danych, chcemy przedstawić graficznie strukturę zbioru danych w przestrzeni dwu- lub trójwymiarowej, szukamy skupień obiektów ze względu na podobieństwo w zakresie analizowanych cech, określamy minimalną liczbę wymiarów

90 Porównanie dwóch metod Kiedy stosować daną metodę? Analizę Czynnikową stosujemy, gdy: 1 chcemy wyjaśnić zaobserwowaną korelację między zmiennymi przy pomocy modelu przyczynowego opartego na strukturze związków zmiennych obserwowalnych z ukrytymi czynnikami 2 koncentrujemy się na wyjaśnieniu korelacji między zmiennymi i dlatego chcemy wyłączyć z analizy wariancję swoistą zmiennych

91 Porównanie dwóch metod 3 zmienne są obciążone względnie dużym błędem pomiarowym, który badacz chce wyłączyć z analizy 4 celem analizy jest klasyfikacja zmiennych we względnie jednorodne grupy, w gruncie rzeczy będące właśnie wskaźnikami pewnych konstruktów 5 dysponujemy modelem teoretycznym struktury takiego związku lub będziemy uzyskane wyniki interpretować w kategoriach teoretycznego modelu przyczynowego

92 Porównanie dwóch metod Podsumowanie Analiza czynnikowa i analiza głównych składowych to najpowszechniej stosowane techniki analizy wielowymiarowej. Są sprawdzonymi i dobrymi narzędziami, pod warunkiem dobrego zrozumienia. Wiele wyborów dokonywanych przez badacza ma charakter arbitralny. Z drugiej strony, jak to zauważyliśmy, analiza czynnikowa daje podobne rezultaty przy różnych metodach wyodrębniania czynników oraz podobne do analizy głównych składowych. W selekcji i interpretacji czynników ważne jest doświadczenie analityka i merytoryczna znajomość problemu.

93 Dodatek Bibliografia I Ravindra Khattree and Dayanand N. Naik. Multivariate Data Reduction and Discriminstion with SAS Software. Cary, NC: SAS Institute Inc., Jarosław Górniak. Analiza czynnikowa analiza głównych składowych. ASK, Instytut Socjologii UJ, Johnson, R. A., Wichern, D. W. Applied multivariate statistical analysis. Prentice Hall, 1992.

94 Dodatek Bibliografia II Joanna Ciecieląg, Marek Pęczkowski Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. dostępny w Internecie pod linkiem dostęp:

ANALIZA CZYNNIKOWA Przykład 1

ANALIZA CZYNNIKOWA Przykład 1 ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka Wykład XV: Zagadnienia redukcji wymiaru danych 2 lutego 2015 r. Standaryzacja danych Standaryzacja danych Własności macierzy korelacji Definicja Niech X będzie zmienną losową o skończonym drugim momencie.

Bardziej szczegółowo

Statystyka i eksploracja danych

Statystyka i eksploracja danych Wykład XII: Zagadnienia redukcji wymiaru danych 12 maja 2014 Definicja Niech X będzie zmienną losową o skończonym drugim momencie. Standaryzacją zmiennej X nazywamy zmienną losową Z = X EX Var (X ). Definicja

Bardziej szczegółowo

CELE ANALIZY CZYNNIKOWEJ

CELE ANALIZY CZYNNIKOWEJ ANALIZA CZYNNIKOWA... stanowi zespół metod i procedur statystycznych pozwalających na badanie wzajemnych relacji między dużą liczbą zmiennych i wykrywanie ukrytych uwarunkowań, ktore wyjaśniają ich występowanie.

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

Analiza składowych głównych i czynnikowa

Analiza składowych głównych i czynnikowa Analiza składowych głównych i czynnikowa Martyna Kosna Katarzyna Gołota Politechnika Gdańska Wydział Fizyki Technicznej i Matematyki Stosowanej Matematyka Finansowa 2018 1 / 89 Analiza Głównych Składowych

Bardziej szczegółowo

Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn

Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmienn Analiza czynnikowa Wprowadzenie (1) Przedmiotem analizy czynnikowej jest badanie wewnętrznych zależności w zbiorze zmiennych. Jest to modelowanie niejawne. Oprócz zmiennych, które są bezpośrednio obserwowalne

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Elementy statystyki wielowymiarowej

Elementy statystyki wielowymiarowej Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Analiza czynnikowa i wnioskowanie o strukturze macierzy kowariancji

Analiza czynnikowa i wnioskowanie o strukturze macierzy kowariancji i wnioskowanie o strukturze macierzy kowariancji Katarzyna Hoffmann, Magdalena Czaplińska Paulina Filipiak, Szymon Flohr Politechnika Gdańska 20 maja 2014 i wnioskowanie o strukturze macierzy kowariancji

Bardziej szczegółowo

Analiza głównych składowych- redukcja wymiaru, wykł. 12

Analiza głównych składowych- redukcja wymiaru, wykł. 12 Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Analiza czynnikowa i wnioskowanie dla właściwości macierzy kowa

Analiza czynnikowa i wnioskowanie dla właściwości macierzy kowa Analiza czynnikowa i wnioskowanie dla właściwości macierzy kowariancji Wioleta Arym, Daria Szlagowska, Martyna Zarach, Andrzej Rebell Wydział FTiMS, Politechnika Gdańska 9 maja 2014 Początki analizy czynnikowej

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Metoda największej wiarygodności

Metoda największej wiarygodności Rozdział Metoda największej wiarygodności Ogólnie w procesie estymacji na podstawie prób x i (każde x i może być wektorem) wyznaczamy parametr λ (w ogólnym przypadku również wektor) opisujący domniemany

Bardziej szczegółowo

Statystyczna analiza danych

Statystyczna analiza danych Statystyczna analiza danych Korelacja i regresja Ewa Szczurek szczurek@mimuw.edu.pl Instytut Informatyki Uniwersytet Warszawski 1/30 Ostrożnie z interpretacją p wartości p wartości zależą od dwóch rzeczy

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Ważne rozkłady i twierdzenia c.d.

Ważne rozkłady i twierdzenia c.d. Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

KADD Metoda najmniejszych kwadratów funkcje nieliniowe Metoda najmn. kwadr. - funkcje nieliniowe Metoda najmniejszych kwadratów Funkcje nieliniowe Procedura z redukcją kroku iteracji Przykłady zastosowań Dopasowanie funkcji wykładniczej Dopasowanie funkcji

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

Metoda największej wiarygodności

Metoda największej wiarygodności Metoda największej wiarygodności Próbki w obecności tła Funkcja wiarygodności Iloraz wiarygodności Pomiary o różnej dokładności Obciążenie Informacja z próby i nierówność informacyjna Wariancja minimalna

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12 Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie

Bardziej szczegółowo

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka Statystyka opisowa. Wykład V. e-mail:e.kozlovski@pollub.pl Spis treści 1 Prosta regresji cechy Y względem cech X 1,..., X k. 2 3 Wyznaczamy zależność cechy Y od cech X 1, X 2,..., X k postaci Y = α 0 +

Bardziej szczegółowo

Prawdopodobieństwo i statystyka r.

Prawdopodobieństwo i statystyka r. Prawdopodobieństwo i statystyka 9.06.999 r. Zadanie. Rzucamy pięcioma kośćmi do gry. Następnie rzucamy ponownie tymi kośćmi, na których nie wypadły szóstki. W trzeciej rundzie rzucamy tymi kośćmi, na których

Bardziej szczegółowo

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe Nierówność Czebyszewa Niech X będzie zmienną losową o skończonej wariancji V ar(x). Wtedy wartość oczekiwana E(X) też jest skończona i

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym

Bardziej szczegółowo

KADD Minimalizacja funkcji

KADD Minimalizacja funkcji Minimalizacja funkcji Poszukiwanie minimum funkcji Foma kwadratowa Metody przybliżania minimum minimalizacja Minimalizacja w n wymiarach Metody poszukiwania minimum Otaczanie minimum Podział obszaru zawierającego

Bardziej szczegółowo

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Bardziej szczegółowo

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb Współzależność Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb (x i, y i ). Geometrycznie taką parę

Bardziej szczegółowo

10. Redukcja wymiaru - metoda PCA

10. Redukcja wymiaru - metoda PCA Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas: ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań

Bardziej szczegółowo

Układy równań i nierówności liniowych

Układy równań i nierówności liniowych Układy równań i nierówności liniowych Wiesław Krakowiak 1 grudnia 2010 1 Układy równań liniowych DEFINICJA 11 Układem równań m liniowych o n niewiadomych X 1,, X n, nazywamy układ postaci: a 11 X 1 + +

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y

Bardziej szczegółowo

Metoda największej wiarogodności

Metoda największej wiarogodności Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wprowadzenie Założenia Logarytm

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

0 + 0 = 0, = 1, = 1, = 0.

0 + 0 = 0, = 1, = 1, = 0. 5 Kody liniowe Jak już wiemy, w celu przesłania zakodowanego tekstu dzielimy go na bloki i do każdego z bloków dodajemy tak zwane bity sprawdzające. Bity te są w ścisłej zależności z bitami informacyjnymi,

Bardziej szczegółowo

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki WYKŁAD 6 Witold Bednorz, Paweł Wolff 1 Instytut Matematyki Uniwersytet Warszawski Rachunek Prawdopodobieństwa, WNE, 2010-2011 Własności Wariancji Przypomnijmy, że VarX = E(X EX) 2 = EX 2 (EX) 2. Własności

Bardziej szczegółowo

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Cezary Dendek Wydział Matematyki i Nauk Informacyjnych PW Plan prezentacji Plan prezentacji Wprowadzenie

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 3 Metody estymacji. Estymator największej wiarygodności Zad. 1 Pojawianie się spamu opisane jest zmienną losową y o rozkładzie zero-jedynkowym

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Korelacja krzywoliniowa i współzależność cech niemierzalnych Korelacja krzywoliniowa i współzależność cech niemierzalnych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

Bardziej szczegółowo

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór. L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Komputerowa Analiza Danych Doświadczalnych

Komputerowa Analiza Danych Doświadczalnych Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy

Bardziej szczegółowo

5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE 5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych 9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :

Bardziej szczegółowo

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k. Funkcje wymierne Jerzy Rutkowski Teoria Przypomnijmy, że przez R[x] oznaczamy zbiór wszystkich wielomianów zmiennej x i o współczynnikach rzeczywistych Definicja Funkcją wymierną jednej zmiennej nazywamy

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji Wykład 11. Metoda najmniejszych kwadratów Szukamy zależności Dane są wyniki pomiarów dwóch wielkości x i y: (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Przypuśćmy, że nanieśliśmy je na wykres w układzie

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Macierze. Rozdział Działania na macierzach

Macierze. Rozdział Działania na macierzach Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy

Bardziej szczegółowo

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA

AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja

Bardziej szczegółowo

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne 5.2. Momenty rozkładów łącznych. Katarzyna Rybarczyk-Krzywdzińska rozkładów wielowymiarowych Przypomnienie Jeśli X jest zmienną losową o rozkładzie

Bardziej szczegółowo

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski P Zmienne losowe niezależne - przypomnienie Dwie rzeczywiste zmienne losowe X i Y

Bardziej szczegółowo

Wykład z równań różnicowych

Wykład z równań różnicowych Wykład z równań różnicowych 1 Wiadomości wstępne Umówmy się, że na czas tego wykładu zrezygnujemy z oznaczania n-tego wyrazu ciągu symbolem typu x n, y n itp. Zamiast tego pisać będziemy x (n), y (n) itp.

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

Zawansowane modele wyborów dyskretnych

Zawansowane modele wyborów dyskretnych Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów

Bardziej szczegółowo

3. Macierze i Układy Równań Liniowych

3. Macierze i Układy Równań Liniowych 3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Rozkłady wielu zmiennych

Rozkłady wielu zmiennych Rozkłady wielu zmiennych Uogólnienie pojęć na rozkład wielu zmiennych Dystrybuanta, gęstość prawdopodobieństwa, rozkład brzegowy, wartości średnie i odchylenia standardowe, momenty Notacja macierzowa Macierz

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Ćwiczenia lista zadań nr 2 autorzy: A. Gonczarek, J.M. Tomczak Metody estymacji ML Zad. 1 Pojawianie się spamu opisane jest zmienną losową x o rozkładzie dwupunktowym

Bardziej szczegółowo

PODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.

PODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach. WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI Katedra Inżynierii Systemów Sterowania PODSTAWY AUTOMATYKI MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.

Bardziej szczegółowo

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

Matematyka ubezpieczeń majątkowych r.

Matematyka ubezpieczeń majątkowych r. Matematyka ubezpieczeń majątkowych 3..007 r. Zadanie. Każde z ryzyk pochodzących z pewnej populacji charakteryzuje się tym że przy danej wartości λ parametru ryzyka Λ rozkład wartości szkód z tego ryzyka

Bardziej szczegółowo

Podstawowe modele probabilistyczne

Podstawowe modele probabilistyczne Wrocław University of Technology Podstawowe modele probabilistyczne Maciej Zięba maciej.zieba@pwr.edu.pl Rozpoznawanie Obrazów, Lato 2018/2019 Pojęcie prawdopodobieństwa Prawdopodobieństwo reprezentuje

Bardziej szczegółowo

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody

Bardziej szczegółowo

Metody numeryczne Wykład 4

Metody numeryczne Wykład 4 Metody numeryczne Wykład 4 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Metody skończone rozwiązywania

Bardziej szczegółowo

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa. VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa. W rozdziale tym zajmiemy się dokładniej badaniem stabilności rozwiązań równania różniczkowego. Pojęcie stabilności w

Bardziej szczegółowo

3. FUNKCJA LINIOWA. gdzie ; ół,.

3. FUNKCJA LINIOWA. gdzie ; ół,. 1 WYKŁAD 3 3. FUNKCJA LINIOWA FUNKCJĄ LINIOWĄ nazywamy funkcję typu : dla, gdzie ; ół,. Załóżmy na początek, że wyraz wolny. Wtedy mamy do czynienia z funkcją typu :.. Wykresem tej funkcji jest prosta

Bardziej szczegółowo

6. Identyfikacja wielowymiarowych systemów statycznych metodanajmniejszychkwadratów

6. Identyfikacja wielowymiarowych systemów statycznych metodanajmniejszychkwadratów 6. Identyfikacja wielowymiarowych systemów statycznych metodanajmniejszychkwadratów . Przedmiot identyfikacji System () x (2) x * a z y ( s ) x y = F (x,z)=f(x,z,a ),gdziex = F () znane, a nieznane x ()

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9 Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli

Bardziej szczegółowo

Funkcje dwóch zmiennych

Funkcje dwóch zmiennych Funkcje dwóch zmiennych Andrzej Musielak Str Funkcje dwóch zmiennych Wstęp Funkcja rzeczywista dwóch zmiennych to funkcja, której argumentem jest para liczb rzeczywistych, a wartością liczba rzeczywista.

Bardziej szczegółowo