PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa
|
|
- Justyna Bukowska
- 8 lat temu
- Przeglądów:
Transkrypt
1 Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa
2 Obserwacje nietypowe i wpływowe
3 Obserwacje nietypowe i wpływowe Obserwacje nietypowe w analizie regresji: nietypowe wartości zmiennej Y - prowadzące do dużych reszt modelu e i nietypowe wartości jednej lub większej liczby zmiennych objaśniających - prowadzą do relatywnie małych wartości e i Dla MNK są problematyczne, gdyż w znacznym stopniu determinują postać prostej regresji - są wpływowe Jeżeli obserwacja posiada nietypową wartość Y (duże e i ), to mówimy że ma dużą odmienność. Rysunek przedstawia przykład obserwacji wpływowej.
4 Obserwacje nietypowe i wpływowe Jeżeli obserwacja posiada nietypową wartość X i i typową wartość Y i (małe e i ) to mówimy że ma dużą dźwignię (ang. leverage). Rysunek przedstawia przykład obserwacji o dużej dźwigni.
5 Leverage? Aby wyjaśnić pojęcie punktów o dużej dźwigni (leverage) rozważmy dane pochodzące z pracy Freedman et al. (1991) Dane dotyczą liczby wypalanych papierosów w różnych krajach w 1930 roku oraz liczby zgonów (liczba zgonów na milion mieszkańców) spowodowanych rakiem płuc w 1950 roku. Country Cigarette Deaths 1 Australia Canada Denmark Finland Great Britain Iceland Netherlands Norway Sweden Switzerland USA
6 Punkty o dużej dźwigni (leverage) Niebieski punkt nazywamy punktem o dużej dźwigni (leverage point)
7 Punkty o dużej dźwigni (leverage) Mają nietypową wartość x (x- liczba papierosów, y-liczba zgonów) Mają wpływ na własności modelu: Radykalnie zmieniają wartości błędów standardowych i współczynnika dopasowania R 2 Model dopasowany - wszystkie dane y = x Adjusted R 2 = Model dopasowany - po usunięciu punktu o dużej dźwigni: y = x Adjusted R 2 =
8 Obserwacje odstające (ang. outliers) Obserwacja odstajaca: jest obserwacją, która nie spełnia równania regresji czyli nie należy do prostej regresji. może znacząco wpływać na postać prostej regresji. Jeśli analizujemy tylko pojedyncze zmienne objaśniające, to identyfikacja obserwacji odstajacych odbywa się na podstawie wykresów rozrzutu lub histogramów. Jeśli chcemy szukać obserwacji odstających dla wielu zmiennych, wówczas możemy analizowac residua lub residua studentyzowane i wsród nich szukać wartości odstających.
9 Wyznaczanie obserwacji odstających Niech e = (e 1, e 2,..., e n ) oznacza wektor wartości resztowych (residuów),gdzie e i = Y i Ŷ i. Błędem standardowym residuum e i nazywamy ( SE ei = S 1 1 n + (X i X ) 2 n ), i=1 (X i X ) 2 gdzie S 2 = 1 n n (X i X ) 2. i=1 Wtedy studentyzowana wartość resztowa wynosi r i = e i SE ei.
10 Wyznaczanie obserwacji odstających Na podstawie wykresu studentyzowanych rezydów można rozpoznać duże ich wartości, będące najprawdopodobniej wartościami odstającymi. Obserwacja jest punktem odstającym jeśli ma dużą wartość standaryzowanej reszty Obserwacje odstające to takie, których wartości bezwzględne standaryzowanych reszt przekraczają 2.
11 Wyznaczanie obserwacji odstających Funkcja rstudent: 1 data1 <- read. table (" dane _ papierosy. txt ", header = TRUE, sep = "\t", quote = "\" ", dec =".") 2 x<- data1$ Cigarette 3 y<- data1$ Deaths 4 lm. linear <-lm(y~x) 5 reszty. stud <- rstudent (lm. linear ) 6 outlier. papierosy <- reszty. stud [ which. max ( abs ( reszty. stud ))] 7 outlier. papierosy Funkcja outliertest (pakiet car): 1 library ( car ) 2 outliertest ( lm. linear ) rstudent unadjusted p-value Bonferonni p Odstającą jest obserwacja jedenasta (USA) o wartości studentyzowanej reszty równej
12 Punkty wpływowe Punkt, który powoduje dużą różnicę w dopasowaniu prostej regresji nazywamy punktem wpływowym Wykrycie obserwacji wpływowych umożliwia pomiar odległości Cooka z tzw. modyfikowanymi residuami: Usuwamy obserwację potencjalnie wpływową i obliczamy różnicę w dopasowaniu. Obserwacja jest wpływowa jeśli ta różnica będzie wysoka. Odległość Cooka mierzy poziom wpływu obserwacji. Wyznaczamy ją następująco: n j=1 D i = (Ŷ j Yˆ j(i) ) 2 ps 2 Ŷj oznacza wartość przewidywaną przez model dla j-tej obserwacji wyznaczoną w modelu z usuniętą obserwacją i -tą ˆ Y j(i) wartość przewidywaną przez model dla j-tej obserwacji wyznaczoną w modelu z którego nie usunięto obserwacji i -tej. p - liczba parametrów w modelu.
13 Wyznaczanie punktów wpływowych Funkcja influenceplot: 1 influenceplot ( lm. linear, id. method = " identify ",id.n = 1, id. cex=1, id. col= palette () [1], main=" Wykres wpływów ", sub=" Rozmiar okręgów jest proporcjonalny do odległości Cooka ")
14 Wyznaczanie punktów wpływowych Klikając na interesujące nas obserwacje (o stosunkowo dużej średnicy okręgów) uzyskujemy ich indeksy na wykresie oraz wartości reszt i odległości Cooka. StudRes Hat CookD Za poziom krytyczny powyżej którego obserwacja może być uznana za wpływową przyjmuje się 1 lub 4 n, gdzie n jest liczbą obserwacji. W badanym przypadku 4 n = 4 11 = Obserwacje wpływowe to obserwacja 5. (Wielka Brytania) oraz 11. (USA)
15 Wyznaczanie punktów wpływowych Funkcja influence.measures: 1 influence. measures (lm. linear ) dfb.1_ dfb.x dffit cov.r cook.d hat inf e e e e e * e e e e e e * Ostatnia kolumna wskazuje punkty wpływowe zaznaczając przy nich gwiazdkę. Są to obserwacje 5.(wielka Brytania) i 11. (USA)
16 Punkty wpływowe Zazwyczaj punkty wpływowe mają następujące własności: Są punktami odstającymi, tzn. graficznie leżą daleko od pozostałych punktów danych Oznacza to, że związek pomiędzy x i y jest inny dla tych punktów niż dla pozostałych punktów w danych W przedstawionym przykładzie liczba zgonów w USA (niebieski punkt) jest niższa niż oczekiwalibyśmy na podstawie liczby wypalanych papierosów (prawdopodobnie dzięki lepszej opiece zdrowotnej) Wyznaczają punkt o dużej dźwigni, tzn wartość zmiennej x jest daleko od średniej. Obserwacje o bardzo małej, lub bardzo dużej wartości x są obserwacjami o dużej dźwigni.
17 Punkty wpływowe W przykładzie liczba zgonów w USA (niebieski punkt) jest punktem odstającym i jest punktem o dużej dźwigni- zatem jest punktem wpływowym. Punkty odstające które nie mają dużej dźwigni nie są wpływowe
18 Regresja nieliniowa
19 Regresja nieliniowa Motywacja Celem wprowadzenia regresji nieliniowej jest próba poradzenia sobie z sytuacjami, gdy relacja pomiędzy zmieną objaśnianą a zmienną objaśniającą ma charakter nieliniowy. W większości przypadków problem sprowadza się do znalezienia pewnej transformacji jednej lub obu zmiennych (objaśnianej i objaśniającej), tak, aby uczynić ich wzajemną relację liniową. Następnie stosowana jest klasyczna metoda regresji liniowej.
20 Przykład 2.1 -Dane "pressure" Dane opisują związek pomiędzy temperaturą w stopniach Celsjusza a ciśnieniem pary rtęci w milimetrach. W danych mamy dwie zmienne: temperature w stopniach Celsjusza oraz pressure - ciśnienie pary rtęci ( w milimetrach rtęci). Dane pochodzą z książki "Handbook of Chemistry and Physics", CRC Press (1973). Wczytanie i podsumowanie danych: 1 data ( pressure ) 2 str ( pressure ) ## podsumowanie zawartości zbioru danych 3 summary ( pressure ) ## podsumowanie zawartości zbioru danych 4 help ( pressure ) ## wyswietla informację na temat zbioru dancyh
21 Przykład 2.1 -Dane "pressure" 1 str ( pressure ) ## podsumowanie zawartości zbioru danych data.frame : 19 obs. of 2 variables: $ temperature: num $ pressure : num summary ( pressure ) ## podsumowanie zawartości zbioru danych temperature pressure Min. : 0 Min. : st Qu.: 90 1st Qu.: Median :180 Median : Mean :180 Mean : rd Qu.:270 3rd Qu.: Max. :360 Max. :
22 Przykład 2.1 -Dane "pressure" Wyjaśnienie: Gdy ciecz jest umieszczona w próżni, zaczyna wyparowywać. Ten proces trwa do momentu gdy ciecz i para osiągną równowagę dynamiczną (liczba cząsteczek cieczy, które przejdą w parę jest równa liczbie cząsteczek pary, które przejdą w ciecz). Wówczas ciśnienie wywierane przez parę na ciecz jest nazywane ciśnieniem pary (lub ciśnieniem pary w równowadze) danej substancji. Ciśnienie pary ma skomplikowany związek z temperaturą i (najprawdopodobniej) nie zostało to opisane za pomocą teoretycznego prawa ( przynajmniej w przypadku rtęci). Ponieważ tutaj zajmujemy się fazą przejściową pomiędzy cieczą a parą, a nie tylko gazem, standardowe prawa nie mają zastosowania.
23 Przykład 2.1 -Dane "pressure" Ciśnienie pary dla rtęci i jego związek z temperaturą było istotnym problemem pojawiającym się na przykład w sytuacji skalowania narzędzi naukowych takich jak termometry rtęciowe i barometry. W celu urealnienia problemu przekształcamy jednostki do jednostek SI. 1 pressure $ temperature = pressure $ temperature pressure $ pressure = pressure $ pressure * summary ( pressure ) temperature pressure Min. :273.1 Min. :2.666e-05 1st Qu.: st Qu.:2.399e-02 Median :453.1 Median :1.173e+00 Mean :453.1 Mean :1.657e+01 3rd Qu.: rd Qu.:1.686e+01 Max. :633.1 Max. :1.074e+02 Są to przekształcenia liniowe a zatem nie będą miały wpływu na rodzaj zależności pomiędzy zmiennymi.
24 Przykład 2.1 -Dane "pressure" Dla uproszczenia późniejszego zapisu zastępujemy formuły typu pressure$pressure prostszymi wyrażeniami. 1 pres = pressure $ pressure 2 temp = pressure $ temperature 3 rm( pressure ) ## usunięcie zbędnych zmiennych
25 Przykład 2.1 -Dane "pressure" Zaczynamy od narysowania danych 1 par ( mfrow=c (1,4) ) # jeden wiersz na 4 rysunki 2 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)")
26 Przykład 2.1 -Dane "pressure" Widząc kształt wykresu danych możemy pomyśleć że związek pomiędzy zmiennymi ma charakter wykładniczy. A zatem stosujemy transformację logarytmiczną. Można to zrobić na dwa sposoby - albo transformując zmienna za pomocą komendy logpres=log(pres), lub rysując dane na zmienionej skali log=y.
27 Przykład 2.1 -Dane "pressure" 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="y")
28 Przykład 2.1 -Dane "pressure" Po transformacji okazuje się że jest istotnie lepiej, jednak dane wydają się być przekorygowane. Próbujemy następnie zastosować transformację logarytmiczną zarówno dla zmiennej x jak i zmiennej y.
29 Przykład 2.1 -Dane "pressure" 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="xy")
30 Przykład 2.1 -Dane "pressure" Jak widać to polepsza wynik, ale nadal mamy widoczną łukowatą strukturę zależności.
31 Przykład 2.1 -Dane "pressure" Sprawdzamy co się stanie jeśli zastosujemy transformację logarytmiczną tylko dla x: 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="x")
32 Przykład 2.1 -Dane "pressure" Jak widać wynik jest podobny do sytuacji wyjściowej, co nie rozwiązuje naszego problemu. Mimo, że wiemy już, że model nie jest poprawny ( na podstawie rysunków),dopasujmy modele liniowe do transformacji wykładniczej i logarytmicznej, aby zilustrować proces. 1 par ( mfrow=c (1,2) ) # jeden wiersz na dwa rysunki 2 lm. out1 = lm( log ( pres ) ~ temp ) # model wykładniczy 3 plot ( lm. out1$fitted, lm. out1$resid ) # rysunek reszt 4 5 lm. out2 = lm( log ( pres ) ~ log ( temp )) # transformacja log dla x i y 6 plot ( lm. out2$fitted, lm. out2$resid ) # rysunek reszt
33 Przykład 2.1 -Dane "pressure" Na wykresach widać wyraźnie nielosowy układ danych według pewnej krzywej, co sugeruje, że zastosowane modele są niewłaściwe.
34 Regresja wielomianowa Definicja Wielomianem zmiennej x rzędu k nazywamy funkcję f (x) = a k x k + a k 1 x k a 1 x + a 0 Wielomian odpowiedniego rzędu będzie pasował idealnie do wykresu danych. Jeśli rząd wielomianu jest o jeden mniejszy od liczby punktów do których ma być dopasowany, to dopasowanie będzie idealne. Jednakże nie będzie to w żaden sposób użyteczne i nie będzie miało żadnej mocy objaśniającej. Zobaczmy, co możemy uzyskać stosując wielomiany niższego rzędu.
35 Regresja wielomianowa Wystarczy spojrzeć na wykres danych aby stwierdzić, że nie jest to parabola, a zatem zaczynamy od próby dopasowania wielomianu rzędu 3.
36 Regresja wielomianowa Chcemy dopasować model postaci pres = β 0 + β 1 temp + β 2 temp 2 + β 3 temp 3 Trzema zmiennymi objaśniającymi są: temp, temp 2 oraz temp 3 Druga i trzecia potęga zmiennej temp musi być wprowadzona do modelu za pomocą wyrażeń I (temp 2 ) oraz I (temp 3 ) odpowiednio. 1 lm. out3 = lm( pres ~ temp + I( temp ^2) + I( temp ^3) ) 2 summary ( lm. out3 ) Call: lm(formula = pres ~ temp + I(temp^2) + I(temp^3)) Residuals: Min 1Q Median 3Q Max
37 Regresja wielomianowa Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e e-06 *** temp 3.804e e e-07 *** I(temp^2) e e e-07 *** I(temp^3) 8.440e e e-08 *** Residual standard error: on 15 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 15 DF, p-value: 5.89e-15 Wszystkie trzy zmienne są istotne (wyraz wolny także) Współczynnik dopasowania modelu - skorygowane R 2 - wynosi 0.987, co może sugerować bardzo dobre dopasowanie modelu Jednak wykres reszt wykazuje, że nasz model jest niewłaściwy:
38 Regresja wielomianowa 1 par ( mfrow=c (1,1) ) 2 plot ( lm. out3$fitted, lm. out3$resid )
39 Regresja wielomianowa Aby zobaczyć dlaczego tak jest : 1 plot ( pres ~ temp ) 2 curve ( *x *x ^ *x^3, add=t)
40 Regresja wielomianowa Krzywa wyznaczona równaniem wielomianowym ma wyraźne punkty przegięcia W danych takich punktów nie ma Zwiększenie stopnia wielomianu jest naturalnym rozszerzeniem powyższego modelu i polepszy dopasowanie Nie doprowadzi nas jednak do uzyskania właściwego modelu
41 Transformacja Boxa-Coxa W sytuacjach takich jak powyższa użytecznym narzędziem może się okazać transformacja odwrotna (Huber et al., 2006, Industrial & Engineering Chemistry Reseach, 45 (21), ) 1 plot ( pres ~ I(1/ temp ))
42 Transformacja Boxa-Coxa Sama taka transformacja nie jest jednak wystarczająca Transformacja Boxa-Coxa pozwala nam znaleźć optymalne rozwiązanie (transformację zmiennej objaśnianej) stosując metodę największej wiarogodności Klasę transformacji Boxa-Coxa określa się następująco t λ (x) = { x λ 1 λ, λ 0 ln(x), λ = 0 dla x > 0 Wybór λ dokonywany metodą największej wiarogodności
43 1 library (" MASS ") 2 par ( mfrow=c (1,2) ) 3 boxcox ( pres ~ I(1/ temp )) # podstawowy wykres box - cox 4 boxcox ( pres ~ I(1/ temp ), lambda = seq ( -.2,.2,.01) ) Rysunek sugeruje, że powinniśmy wybrać λ bardzo bliskie zeru, czyli t λ (x) = ln(x).
44 Transformacja Boxa-Coxa- Dane po transformacji 1 plot ( log ( pres ) ~ I(1/ temp ))
45 Transformacja Boxa-Coxa- Dopasowanie modelu 1 lm. out4 = lm( log ( pres ) ~ I(1/ temp )) 2 summary ( lm. out4 ) Call: lm(formula = log(pres) ~ I(1/temp)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.626e e <2e-16 *** I(1/temp) e e <2e-16 *** Residual standard error: on 17 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 1.59e+05 on 1 and 17 DF, p-value: < 2.2e-16
46 Transformacja Boxa-Coxa- Dopasowanie modelu Wnioski Bardzo dobre dopasowanie modelu (R 2 = ) Model dopasowany ma postać log(pres) = temp Sprawdzamy dopasowanie na wykresach:
47 Transformacja Boxa-Coxa- Dopasowanie modelu 1 par ( mfrow=c (2,2) ) 2 plot ( lm. out4 )
48 Jak to interpretować? Po dopasowaniu modelu powinniśmy sprawdzić czy spełnione są przyjęte założenia Jeżeli założenia modelu są spełnione to reszty modelu (residua) powinny mieć rozkład normalny o równych wariancjach Założenia modelu możemy badać weryfikując własności reszt. Służą temu wykresy diagnostyczne.
49 Jak to interpretować? Wykres Residuals vs Fitted Oś pozioma - wartości dopasowane przez model Ŷ i Oś pionowa - wartości residuów e i = Y i Ŷ i. Dla modelu adekwatnego residua mają jednorodną wariancję i lokalną średnią równą zero. Możemy ocenić: czy średnia wartość residuów zależy od Ŷi (ma nie zależeć) czy średnia wartość residuów jest bliska zeru ( ma być bliska zeru) czy wariancja zmienia sę dla różnych wartości Ŷi (ma się nie zmieniać) czy wariancja jest jednorodna (ma być jednorodna)
50 Jak to interpretować? Wykres Normal Q-Q (wykres kwantylowy dla rozkładu normalnego) Oś pozioma - wartości kwantyli rozkładu normalnego odpowiadające residuom e i = Y i Ŷ i. Oś pionowa - kwantyle empiryczne dla standaryzowanych residuów Dla modelu adekwatnego residua mają rozkład normalny, a więc punkty na wykresie powinny układać się wzdłuż linii prostej Odstępstwa od tej linii sugerują brak normalności i dają podstawę do zastosowania transformacji nieliniowej Przy dużych rozmiarach prób nie należy się przejmować niewielkim odstępstwem od normalności
51 Jak to interpretować? Wykres Scale - Location Oś pozioma - wartości dopasowane przez model Ŷ i. Oś pionowa - pierwiastki z modułów standaryzowanych residuów. Dla modelu adekwatnego spodziewamy się równomiernie rozmieszczonych punktów wzdłuż osi poziomej Obecność jakiejkolwiek regularności lub trendu sugeruje odstępstwo od założenia o jednorodnej wariancji.
52 Jak to interpretować? Wykres Residuals vs Leverage Służy do wykrywania obserwacji nietypowych
53 Jak to interpretować? Wykres Residuals vs Leverage Oś pionowa - standaryzowane residua. Oś pozioma - siły dźwigni (leverage) tj. miary wpływu danej obserwacji na ocenę modelu. Siła dźwigni hi określa jaki wpływ na ocenę współczynników modelu ma obserwacja X i, czyli jak bardzo różnią się oceny współczynników dla modelu z tą obserwacja i dla modelu bez tej obserwacji. W modelu adekwatnym pojedyncza obserwacja nie powinna mieć znacząco silniejszego wpływu na ocenę współczynników niż pozostałe. Wartości residuów nie powinny być znacząco różne od zera. Miarą wpływu obserwacji X i jest także odległość Cooka Jeżeli dla jakiejś obserwacji odległość jest większa od 1 to dana obserwacja może być błędem pomiarowym lub wskazywać na złe określenie modelu.
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: Eksploracja (mining) Problemy: Jedna zmienna 2000 najwi ększych
Bardziej szczegółowoRegresja liniowa w R Piotr J. Sobczyk
Regresja liniowa w R Piotr J. Sobczyk Uwaga Poniższe notatki mają charakter roboczy. Mogą zawierać błędy. Za przesłanie mi informacji zwrotnej o zauważonych usterkach serdecznie dziękuję. Weźmy dane dotyczące
Bardziej szczegółowoRegresja liniowa wprowadzenie
Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem
Bardziej szczegółowoAnaliza regresji część III. Agnieszka Nowak - Brzezińska
Analiza regresji część III Agnieszka Nowak - Brzezińska Są trzy typy obserwacji, które mogą ale nie muszą wywierać nadmiernego nacisku na wyniki regresji: Obserwacje oddalone (outlier) Obserwacje wysokiej
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowoAnaliza zależności cech ilościowych regresja liniowa (Wykład 13)
Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny
Bardziej szczegółowoPODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Regresja liniowa Korelacja Modelowanie Analiza modelu Wnioskowanie Korelacja 3 Korelacja R: charakteryzuje
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12
Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie
Bardziej szczegółowoAnaliza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Bardziej szczegółowoWERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Bardziej szczegółowoModel regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago
Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,
Bardziej szczegółowoRegresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Bardziej szczegółowoKORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
Bardziej szczegółowoLepiej zapobiegać niż leczyć Diagnostyka regresji
Anceps remedium melius quam nullum Lepiej zapobiegać niż leczyć Diagnostyka regresji Na tych zajęciach nauczymy się identyfikować zagrożenia dla naszej analizy regresji. Jednym elementem jest oczywiście
Bardziej szczegółowoRegresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
Bardziej szczegółowoNatalia Nehrebecka Stanisław Cichocki. Wykład 13
Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje
Bardziej szczegółowoistocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy
MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze
Bardziej szczegółowoDiagnostyka modelu. Dowód [5.4] Dowód [ ]
Diagnostyka modelu Dowód [5.4] Dowód [5.5-5.6] Przykład > head(savings) sr pop15 pop75 dpi ddpi Australia 11.43 29.35 2.87 2329.68 2.87 Austria 12.07 23.32 4.41 1507.99 3.93 Belgium 13.17 23.80 4.43 2108.47
Bardziej szczegółowoStatystyka w analizie i planowaniu eksperymentu
23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja
Bardziej szczegółowoAnaliza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
Bardziej szczegółowo7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 4
Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik
Bardziej szczegółowo3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Bardziej szczegółowoTestowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Bardziej szczegółowo3a. Wstęp: Elementarne równania i nierówności
3a. Wstęp: Elementarne równania i nierówności Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie zima 2017/2018 Grzegorz Kosiorowski (Uniwersytet Ekonomiczny 3a. Wstęp: w Krakowie) Elementarne równania
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoZmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Bardziej szczegółowoRozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Bardziej szczegółowoRegresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
Bardziej szczegółowoTemat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji
Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej
Bardziej szczegółowoRegresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
Bardziej szczegółowoWprowadzenie do technik analitycznych Metoda najmniejszych kwadratów
Wprowadzenie do technik analitycznych Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Wykład 2 Korelacja i regresja Przykład: Temperatura latem średnia liczba napojów sprzedawanych
Bardziej szczegółowoEstymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Bardziej szczegółowoROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. LICZBA TEMAT GODZIN LEKCYJNYCH Potęgi, pierwiastki i logarytmy (8 h) Potęgi 3 Pierwiastki 3 Potęgi o wykładnikach
Bardziej szczegółowoTestowanie hipotez statystycznych.
Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio
Bardziej szczegółowoAnaliza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Bardziej szczegółowoNowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: 2000 największych spółek światowych z 2004 (Forbes Magazine)
Bardziej szczegółowoStatystyczne metody analizy danych przy użyciu środowiska R
Statystyczne metody analizy danych przy użyciu środowiska R Agnieszka Nowak - Brzezińska Instytut Informatyki, Uniwersytet Śląski Wybrane zagadnienia Plan wystąpienia 1. Wprowadzenie. 2. Środowisko R.
Bardziej szczegółowoStatystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34
Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoPermutacyjna metoda oceny istotności regresji
Permutacyjna metoda oceny istotności regresji (bez założenia normalności) f
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowoZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II
ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II POZIOM ROZSZERZONY Równania i nierówności z wartością bezwzględną. rozwiązuje równania i nierówności
Bardziej szczegółowoZadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoANALIZA REGRESJI SPSS
NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek
Bardziej szczegółowoKORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Bardziej szczegółowoK wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)
Bardziej szczegółowoWykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Bardziej szczegółowoFunkcja kwadratowa. f(x) = ax 2 + bx + c,
Funkcja kwadratowa. Funkcją kwadratową nazywamy funkcję f : R R określoną wzorem gdzie a, b, c R, a 0. f(x) = ax 2 + bx + c, Szczególnym przypadkiem funkcji kwadratowej jest funkcja f(x) = ax 2, a R \
Bardziej szczegółowoStatystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31
Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoZadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Bardziej szczegółowoOutlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.
Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą
Bardziej szczegółowo( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Bardziej szczegółowoEkonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoLINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU
LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości
Bardziej szczegółowoDopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Bardziej szczegółowoElementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Bardziej szczegółowoRegresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych
Etapy analizy regresji Regresja liniowa 1. zaproponowanie modelu, 2. sprawdzenie założeń dotyczących zmiennych, 3. wyszukanie wartości odstających, wpływających i dźwigni, 4. oszacowanie istotności modelu
Bardziej szczegółowoStosowana Analiza Regresji
prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile
Bardziej szczegółowoWymagania edukacyjne z matematyki klasa II technikum
Wymagania edukacyjne z matematyki klasa II technikum Poziom rozszerzony Obowiązują wymagania z zakresu podstawowego oraz dodatkowo: 1. JĘZYK MATEMATYKI I FUNKCJE LICZBOWE Uczeń otrzymuje ocenę dopuszczającą
Bardziej szczegółowoMetoda najmniejszych kwadratów
Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład 2 z 5
Agnieszka Nowak Brzezińska Wykład 2 z 5 metoda typ Zmienna niezależna Regresja liniowa Regresja Wszystkie ilościowe Zakłada liniową zależność, prosta w implementacji Analiza dyskryminacyjna klasyfikacja
Bardziej szczegółowoWykład 4 Związki i zależności
Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji Słownictwo: Zmienna
Bardziej szczegółowoWYKONUJEMY POMIARY. Ocenę DOSTATECZNĄ otrzymuje uczeń, który :
WYKONUJEMY POMIARY Ocenę DOPUSZCZAJĄCĄ otrzymuje uczeń, który : wie, w jakich jednostkach mierzy się masę, długość, czas, temperaturę wie, do pomiaru jakich wielkości służy barometr, menzurka i siłomierz
Bardziej szczegółowoRuch jednostajnie przyspieszony wyznaczenie przyspieszenia
Doświadczenie: Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia Cele doświadczenia Celem doświadczenia jest zbadanie zależności drogi przebytej w ruchu przyspieszonym od czasu dla kuli bilardowej
Bardziej szczegółowoWykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Bardziej szczegółowoOBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp
tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE
Bardziej szczegółowoPakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych
ZESPÓŁ SZKÓŁ HANDLOWO-EKONOMICZNYCH IM. MIKOŁAJA KOPERNIKA W BIAŁYMSTOKU Pakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych Mój przedmiot matematyka spis scenariuszy
Bardziej szczegółowoEkonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R
Bardziej szczegółowoFunkcja kwadratowa. f(x) = ax 2 + bx + c = a
Funkcja kwadratowa. Funkcją kwadratową nazywamy funkcję f : R R określoną wzorem gdzie a, b, c R, a 0. f(x) = ax + bx + c, Szczególnym przypadkiem funkcji kwadratowej jest funkcja f(x) = ax, a R \ {0}.
Bardziej szczegółowoWprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Bardziej szczegółowo1. Granice funkcji - wstępne definicje i obliczanie prostych granic
1. Granice funkcji - wstępne definicje i obliczanie prostych granic Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie rzegorz Kosiorowski (Uniwersytet Ekonomiczny 1. Granice w Krakowie) funkcji -
Bardziej szczegółowoWSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Bardziej szczegółowoPodziałka liniowa czy logarytmiczna?
Podziałka liniowa czy logarytmiczna? Bardzo często do graficznego przedstawienia pewnych zależności odpowiednie jest użycie podziałki liniowej na osi x i osi y wykonywanego wykresu. Są jednak przypadki,
Bardziej szczegółowoAnalizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
Bardziej szczegółowoMikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Bardziej szczegółowoAnaliza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
Bardziej szczegółowoWstęp do analizy matematycznej
Wstęp do analizy matematycznej Andrzej Marciniak Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych i ich zastosowań w
Bardziej szczegółowoANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8
ANALIZA REGRESJI WIELOKROTNEJ Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ZADANIE 1A 1. Irysy: Sprawdź zależność długości płatków korony od ich szerokości Utwórz wykres punktowy Wyznacz współczynnik
Bardziej szczegółowoWykład 4 Przebieg zmienności funkcji. Badanie dziedziny oraz wyznaczanie granic funkcji poznaliśmy na poprzednich wykładach.
Wykład Przebieg zmienności funkcji. Celem badania przebiegu zmienności funkcji y = f() jest poznanie ważnych własności tej funkcji na podstawie jej wzoru. Efekty badania pozwalają naszkicować wykres badanej
Bardziej szczegółowoINFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
Bardziej szczegółowoAnaliza regresji część II. Agnieszka Nowak - Brzezińska
Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej
Bardziej szczegółowoEkonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006
, transformacja liniowa i estymacja modelu KMNK Paweł Cibis pcibis@o2.pl 23 marca 2006 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności 2 3 Etapy transformacji
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoWYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony. Wiadomości i umiejętności
WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony Funkcja wykładnicza i funkcja logarytmiczna. Stopień Wiadomości i umiejętności -definiować potęgę
Bardziej szczegółowoStatystyka opisowa- cd.
12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa- cd. Wykład 4 Dr inż. Adam Deptuła HISTOGRAM UNORMOWANY Pole słupka = wysokość słupka x długość przedziału Pole słupka = n i n h h,
Bardziej szczegółowoLABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Bardziej szczegółowoFunkcja liniowa - podsumowanie
Funkcja liniowa - podsumowanie 1. Funkcja - wprowadzenie Założenie wyjściowe: Rozpatrywana będzie funkcja opisana w dwuwymiarowym układzie współrzędnych X. Oś X nazywana jest osią odciętych (oś zmiennych
Bardziej szczegółowoTestowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Bardziej szczegółowoProjekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski
Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem
Bardziej szczegółowo2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.
ZAKRES ROZSZERZONY 1. Liczby rzeczywiste. Uczeń: 1) przedstawia liczby rzeczywiste w różnych postaciach (np. ułamka zwykłego, ułamka dziesiętnego okresowego, z użyciem symboli pierwiastków, potęg); 2)
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA PROSTO DO MATURY KLASA 1 ZAKRES PODSTAWOWY
PRZEDMIOTOWY SYSTEM OCENIANIA PROSTO DO MATURY KLASA 1 ZAKRES PODSTAWOWY Warszawa 2019 LICZBY RZECZYWISTE stosować prawidłowo pojęcie zbioru, podzbioru, zbioru pustego; zapisywać zbiory w różnej postaci
Bardziej szczegółowoMetody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Bardziej szczegółowoPLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY. I. Proste na płaszczyźnie (15 godz.)
PLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY I. Proste na płaszczyźnie (15 godz.) Równanie prostej w postaci ogólnej Wzajemne połoŝenie dwóch prostych Nierówność liniowa z dwiema niewiadomymi
Bardziej szczegółowoSTATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Bardziej szczegółowo