PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa

Wielkość: px
Rozpocząć pokaz od strony:

Download "PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa"

Transkrypt

1 Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa

2 Obserwacje nietypowe i wpływowe

3 Obserwacje nietypowe i wpływowe Obserwacje nietypowe w analizie regresji: nietypowe wartości zmiennej Y - prowadzące do dużych reszt modelu e i nietypowe wartości jednej lub większej liczby zmiennych objaśniających - prowadzą do relatywnie małych wartości e i Dla MNK są problematyczne, gdyż w znacznym stopniu determinują postać prostej regresji - są wpływowe Jeżeli obserwacja posiada nietypową wartość Y (duże e i ), to mówimy że ma dużą odmienność. Rysunek przedstawia przykład obserwacji wpływowej.

4 Obserwacje nietypowe i wpływowe Jeżeli obserwacja posiada nietypową wartość X i i typową wartość Y i (małe e i ) to mówimy że ma dużą dźwignię (ang. leverage). Rysunek przedstawia przykład obserwacji o dużej dźwigni.

5 Leverage? Aby wyjaśnić pojęcie punktów o dużej dźwigni (leverage) rozważmy dane pochodzące z pracy Freedman et al. (1991) Dane dotyczą liczby wypalanych papierosów w różnych krajach w 1930 roku oraz liczby zgonów (liczba zgonów na milion mieszkańców) spowodowanych rakiem płuc w 1950 roku. Country Cigarette Deaths 1 Australia Canada Denmark Finland Great Britain Iceland Netherlands Norway Sweden Switzerland USA

6 Punkty o dużej dźwigni (leverage) Niebieski punkt nazywamy punktem o dużej dźwigni (leverage point)

7 Punkty o dużej dźwigni (leverage) Mają nietypową wartość x (x- liczba papierosów, y-liczba zgonów) Mają wpływ na własności modelu: Radykalnie zmieniają wartości błędów standardowych i współczynnika dopasowania R 2 Model dopasowany - wszystkie dane y = x Adjusted R 2 = Model dopasowany - po usunięciu punktu o dużej dźwigni: y = x Adjusted R 2 =

8 Obserwacje odstające (ang. outliers) Obserwacja odstajaca: jest obserwacją, która nie spełnia równania regresji czyli nie należy do prostej regresji. może znacząco wpływać na postać prostej regresji. Jeśli analizujemy tylko pojedyncze zmienne objaśniające, to identyfikacja obserwacji odstajacych odbywa się na podstawie wykresów rozrzutu lub histogramów. Jeśli chcemy szukać obserwacji odstających dla wielu zmiennych, wówczas możemy analizowac residua lub residua studentyzowane i wsród nich szukać wartości odstających.

9 Wyznaczanie obserwacji odstających Niech e = (e 1, e 2,..., e n ) oznacza wektor wartości resztowych (residuów),gdzie e i = Y i Ŷ i. Błędem standardowym residuum e i nazywamy ( SE ei = S 1 1 n + (X i X ) 2 n ), i=1 (X i X ) 2 gdzie S 2 = 1 n n (X i X ) 2. i=1 Wtedy studentyzowana wartość resztowa wynosi r i = e i SE ei.

10 Wyznaczanie obserwacji odstających Na podstawie wykresu studentyzowanych rezydów można rozpoznać duże ich wartości, będące najprawdopodobniej wartościami odstającymi. Obserwacja jest punktem odstającym jeśli ma dużą wartość standaryzowanej reszty Obserwacje odstające to takie, których wartości bezwzględne standaryzowanych reszt przekraczają 2.

11 Wyznaczanie obserwacji odstających Funkcja rstudent: 1 data1 <- read. table (" dane _ papierosy. txt ", header = TRUE, sep = "\t", quote = "\" ", dec =".") 2 x<- data1$ Cigarette 3 y<- data1$ Deaths 4 lm. linear <-lm(y~x) 5 reszty. stud <- rstudent (lm. linear ) 6 outlier. papierosy <- reszty. stud [ which. max ( abs ( reszty. stud ))] 7 outlier. papierosy Funkcja outliertest (pakiet car): 1 library ( car ) 2 outliertest ( lm. linear ) rstudent unadjusted p-value Bonferonni p Odstającą jest obserwacja jedenasta (USA) o wartości studentyzowanej reszty równej

12 Punkty wpływowe Punkt, który powoduje dużą różnicę w dopasowaniu prostej regresji nazywamy punktem wpływowym Wykrycie obserwacji wpływowych umożliwia pomiar odległości Cooka z tzw. modyfikowanymi residuami: Usuwamy obserwację potencjalnie wpływową i obliczamy różnicę w dopasowaniu. Obserwacja jest wpływowa jeśli ta różnica będzie wysoka. Odległość Cooka mierzy poziom wpływu obserwacji. Wyznaczamy ją następująco: n j=1 D i = (Ŷ j Yˆ j(i) ) 2 ps 2 Ŷj oznacza wartość przewidywaną przez model dla j-tej obserwacji wyznaczoną w modelu z usuniętą obserwacją i -tą ˆ Y j(i) wartość przewidywaną przez model dla j-tej obserwacji wyznaczoną w modelu z którego nie usunięto obserwacji i -tej. p - liczba parametrów w modelu.

13 Wyznaczanie punktów wpływowych Funkcja influenceplot: 1 influenceplot ( lm. linear, id. method = " identify ",id.n = 1, id. cex=1, id. col= palette () [1], main=" Wykres wpływów ", sub=" Rozmiar okręgów jest proporcjonalny do odległości Cooka ")

14 Wyznaczanie punktów wpływowych Klikając na interesujące nas obserwacje (o stosunkowo dużej średnicy okręgów) uzyskujemy ich indeksy na wykresie oraz wartości reszt i odległości Cooka. StudRes Hat CookD Za poziom krytyczny powyżej którego obserwacja może być uznana za wpływową przyjmuje się 1 lub 4 n, gdzie n jest liczbą obserwacji. W badanym przypadku 4 n = 4 11 = Obserwacje wpływowe to obserwacja 5. (Wielka Brytania) oraz 11. (USA)

15 Wyznaczanie punktów wpływowych Funkcja influence.measures: 1 influence. measures (lm. linear ) dfb.1_ dfb.x dffit cov.r cook.d hat inf e e e e e * e e e e e e * Ostatnia kolumna wskazuje punkty wpływowe zaznaczając przy nich gwiazdkę. Są to obserwacje 5.(wielka Brytania) i 11. (USA)

16 Punkty wpływowe Zazwyczaj punkty wpływowe mają następujące własności: Są punktami odstającymi, tzn. graficznie leżą daleko od pozostałych punktów danych Oznacza to, że związek pomiędzy x i y jest inny dla tych punktów niż dla pozostałych punktów w danych W przedstawionym przykładzie liczba zgonów w USA (niebieski punkt) jest niższa niż oczekiwalibyśmy na podstawie liczby wypalanych papierosów (prawdopodobnie dzięki lepszej opiece zdrowotnej) Wyznaczają punkt o dużej dźwigni, tzn wartość zmiennej x jest daleko od średniej. Obserwacje o bardzo małej, lub bardzo dużej wartości x są obserwacjami o dużej dźwigni.

17 Punkty wpływowe W przykładzie liczba zgonów w USA (niebieski punkt) jest punktem odstającym i jest punktem o dużej dźwigni- zatem jest punktem wpływowym. Punkty odstające które nie mają dużej dźwigni nie są wpływowe

18 Regresja nieliniowa

19 Regresja nieliniowa Motywacja Celem wprowadzenia regresji nieliniowej jest próba poradzenia sobie z sytuacjami, gdy relacja pomiędzy zmieną objaśnianą a zmienną objaśniającą ma charakter nieliniowy. W większości przypadków problem sprowadza się do znalezienia pewnej transformacji jednej lub obu zmiennych (objaśnianej i objaśniającej), tak, aby uczynić ich wzajemną relację liniową. Następnie stosowana jest klasyczna metoda regresji liniowej.

20 Przykład 2.1 -Dane "pressure" Dane opisują związek pomiędzy temperaturą w stopniach Celsjusza a ciśnieniem pary rtęci w milimetrach. W danych mamy dwie zmienne: temperature w stopniach Celsjusza oraz pressure - ciśnienie pary rtęci ( w milimetrach rtęci). Dane pochodzą z książki "Handbook of Chemistry and Physics", CRC Press (1973). Wczytanie i podsumowanie danych: 1 data ( pressure ) 2 str ( pressure ) ## podsumowanie zawartości zbioru danych 3 summary ( pressure ) ## podsumowanie zawartości zbioru danych 4 help ( pressure ) ## wyswietla informację na temat zbioru dancyh

21 Przykład 2.1 -Dane "pressure" 1 str ( pressure ) ## podsumowanie zawartości zbioru danych data.frame : 19 obs. of 2 variables: $ temperature: num $ pressure : num summary ( pressure ) ## podsumowanie zawartości zbioru danych temperature pressure Min. : 0 Min. : st Qu.: 90 1st Qu.: Median :180 Median : Mean :180 Mean : rd Qu.:270 3rd Qu.: Max. :360 Max. :

22 Przykład 2.1 -Dane "pressure" Wyjaśnienie: Gdy ciecz jest umieszczona w próżni, zaczyna wyparowywać. Ten proces trwa do momentu gdy ciecz i para osiągną równowagę dynamiczną (liczba cząsteczek cieczy, które przejdą w parę jest równa liczbie cząsteczek pary, które przejdą w ciecz). Wówczas ciśnienie wywierane przez parę na ciecz jest nazywane ciśnieniem pary (lub ciśnieniem pary w równowadze) danej substancji. Ciśnienie pary ma skomplikowany związek z temperaturą i (najprawdopodobniej) nie zostało to opisane za pomocą teoretycznego prawa ( przynajmniej w przypadku rtęci). Ponieważ tutaj zajmujemy się fazą przejściową pomiędzy cieczą a parą, a nie tylko gazem, standardowe prawa nie mają zastosowania.

23 Przykład 2.1 -Dane "pressure" Ciśnienie pary dla rtęci i jego związek z temperaturą było istotnym problemem pojawiającym się na przykład w sytuacji skalowania narzędzi naukowych takich jak termometry rtęciowe i barometry. W celu urealnienia problemu przekształcamy jednostki do jednostek SI. 1 pressure $ temperature = pressure $ temperature pressure $ pressure = pressure $ pressure * summary ( pressure ) temperature pressure Min. :273.1 Min. :2.666e-05 1st Qu.: st Qu.:2.399e-02 Median :453.1 Median :1.173e+00 Mean :453.1 Mean :1.657e+01 3rd Qu.: rd Qu.:1.686e+01 Max. :633.1 Max. :1.074e+02 Są to przekształcenia liniowe a zatem nie będą miały wpływu na rodzaj zależności pomiędzy zmiennymi.

24 Przykład 2.1 -Dane "pressure" Dla uproszczenia późniejszego zapisu zastępujemy formuły typu pressure$pressure prostszymi wyrażeniami. 1 pres = pressure $ pressure 2 temp = pressure $ temperature 3 rm( pressure ) ## usunięcie zbędnych zmiennych

25 Przykład 2.1 -Dane "pressure" Zaczynamy od narysowania danych 1 par ( mfrow=c (1,4) ) # jeden wiersz na 4 rysunki 2 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)")

26 Przykład 2.1 -Dane "pressure" Widząc kształt wykresu danych możemy pomyśleć że związek pomiędzy zmiennymi ma charakter wykładniczy. A zatem stosujemy transformację logarytmiczną. Można to zrobić na dwa sposoby - albo transformując zmienna za pomocą komendy logpres=log(pres), lub rysując dane na zmienionej skali log=y.

27 Przykład 2.1 -Dane "pressure" 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="y")

28 Przykład 2.1 -Dane "pressure" Po transformacji okazuje się że jest istotnie lepiej, jednak dane wydają się być przekorygowane. Próbujemy następnie zastosować transformację logarytmiczną zarówno dla zmiennej x jak i zmiennej y.

29 Przykład 2.1 -Dane "pressure" 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="xy")

30 Przykład 2.1 -Dane "pressure" Jak widać to polepsza wynik, ale nadal mamy widoczną łukowatą strukturę zależności.

31 Przykład 2.1 -Dane "pressure" Sprawdzamy co się stanie jeśli zastosujemy transformację logarytmiczną tylko dla x: 1 plot ( pres ~ temp, main=" Ciśnienie pary \n dla rtęci ", xlab=" Temperatura (w stopniach Kelvina )", ylab=" Ciśnienie ( kpascal -e)", log ="x")

32 Przykład 2.1 -Dane "pressure" Jak widać wynik jest podobny do sytuacji wyjściowej, co nie rozwiązuje naszego problemu. Mimo, że wiemy już, że model nie jest poprawny ( na podstawie rysunków),dopasujmy modele liniowe do transformacji wykładniczej i logarytmicznej, aby zilustrować proces. 1 par ( mfrow=c (1,2) ) # jeden wiersz na dwa rysunki 2 lm. out1 = lm( log ( pres ) ~ temp ) # model wykładniczy 3 plot ( lm. out1$fitted, lm. out1$resid ) # rysunek reszt 4 5 lm. out2 = lm( log ( pres ) ~ log ( temp )) # transformacja log dla x i y 6 plot ( lm. out2$fitted, lm. out2$resid ) # rysunek reszt

33 Przykład 2.1 -Dane "pressure" Na wykresach widać wyraźnie nielosowy układ danych według pewnej krzywej, co sugeruje, że zastosowane modele są niewłaściwe.

34 Regresja wielomianowa Definicja Wielomianem zmiennej x rzędu k nazywamy funkcję f (x) = a k x k + a k 1 x k a 1 x + a 0 Wielomian odpowiedniego rzędu będzie pasował idealnie do wykresu danych. Jeśli rząd wielomianu jest o jeden mniejszy od liczby punktów do których ma być dopasowany, to dopasowanie będzie idealne. Jednakże nie będzie to w żaden sposób użyteczne i nie będzie miało żadnej mocy objaśniającej. Zobaczmy, co możemy uzyskać stosując wielomiany niższego rzędu.

35 Regresja wielomianowa Wystarczy spojrzeć na wykres danych aby stwierdzić, że nie jest to parabola, a zatem zaczynamy od próby dopasowania wielomianu rzędu 3.

36 Regresja wielomianowa Chcemy dopasować model postaci pres = β 0 + β 1 temp + β 2 temp 2 + β 3 temp 3 Trzema zmiennymi objaśniającymi są: temp, temp 2 oraz temp 3 Druga i trzecia potęga zmiennej temp musi być wprowadzona do modelu za pomocą wyrażeń I (temp 2 ) oraz I (temp 3 ) odpowiednio. 1 lm. out3 = lm( pres ~ temp + I( temp ^2) + I( temp ^3) ) 2 summary ( lm. out3 ) Call: lm(formula = pres ~ temp + I(temp^2) + I(temp^3)) Residuals: Min 1Q Median 3Q Max

37 Regresja wielomianowa Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e e-06 *** temp 3.804e e e-07 *** I(temp^2) e e e-07 *** I(temp^3) 8.440e e e-08 *** Residual standard error: on 15 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 15 DF, p-value: 5.89e-15 Wszystkie trzy zmienne są istotne (wyraz wolny także) Współczynnik dopasowania modelu - skorygowane R 2 - wynosi 0.987, co może sugerować bardzo dobre dopasowanie modelu Jednak wykres reszt wykazuje, że nasz model jest niewłaściwy:

38 Regresja wielomianowa 1 par ( mfrow=c (1,1) ) 2 plot ( lm. out3$fitted, lm. out3$resid )

39 Regresja wielomianowa Aby zobaczyć dlaczego tak jest : 1 plot ( pres ~ temp ) 2 curve ( *x *x ^ *x^3, add=t)

40 Regresja wielomianowa Krzywa wyznaczona równaniem wielomianowym ma wyraźne punkty przegięcia W danych takich punktów nie ma Zwiększenie stopnia wielomianu jest naturalnym rozszerzeniem powyższego modelu i polepszy dopasowanie Nie doprowadzi nas jednak do uzyskania właściwego modelu

41 Transformacja Boxa-Coxa W sytuacjach takich jak powyższa użytecznym narzędziem może się okazać transformacja odwrotna (Huber et al., 2006, Industrial & Engineering Chemistry Reseach, 45 (21), ) 1 plot ( pres ~ I(1/ temp ))

42 Transformacja Boxa-Coxa Sama taka transformacja nie jest jednak wystarczająca Transformacja Boxa-Coxa pozwala nam znaleźć optymalne rozwiązanie (transformację zmiennej objaśnianej) stosując metodę największej wiarogodności Klasę transformacji Boxa-Coxa określa się następująco t λ (x) = { x λ 1 λ, λ 0 ln(x), λ = 0 dla x > 0 Wybór λ dokonywany metodą największej wiarogodności

43 1 library (" MASS ") 2 par ( mfrow=c (1,2) ) 3 boxcox ( pres ~ I(1/ temp )) # podstawowy wykres box - cox 4 boxcox ( pres ~ I(1/ temp ), lambda = seq ( -.2,.2,.01) ) Rysunek sugeruje, że powinniśmy wybrać λ bardzo bliskie zeru, czyli t λ (x) = ln(x).

44 Transformacja Boxa-Coxa- Dane po transformacji 1 plot ( log ( pres ) ~ I(1/ temp ))

45 Transformacja Boxa-Coxa- Dopasowanie modelu 1 lm. out4 = lm( log ( pres ) ~ I(1/ temp )) 2 summary ( lm. out4 ) Call: lm(formula = log(pres) ~ I(1/temp)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.626e e <2e-16 *** I(1/temp) e e <2e-16 *** Residual standard error: on 17 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 1.59e+05 on 1 and 17 DF, p-value: < 2.2e-16

46 Transformacja Boxa-Coxa- Dopasowanie modelu Wnioski Bardzo dobre dopasowanie modelu (R 2 = ) Model dopasowany ma postać log(pres) = temp Sprawdzamy dopasowanie na wykresach:

47 Transformacja Boxa-Coxa- Dopasowanie modelu 1 par ( mfrow=c (2,2) ) 2 plot ( lm. out4 )

48 Jak to interpretować? Po dopasowaniu modelu powinniśmy sprawdzić czy spełnione są przyjęte założenia Jeżeli założenia modelu są spełnione to reszty modelu (residua) powinny mieć rozkład normalny o równych wariancjach Założenia modelu możemy badać weryfikując własności reszt. Służą temu wykresy diagnostyczne.

49 Jak to interpretować? Wykres Residuals vs Fitted Oś pozioma - wartości dopasowane przez model Ŷ i Oś pionowa - wartości residuów e i = Y i Ŷ i. Dla modelu adekwatnego residua mają jednorodną wariancję i lokalną średnią równą zero. Możemy ocenić: czy średnia wartość residuów zależy od Ŷi (ma nie zależeć) czy średnia wartość residuów jest bliska zeru ( ma być bliska zeru) czy wariancja zmienia sę dla różnych wartości Ŷi (ma się nie zmieniać) czy wariancja jest jednorodna (ma być jednorodna)

50 Jak to interpretować? Wykres Normal Q-Q (wykres kwantylowy dla rozkładu normalnego) Oś pozioma - wartości kwantyli rozkładu normalnego odpowiadające residuom e i = Y i Ŷ i. Oś pionowa - kwantyle empiryczne dla standaryzowanych residuów Dla modelu adekwatnego residua mają rozkład normalny, a więc punkty na wykresie powinny układać się wzdłuż linii prostej Odstępstwa od tej linii sugerują brak normalności i dają podstawę do zastosowania transformacji nieliniowej Przy dużych rozmiarach prób nie należy się przejmować niewielkim odstępstwem od normalności

51 Jak to interpretować? Wykres Scale - Location Oś pozioma - wartości dopasowane przez model Ŷ i. Oś pionowa - pierwiastki z modułów standaryzowanych residuów. Dla modelu adekwatnego spodziewamy się równomiernie rozmieszczonych punktów wzdłuż osi poziomej Obecność jakiejkolwiek regularności lub trendu sugeruje odstępstwo od założenia o jednorodnej wariancji.

52 Jak to interpretować? Wykres Residuals vs Leverage Służy do wykrywania obserwacji nietypowych

53 Jak to interpretować? Wykres Residuals vs Leverage Oś pionowa - standaryzowane residua. Oś pozioma - siły dźwigni (leverage) tj. miary wpływu danej obserwacji na ocenę modelu. Siła dźwigni hi określa jaki wpływ na ocenę współczynników modelu ma obserwacja X i, czyli jak bardzo różnią się oceny współczynników dla modelu z tą obserwacja i dla modelu bez tej obserwacji. W modelu adekwatnym pojedyncza obserwacja nie powinna mieć znacząco silniejszego wpływu na ocenę współczynników niż pozostałe. Wartości residuów nie powinny być znacząco różne od zera. Miarą wpływu obserwacji X i jest także odległość Cooka Jeżeli dla jakiejś obserwacji odległość jest większa od 1 to dana obserwacja może być błędem pomiarowym lub wskazywać na złe określenie modelu.

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: Eksploracja (mining) Problemy: Jedna zmienna 2000 najwi ększych

Bardziej szczegółowo

Regresja liniowa w R Piotr J. Sobczyk

Regresja liniowa w R Piotr J. Sobczyk Regresja liniowa w R Piotr J. Sobczyk Uwaga Poniższe notatki mają charakter roboczy. Mogą zawierać błędy. Za przesłanie mi informacji zwrotnej o zauważonych usterkach serdecznie dziękuję. Weźmy dane dotyczące

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

Analiza regresji część III. Agnieszka Nowak - Brzezińska

Analiza regresji część III. Agnieszka Nowak - Brzezińska Analiza regresji część III Agnieszka Nowak - Brzezińska Są trzy typy obserwacji, które mogą ale nie muszą wywierać nadmiernego nacisku na wyniki regresji: Obserwacje oddalone (outlier) Obserwacje wysokiej

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Regresja liniowa Korelacja Modelowanie Analiza modelu Wnioskowanie Korelacja 3 Korelacja R: charakteryzuje

Bardziej szczegółowo

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12 Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje

Bardziej szczegółowo

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi

Bardziej szczegółowo

Lepiej zapobiegać niż leczyć Diagnostyka regresji

Lepiej zapobiegać niż leczyć Diagnostyka regresji Anceps remedium melius quam nullum Lepiej zapobiegać niż leczyć Diagnostyka regresji Na tych zajęciach nauczymy się identyfikować zagrożenia dla naszej analizy regresji. Jednym elementem jest oczywiście

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Natalia Nehrebecka Stanisław Cichocki. Wykład 13 Natalia Nehrebecka Stanisław Cichocki Wykład 13 1 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość 2 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje

Bardziej szczegółowo

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze

Bardziej szczegółowo

Diagnostyka modelu. Dowód [5.4] Dowód [ ]

Diagnostyka modelu. Dowód [5.4] Dowód [ ] Diagnostyka modelu Dowód [5.4] Dowód [5.5-5.6] Przykład > head(savings) sr pop15 pop75 dpi ddpi Australia 11.43 29.35 2.87 2329.68 2.87 Austria 12.07 23.32 4.41 1507.99 3.93 Belgium 13.17 23.80 4.43 2108.47

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4 Stanisław Cichocki Natalia Nehrebecka Wykład 4 1 1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

3a. Wstęp: Elementarne równania i nierówności

3a. Wstęp: Elementarne równania i nierówności 3a. Wstęp: Elementarne równania i nierówności Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie zima 2017/2018 Grzegorz Kosiorowski (Uniwersytet Ekonomiczny 3a. Wstęp: w Krakowie) Elementarne równania

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów Wprowadzenie do technik analitycznych Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski Wykład 2 Korelacja i regresja Przykład: Temperatura latem średnia liczba napojów sprzedawanych

Bardziej szczegółowo

Estymacja parametrów w modelu normalnym

Estymacja parametrów w modelu normalnym Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia

Bardziej szczegółowo

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. LICZBA TEMAT GODZIN LEKCYJNYCH Potęgi, pierwiastki i logarytmy (8 h) Potęgi 3 Pierwiastki 3 Potęgi o wykładnikach

Bardziej szczegółowo

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych. Bioinformatyka Wykład 6 Wrocław, 7 listopada 2011 Temat. Weryfikacja hipotez statystycznych dotyczących proporcji. Test dla proporcji. Niech X 1,..., X n będzie próbą statystyczną z 0-1. Oznaczmy odpowiednio

Bardziej szczegółowo

Analiza składowych głównych

Analiza składowych głównych Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi

Bardziej szczegółowo

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: 2000 największych spółek światowych z 2004 (Forbes Magazine)

Bardziej szczegółowo

Statystyczne metody analizy danych przy użyciu środowiska R

Statystyczne metody analizy danych przy użyciu środowiska R Statystyczne metody analizy danych przy użyciu środowiska R Agnieszka Nowak - Brzezińska Instytut Informatyki, Uniwersytet Śląski Wybrane zagadnienia Plan wystąpienia 1. Wprowadzenie. 2. Środowisko R.

Bardziej szczegółowo

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34 Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Permutacyjna metoda oceny istotności regresji

Permutacyjna metoda oceny istotności regresji Permutacyjna metoda oceny istotności regresji (bez założenia normalności) f

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II

ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II ZAGADNIENIA PROGRAMOWE I WYMAGANIA EDUKACYJNE DO TESTU PRZYROSTU KOMPETENCJI Z MATEMATYKI DLA UCZNIA KLASY II POZIOM ROZSZERZONY Równania i nierówności z wartością bezwzględną. rozwiązuje równania i nierówności

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

ANALIZA REGRESJI SPSS

ANALIZA REGRESJI SPSS NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14 Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Funkcja kwadratowa. f(x) = ax 2 + bx + c,

Funkcja kwadratowa. f(x) = ax 2 + bx + c, Funkcja kwadratowa. Funkcją kwadratową nazywamy funkcję f : R R określoną wzorem gdzie a, b, c R, a 0. f(x) = ax 2 + bx + c, Szczególnym przypadkiem funkcji kwadratowej jest funkcja f(x) = ax 2, a R \

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Zadania ze statystyki, cz.6

Zadania ze statystyki, cz.6 Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z

Bardziej szczegółowo

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości

Bardziej szczegółowo

Dopasowywanie modelu do danych

Dopasowywanie modelu do danych Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;

Bardziej szczegółowo

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący

Bardziej szczegółowo

Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych

Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych Etapy analizy regresji Regresja liniowa 1. zaproponowanie modelu, 2. sprawdzenie założeń dotyczących zmiennych, 3. wyszukanie wartości odstających, wpływających i dźwigni, 4. oszacowanie istotności modelu

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Wymagania edukacyjne z matematyki klasa II technikum

Wymagania edukacyjne z matematyki klasa II technikum Wymagania edukacyjne z matematyki klasa II technikum Poziom rozszerzony Obowiązują wymagania z zakresu podstawowego oraz dodatkowo: 1. JĘZYK MATEMATYKI I FUNKCJE LICZBOWE Uczeń otrzymuje ocenę dopuszczającą

Bardziej szczegółowo

Metoda najmniejszych kwadratów

Metoda najmniejszych kwadratów Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład 2 z 5

Agnieszka Nowak Brzezińska Wykład 2 z 5 Agnieszka Nowak Brzezińska Wykład 2 z 5 metoda typ Zmienna niezależna Regresja liniowa Regresja Wszystkie ilościowe Zakłada liniową zależność, prosta w implementacji Analiza dyskryminacyjna klasyfikacja

Bardziej szczegółowo

Wykład 4 Związki i zależności

Wykład 4 Związki i zależności Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji Słownictwo: Zmienna

Bardziej szczegółowo

WYKONUJEMY POMIARY. Ocenę DOSTATECZNĄ otrzymuje uczeń, który :

WYKONUJEMY POMIARY. Ocenę DOSTATECZNĄ otrzymuje uczeń, który : WYKONUJEMY POMIARY Ocenę DOPUSZCZAJĄCĄ otrzymuje uczeń, który : wie, w jakich jednostkach mierzy się masę, długość, czas, temperaturę wie, do pomiaru jakich wielkości służy barometr, menzurka i siłomierz

Bardziej szczegółowo

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia Doświadczenie: Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia Cele doświadczenia Celem doświadczenia jest zbadanie zależności drogi przebytej w ruchu przyspieszonym od czasu dla kuli bilardowej

Bardziej szczegółowo

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

Pakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych

Pakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych ZESPÓŁ SZKÓŁ HANDLOWO-EKONOMICZNYCH IM. MIKOŁAJA KOPERNIKA W BIAŁYMSTOKU Pakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych Mój przedmiot matematyka spis scenariuszy

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pawel@cibis.pl 9 marca 2007 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności Skorygowany R

Bardziej szczegółowo

Funkcja kwadratowa. f(x) = ax 2 + bx + c = a

Funkcja kwadratowa. f(x) = ax 2 + bx + c = a Funkcja kwadratowa. Funkcją kwadratową nazywamy funkcję f : R R określoną wzorem gdzie a, b, c R, a 0. f(x) = ax + bx + c, Szczególnym przypadkiem funkcji kwadratowej jest funkcja f(x) = ax, a R \ {0}.

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

1. Granice funkcji - wstępne definicje i obliczanie prostych granic

1. Granice funkcji - wstępne definicje i obliczanie prostych granic 1. Granice funkcji - wstępne definicje i obliczanie prostych granic Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie rzegorz Kosiorowski (Uniwersytet Ekonomiczny 1. Granice w Krakowie) funkcji -

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Podziałka liniowa czy logarytmiczna?

Podziałka liniowa czy logarytmiczna? Podziałka liniowa czy logarytmiczna? Bardzo często do graficznego przedstawienia pewnych zależności odpowiednie jest użycie podziałki liniowej na osi x i osi y wykonywanego wykresu. Są jednak przypadki,

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

Wstęp do analizy matematycznej

Wstęp do analizy matematycznej Wstęp do analizy matematycznej Andrzej Marciniak Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii informatycznych i ich zastosowań w

Bardziej szczegółowo

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ANALIZA REGRESJI WIELOKROTNEJ Zastosowanie statystyki w bioinżynierii Ćwiczenia 8 ZADANIE 1A 1. Irysy: Sprawdź zależność długości płatków korony od ich szerokości Utwórz wykres punktowy Wyznacz współczynnik

Bardziej szczegółowo

Wykład 4 Przebieg zmienności funkcji. Badanie dziedziny oraz wyznaczanie granic funkcji poznaliśmy na poprzednich wykładach.

Wykład 4 Przebieg zmienności funkcji. Badanie dziedziny oraz wyznaczanie granic funkcji poznaliśmy na poprzednich wykładach. Wykład Przebieg zmienności funkcji. Celem badania przebiegu zmienności funkcji y = f() jest poznanie ważnych własności tej funkcji na podstawie jej wzoru. Efekty badania pozwalają naszkicować wykres badanej

Bardziej szczegółowo

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne

Bardziej szczegółowo

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Analiza regresji część II. Agnieszka Nowak - Brzezińska Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej

Bardziej szczegółowo

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006 , transformacja liniowa i estymacja modelu KMNK Paweł Cibis pcibis@o2.pl 23 marca 2006 1 Miary dopasowania modelu do danych empirycznych Współczynnik determinacji Współczynnik zbieżności 2 3 Etapy transformacji

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony. Wiadomości i umiejętności

WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony. Wiadomości i umiejętności WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony Funkcja wykładnicza i funkcja logarytmiczna. Stopień Wiadomości i umiejętności -definiować potęgę

Bardziej szczegółowo

Statystyka opisowa- cd.

Statystyka opisowa- cd. 12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa- cd. Wykład 4 Dr inż. Adam Deptuła HISTOGRAM UNORMOWANY Pole słupka = wysokość słupka x długość przedziału Pole słupka = n i n h h,

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Funkcja liniowa - podsumowanie

Funkcja liniowa - podsumowanie Funkcja liniowa - podsumowanie 1. Funkcja - wprowadzenie Założenie wyjściowe: Rozpatrywana będzie funkcja opisana w dwuwymiarowym układzie współrzędnych X. Oś X nazywana jest osią odciętych (oś zmiennych

Bardziej szczegółowo

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4. Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.

2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu. ZAKRES ROZSZERZONY 1. Liczby rzeczywiste. Uczeń: 1) przedstawia liczby rzeczywiste w różnych postaciach (np. ułamka zwykłego, ułamka dziesiętnego okresowego, z użyciem symboli pierwiastków, potęg); 2)

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA PROSTO DO MATURY KLASA 1 ZAKRES PODSTAWOWY

PRZEDMIOTOWY SYSTEM OCENIANIA PROSTO DO MATURY KLASA 1 ZAKRES PODSTAWOWY PRZEDMIOTOWY SYSTEM OCENIANIA PROSTO DO MATURY KLASA 1 ZAKRES PODSTAWOWY Warszawa 2019 LICZBY RZECZYWISTE stosować prawidłowo pojęcie zbioru, podzbioru, zbioru pustego; zapisywać zbiory w różnej postaci

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

PLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY. I. Proste na płaszczyźnie (15 godz.)

PLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY. I. Proste na płaszczyźnie (15 godz.) PLAN WYNIKOWY DLA KLASY DRUGIEJ POZIOM PODSTAWOWY I ROZSZERZONY I. Proste na płaszczyźnie (15 godz.) Równanie prostej w postaci ogólnej Wzajemne połoŝenie dwóch prostych Nierówność liniowa z dwiema niewiadomymi

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo