Zagadnienia regresji. Cz ± III Regresja wielokrotna Konspekt do zaj : Statystyczne metody analizy danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Zagadnienia regresji. Cz ± III Regresja wielokrotna Konspekt do zaj : Statystyczne metody analizy danych"

Transkrypt

1 Zagadnienia regresji. Cz ± III Regresja wielokrotna Konspekt do zaj : Statystyczne metody analizy danych 1 Wprowadzenie Agnieszka Nowak-Brzezi«ska 17 listopada 2009 Niech ogólne równanie regresji ma posta : ŷ = b 0 + b 1 x 1 + b 2 x b m x m + ɛ W takim modelu mamy zatem m zmiennych obja±niaj cych. Omawiaj c dot d regresj liniow (prost ) rozpatrywali±my jedynie takie przypadki zale»no- ±ci mi dzy zmiennymi obja±niaj cymi a obja±nianymi gdzie zmienna obja±niana byªa zale»na tylko od jednej konkretnej zmiennej obja±niaj cej. Jednak w praktyce niezwykle cz sto zmienna obja±niana zale»na jest nie od jednej ale od kilku (wielu) zmiennych obja±niaj cych. Pomiar wspóªczynnika determinacji dla jednej i wielu zmiennych obja±niaj cych, test t zale»no±ci mi dzy zmienn obja±nian a obja- ±niaj c a tak»e test istotno±ci F caªego modelu regresji oraz zagadnienie wspóªliniowo±ci s tematem niniejszych zaj. 2 Przykªad analizy wspóªczynnika R 2 dla jednej i wielu zmiennych obja±niaj cych Przykªad wykonamy dla zbioru danych z pªatkami ±niadaniowymi. Pobierzemy go z adresu Zbiór zawiera dane 77 rodzajów pªatków ±niadaniowych, które opisane s 14 atrybutami warunkowymi i jednym atrybutem decyzyjnym rating mówi cym o warto±ci od»ywczej pªatków w oparciu o informacje typu: calories, sugars, f iber, sodium, vitamins czy weight (oraz inne). 2.1 Przykªad analizy wspóªczynnika R 2 dla jednej zmiennej obja±niaj cej Procedura analizy wspóªczynnika determinacji R 2 dla jednej zmiennej obja±niaj cej mo»e wygl da nast puj co. Je±li zaªo»ymy,»e zmienn obja±nian ma by warto± od»ywcza pªatków (rating) za± zmienn obja±niaj c poziom cukrów (sugars) to komenda R wywoªuj c badanie zale»no±ci mi dzy tymi zmiennymi b dzie nastepuj ca: 1

2 lm(rating~sugars, data=dane) Wówczas peªny zapis okna dialogu z R-em b dzie nast puj cy: > dane<- read.table("c:\\cereals.data", header = TRUE, row.names = 1) > model<-lm(rating~sugars, data=dane) > summary(model) Call: lm(formula = rating ~ sugars, data = dane) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** sugars e-15 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 75 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 75 DF, p-value: 1.153e-15 > Widzimy zatem,»e równanie regresji, gdy zmienn obja±nian b dzie zmienna rating (warto± od»ywcza pªatków) za± obja±niaj c sugars (poziom cukrów), b dzie nast puj cej postaci: rating = -2.4 * sugars Teraz mo»emy przewidywa,»e gdy poziom cukrów wynosi np 1 to warto± od»ywcza pªatków b dzie wynosi 56.9 za± gdy poziom cukrów b dzie wynosiª np 10 wówczas warto± od»ywcza zmaleje do warto±ci 35.3 (patrz poni»ej). > predict(model,data.frame(sugars=10), level = 0.9, interval = "confidence") fit lwr upr > predict(model,data.frame(sugars=1), level = 0.9, interval = "confidence") fit lwr upr Przykªad analizy wspóªczynnika R 2 dla wielu zmiennych obja±niaj cych Jak ju» wspomnieli±my we wst pie, cz sto w ±wiecie rzeczywistym mamy do czynienia z zale»no±ciami zmiennej obja±niaj c nie od jednej zmiennej obja±nianej ale raczej od wielu zmiennych obja±niaj cych. Wykonanie tego typu analiz w pakiecie R nie jest rzecz trudn. Wr cz przeciwnie. Nim przeprowadzimy analiz zale»no±ci zmiennej rating od wielu zmiennych obja±niaj cych np. sugars oraz ber przyjrzyjmy si wykresom rozrzutu dla tych zmiennych osobno. Wykres rozrzutu bowiem doskonale odzwierciedla zale»no±ci mi dzy pojedynczymi zmiennymi. 2

3 wykres rozrzutu rating sugars Rysunek 1: Wykres rozrzutu dla zmiennej sugars wykres rozrzutu rating fiber Rysunek 2: Wykres rozrzutu dla zmiennej f iber Przykªad analizy zmiennej obja±nianej (a wi c warto±ci od»ywczej pªatków ze zbioru Cereals) od kilku zmiennych, np. sugars oraz ber (a wi c odpowiednio: poziom cukrów oraz bªonnik) przedstawiamy poni»ej. > model<-lm(rating~sugars+fiber, data=dane) > summary(model) 3

4 Call: lm(formula = rating ~ sugars + fiber, data = dane) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** sugars < 2e-16 *** fiber e-14 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 74 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 74 DF, p-value: < 2.2e-16 wtedy powiemy,»e równanie regresji b dzie wygl da nast puj co: rating = * sugars * fiber Czyli, aby zinterpetowa wspóªczynnik nachylenia prostej regresji b 1 = powiemy,»e warto± od»ywcza maleje o punktu, je±li zawarto± cukru ro- ±nie o jedn jednostk. Zakªadamy przy tym,»e zawarto± bªonnika (ber) jest staªa. Z kolei interpretacja wspóªczynnika b 2 = jest taka,»e warto± od-»ywcza ro±nie o punktu, je±li zawarto± bªonnika ro±nie o jedn jednostk a zawarto± cukru (sugars) jest staªa. Uogólniaj c b dziemy mówi,»e dla m zmiennych obja±niaj cych zachodzi reguªa, zgodnie z któr oszacowana zmiana warto±ci zmiennej odpowiedzi to b i, je±li warto± zmiennej x i ro±nie o jednostk i zakªadaj c,»e wszystkie pozostaªe warto±ci zmiennych s staªe. Bª dy predykcji s mierzone przy u»yciu reszt y ŷ. Co wa»ne: w prostej regresji liniowej reszty reprezentuj odlegªo± (mierzon wzdªu» osi pionowej) pomi dzy wªa±ciwym punktem danych a lini regresji. Za± w regresji wielokrotnej, reszta jest reprezentowana jako odlegªo± mi dzy wªa±ciwym punktem danych a pªaszczyzn lub hiperpªaszczyzn regresji. Przykªadowo pªatki Spoon Size Shredded Wheat zawieraj x 1 = 0 gramów cukru i x 2 = 3 gramy bªonnika, a ich warto± od»ywcza jest równa podczas gdy warto± oszacowana, podana za pomoc równania regresji: > predict(model, data.frame(sugars=0,fiber=3),level=0.95, interval="confidence") fit lwr upr > Zatem dla tych konkretnych pªatków reszta jest równa = Zwró my uwag na to,»e wyniki które tutaj zwraca fukcja R: predict s bardzo istotne. Mianowicie, oprócz podanej (oszacowanej, przewidywanej) warto- ±ci zmiennej obja±niaj cej, otrzymujemy równie» przedziaª ufno±ci na zadanym poziomie ufno±ci równym 0.95, który to przedziaª mie±ci si mi dzy warto±ci (lwr) a (upr). 4

5 Pami tamy z poprzednich zaj,»e z poj ciem regresji wi»e si poj cie wspóªczynnika determinacji R 2. R 2 = SSR SST, gdzie SSR to regresyjna suma kwadratów (SSR = n i=1 (ŷ ȳ)2 ) za± SST to caªkowita suma kwadratów (SST = n i=1 (y ȳ)2 ). B dziemy go interpetowa jako cz ± zmienno±ci zmiennej obja±nianej, która jest wyja±niana przez liniow zale»no± ze zbiorem zmiennych obja±niaj cych. Co wa»ne: Im wi ksza b dzie liczba zmiennych obja±niaj cych tym nie mniejsza b dzie warto± wspóªczynnika determinacji R 2. Mo»emy wnioskowa,»e gdy dodajemy now zmienn obja±niaj c do modelu, warto± R 2 b dzie nie mniejsza ni» przy modelu o mniejszej liczbie zmiennych. Oczywi±cie skala (wielko± ) tej ró»nicy jest bardzo istotnaw zale»no±ci od tego czy dodamy t zmienn do modelu czy te» nie. Je±li wzrost jest du»y to uznamy t zmienn za znacz c (przydatn ). Je±li takie reszty obliczymy dla ka»dej obserwacji to mo»liwe b dzie wyznaczenie warto±ci wspóªczynnika determinacji R 2. W naszym przypadku jest on równy czyli 80.92%. Oznacza to w naszej analizie,»e 80.92% zmienno±ci warto±ci od»ywczej jest wyja±niana przez liniow zale»no± (pªaszczyzn ) pomi dzy zmienn warto± od»ywcza a zbiorem zmiennych obja±niaj cych - zawarto±ci cukrów i zawarto±ci bªonnika. Je±li popatrzymy jaka byªa warto± tego wspóªczynnika, gdy badali±my na pocz tku zale»no± zmiennej obja±nianej tylko od jednej zmiennej obja±niaj cej (cukry) to warto± ta wynosiªa R 2 = 57.71%. Dla dwóch zmiennych obja±niaj cych ta warto±ci wyniosªa 80.92%. Czyli powiemy,»e dodaj c now zmienn obja±niaj c (w tym przypadku bªonnik) mo-»emy wyja±ni dodatkowe = 22.19% zmienno±ci warto±ci od»ywczej (rating) pªatków. Typowy bª d oszacowania jest tu obliczany jako standardowy bª d oszacowania s i wynosi 6.22 punktu. Oznacza to,»e estymacja warto±ci od»ywczej pªatków na podstawie zawarto±ci cukrów i bªonnika zwykle ró»ni si od wªa±ciwej warto±ci o 6.22 punktu. Je±li nowa zmienna jest przydatna, to bª d ten powinien si zmniejsza po dodaniu nowej zmiennej. Najprostszym sposobem na wybór optymalnej liczby zmiennych obja±niaj cych jest wspóªczynnik Radj 2 zwany uproszczonym wspóªczynnikiem. Je±li zaªo»ymy,»e R 2 = 1 SSE to wówczas warto± SST R2 adj obliczymy jako Radj 2 = 1 SSE(n p) SST (n 1) i zwykle ta warto± b dzie po prostu nieco mniejsza ni» warto± R 2. W ±rodowisku R wspóªczynnik determinacji R 2 wyznaczymy stosuj c bezpo±rednio komend : summary(model.liniowy)$r.square. Z kolei wspóªczynnik determinacji ale ten tzw. skorygowany (ang. adjusted) za pomoc komendy: summary(model.liniowy)$adj.r.squared. Chc c wyznaczy warto±ci tych wspóªczynników dla naszego testowego modelu w dwiema zmiennymi obja±niaj cymi sugars oraz f iber w ±rodowisku R u»yjemy odpowiednich komend, jak to pokazuje poni»szy kod R wraz z wynikami: > dane<- read.table("c:\\cereals.data", header = TRUE, row.names = 1) > model<-lm(rating~sugars+fiber, data=dane) > summary(model)$r.square [1]

6 > summary(model)$adj.r.squared [1] Jak widzimy wspóªczynnik R 2 wynosi za± R 2 adj odpowiednio Wyznaczenie obserwacji odstaj cych w modelu z wieloma zmiennymi obja±niaj cymi Chc c przeprowadzi test na obserwacje odstaj ce u»yjemy znanego ju» pakietu car i funkcji outlier.test w ramach tego pakietu. library(car) > outlier.test(model) max rstudent = , degrees of freedom = 73, unadjusted p = , Bonferroni p = Observation: Golden_Crisp Wykryto wi c jedn obserwacj odstaj c (pªatki o nazwie Golden_Crisp). Wyznaczenie obserwacji wpªywowych w modelu z wieloma zmiennymi obja±niaj cymi Warto±ci wpªywowe b dziemy wykrywa za pomoc fukcji influence.measures. Wyniki takiej analizy widzimy poni»ej. influence.measures(model) Influence measures of lm(formula = rating ~ sugars + fiber, data = dane) : dfb.1_ dfb.sgrs dfb.fibr dffit 100\%_Bran e \%_Natural_Bran e All-Bran e All-Bran_with_Extra_Fiber e Almond_Delight e Apple_Cinnamon_Cheerios e Apple_Jacks e Basic_ e Bran_Chex e Bran_Flakes e Cap'n'Crunch e Cheerios e Cinnamon_Toast_Crunch e Clusters e Cocoa_Puffs e Corn_Chex e Corn_Flakes e Corn_Pops e Count_Chocula e Cracklin'_Oat_Bran e Cream_of_Wheat_(Quick) e Crispix e Crispy_Wheat_&_Raisins e

7 Double_Chex e Froot_Loops e Frosted_Flakes e Frosted_Mini-Wheats e Fruit_&_Fibre_Dates,_Walnuts,_and_Oats e Fruitful_Bran e Fruity_Pebbles e Golden_Crisp e Golden_Grahams e Grape_Nuts_Flakes e Grape-Nuts e Great_Grains_Pecan e Honey_Graham_Ohs e Honey_Nut_Cheerios e Honey-comb e Just_Right_Crunchy Nuggets e Just_Right_Fruit_&_Nut e Kix e Life e Lucky_Charms e Maypo e Muesli_Raisins,_Dates,_&_Almonds e Muesli_Raisins,_Peaches,_&_Pecans e Mueslix_Crispy_Blend e Multi-Grain_Cheerios e Nut&Honey_Crunch e Nutri-Grain_Almond-Raisin e Nutri-grain_Wheat e Oatmeal_Raisin_Crisp e Post_Nat._Raisin_Bran e Product_ e Puffed_Rice e Puffed_Wheat e Quaker_Oat_Squares e Quaker_Oatmeal e Raisin_Bran e Raisin_Nut_Bran e Raisin_Squares e Rice_Chex e Rice_Krispies e Shredded_Wheat e Shredded_Wheat_'n'Bran e Shredded_Wheat_spoon_size e Smacks e Special_K e Strawberry_Fruit_Wheats e Total_Corn_Flakes e Total_Raisin_Bran e Total_Whole_Grain e Triples e Trix e Wheat_Chex e Wheaties e Wheaties_Honey_Gold e

8 cov.r cook.d hat inf 100\%_Bran e * 100\%_Natural_Bran e All-Bran e * All-Bran_with_Extra_Fiber e * Almond_Delight e Apple_Cinnamon_Cheerios e Apple_Jacks e Basic_ e Bran_Chex e Bran_Flakes e Cap'n'Crunch e Cheerios e Cinnamon_Toast_Crunch e Clusters e Cocoa_Puffs e Corn_Chex e Corn_Flakes e Corn_Pops e Count_Chocula e Cracklin'_Oat_Bran e Cream_of_Wheat_(Quick) e Crispix e Crispy_Wheat_&_Raisins e Double_Chex e Froot_Loops e Frosted_Flakes e Frosted_Mini-Wheats e * Fruit_&_Fibre_Dates,_Walnuts,_and_Oats e Fruitful_Bran e Fruity_Pebbles e Golden_Crisp e * Golden_Grahams e Grape_Nuts_Flakes e Grape-Nuts e Great_Grains_Pecan e Honey_Graham_Ohs e Honey_Nut_Cheerios e Honey-comb e Just_Right_Crunchy Nuggets e Just_Right_Fruit_&_Nut e Kix e Life e Lucky_Charms e Maypo e Muesli_Raisins,_Dates,_&_Almonds e Muesli_Raisins,_Peaches,_&_Pecans e Mueslix_Crispy_Blend e Multi-Grain_Cheerios e Nut&Honey_Crunch e Nutri-Grain_Almond-Raisin e Nutri-grain_Wheat e Oatmeal_Raisin_Crisp e Post_Nat._Raisin_Bran e * 8

9 Product_ e Puffed_Rice e Puffed_Wheat e Quaker_Oat_Squares e Quaker_Oatmeal e Raisin_Bran e Raisin_Nut_Bran e Raisin_Squares e Rice_Chex e Rice_Krispies e Shredded_Wheat e Shredded_Wheat_'n'Bran e Shredded_Wheat_spoon_size e Smacks e Special_K e Strawberry_Fruit_Wheats e Total_Corn_Flakes e Total_Raisin_Bran e Total_Whole_Grain e Triples e Trix e Wheat_Chex e Wheaties e Wheaties_Honey_Gold e > A wi c mamy zapewne 6 obserwacji wpªywowych. S to kolejno pªatki: 100%_Bran,All-Bran, All-Bran_with_Extra_Fiber czy Frosted_Mini-Wheats, Golden_Crisp (które zreszt uznali±my za obserwacj odstaj c, outlier) oraz Post_Nat._Raisin_Bran. 3 Wspóªliniowo± Gdy zmienne obja±niaj ce s wysoko skorelowane wyniki analizy regresji mog by niestabilne. Szacowana warto± zmiennej X j mo»e zmieni wielko± a nawet kierunek zale»nie od pozostaªych zmiennych obja±niaj cych zawartych w tak testowanym modelu regresji. Taka zale»no± liniowa mi dzy zmiennymi obja±niaj cymi mo»e zagra»a trafno±ci wyników analizy regresji. Zagadnieniami, które uj to tak»e na wykªadzie byªo zagadnienie dotycz ce analizy wspóªliniowo- ±ci zmiennych (ang. collinearity). Do wska¹ników oceniaj cych wspóªlniowo± nale»y, m.in VIF (Variance Ination Factor) zwany wspóªczynnikiem podbicia (inacji) wariancji. V IF pozwala wychwyci wzrost wariancji ze wzgl du na wspóªliniowo± cechy. Innymi sªowy: wskazuje on o ile wariancje wspóªczynników s zawy»one z powodu zale»no±ci liniowych w testowanym modelu. Niektóre pakiety statystyczne pozwalaj tak»e alternatywnie mierzy tzw. wspóªczynnik 1 toleracji (TOL - ang. tolerance), który mierzy si jako. V IF V IF i = (1 R 2 i ) 1 dla modelu x i = f(x 1,..., x i 1, x i+1,..., x p ) gdzie zmienna x i b dzie wyja- ±niana przez wszystkie pozostaªe zmienne. 9

10 Gdy V IF > 10 mówimy,»e wspóªliniowo± wyst piªa. Musimy j usun. Eliminacja wspoªliniowo±ci polega na usuni ciu z modelu cech, które s liniow kombinacj innych zmiennych niezale»nych. Rad na wspóªliniowo± jest wg niektórych prac zwi kszenie zbioru obserwacji o nowe, tak, by zmienimalizowa istniej ce zale»no±ci liniowe pomi dzy zmiennymi wyja±niaj cymi. Jednak wiadomym jest»e zwi kszenie liczby obserwacji nie gwarantuje poprawy - a wi c nie jest to dobry pomysª. Lepszym wydaje si komponowanie zmiennych zale»nych w nowe zmienne (np. waga i wzrost, które s skorelowane silnie, i zamiast nich tworzenie jednej zmiennej stosunek wzrostu do wagi). Tak now zmienn nazywa si w literaturze kompozytem. Cz sto - dla du»ej liczby zmiennych obja±niaj cych - stosuje sie metod analizy skªadowych gªównych (ang. principal component analysis która b dzie tematem odr bnych zaj ) dla redukcji liczby zmiennych do jednego lub kilku kompozytów niezale»nych. 3.1 Przykªad modelu ze wspóªliniowo±ci Dla modelu postaci: Y i = β 0 + β 1 X 1i + β 2 X 2i + β 3 X 3i + ɛ 1i w którym X 3i = 10 X 1i 2 X 2i powiemy,»e zmienna x 3 jest kombinacj liniow zmiennych x 1 i x 2. Próba szacowania takiego modelu zwi zana jest ze ±wiadomym popeªnianiem bª du, gdy» w modelu tym wyst puje dokªadna wspóªliniowo± (jedna ze zmiennych obja±niaj cych jest kombinacj liniow pozostaªych). W ±rodowisku R sprawdzanie wspóªliniowo±ci nie jest trudne. Wystarczy skorzysta z funkcji vif której argumentem jest model regresji dla danego zbioru danych. Przykªad dotycz cy naszego zbioru pªatków zbo»owych przedstawiamy poni»ej: > vif(lm(rating~sugars+fiber, data=dane)) sugars fiber Inaczej sprawa wygl da dla 1 stopnia swobody a inaczej dla wi kszej liczby stopni swobody, gdy oblicza si tzw. uogólniony wspoªoczynnik podbicia wariancji (GV IF ( 1/2Df)). 4 Jako± utworzonego modelu regresji Porównanie ró»nych modeli regresji jest niew tpliwie istotne, zwªaszcza gdy chcemy wybra ten tzw. najlepszy model. Jedn z metod oceniaj cych jako± modelu na podstawie miar dopasowania modelu dla modelu regresji liniowej jest wspóªczynnik determinacji R 2. Musimy jednak od razu zauwa»y,»e model taki mo»na ocenia ale w odniesieniu do próby ucz cej. A co z nowo dodawanymi do modelu danymi? Czy model wcze±niej okre±lony dla danych ucz cych jako poprawny i optymalny nadal takim musi by dla danych testowych? Ocen klasykatorów dla prób ucz cych i testowych rozwi» nam takie metody jak kroswalidacja, czy metoda bootstrap a tak»e wspóªczynniki czuªo±ci oraz specyczno±ci stosowane z tzw. krzywymi ROC. To zagadnienie b dzie przedmiotem odr bnych zaj. 10

11 4.1 Porównywanie modeli regresji Zaªó»my,»e chcemy porówna dwa modele regresji: lm(rating~sugarsber)+ oraz lm(rating~sugars). > regresja<-lm(rating~sugars+fiber, data=dane) > regresja1<-lm(rating~sugars, data=dane) > anova(regresja, regresja1) Analysis of Variance Table Model 1: rating ~ sugars + fiber Model 2: rating ~ sugars Res.Df RSS Df Sum of Sq F Pr(>F) e-14 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 > 4.2 Kryterium Akaikego u»yteczn miar dopasowania modelu U»yteczn miar dopasowania, szczególnie przy porównywaniu kilku konkurencyjnych modeli, jest tak»e warto± kryterium Akaikego, która dla danego modelu jest okre±lona jako: AIC = dev ω + 2(p + 1) gdzie p + 1 jest liczb parametrów modelu za± dev ω b dziemy nazywa odchyleniem modelu (ang. model deviance i dla naszego przypadku analizy rezyduuów b dzie po prostu sum kwadratów rezyduuów n i=1 y i ŷ i dla i = 1, 2,..., n). Czynnik 2(p + 1) odgrywa rol kary pªaconej za doª czenie nowych zmiennych do modelu i ma na celu zrównowa»enie oczywistego zmniejszenia si w takim przypadku odchylenia modelu. Maj c kilka modeli, wybierzemy ten, który cechuje si minimaln warto±ci AIC i co wa»ne jest opisany mo»liwie maª liczb parametrów. Mo»emy teraz wybra, który z utworzonych modeli jest lepszy. Pomocnym jest tutaj tzw. kryterium Akaikego. Wykorzystanie jego wªa±ciwo±ci w ±rodowisku R wygl da nast puj co: > dane<- read.table("c:\\cereals.data", header = TRUE, row.names = 1) > model<-lm(rating~sugars, data=dane) > model2<-lm(rating~sugars+fiber, data=dane) > AIC(model) [1] > AIC(model2) [1] Bibliograa Opracowanie przygotowano w oparciu o prace: 1. J. Koronacki i J. wik, Statystyczne systemy ucz ce si, wyd. II, Exit J. Koronacki i J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT

12 3. Daniel T. Larose, Metody i modele eksploracji danych, Tytuª oryginalny: Data Mining Methods and Models, Wydawnictwo Naukowe PWN Redakcja naukowa: Marek Walesiak, Eugeniusz Gatnar, Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN

Analiza regresji. Analiza korelacji.

Analiza regresji. Analiza korelacji. Analiza regresji. Analiza korelacji. Levels name mfr type calories protein fat sodium fiber carbo sugars potass vitamins shelf weight cups rating Storage 77 integer 7 integer 2 integer integer integer

Bardziej szczegółowo

Analiza regresji część III. Agnieszka Nowak - Brzezińska

Analiza regresji część III. Agnieszka Nowak - Brzezińska Analiza regresji część III Agnieszka Nowak - Brzezińska Są trzy typy obserwacji, które mogą ale nie muszą wywierać nadmiernego nacisku na wyniki regresji: Obserwacje oddalone (outlier) Obserwacje wysokiej

Bardziej szczegółowo

Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI

Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI Analiza regresji Analiza regresji jest bardzo popularną i chętnie stosowaną

Bardziej szczegółowo

Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych

Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych Opis zaj Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych Agnieszka Nowak-Brzezi«ska 28 pa¹dziernika 2009 Celem zaj jest realizacja praktyczna zagadnie«zwi zanych z analiz regresji,

Bardziej szczegółowo

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Analiza zależności cech ilościowych regresja liniowa (Wykład 13) Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny

Bardziej szczegółowo

Ekonometria - wykªad 8

Ekonometria - wykªad 8 Ekonometria - wykªad 8 3.1 Specykacja i werykacja modelu liniowego dobór zmiennych obja±niaj cych - cz ± 1 Barbara Jasiulis-Goªdyn 11.04.2014, 25.04.2014 2013/2014 Wprowadzenie Ideologia Y zmienna obja±niana

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład 2 z 5

Agnieszka Nowak Brzezińska Wykład 2 z 5 Agnieszka Nowak Brzezińska Wykład 2 z 5 metoda typ Zmienna niezależna Regresja liniowa Regresja Wszystkie ilościowe Zakłada liniową zależność, prosta w implementacji Analiza dyskryminacyjna klasyfikacja

Bardziej szczegółowo

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13 Elementarna statystyka Wnioskowanie o regresji (Inference for regression) Alexander Bendikov Uniwersytet Wrocªawski 2 czerwca 2016 Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for

Bardziej szczegółowo

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Metody statystyczne w biologii - Wykªad 8 Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Regresja logistyczna 1. Podstawy teoretyczne i przykªady zastosowania

Bardziej szczegółowo

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 2 Werykacja modelu liniowego (2) Ekonometria 1 / 33 Plan wicze«1 Wprowadzenie 2 Ocena dopasowania R-kwadrat Skorygowany R-kwadrat i kryteria informacyjne 3 Ocena istotno±ci zmiennych

Bardziej szczegółowo

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja

Bardziej szczegółowo

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,

Bardziej szczegółowo

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 1 Regresja liniowa i MNK (1) Ekonometria 1 / 25 Plan wicze«1 Ekonometria czyli...? 2 Obja±niamy ceny wina 3 Zadania z podr cznika (1) Ekonometria 2 / 25 Plan prezentacji 1 Ekonometria

Bardziej szczegółowo

Regresja liniowa w R Piotr J. Sobczyk

Regresja liniowa w R Piotr J. Sobczyk Regresja liniowa w R Piotr J. Sobczyk Uwaga Poniższe notatki mają charakter roboczy. Mogą zawierać błędy. Za przesłanie mi informacji zwrotnej o zauważonych usterkach serdecznie dziękuję. Weźmy dane dotyczące

Bardziej szczegółowo

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi

Bardziej szczegółowo

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 4 Prognozowanie (4) Ekonometria 1 / 18 Plan wicze«1 Prognoza punktowa i przedziaªowa 2 Ocena prognozy ex post 3 Stabilno± i sezonowo± Sezonowo± zadanie (4) Ekonometria 2 / 18 Plan

Bardziej szczegółowo

Regresja liniowa wprowadzenie

Regresja liniowa wprowadzenie Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem

Bardziej szczegółowo

wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia

wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. wiczenia 1 2 do wiczenia 3 4 Badanie do±wiadczalne 5 pomiarów 6 7 Cel Celem wiczenia jest zapoznanie studentów z etapami przygotowania i

Bardziej szczegółowo

Ekonometria. wiczenia 3 Autokorelacja, heteroskedastyczno±, wspóªliniowo± Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 3 Autokorelacja, heteroskedastyczno±, wspóªliniowo± Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 3 Autokorelacja, heteroskedastyczno±, wspóªliniowo± (3) Ekonometria 1 / 29 Plan wicze«1 Wprowadzenie 2 Normalny rozkªad 3 Autokorelacja 4 Heteroskedastyczno± Test White'a Odporne bª

Bardziej szczegółowo

Funkcje, wielomiany. Informacje pomocnicze

Funkcje, wielomiany. Informacje pomocnicze Funkcje, wielomiany Informacje pomocnicze Przydatne wzory: (a + b) 2 = a 2 + 2ab + b 2 (a b) 2 = a 2 2ab + b 2 (a + b) 3 = a 3 + 3a 2 b + 3ab 2 + b 3 (a b) 3 = a 3 3a 2 b + 3ab 2 b 3 a 2 b 2 = (a + b)(a

Bardziej szczegółowo

1 Bª dy i arytmetyka zmiennopozycyjna

1 Bª dy i arytmetyka zmiennopozycyjna 1 Bª dy i arytmetyka zmiennopozycyjna Liczby w pami ci komputera przedstawiamy w ukªadzie dwójkowym w postaci zmiennopozycyjnej Oznacza to,»e s one postaci ±m c, 01 m < 1, c min c c max, (1) gdzie m nazywamy

Bardziej szczegółowo

Metody dowodzenia twierdze«

Metody dowodzenia twierdze« Metody dowodzenia twierdze«1 Metoda indukcji matematycznej Je±li T (n) jest form zdaniow okre±lon w zbiorze liczb naturalnych, to prawdziwe jest zdanie (T (0) n N (T (n) T (n + 1))) n N T (n). 2 W przypadku

Bardziej szczegółowo

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions) Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions) Alexander Bendikov Uniwersytet Wrocªawski 25 maja 2016 Elementarna statystyka Dwie próby: porównanie

Bardziej szczegółowo

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Analiza regresji część II. Agnieszka Nowak - Brzezińska Analiza regresji część II Agnieszka Nowak - Brzezińska Niebezpieczeństwo ekstrapolacji Analitycy powinni ograniczyć predykcję i estymację, które są wykonywane za pomocą równania regresji dla wartości objaśniającej

Bardziej szczegółowo

Wykªad 6: Model logitowy

Wykªad 6: Model logitowy Wykªad 6: Model logitowy Ekonometria Stosowana SGH Model logitowy 1 / 18 Plan wicze«1 Modele zmiennej jako±ciowej idea 2 Model logitowy Specykacja i interpretacja parametrów Dopasowanie i restrykcje 3

Bardziej szczegółowo

Regresja ważona. Co, gdy nie ma stałej wariancji? Tu prawdziwe σ 2 =1 (dużo powtórzeń, więc wariancje są dobrze oszacowane) PAR Wykład 5 1/8

Regresja ważona. Co, gdy nie ma stałej wariancji? Tu prawdziwe σ 2 =1 (dużo powtórzeń, więc wariancje są dobrze oszacowane) PAR Wykład 5 1/8 Dobry chrześcijanin powinien wystrzegać się matematyków i tych wszystkich, którzy tworzą puste proroctwa. Istnieje niebezpieczeństwo, że matematycy zawarli przymierze z diabłem, aby zgubić duszę człowieka

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Statystyczna analiza danych w programie STATISTICA ( 4 (wykład Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Regresja prosta liniowa Regresja prosta jest

Bardziej szczegółowo

Ekstremalnie fajne równania

Ekstremalnie fajne równania Ekstremalnie fajne równania ELEMENTY RACHUNKU WARIACYJNEGO Zaczniemy od ogólnych uwag nt. rachunku wariacyjnego, który jest bardzo przydatnym narz dziem mog cym posªu»y do rozwi zywania wielu problemów

Bardziej szczegółowo

Lab. 02: Algorytm Schrage

Lab. 02: Algorytm Schrage Lab. 02: Algorytm Schrage Andrzej Gnatowski 5 kwietnia 2015 1 Opis zadania Celem zadania laboratoryjnego jest zapoznanie si z jednym z przybli»onych algorytmów sªu» cych do szukania rozwi za«znanego z

Bardziej szczegółowo

Ekonometria - wykªad 1

Ekonometria - wykªad 1 Ekonometria - wykªad 1 0. Wprowadzenie Barbara Jasiulis-Goªdyn 28.02.2014 2013/2014 Ekonometria Literatura [1] B. Borkowski, H. Dudek, W. Szczesny, Ekonometria. Wybrane Zaganienia, PWN, Warszawa 2003.

Bardziej szczegółowo

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15 ANALIZA NUMERYCZNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Metoda Eulera 3 1.1 zagadnienia brzegowe....................... 3 1.2 Zastosowanie ró»niczki...................... 4 1.3 Output do pliku

Bardziej szczegółowo

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 8 Modele zmiennej jako±ciowej (8) Ekonometria 1 / 25 Plan wicze«1 Modele zmiennej jako±ciowej 2 Model logitowy Specykacja i interpretacja parametrów Dopasowanie i restrykcje 3 Predykcja

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Proste modele o zªo»onej dynamice

Proste modele o zªo»onej dynamice Proste modele o zªo»onej dynamice czyli krótki wst p do teorii chaosu Tomasz Rodak Festiwal Nauki, Techniki i Sztuki 2018 April 17, 2018 Dyskretny model pojedynczej populacji Rozwa»my pojedyncz populacj

Bardziej szczegółowo

Statystyczne metody analizy danych przy użyciu środowiska R

Statystyczne metody analizy danych przy użyciu środowiska R Statystyczne metody analizy danych przy użyciu środowiska R Agnieszka Nowak - Brzezińska Instytut Informatyki, Uniwersytet Śląski Wybrane zagadnienia Plan wystąpienia 1. Wprowadzenie. 2. Środowisko R.

Bardziej szczegółowo

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej

Bardziej szczegółowo

Statystyka w analizie i planowaniu eksperymentu

Statystyka w analizie i planowaniu eksperymentu 28 marca 2012 Analiza wariancji klasyfikacja jednokierunkowa - wst ep Przypuśćmy, że chcemy porównać wieksz a (niż dwie) liczbe grup. Aby porównać średnie w kilku grupach, można przeprowadzić analize wariancji.

Bardziej szczegółowo

Metodydowodzenia twierdzeń

Metodydowodzenia twierdzeń 1 Metodydowodzenia twierdzeń Przez zdanie rozumiemy dowolne stwierdzenie, które jest albo prawdziwe, albo faªszywe (nie mo»e by ono jednocze±nie prawdziwe i faªszywe). Tradycyjnie b dziemy u»ywali maªych

Bardziej szczegółowo

Macierze i Wyznaczniki

Macierze i Wyznaczniki Macierze i Wyznaczniki Kilka wzorów i informacji pomocniczych: Denicja 1. Tablic nast puj cej postaci a 11 a 12... a 1n a 21 a 22... a 2n A =... a m1 a m2... a mn nazywamy macierz o m wierszach i n kolumnach,

Bardziej szczegółowo

Macierze i Wyznaczniki

Macierze i Wyznaczniki dr Krzysztof yjewski Mechatronika; S-I.in». 5 pa¹dziernika 6 Macierze i Wyznaczniki Kilka wzorów i informacji pomocniczych: Denicja. Tablic nast puj cej postaci a a... a n a a... a n A =... a m a m...

Bardziej szczegółowo

Permutacyjna metoda oceny istotności regresji

Permutacyjna metoda oceny istotności regresji Permutacyjna metoda oceny istotności regresji (bez założenia normalności) f

Bardziej szczegółowo

Lekcja 9 - LICZBY LOSOWE, ZMIENNE

Lekcja 9 - LICZBY LOSOWE, ZMIENNE Lekcja 9 - LICZBY LOSOWE, ZMIENNE I STAŠE 1 Liczby losowe Czasami spotkamy si z tak sytuacj,»e b dziemy potrzebowa by program za nas wylosowaª jak ± liczb. U»yjemy do tego polecenia: - liczba losowa Sprawd¹my

Bardziej szczegółowo

2 Liczby rzeczywiste - cz. 2

2 Liczby rzeczywiste - cz. 2 2 Liczby rzeczywiste - cz. 2 W tej lekcji omówimy pozostaªe tematy zwi zane z liczbami rzeczywistymi. 2. Przedziaªy liczbowe Wyró»niamy nast puj ce rodzaje przedziaªów liczbowych: (a) przedziaªy ograniczone:

Bardziej szczegółowo

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKŠAD 3 29 pa¹dziernik 2015 1 / 39 Plan wykªadu 1. Test log-rank dla wi cej ni» dwóch grup 2. Test Mantela-Haenszela dla wi cej ni» dwóch grup 3. Wst p do

Bardziej szczegółowo

Podstawy statystycznego modelowania danych - Wykªad 7

Podstawy statystycznego modelowania danych - Wykªad 7 Podstawy statystycznego modelowania danych - Wykªad 7 Tomasz Suchocki ANOVA Plan wykªadu Analiza wariancji 1. Rys historyczny 2. Podstawy teoretyczne i przykªady zastosowania 3. ANOVA w pakiecie R Tomasz

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: Eksploracja (mining) Problemy: Jedna zmienna 2000 najwi ększych

Bardziej szczegółowo

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6 Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Model mieszany

Bardziej szczegółowo

Metody probablistyczne i statystyka stosowana

Metody probablistyczne i statystyka stosowana Politechnika Wrocªawska - Wydziaª Podstawowych Problemów Techniki - 011 Metody probablistyczne i statystyka stosowana prowadz cy: dr hab. in». Krzysztof Szajowski opracowanie: Tomasz Kusienicki* κ 17801

Bardziej szczegółowo

Regresja liniowa, klasyfikacja metodą k-nn. Agnieszka Nowak Brzezińska

Regresja liniowa, klasyfikacja metodą k-nn. Agnieszka Nowak Brzezińska Regresja liniowa, klasyfikacja metodą k-nn Agnieszka Nowak Brzezińska Analiza regresji Analiza regresji jest bardzo popularną i chętnie stosowaną techniką statystyczną pozwalającą opisywać związki zachodzące

Bardziej szczegółowo

Funkcje wielu zmiennych

Funkcje wielu zmiennych dr Krzysztof yjewski Informatyka I rok I 0 in» 12 stycznia 2016 Funkcje wielu zmiennych Informacje pomocnicze Denicja 1 Niech funkcja f(x y) b dzie okre±lona przynajmniej na otoczeniu punktu (x 0 y 0 )

Bardziej szczegółowo

Aproksymacja funkcji metod najmniejszych kwadratów

Aproksymacja funkcji metod najmniejszych kwadratów Aproksymacja funkcji metod najmniejszych kwadratów Teoria Interpolacja polega na znajdowaniu krzywej przechodz cej przez wszystkie w zªy. Zdarzaj si jednak sytuacje, w których dane te mog by obarczone

Bardziej szczegółowo

ANALIZA REGRESJI SPSS

ANALIZA REGRESJI SPSS NLIZ REGRESJI SPSS Metody badań geografii społeczno-ekonomicznej KORELCJ REGRESJ O ile celem korelacji jest zmierzenie siły związku liniowego między (najczęściej dwoma) zmiennymi, o tyle w regresji związek

Bardziej szczegółowo

Modele wielorównaniowe. Problem identykacji

Modele wielorównaniowe. Problem identykacji Modele wielorównaniowe. Problem identykacji Ekonometria Szeregów Czasowych SGH Identykacja 1 / 43 Plan wykªadu 1 Wprowadzenie 2 Trzy przykªady 3 Przykªady: interpretacja 4 Warunki identykowalno±ci 5 Restrykcje

Bardziej szczegółowo

Pakiety statystyczne - Wykªad 8

Pakiety statystyczne - Wykªad 8 Pakiety statystyczne - Wykªad 8 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Analiza wariancji 1. Rys historyczny 2. Podstawy teoretyczne

Bardziej szczegółowo

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy ANALIZA PORÓWNAŃ WIELOKROTNYCH GDY WARIANCJE SĄ NIERÓWNE lsales.bim

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1 Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Analiza wariancji

Bardziej szczegółowo

Modele wielorównaniowe. Estymacja parametrów

Modele wielorównaniowe. Estymacja parametrów Modele wielorównaniowe. Estymacja parametrów Ekonometria Szeregów Czasowych SGH Estymacja 1 / 47 Plan wykªadu 1 Po±rednia MNK 2 Metoda zmiennych instrumentalnych 3 Podwójna MNK 4 Estymatory klasy k 5 MNW

Bardziej szczegółowo

In»ynierskie zastosowania statystyki wiczenia

In»ynierskie zastosowania statystyki wiczenia Uwagi: 27012014 poprawiono kilka literówek, zwi zanych z przedziaªami ufno±ci dla wariancji i odchylenia standardowego In»ynierskie zastosowania statystyki wiczenia Przedziaªy wiarygodno±ci, testowanie

Bardziej szczegółowo

A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.

A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy. Logika i teoria mnogo±ci, konspekt wykªad 12 Teoria mocy, cz ± II Def. 12.1 Ka»demu zbiorowi X przyporz dkowujemy oznaczany symbolem X obiekt zwany liczb kardynaln (lub moc zbioru X) w taki sposób,»e ta

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Ekonometria dla IiE i MSEMat Z7

Ekonometria dla IiE i MSEMat Z7 Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany

Bardziej szczegółowo

Metody numeryczne i statystyka dla in»ynierów

Metody numeryczne i statystyka dla in»ynierów Kierunek: Automatyka i Robotyka, II rok Wprowadzenie PWSZ Gªogów, 2009 Plan wykªadów Wprowadzenie, podanie zagadnie«, poj cie metody numerycznej i algorytmu numerycznego, obszar zainteresowa«i stosowalno±ci

Bardziej szczegółowo

Wykªad 4. Funkcje wielu zmiennych.

Wykªad 4. Funkcje wielu zmiennych. Wykªad jest prowadzony w oparciu o podr cznik Analiza matematyczna 2. Denicje, twierdzenia, wzory M. Gewerta i Z. Skoczylasa. Wykªad 4. Funkcje wielu zmiennych. Zbiory na pªaszczy¹nie i w przestrzeni.

Bardziej szczegółowo

Listy i operacje pytania

Listy i operacje pytania Listy i operacje pytania Iwona Polak iwona.polak@us.edu.pl Uniwersytet l ski Instytut Informatyki pa¹dziernika 07 Który atrybut NIE wyst puje jako atrybut elementów listy? klucz elementu (key) wska¹nik

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Arkusz maturalny. Šukasz Dawidowski. 25 kwietnia 2016r. Powtórki maturalne

Arkusz maturalny. Šukasz Dawidowski. 25 kwietnia 2016r. Powtórki maturalne Arkusz maturalny Šukasz Dawidowski Powtórki maturalne 25 kwietnia 2016r. Odwrotno±ci liczby rzeczywistej 1. 9 8 2. 0, (1) 3. 8 9 4. 0, (8) 3 4 4 4 1 jest liczba Odwrotno±ci liczby rzeczywistej 3 4 4 4

Bardziej szczegółowo

Statystyka matematyczna

Statystyka matematyczna Statystyka matematyczna Aleksandra Ki±lak-Malinowska akis@uwm.edu.pl http://wmii.uwm.edu.pl/ akis/ Czym zajmuje si statystyka? Statystyka zajmuje si opisywaniem i analiz zjawisk masowych otaczaj cej czªowieka

Bardziej szczegółowo

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.

Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych. Wykªad jest prowadzony w oparciu o podr cznik Analiza matematyczna 2. Denicje, twierdzenia, wzory M. Gewerta i Z. Skoczylasa. Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych. Denicja Mówimy,»e funkcja

Bardziej szczegółowo

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14 WST P DO TEORII INFORMACJI I KODOWANIA Grzegorz Szkibiel Wiosna 203/4 Spis tre±ci Kodowanie i dekodowanie 4. Kodowanie a szyfrowanie..................... 4.2 Podstawowe poj cia........................

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Interpolacja Lagrange'a, bazy wielomianów

Interpolacja Lagrange'a, bazy wielomianów Rozdziaª 4 Interpolacja Lagrange'a, bazy wielomianów W tym rozdziale zajmiemy si interpolacj wielomianow. Zadanie interpolacji wielomianowej polega na znalezieniu wielomianu stopnia nie wi kszego od n,

Bardziej szczegółowo

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKŠAD 4 03 listopad 2014 1 / 47 Plan wykªadu 1. Testowanie zaªo»e«o proporcjonalnym hazardzie w modelu Cox'a 2. Wybór zmiennych do modelu Cox'a 3. Meta analiza

Bardziej szczegółowo

Statystyka matematyczna - ZSTA LMO

Statystyka matematyczna - ZSTA LMO Statystyka matematyczna - ZSTA LMO Šukasz Smaga Wydziaª Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza w Poznaniu Wykªad 4 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 1 / 18 Wykªad 4 - zagadnienia

Bardziej szczegółowo

Funkcje wielu zmiennych

Funkcje wielu zmiennych Funkcje wielu zmiennych Informacje pomocnicze Denicja 1 Niech funkcja f(x, y) b dzie okre±lona przynajmniej na otoczeniu punktu (x 0, y 0 ) Pochodn cz stkow pierwszego rz du funkcji dwóch zmiennych wzgl

Bardziej szczegółowo

Arytmetyka zmiennopozycyjna

Arytmetyka zmiennopozycyjna Rozdziaª 4 Arytmetyka zmiennopozycyjna Wszystkie obliczenia w octavie s wykonywane w arytmetyce zmiennopozycyjnej (inaczej - arytmetyce ) podwójnej precyzji (double) - cho w najnowszych wersjach octave'a

Bardziej szczegółowo

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: 2000 największych spółek światowych z 2004 (Forbes Magazine)

Bardziej szczegółowo

Analiza wariancji Piotr J. Sobczyk 19 November 2016

Analiza wariancji Piotr J. Sobczyk 19 November 2016 Analiza wariancji Piotr J. Sobczyk 19 November 2016 Zacznijmy zajęcia od klasycznego przykładu czyli testu Studenta dla dwóch prób. x 1,i N(µ 1, σ 2 ), i = 1,..., n 1 x 2,i N(µ 2, σ 2 ), i = 1,..., n 2

Bardziej szczegółowo

1 Metody iteracyjne rozwi zywania równania f(x)=0

1 Metody iteracyjne rozwi zywania równania f(x)=0 1 Metody iteracyjne rozwi zywania równania f()=0 1.1 Metoda bisekcji Zaªó»my,»e funkcja f jest ci gªa w [a 0, b 0 ]. Pierwiastek jest w przedziale [a 0, b 0 ] gdy f(a 0 )f(b 0 ) < 0. (1) Ustalmy f(a 0

Bardziej szczegółowo

Ekonometria. wiczenia 5 i 6 Modelowanie szeregów czasowych. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 5 i 6 Modelowanie szeregów czasowych. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 5 i 6 Modelowanie szeregów czasowych (5-6) Ekonometria 1 / 30 Plan prezentacji 1 Regresja pozorna 2 Testowanie stopnia zintegrowania szeregu 3 Kointegracja 4 Modele dynamiczne (5-6)

Bardziej szczegółowo

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1 Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu 1 Podstawowe

Bardziej szczegółowo

ZADANIA. Maciej Zakarczemny

ZADANIA. Maciej Zakarczemny ZADANIA Maciej Zakarczemny 2 Spis tre±ci 1 Algebra 5 2 Analiza 7 2.1 Granice iterowane, granica podwójna funkcji dwóch zmiennych....... 7 2.2 Caªki powierzchniowe zorientowane...................... 8 2.2.1

Bardziej szczegółowo

Zadania z analizy matematycznej - sem. II Rachunek ró»niczkowy funkcji wielu zmiennych

Zadania z analizy matematycznej - sem. II Rachunek ró»niczkowy funkcji wielu zmiennych Zadania z analizy matematycznej - sem II Rachunek ró»niczkowy funkcji wielu zmiennych Denicja (Pochodne cz stkowe dla funkcji trzech zmiennych) Niech D R 3 b dzie obszarem oraz f : D R f = f y z) P 0 =

Bardziej szczegółowo

Egzamin z ekonometrii - wersja ogólna

Egzamin z ekonometrii - wersja ogólna Egzamin z ekonometrii - wersja ogólna 27-0-202 Pytania teoretyczne. Dlaczego w modelu nie powinno si umieszcza staªej i wszystkich zmiennych zero-jedynkowych, zwi zanych z poziomami zmiennej dyskretnej?

Bardziej szczegółowo

Model obiektu w JavaScript

Model obiektu w JavaScript 16 marca 2009 E4X Paradygmat klasowy Klasa Deniuje wszystkie wªa±ciwo±ci charakterystyczne dla wybranego zbioru obiektów. Klasa jest poj ciem abstrakcyjnym odnosz cym si do zbioru, a nie do pojedynczego

Bardziej szczegółowo

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach Matematyka w ekonomii i ubezpieczeniach ( Niezale»ne szkody maja rozkªady P (X i = k) = exp( 1)/k!, P (Y i = k) = 4+k ) k (1/3) 5 (/3) k, k = 0, 1,.... Niech S = X 1 +... + X 500 + Y 1 +... + Y 500. Skªadka

Bardziej szczegółowo

Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna

Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna 1. Podaj denicj liczby zespolonej. 2. Jak obliczy sum /iloczyn dwóch liczb zespolonych w postaci algebraicznej? 3. Co to jest liczba urojona?

Bardziej szczegółowo

Interpolacja funkcjami sklejanymi

Interpolacja funkcjami sklejanymi Interpolacja funkcjami sklejanymi Funkcje sklejane: Zaªó»my,»e mamy n + 1 w zªów t 0, t 1,, t n takich,»e t 0 < t 1 < < t n Dla danej liczby caªkowitej, nieujemnej k funkcj sklejan stopnia k nazywamy tak

Bardziej szczegółowo

Ekonometria. wiczenia 7 Modele nieliniowe. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. wiczenia 7 Modele nieliniowe. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej Ekonometria wiczenia 7 Modele nieliniowe (7) Ekonometria 1 / 19 Plan wicze«1 Nieliniowo± : co to zmienia? 2 Funkcja produkcji Cobba-Douglasa 3 Nieliniowa MNK (7) Ekonometria 2 / 19 Plan prezentacji 1 Nieliniowo±

Bardziej szczegółowo

Analiza wydajno±ci serwera openldap

Analiza wydajno±ci serwera openldap Analiza wydajno±ci serwera openldap Autor: Tomasz Kowal 13 listopada 2003 Wst p Jako narz dzie testowe do pomiarów wydajno±ci i oceny konguracji serwera openldap wykorzystano pakiet DirectoryMark w wersji

Bardziej szczegółowo

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15 ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych

Bardziej szczegółowo

LXIV OLIMPIADA FIZYCZNA ZAWODY III STOPNIA

LXIV OLIMPIADA FIZYCZNA ZAWODY III STOPNIA Za zadanie D mo»na otrzyma maksymalnie 40 punktów. Zadanie D. Maj c do dyspozycji: LXIV OLIMPIADA FIZYCZNA ZAWODY III STOPNIA CZ DO WIADCZALNA generator napi cia o przebiegu sinusoidalnym o ustalonej amplitudzie

Bardziej szczegółowo

Ekonometria Bayesowska

Ekonometria Bayesowska Ekonometria Bayesowska Wykªad 6: Bayesowskie ª czenie wiedzy (6) Ekonometria Bayesowska 1 / 21 Plan wykªadu 1 Wprowadzenie 2 Oczekiwana wielko± modelu 3 Losowanie próby modeli 4 wiczenia w R (6) Ekonometria

Bardziej szczegółowo

Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych

Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych Etapy analizy regresji Regresja liniowa 1. zaproponowanie modelu, 2. sprawdzenie założeń dotyczących zmiennych, 3. wyszukanie wartości odstających, wpływających i dźwigni, 4. oszacowanie istotności modelu

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo