Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
|
|
- Błażej Borkowski
- 6 lat temu
- Przeglądów:
Transkrypt
1 Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: 2000 największych spółek światowych z 2004 (Forbes Magazine) data("forbes2000",package="hsaur2") attach(forbes2000) plot(log(assets),log(sales)) Statystyczne modelowanie decyzji biznesowych 1
2 Loess Po funkcji loess Statystyczne modelowanie decyzji biznesowych 2
3 Funkcja wagowa loplot <- function (x,y,xl="",yl="") { plot(x,y,xlab=xl,ylab=yl) loe <- loess(y ~ x) ly <- predict(loe,data.frame(x = sort(x))) lines(sort(x),ly,col="red") } Statystyczne modelowanie decyzji biznesowych 3
4 loplot(log(assets),log(sales),"log(assets)","log(sales)") Statystyczne modelowanie decyzji biznesowych 4
5 Strzałka Tukeya strzalkatukeya(log(assets),log(sales)) potęga x = 1 potęga y = 1 błąd = b1 = b2 = potęga (x/y),koniec - ESC Wybierz x,y,esc: x potęga x = 2 potęga y = 1 błąd = b1 = b2 = potęga (x/y),koniec - ESC Wybierz x,y,esc: strzalkatukeya(log(assets),log(sales),prog=0.11) potęga x = 1 potęga y = 1 błąd = b1 = b2 = potęga (x/y),koniec - ESC Wybierz x,y,esc: x potęga x = 2 potęga y = 1 błąd = b1 = b2 = PRZYBLIŻONE RÓWNANIE REGRESJI: a = b = Statystyczne modelowanie decyzji biznesowych 5
6 plot(log(assets),log(sales)) lines(sort(log(assets)), sort(log(assets))^2,col="blue") Statystyczne modelowanie decyzji biznesowych 6
7 strzalkatukeya(log(assets),log(sales),0.5) potęga x = 1 potęga y = 1 błąd = b1 = b2 = potęga (x/y),koniec - ESC Wybierz x,y,esc: x potęga x = 1.5 potęga y = 1 błąd = b1 = b2 = PRZYBLIŻONE RÓWNANIE REGRESJI: a = b = plot(log(assets),log(sales)) lines(sort(log(assets)), sort(log(assets))^1.5,col="blue") Statystyczne modelowanie decyzji biznesowych 7
8 MODELE ZMIENNA CIĄGŁA~CZYNNIK lsales.bim <- log10(sales[category %in% c("banking","insurance","media")]) catbim <- as.factor(category[category %in% c("banking","insurance","media")]) sbim <- data.frame(lsales.bim,catbim) str(sbim) 'data.frame': 486 obs. of 2 variables: $ lsales.bim: num $ catbim : Factor w/ 27 levels "Aerospace & defense",..: catbim[1:10] [1] Banking Insurance Banking Banking Insurance Banking Banking Banking [9] Banking Banking qqnorm(lsales.bim[catbim=="banking"]) qqline(lsales.bim[catbim=="banking"],col=2) Normal Q-Q Plot Sample Quantiles qqnorm(lsales.bim[catbim=="insurance"]) qqline(lsales.bim[catbim=="insurance"],col=2) Theoretical Quantiles Statystyczne modelowanie decyzji biznesowych 8
9 Normal Q-Q Plot Sample Quantiles qqnorm(lsales.bim[catbim=="media"]) qqline(lsales.bim[catbim=="media"],col=2) Theoretical Quantiles Normal Q-Q Plot Sample Quantiles Theoretical Quantiles cat("banking",mean(lsales.bim[catbim=="banking"]),"\n", "Insurance",mean(lsales.BIM[catBIM=="Insurance"]),"\n", "Media",mean(lsales.BIM[catBIM=="Media"])) Banking Insurance Media Statystyczne modelowanie decyzji biznesowych 9
10 cat("banking",sd(lsales.bim[catbim=="banking"]),"\n", "Insurance",sd(lsales.BIM[catBIM=="Insurance"]),"\n", "Media",sd(lsales.BIM[catBIM=="Media"])) Banking Insurance Media library("lawstat") levene.test(lsales.bim,catbim,location="mean") classical Levene's test based on the absolute deviations from the mean ( none not applied because the location is not set to median ) data: lsales.bim Test Statistic = , p-value = sbim1 <- subset(sbim,lsales.bim>0) colnames(sbim1)<- c("lsales.bim1","catbim1") cat("banking",mean(lsales.bim1[catbim1=="banking"]),"\n", "Insurance",mean(lsales.BIM1[catBIM1=="Insurance"]),"\n", "Media",mean(lsales.BIM1[catBIM1=="Media"])) Banking Insurance Media cat("banking",sd(lsales.bim1[catbim1=="banking"]),"\n", "Insurance",sd(lsales.BIM1[catBIM1=="Insurance"]),"\n", "Media",sd(lsales.BIM1[catBIM1=="Media"])) Banking Insurance Media levene.test(lsales.bim1,catbim1,location="mean") classical Levene's test based on the absolute deviations from the mean ( none not applied because the location is not set to median ) data: lsales.bim1 Test Statistic = 2.919, p-value = (anova(lm(lsales.bim1~catbim1))) Analysis of Variance Table Response: lsales.bim1 Df Sum Sq Mean Sq F value Pr(>F) catbim Residuals Signif. codes: Statystyczne modelowanie decyzji biznesowych 10
11 sal.aov <- aov(lsales.bim1~catbim1) plot(sal.aov) seria wykresów diagnostycznych: Residuals Residuals vs Fitted Fitted values aov(lsales.bim1 ~ catbim1) Normal Q-Q Standardized residuals Theoretical Quantiles aov(lsales.bim1 ~ catbim1) Statystyczne modelowanie decyzji biznesowych 11
12 TukeyHSD(sal.aov) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = lsales.bim1 ~ catbim1) $catbim1 diff lwr upr p adj Insurance-Banking Media-Banking Media-Insurance plot(tukeyhsd(sal.aov)) Statystyczne modelowanie decyzji biznesowych 12
13 CENY W 2004 > mieszkania <- read.table(" + > summary(mieszkania) header=t,sep=";") cena pokoi powierzchnia dzielnica typ.budynku Min. : Min. :1.00 Min. :17.00 Biskupin :65 kamienica :61 1st Qu.: st Qu.:2.00 1st Qu.:31.15 Krzyki :79 niski blok:63 Median : Mean : Median :3.00 Mean :2.55 Median :43.70 Mean :46.20 Srodmiescie:56 wiezowiec :76 3rd Qu.: rd Qu.:3.00 3rd Qu.:61.40 Max. : Max. :4.00 Max. :87.70 > str(mieszkania) 'data.frame': 200 obs. of 5 variables: $ cena : num $ pokoi : int $ powierzchnia: num $ dzielnica : Factor w/ 3 levels "Biskupin","Krzyki",..: $ typ.budynku : Factor w/ 3 levels "kamienica","niski blok",..: > shapiro.test(cena) Shapiro-Wilk normality test data: cena W = , p-value = Sample Quantiles Normal Q-Q Plot Theoretical Quantiles > levene.test(cena,dzielnica,"median",bootstrap=t) bootstrap modified robust Brown-Forsythe Levene-type test based on the absolute deviations from the median data: cena Test Statistic = , p-value = Statystyczne modelowanie decyzji biznesowych 13
14 Spełnione są założenia ANOVA > a1 <- anova(lm(cena~dzielnica)) > (a1 <- anova(lm(cena~dzielnica))) Analysis of Variance Table Response: cena Df Sum Sq Mean Sq F value Pr(>F) dzielnica e Residuals e Signif. codes: > tapply(cena,dzielnica,mean) Biskupin Krzyki Srodmiescie a2 <- aov(cena~dzielnica) plot(a2) Residuals vs Fitted Residuals -1e+05 0e+00 1e Fitted values aov(cena ~ dzielnica) Statystyczne modelowanie decyzji biznesowych 14
15 Standardized residuals Normal Q-Q Theoretical Quantiles aov(cena ~ dzielnica) > TukeyHSD(a2,"dzielnica") Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = cena ~ dzielnica) $dzielnica diff lwr upr p adj Krzyki-Biskupin Srodmiescie-Biskupin Srodmiescie-Krzyki Grupy jednorodne {K,S} {B} Srodmiescie-Krzyki Krzyki-Biskupin 95% family-wise confidence level Differences in mean levels of dzielnica Statystyczne modelowanie decyzji biznesowych 15
16 # kontrasty np # czy cena na Biskupinie różni się od średniej na Krzykach i Śródmiesciu? # czy ceny na Krzykach i Śródmiesciu są różne? kontrasty=cbind(c(2,-1,-1),c(0,1,-1)) model=lm(cena~dzielnica,contrasts=list(dzielnica=kontrasty)) > summary(model)$coef Estimate Std. Error t value Pr(> t ) (Intercept) e-126 dzielnica e-03 dzielnica e-01 Statystyczne modelowanie decyzji biznesowych 16
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy ANALIZA PORÓWNAŃ WIELOKROTNYCH GDY WARIANCJE SĄ NIERÓWNE lsales.bim
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy Dane: Eksploracja (mining) Problemy: Jedna zmienna 2000 najwi ększych
Analiza wariancji Piotr J. Sobczyk 19 November 2016
Analiza wariancji Piotr J. Sobczyk 19 November 2016 Zacznijmy zajęcia od klasycznego przykładu czyli testu Studenta dla dwóch prób. x 1,i N(µ 1, σ 2 ), i = 1,..., n 1 x 2,i N(µ 2, σ 2 ), i = 1,..., n 2
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona
KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y 2. Współczynnik korelacji Pearsona 3. Siła i kierunek związku między zmiennymi 4. Korelacja ma sens, tylko wtedy, gdy związek między zmiennymi
Regresja liniowa w R Piotr J. Sobczyk
Regresja liniowa w R Piotr J. Sobczyk Uwaga Poniższe notatki mają charakter roboczy. Mogą zawierać błędy. Za przesłanie mi informacji zwrotnej o zauważonych usterkach serdecznie dziękuję. Weźmy dane dotyczące
Ogólny model liniowy
Ogólny model liniowy Twórcy Autor statystyki testowej Wyprowadził wzór na gęstość rozkładu statystyki testowej Ronald Aylmer Fisher ( 1890-1962 ) angielski genetyk George W. Snedecor (1881-1974) amerykański
Bioinformatyka V. Analiza Danych w Języku R
Bioinformatyka V Analiza Danych w Języku R ANALIZA DANYCH Metody statystyczne analizy danych eksploracja danych testowanie hipotez analiza Bayesowska Metody uczenia maszynowego Uczenie nadzorowane Uczenie
Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań
Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań Analizę wariancji możemy wykonać w SAS za pomocą procedury ANOVA oraz GLM. ANOVA Analysis of variance (Analiza
Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych
Opis zaj Analiza regresji Konspekt do zaj : Statystyczne metody analizy danych Agnieszka Nowak-Brzezi«ska 28 pa¹dziernika 2009 Celem zaj jest realizacja praktyczna zagadnie«zwi zanych z analiz regresji,
Permutacyjna metoda oceny istotności regresji
Permutacyjna metoda oceny istotności regresji (bez założenia normalności) f
Analiza mediacji i moderacji. X - predyktor M - mediator Y - zmienna zależna. Dr Paweł Kleka /50. Trochę historii.
Analiza mediacji i moderacji Dr Paweł Kleka 2019-04-04 X - predyktor M - mediator Y - zmienna zależna 3/50 Trochę historii Mediacja 4/50 Mediacja całkowita Analiza wielkości efektu pośredniego wg Barona
PAKIETY STATYSTYCZNE
. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa
Ekonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Analiza zależności cech ilościowych regresja liniowa (Wykład 13)
Analiza zależności cech ilościowych regresja liniowa (Wykład 13) dr Mariusz Grządziel semestr letni 2012 Przykład wprowadzajacy W zbiorze danych homedata (z pakietu R-owskiego UsingR) można znaleźć ceny
Regresja ważona. Co, gdy nie ma stałej wariancji? Tu prawdziwe σ 2 =1 (dużo powtórzeń, więc wariancje są dobrze oszacowane) PAR Wykład 5 1/8
Dobry chrześcijanin powinien wystrzegać się matematyków i tych wszystkich, którzy tworzą puste proroctwa. Istnieje niebezpieczeństwo, że matematycy zawarli przymierze z diabłem, aby zgubić duszę człowieka
Krzysztof Trajkowski. Przeglad pakietów do analizy zmiennych zależnych
Krzysztof Trajkowski Przeglad pakietów do analizy zmiennych zależnych 8 stycznia 2013 1. Wprowadzenie W tym poradniku zostanie dokonany przegląd kilku funkcji do analizy zmiennych zależnych z zastosowaniem
Lepiej zapobiegać niż leczyć Diagnostyka regresji
Anceps remedium melius quam nullum Lepiej zapobiegać niż leczyć Diagnostyka regresji Na tych zajęciach nauczymy się identyfikować zagrożenia dla naszej analizy regresji. Jednym elementem jest oczywiście
ANOVA podstawy analizy wariancji
ANOVA podstawy analizy wariancji Marcin Kolankowski 11 marca 2009 Do czego służy analiza wariancji Analiza wariancji (ang. ANalysis Of VAriance - ANOVA) służy do wykrywania różnic pomiędzy średnimi w wielu
Przykłady Ryzyko względne a iloraz szans ANOVA ZMAD. Stanisław Jaworski: ZMAD. Uniwersytet Medyczny
ZMAD Stanisław Jaworski proporcja Stosunek do aborcji (1) Z pewnej ściśle określonej populacji kobiet wylosowano 950 osób. Każdą kobietę zapytano, czy jest za utrzymaniem obecnej ustawy antyaborcyjnej.
Statystyka w analizie i planowaniu eksperymentu
23 kwietnia 2014 Korelacja - wspó lczynnik korelacji 1 Gdy badamy różnego rodzaju rodzaju zjawiska (np. przyrodnicze) możemy stwierdzić, że na każde z nich ma wp lyw dzia lanie innych czynników; Korelacja
Zaliczenie na ocenę 0,5 0,5
Zał. nr 4 do ZW WYDZIAŁ CHEMICZNY KARTA PRZEDMIOTU Nazwa w języku polskim Wstęp do statystyki praktycznej Nazwa w języku angielskim Introduction to practical statistics Kierunek studiów (jeśli dotyczy)
Regresja liniowa. Etapy analizy regresji. Założenia regresji. Kodowanie zmiennych jakościowych
Etapy analizy regresji Regresja liniowa 1. zaproponowanie modelu, 2. sprawdzenie założeń dotyczących zmiennych, 3. wyszukanie wartości odstających, wpływających i dźwigni, 4. oszacowanie istotności modelu
(LMP-Liniowy model prawdopodobieństwa)
OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne
Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago
Model regresji wielokrotnej Wykład 14 (4.06.2007) Przykład ceny domów w Chicago Poniżej są przedstawione dane dotyczące cen domów w Chicago (źródło: Sen, A., Srivastava, M., Regression Analysis, Springer,
Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ
WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość
Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji
Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej
Repeated Measures ANOVA ANOVA z powtarzanymi pomiarami
Repeated Measures ANOVA ANOVA z powtarzanymi pomiarami Plan prezentacji 1 Wprowadzenie 2 Postać modelu Założenia Droga do testu Test Sferyczność 3 Problem Badanie skuteczności pewnej terapii medycznej:
Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV
Regresja logistyczna analiza relacji między zbiorem zmiennych niezależnych (ilościowych i dychotomicznych) a dychotomiczną zmienną zależną wyniki wyrażone są w prawdopodobieństwie przynależności do danej
Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy
Ćwiczenie: Analiza zmienności prosta Przykład w MS EXCEL Sprawdź czy genotyp jagniąt wpływa statystycznie na cechy użytkowości rzeźnej? Obliczenia wykonaj za pomocą modułu Analizy danych (jaganova.xls).
Regresja liniowa wprowadzenie
Regresja liniowa wprowadzenie a) Model regresji liniowej ma postać: gdzie jest zmienną objaśnianą (zależną); są zmiennymi objaśniającymi (niezależnymi); natomiast są parametrami modelu. jest składnikiem
Linearna regresija. 7. prosinca 2012.
Linearna regresija 7. prosinca 2012. > setwd("/home/marina/statisticki praktikum/vjezbe9") > forbes = read.table("forbes.dat") > hooker = read.table("hooker.dat") > forbes V1 V2 1 194.5 20.79 2 194.3 20.79
Modelowanie zachowania kursu EURUSD po ogłoszeniu odczytu US Nonfarm Payrolls z wykorzystaniem modeli ARIMA-GARCH
Raport 10/2015 Modelowanie zachowania kursu EURUSD po ogłoszeniu odczytu US Nonfarm Payrolls z wykorzystaniem modeli ARIMA-GARCH autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych
Planowanie doświadczeń DPLD LMO Laboratoria z wykorzystaniem programu R
Planowanie doświadczeń DPLD LMO Laboratoria z wykorzystaniem programu R Literatura 1. Biecek P., Przewodnik po pakiecie R, GIS 2008. 2. Biecek P., Analiza danych z programem R. Modele liniowe z efektami
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH
Wykład 1 Prosta regresja liniowa - model i estymacja parametrów. Regresja z wieloma zmiennymi - analiza, diagnostyka i interpretacja wyników. Literatura pomocnicza J. Koronacki i J. Ćwik Statystyczne systemy
Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich
Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich Magdalena Frąszczak Wrocław, 22.03.2017r Problem Behrensa Fishera Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu normalnego
Karol Andrzejczak MIEJSKIEGO
PRACE NAUKOWE POLITECHNIKI WARSZAWSKIEJ z. 114 Transport 2016 Karol Andrzejczak Franciszek Tomaszewski, METODYCZNE ASU PORTU MIEJSKIEGO : czerwiec 2016 Streszczenie: W artykule przedstawiono zastosowanie
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL Jan Kowalczyk IBL
Ocena interakcji genotypu i środowiska w doświadczeniu proweniencyjno - rodowym z sosną zwyczajną IBL 2004 Jan Kowalczyk IBL Interakcja GxE Zachodzi wtedy gdy reakcja genotypów jest różna w różnych środowiskach
Modele warunkowej heteroscedastyczności
Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty
Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji
Środowisko R Założenie normalności metody nieparametryczne Wykład R4; 4.06.07 Weryfikacja założenia o normalności rozkładu populacji Dane są obserwacje x 1, x 2,..., x n. Czy można założyć, że x 1, x 2,...,
Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka.
Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka. Dane The Western Collaborative Group Study (WCGS) badanie epidemiologiczne zaprojektowane,
S t a t y s t y k a, część 3. Michał Żmihorski
S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach
Jak naprawiê popsutπ zabawkí
Jak naprawiê popsutπ zabawkí Transformacje zmiennych w modelach liniowych Piotr J. Sobczyk Data analysis is an artful science! It involves making subjective decisions using very objective tools! Znalezione
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa
Wykład 2 Obserwacje nietypowe i wpływowe Regresja nieliniowa Obserwacje nietypowe i wpływowe Obserwacje nietypowe i wpływowe Obserwacje nietypowe w analizie regresji: nietypowe wartości zmiennej Y - prowadzące
1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe
Zjazd 7. SGGW, dn. 28.11.10 r. Matematyka i statystyka matematyczna Tematy 1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe nna Rajfura 1 Zagadnienia Przykład porównania wielu obiektów w
Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI
Regresja liniowa oraz regresja wielokrotna w zastosowaniu zadania predykcji danych. Agnieszka Nowak Brzezińska Wykład III-VI Analiza regresji Analiza regresji jest bardzo popularną i chętnie stosowaną
Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz
Analiza wariancji Źródło: Aczel A. D. Statystyka w zarządzaniu Analiza wariancji jednoczynnikowa Populacja Pole trójkąty 1 4 5 3 7 4 8 kwadraty 1 10 11 3 1 4 13 kółka 1 1 3 3 Populacja Pole trójkąty 1
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Konrad Miziński, nr albumu 233703 31 maja 2015 Zadanie 1 Wartości oczekiwane µ 1 i µ 2 oszacowano wg wzorów: { µ1 = 0.43925 µ = X
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.48 WIESŁAWA MALSKA Wykorzystanie testu Levene a i testu Browna-Forsythe
WPŁYW WARUNKÓW TERMICZNO-ŚWIETLNYCH NA CZAS TRWANIA FAZ ROZWOJOWYCH PSZENICY JAREJ. Dr hab. Alicja Sułek Dr Anna Nieróbca
WPŁYW WARUNKÓW TERMICZNO-ŚWIETLNYCH NA CZAS TRWANIA FAZ ROZWOJOWYCH PSZENICY JAREJ Dr hab. Alicja Sułek Dr Anna Nieróbca Celem badań było prześledzenie wpływu warunków termiczno-świetlnych na czas trwania
Algorytm k-średnich. Źródło: LaroseD.T., Okrywanie wiedzy w danych.wprowadzenie do eksploracji danych, PWN, Warszawa 2005.
Algorytm k-średnich Źródło: LaroseD.T., Okrywanie wiedzy w danych.wprowadzenie do eksploracji danych, PWN, Warszawa 005. Dane a b c d e f g h (,3) (3,3) (4,3) (5,3) (,) (4,) (,) (,) Algorytm k-średnich
Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz
Analiza wariancji Źródło: Aczel A. D. Statystyka w zarządzaniu Analiza wariancji jednoczynnikowa Populacja Pole trójkąty 4 5 3 7 4 8 kwadraty 0 3 4 3 kółka 3 3 Populacja Pole trójkąty 4 5 3 7 4 8 SUMA
Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu
Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy
Wykład 15. Metody nieparametryczne. Elementy analizy wielowymiarowej Weryfikacja założenia o normalności rozkładu populacji
Wykład 15. Metody nieparametryczne. Elementy analizy wielowymiarowej. 9.06.08 Weryfikacja założenia o normalności rozkładu populacji Dane są obserwacje x 1, x 2,..., x n. Czy można założyć, że x 1, x 2,...,
Cwiczenie 3 - Rozkłady empiryczne i. teoretyczne
Cwiczenie 3 - Rozkłady empiryczne i teoretyczne Michał Marosz 31 października 2015 1 Spis treści Rozkład empiryczny i dystrybuanta empiryczna 6 Estymacja parametrów rozkładów teoretycznych 8 Zmienne dyskretne
Matematyka i statystyka matematyczna dla rolników w SGGW
Było: Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji
R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych
R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we
Regresja - zadania i przykłady.
Regresja - zadania i przykłady. W5 e0 Zadanie 1. Poniżej zamieszczono fragmenty wydruków dotyczących dopasowania modelu regresji do zmiennej ozone w oparciu o promieniowanie (radiation), oraz w oparciu
Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków
Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków Wojciech Niemiro, Jacek Tomczyk i Marta Zalewska Uniwersytet
Równania strukturalne
Po co nam SEM? Badanie zależności między latentnymi zmiennymi Porównywanie konkurencyjnych modeli Badanie efektów pośrednich i bezpośrednich Konfirmacyjne analizy struktury narzędzi badawczych Testowanie
Regresja - zadania i przykłady.
Regresja - zadania i przykłady. W5 e0 Zadanie 1. Poniżej zamieszczono fragmenty wydruków dotyczących dopasowania modelu regresji do zmiennej ozone w oparciu o promieniowanie (radiation), oraz w oparciu
Ćwiczenie komputerowe 2 testy t-studenta. Program Statistica
Ćwiczenie komputerowe testy t-studenta. Program Statistica Test t-studenta dla par. Przykład Podsumowanie:roznica: =przed-po K-S d=.69, p>.; Lilliefors p>. Shapiro-Wilk W=.98, p=. Wykres normalności: roznica
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych
Natalia Nehrebecka. Wykład 1
Natalia Nehrebecka Wykład 1 1 1. Sprawy organizacyjne Zasady zaliczenia Dwiczenia Literatura 2. Czym zajmuje się ekonometria? 3. Formy danych statystycznych 4. Model ekonometryczny 2 1. Sprawy organizacyjne
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów
Rozpoznawanie twarzy metodą PCA Michał Bereta www.michalbereta.pl 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów Wiemy, że możemy porównywad klasyfikatory np. za pomocą kroswalidacji.
TESTY ANOVA JAKO NARZĘDZIE WSPOMAGAJĄCE WERYFIKACJĘ HIPOTEZ STATYSTYCZNYCH ANOVA TESTS AS A TOOL TO ASSIST IN VERIFYING STATISTICAL HYPOTHESIS
ARTYKUŁY NAUKOWE ASO.A.10(2)/2017.148-159 Wiesława Malska * Bogusław Twaróg ** TESTY ANOVA JAKO NARZĘDZIE WSPOMAGAJĄCE WERYFIKACJĘ HIPOTEZ STATYSTYCZNYCH ANOVA TESTS AS A TOOL TO ASSIST IN VERIFYING STATISTICAL
Analizy wariancji ANOVA (analysis of variance)
ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy
Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy # TS library("aer") data("uknondurables") # quarterly consumption
zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE
zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka Przebieg regresji liniowej: 1. Znaleźć funkcję y=f(x) (dopasowanie modelu) 2. Sprawdzić: a) Wsp. determinacji R 2 b) Test istotności
Wykład: Założenia analizy wariancji. Analiza wariancji złożona i testy wielokrotnych porównań.
Wykład: Założenia analizy wariancji. Analiza wariancji złożona i testy wielokrotnych porównań. Założenia analizy wariancji: Niezależność zmiennych objaśniających (czynników). Homogeniczność wariancji (równość
Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.
Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy
Analiza regresji. Analiza korelacji.
Analiza regresji. Analiza korelacji. Levels name mfr type calories protein fat sodium fiber carbo sugars potass vitamins shelf weight cups rating Storage 77 integer 7 integer 2 integer integer integer
Regresja logistyczna
Regresja logistyczna Zacznijmy od danych dotyczących tego czy studenci zostali przyjęci na studia. admissions
Analiza wariancji - ANOVA
Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu
Egzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna
Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
Modelowanie danych hodowlanych
Modelowanie danych hodowlanych 1. Wykład wstępny. Algebra macierzowa 3. Wykorzystanie różnych źródeł informacji w predykcji wartości hodowlanej 4. Kowariancja genetyczna pomiędzy spokrewnionymi osobnikami
Egzamin z ekonometrii wersja IiE, MSEMAT
Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.
Rozwiązanie: MSFA MSAB
Zadanie 1: Skompletuj poniższą tablicę analizy wariancji dwutorowej. Źródło SS? Wariancja? A 1828,09 2 MSFA=914,045? B 1102,34 3 =367,447 17,09? 88,91??? Błąd? 12??? 3277,34 23?? Rozwiązanie powyższego
Wykład 7 Testowanie zgodności z rozkładem normalnym
Wykład 7 Testowanie zgodności z rozkładem normalnym Wrocław, 05 kwietnia 2017 Rozkład normalny Niech X = (X 1, X 2,..., X n ) będzie próbą z populacji o rozkładzie normalnym określonym przez dystrybuantę
Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)
Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Plastyczność fenotypowa sosny zwyczajnej na podstawie doświadczenia proweniencyjnego z 1967 roku
Plastyczność fenotypowa sosny zwyczajnej na podstawie doświadczenia proweniencyjnego z 1967 roku Roman Rożkowski, Daniel J. Chmura Instytut Dendrologii PN w Kórniku Plastyczność fenotypowa produkcji antocyjanów
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE
STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 3! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE Jan E. Zejda Katedra Epidemiologii WLK, SUM TREŚĆ SEMINARIUM
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
1.9 Czasowy wymiar danych
1.9 Czasowy wymiar danych Do tej pory rozpatrywaliśmy jedynie modele tworzone na podstawie danych empirycznych pochodzących z prób przekrojowych. Teraz zajmiemy się zagadnieniem budowy modeli regresji,
Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE
WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE Było: Przykład. W doświadczeniu polowym załoŝonym w układzie całkowicie losowym w czterech powtórzeniach porównano
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji Zmienna zależna ilościowa, numeryczna Zmienna niezależna grupująca (dzieli próbę na więcej niż dwie grupy), nominalna zmienną wyrażoną tekstem należy w SPSS przerekodować
Jednowskaźnikowy model Sharpe`a
Uniwersytet Warszawski Wydział Nauk Ekonomicznych Milena Jamroziak i Paweł Androszczuk Model ekonometryczny Jednowskaźnikowy model Sharpe`a dla akcji Amici Praca zaliczeniowa napisana pod kierunkiem mgr
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3 Konrad Miziński, nr albumu 233703 26 maja 2015 Zadanie 1 Wartość krytyczna c, niezbędna wyliczenia mocy testu (1 β) wyznaczono za
Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich
(Wykład 13) Jednoczynnikowa analiza wariancji Wnioskowanie dla jednoczynnikowej ANOV-y Format danych Hipotezy i model ANOVA Tabela ANOVA i test F Porównywanie poszczególnych średnich Jednoczynnikowa ANOVA
1.8 Diagnostyka modelu
1.8 Diagnostyka modelu Dotychczas zajmowaliśmy się własnościami estymatorów przy spełnionych założeniach KMRL. W praktyce nie zawsze spełnione są wszystkie założenia modelu. Jeżeli któreś z nich nie jest
Osiem historyjek o modelach liniowych i mieszanych
Osiem historyjek o modelach liniowych i mieszanych Przemyslaw.Biecek@gmail.com, MIM Uniwersytet Warszawski Plan prezentacji 1 politechnika, czyli ANOVA jednokierunkowa, testy post-hoc i analiza kontrastów,