PAKIETY STATYSTYCZNE

Podobne dokumenty
PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

BIOMETRIA 3. Wprowadzenie do pakietu SAS

Oprogramowanie dla GWAS

(LMP-Liniowy model prawdopodobieństwa)

WSTĘP Oprogramowanie dla GWAS

Ekonometria dla IiE i MSEMat Z7

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

INFORMATYKA W SELEKCJI

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

INFORMATYKA W SELEKCJI

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

STATYSTYKA MATEMATYCZNA

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Informatyka w selekcji - Wykªad 4

Regresja logistyczna. Regresja logistyczna. Przykłady DV. Wymagania

BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

STATYSTYKA MATEMATYCZNA

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Modelowanie danych hodowlanych

Uogólniony model liniowy

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

PODSTAWY STATYSTYKI SEMINARIUM 3 ! UWAGA! SLAJDY WYBRANE I ZMODYFIKOWANE POD KĄTEM PREZENTACJI W INTERNECIE

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

STATYSTYKA MATEMATYCZNA

Wykład: Założenia analizy wariancji. Analiza wariancji złożona i testy wielokrotnych porównań.

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV

STATYSTYKA MATEMATYCZNA

Regresja logistyczna (LOGISTIC)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Zastosowanie uogólnionych modeli liniowych i uogólnionych mieszanych modeli liniowych do analizy danych dotyczacych występowania zębiniaków

Stosowana Analiza Regresji

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

STATYSTYKA MATEMATYCZNA

Budowa modelu i testowanie hipotez

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Regresja liniowa wprowadzenie

Regresja liniowa w R Piotr J. Sobczyk

Ekonometria egzamin 07/03/2018

STUDIUM DOKTORANCKIE KATOWICE, 2011/12 PODSTAWY STATYSTYKI SEMINARIUM 4. Jan E. Zejda Katedra Epidemiologii WLK, SUM

Egzamin z ekonometrii wersja IiE, MSEMAT

Projekt Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

S t a t y s t y k a, część 3. Michał Żmihorski

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka.

SAS 4GL ODS, przykładowe procedury.

Ekonometria dla IiE i MSEMat Z12

Nowa oferta edukacyjna Uniwersytetu Wrocławskiego odpowiedzią na współczesne potrzeby rynku pracy i gospodarki opartej na wiedzy

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

1 Obliczenia na danych

Diagnostyka w Pakiecie Stata

Wprowadzenie do estymacji rozkładów w SAS.

Metody oceny ryzyka operacyjnego

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Stanisław Cichocki. Natalia Nehrebecka

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

SAS Podstawowe informacje przed ćwiczeniem 1

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Matematyka i statystyka matematyczna dla rolników w SGGW

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Własności statystyczne regresji liniowej. Wykład 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Nieliniowe. Liniowe. Nieliniowe. Liniowe. względem parametrów. Linearyzowane. sensu stricto

Stanisław Cichocki. Natalia Nehrebecka

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

Problem równoczesności w MNK

Diagnostyka w Pakiecie Stata

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Transkrypt:

. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 0. R, elementy analizy danych edycja danych. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 2. R, elementy analizy danych symulacje Monte Carlo 3. R, elementy wizualizacji danych dystrybucja standardowa 4. R, tworzenie prostych programów w pakiecie R 5. Podsumowanie materiału

WSTĘP. SAS regresja liniowa proc reg proc glm 2. SAS regresja nieliniowa proc logistic Copyright 208, Joanna Szyda

REGRESJA LINIOWA

REGRESJA LINIOWA zaw. tłuszczu 30 29 28 27 26 25 24 23 22 y x 0 F, N 2 N i N i N N yˆ yˆ i i N y y i gradient błąd 50 60 70 80 90 00 wyraz wolny masa ciała 2 2 Copyrigt 207, Joanna Szyda

REGRESJA LINIOWA PROC REG proc reg data=alcohol ; nazwa procedury, zbiór danych eq: model MAXDRINK=AGE_ONSET ; równanie regresji plot MAXDRINK*AGE_ONSET ; wykres eq2: model MAXDRINK=MAXCIGAR ; 2 równanie regresji run ; maxdrinks age _ y x 0 of 0 _ onset Copyrigt 208, Joanna Szyda

REGRESJA LINIOWA PROC GLM proc glm data=alcohol ; nazwa procedury, zbiór danych model MAXDRINK=AGE_ONSET ; równanie regresji output out=outdat r=residual ; plik wynikowy run ; proc print data=outdat ; var IID residual ; run ; wypisanie pliku wynikowego specyfikacja zmiennych statystyki opisowe dla wartości błędów proc means data=outdat ; var residual; run ; proc univariate data=outdat ; var residual ; run ; Copyrigt 208, Joanna Szyda

REGRESJA LINIOWA WYNIKI The REG Procedure Model: eq Dependent Variable: MAXDRINK nazwa procedury zmienna zależna liczba obserwacji Number of Observations Read 559 Number of Observations Used 602 Number of Observations with Missing Values 957 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr> t Intercept 36.00663.99706 8.03 <.000 AGE_ONSET -0.38452 0.08303-4.63 <.000 maxdrinks age _ of y y x 0 36.00663 0.38452x 0 _ onset Copyrigt 207, Joanna Szyda

REGRESJA LINIOWA WYNIKI Copyrigt 207, Joanna Szyda

REGRESJA LINIOWA WYNIKI The GLM Procedure Dependent Variable: MAXDRINK Sum of Source DF Squares Mean Square F Value Pr > F Model 629.600 629.600 2.45 <.000 Error 600 7468.5860 285.780 Corrected Total 60 77598.860 wartość testu F st. swobody poziom istotności Standard Parameter Estimate Error t Value Pr > t Intercept 36.00662893.99706375 8.03 <.000 AGE_ONSET -0.3845848 0.08302670-4.63 <.000 Copyrigt 207, Joanna Szyda

REGRESJA LINIOWA WYNIKI Obs IID residual 766 000063. 767 0000207. 768 0000597 8.947 769 00006 67.6837 770 000326-3.937 77 00062. 772 0000278. 773 00048. 774 0000839. 775 000440 0.457 nr nr wartość obserwacji osobnika błędu Copyrigt 207, Joanna Szyda

REGRESJA LOGISTYCZNA

TRANSFORMACJA DANYCH prawdopodobieństwo 0 transformacja funkcja prawdopodobieństwa - + Copyrigt 208, Joanna Szyda

transformacja TRANSFORMACJA DANYCH Transformacja logistyczna logit p p ln p 2.50 2.00.50.00 0.50 0.00-0.50 -.00 -.50-2.00-2.50 p logit(p) + p=0.5 logit(p)=0 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 p 0 logit(p) - prawdopodobieństwo (p) Copyrigt 208, Joanna Szyda

RÓWNANIE REGRESJI LOGISTYCZNEJ x x p x p p 0 0 0 exp exp ln p logit exp e podstawa logarytmu naturalnego 2.78 Copyrigt 208, Joanna Szyda

REGRESJA NIELINIOWA PROC LOGISTIC ods graphics on; proc logistic data=alcohol outmodel=logregout plots(only)=(oddsratio effect) ; class ETHNICITY SEX ; model DISEASE= MAXCIGAR ETHNICITY SEX ; oddsratio SEX; oddsratio ETHNICITY; run; ods graphics off; Copyrigt 208, Joanna Szyda