. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 0. R, elementy analizy danych edycja danych. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 2. R, elementy analizy danych symulacje Monte Carlo 3. R, elementy wizualizacji danych dystrybucja standardowa 4. R, tworzenie prostych programów w pakiecie R 5. Podsumowanie materiału
WSTĘP. SAS regresja liniowa proc reg proc glm 2. SAS regresja nieliniowa proc logistic Copyright 208, Joanna Szyda
REGRESJA LINIOWA
REGRESJA LINIOWA zaw. tłuszczu 30 29 28 27 26 25 24 23 22 y x 0 F, N 2 N i N i N N yˆ yˆ i i N y y i gradient błąd 50 60 70 80 90 00 wyraz wolny masa ciała 2 2 Copyrigt 207, Joanna Szyda
REGRESJA LINIOWA PROC REG proc reg data=alcohol ; nazwa procedury, zbiór danych eq: model MAXDRINK=AGE_ONSET ; równanie regresji plot MAXDRINK*AGE_ONSET ; wykres eq2: model MAXDRINK=MAXCIGAR ; 2 równanie regresji run ; maxdrinks age _ y x 0 of 0 _ onset Copyrigt 208, Joanna Szyda
REGRESJA LINIOWA PROC GLM proc glm data=alcohol ; nazwa procedury, zbiór danych model MAXDRINK=AGE_ONSET ; równanie regresji output out=outdat r=residual ; plik wynikowy run ; proc print data=outdat ; var IID residual ; run ; wypisanie pliku wynikowego specyfikacja zmiennych statystyki opisowe dla wartości błędów proc means data=outdat ; var residual; run ; proc univariate data=outdat ; var residual ; run ; Copyrigt 208, Joanna Szyda
REGRESJA LINIOWA WYNIKI The REG Procedure Model: eq Dependent Variable: MAXDRINK nazwa procedury zmienna zależna liczba obserwacji Number of Observations Read 559 Number of Observations Used 602 Number of Observations with Missing Values 957 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr> t Intercept 36.00663.99706 8.03 <.000 AGE_ONSET -0.38452 0.08303-4.63 <.000 maxdrinks age _ of y y x 0 36.00663 0.38452x 0 _ onset Copyrigt 207, Joanna Szyda
REGRESJA LINIOWA WYNIKI Copyrigt 207, Joanna Szyda
REGRESJA LINIOWA WYNIKI The GLM Procedure Dependent Variable: MAXDRINK Sum of Source DF Squares Mean Square F Value Pr > F Model 629.600 629.600 2.45 <.000 Error 600 7468.5860 285.780 Corrected Total 60 77598.860 wartość testu F st. swobody poziom istotności Standard Parameter Estimate Error t Value Pr > t Intercept 36.00662893.99706375 8.03 <.000 AGE_ONSET -0.3845848 0.08302670-4.63 <.000 Copyrigt 207, Joanna Szyda
REGRESJA LINIOWA WYNIKI Obs IID residual 766 000063. 767 0000207. 768 0000597 8.947 769 00006 67.6837 770 000326-3.937 77 00062. 772 0000278. 773 00048. 774 0000839. 775 000440 0.457 nr nr wartość obserwacji osobnika błędu Copyrigt 207, Joanna Szyda
REGRESJA LOGISTYCZNA
TRANSFORMACJA DANYCH prawdopodobieństwo 0 transformacja funkcja prawdopodobieństwa - + Copyrigt 208, Joanna Szyda
transformacja TRANSFORMACJA DANYCH Transformacja logistyczna logit p p ln p 2.50 2.00.50.00 0.50 0.00-0.50 -.00 -.50-2.00-2.50 p logit(p) + p=0.5 logit(p)=0 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 p 0 logit(p) - prawdopodobieństwo (p) Copyrigt 208, Joanna Szyda
RÓWNANIE REGRESJI LOGISTYCZNEJ x x p x p p 0 0 0 exp exp ln p logit exp e podstawa logarytmu naturalnego 2.78 Copyrigt 208, Joanna Szyda
REGRESJA NIELINIOWA PROC LOGISTIC ods graphics on; proc logistic data=alcohol outmodel=logregout plots(only)=(oddsratio effect) ; class ETHNICITY SEX ; model DISEASE= MAXCIGAR ETHNICITY SEX ; oddsratio SEX; oddsratio ETHNICITY; run; ods graphics off; Copyrigt 208, Joanna Szyda