Wprowadzenie do pakietu Ma lgorzata Kalbarczyk-Stȩclik Uniwersytet Warszawski mkalbarczyk@wne.uw.edu.pl Październik 02, 2014
Plan 1 Podstawowe informacje o kursie Warunki zaliczenia Prezentacje Zaliczenie 2
Warunki zaliczenia Prezentacje Zaliczenie Podstawowe informacje Zajȩcia odbywać siȩ bȩd a w pracowni komputerowej i wykorzystywać bȩdziemy pakiet Prowadz acy: Konrad Dymarski, Aneta Dzik i Ma lgorzata Kalbarczyk-Stȩclik Literatura:,,Statystyczna analiza wielowymiarowa i jej zastosowania spo leczno-ekonomiczne Andrzej Balicki Dyżur: Czwartek 12:30-13:00 sala 302 Strona: www.wne.uw.edu.pl/mkalbarczyk
Warunki zaliczenia Prezentacje Zaliczenie Elementy zaliczenia 20 % - trzy kartówki w ci agu ca lego semestru 30 % - prezentacja 50 % - pisemne zaliczenie
Warunki zaliczenia Prezentacje Zaliczenie Prezentacje Prezentować należy w lasne badanie obejmuj ace jedn a z metod przedstawionych na zajȩciach. Terminy: 18.12.2014 (z 4 zajȩć październikowych), 08.01.2015 i 15.01.2015 (z zajȩć listopadowych i grudniowych) Zespo ly: Prezentacje s a w grupach max dwuosobowych i bȩd a trwa ly 15 minut. Deklaracja zespo lów musi być na drugich zajȩciach Temat: Do 30.11.2014 należy podać emailem (do Konrada Dymarskiego) temat prezentacji. Musi być przynajmniej jedna prezentacja z każdej metody. Obowi azuje zasada kto pierwszy ten lepszy
Warunki zaliczenia Prezentacje Zaliczenie Tematy (1) Testy parametryczne i nieparametryczne (2) Korelacje (3) Analiza wariancji i kowariancji (4) Analiza sk ladowych glównych (5) Analiza skupień (6) Porz adkowanie liniowe
Warunki zaliczenia Prezentacje Zaliczenie Pisemne zaliczenie Pisemne zaliczenie obejmuje 3 pytania otwarte. Obejmuje wszystkie tematy. Odbȩdzie siȩ na ostatnich zajȩciach 22.01.2015
Podstawowe informacje o kursie Wygla d Malgorzata Kalbarczyk-Ste clik Statystyka matemtyczna II - zaje cia 1
Ustalenie ile maksymalnie zmiennych może być wykorzystywane.domyślnie jest ich 40,można to zmienić na maksymalnie 800 - set matsize 800 W starszych wersjach przydzielenie Stacie pamiȩci operacyjnej (literka m oznacza, e jest to 100MB. Można wykorzystać b, k oraz g. UWAGA: niemożna zmieniać przydzia lu pamiȩci jeśli już mamy wczytane dane! - set memory 100m Sprawdzenie ustawień - query memory
w Podstawowe informacje o kursie Lista dostȩpnych tematów pomocy - help na temat wybranej komendy Staty - help summarize Jeżeli nie znamy nazwy komendy Staty, której poszukujemy korzystamy z SEARCH - należy podać s lowa kluczowe np. search test for normality
Wczytywanie z pliku Wczytujemy plik z katalogu lub serwera use http://www.stata-press.com/data/r12/hospital.dta, clear Ogl adamy dane - edit Informacje o zbiorze danych- describe
Inne sposoby Podstawowe informacje o kursie Import z pliku np excel import excel C:\scieżka\, sheet Arkusz1 firstrow Wpisywanie danych edit
dla poszczególnych zmiennych label var hospital numer szpitala label var satisfied zadowolenie label var illness choroba
dla poszczególnych wartości zmiennych Definiujemy etykietȩ label define sat 0 not satisfied 1 satisfied Przypisujemy etykietȩ label values satisfied sat
SUMMARIZE Podstawowe informacje o kursie Pokazuje podstawowe statystyki opisowe (średnia, odchylenie standardowe,minimum, maximum) Można skracać su Dla jednej zmiennej su illness Dodatkowe statystyki, opcja detail su illness,detail
TABULATE Podstawowe informacje o kursie Pokazuje tabele czȩstości Dla jednej zmiennej tab illness Tabele krzyżowe dla dwóch zmiennych tab satisfied illness Tabele krzyżowe procentowane w wierszu tab satisfied illness,r Tabele krzyżowe procentowane w kolumnie tab satisfied illness,col
GENERATE Podstawowe informacje o kursie Pozwala stworzyć now a zmienn a Tworzymy zmienn a równ a sta lej gen test=5 Tworzymy now a zmienn a równ a zmiennej hospital gen nowyszpital=hospital Tworzymy zmienn a, która przyjmuje wartość jeden jeżeli zmienna hospital=1 i 0 w przeciwnym przypadku gen nowyszpital2= hospital == 1
BYS, IF, IN Podstawowe informacje o kursie BYS - pozwala wykonywać komendy w podziale na kategorie innej zmiennej bys illness: su satisfied IF - dodanie warunku do komendy - trzeba pamiȩtać o podwójnym znaku równa siȩ tab illness if satisfied==1 IN - Komenda dla wybranego zakresu obserwacji Komenda dla pierwszych 10 obserwacji tab hospital in 1/10 Wykorzystywana z LIST list illness in 1/10
REPLACE RECODE Komendy pozwalaj a na rekodowanie zmiennych Rekodujemy wartości zmiennej nowyszpital 3 na 2 recode nowyszpital 3=2 Zmieniamy wartość zmiennej nowyszpital2 na 2 jeśli zmienna hospital przyjmuje wartość 2 lub 3 replace nowyszpital2=2 if hospital==2 hospital==3