Edytor wprowadzone polecenia zostają w oknie edytora I mogą być uruchamiana poprzez CTRL+R lub Run (tylko zaznaczone linie, z wyświetlaniem wykonywanych linii kodu) lub poprzez Source (zawsze całość, bez wyświetlania linii kodu, jedynie wyświetlane są informacje wprost określone przez funkcję print) Środowisko zmienne, w których pamiętane są dane podczas pracy, polecenie dostosowanego importu Wiersz poleceń polecenia wydawane w tym oknie znikają (powrót do nich jest możliwy poprzez nawigację strzałkami góra i dół). To okno przypomina czyste środowisko R Narzędzie (zainstalowane pakiety, przeglądanie I ładowanie plików, wykresy, okienko pomocy) 1
Zainstaluj programy R https://cran.r-project.org/ I R Studio https://www.rstudio.com/ RCMDR (R na skróty ) 1. Zainstaluj przy pomocy RStudio pakiet clustersim 2. Wykonaj polecenia: library(clustersim) windows() plot(cluster.gen(numobjects = 50,model=4)$data,col=rep(rainbow(3),each=50)) Obejrzyj wyniki działania poleceń 3. Zainstaluj i uruchom nakładkę RCMDR 4. Załaduj dane Salaries z pakietu car 1
5. Obejrzyj zbiór danych, przejdź do edycji (nie zapisując zmian) 6. Stwórz histogram zmiennej salary 2
Co możemy powiedzić o rozkładzie zmiennej? 7. Stwórz wykres rozrzutu (punktowy) zmiennych salary i yrs.service 8. Zmień ręcznie długość osi x od 0 do 300000 (xlim) 9. Zmień ręcznie długość osi y od 10 do 30 (ylim) zwóć uwagę, że wykres się nie mieści 10. Zmień kolor, symbol punktów i rozmiar (col, pch,cex) 11. Ustal inne parametry wykresu poprzez okno konfiguracyjne, włącz identyfikację punktów 3
12. Utwórz wykres punktowy macierzowy dla wszystkich trzech zmiennych metrycznych, określ, dla których z nich wykres wskazuje na wysoką wartość współczynnika korelacji 13. Zwróć uwagę, że każdemu poleceniu odpowiadają instrukcje języka R 14. Z modyfikuj polecenie, żeby każdy punt wykresu był narysowany innym kolorem plot(as.matrix(cbind(salaries$salary,salaries$yrs.service,salaries$yrs.since.phd)), reg.line=false, smooth=false, spread=false, span=0.5, ellipse=false, levels=c(.5,.9), id.n=0, col=rainbow(100)) 15. Stwórz wykres słupkowy wg stanowisk i wykres kołowy wg płci 16. Oblicz podstawowe statystyki dla zbiory poprzez dane podsumowania, podsumowania numeryczne (z opcjami kurtoza i skośność). Zinterpetuj wyniki 17. Pokaż średnią pensję w zależności od płci (Statystyki podsumowania, tabela statystyk). Zwróć uwagę na zapis polecenia obliczenia statystyk w rozbiciu na grupy w języku R 18. Oblicz wspóczynniki korelacji pomiędzy salary, yrs.service, yrs.since.phd, porównaj wyniki z wnioskami z punktu 10. 19. Zbadaj normalność każdej ze zmiennych, zinterpretuj p-wartości testu Shapiro-Wilka 20. Stwórz tablicę kontyngencji płci z rodzajem pracy badawczej oraz płci ze stanowiskiem, ziterpretuj p-wartości testu chi-kwadrat 21. Przeprowadź test t-studenta niezależnych prób dla zmiennych płeć i wynagrodzenie, zinterpretuj wyniki 22. Zwróć uwagi że zmiennej stopień (rank) nie było na liście do wyboru testu niezależnych prób (dlaczego?) Przeprowadź dla tej zmiennej i zmiennej salary analizę wariancji (ANOVA) 23. Stwórz model regresji zmiennej salary w zależności od pozostałych zmiennych, zinterpretuj wyniki.. 24. Zaimportuj plik tekstowy innowacyjnoscue_rcmd.csv jako nowy plik danych pakietu RCMDR - obejrzyj dane 4
- oblicz podstawowe statystyki dla wszystkich zmiennych: średnie, odchylenie standardowe, błąd standardowy średniej, rozstęp ćwiartkowy, kurtozę i kwartyle - oblicz macierz korelacji Pearson a i Spearmana pomiędzy poszczególnymi zmiennymi - zbadaj testem Shapiro Wilka normalność rozkładu pierwszej zmiennej - stwórz trzy dowolne wykresy dla tego zbioru danych - podziel zbiór innowacyjnoscue na trzy klasy metodą k-średnich. 25. Zobacz https://shiny.rstudio.com/tutorial/lesson1/, spróbuj uruchomić przykłady dotyczące serwera shiny 26. Rozpakuj plik mds-opt.zip, zobacz strukturę katalogów oraz ich zawartość 27. 28. 25. Rozpakuj archiwum z pliku mapy.zip (plik na stronie wgrit.ae.jgora.pl/ad). Uruchom plik wybory2015 z wynikami wyborów 29. 26. Uruchom plik dolnoslskie.r, zobacz średnią liczbę zachorowań na choroby serca na 100 osób 30. 27. Uruchom plik 5 powiatów, zobacz samą mapę powiatu śremskiego i okolic, Stwórz mapę swojej okolicy 31. 28. Wyświetl dane dotyczące rozwodów na mapie Polski 32. 29. Wyświetl dowolne dane z BDL na poziomie powiatów dla wybranego województwa 33. 30. Zobacz https://shiny.rstudio.com/tutorial/lesson1/, spróbuj uruchomić przykłady dotyczące Jeżeli starczy czasu dodatkowe pliki do ćwiczeń znajdują się na stronie wgrit.ae.jgora.pl/ad 5