Instalacja Pakietu R www.r-project.org wybór źródła wybór systemu operacyjnego: Download R for Windows opcja: install R for the first time opcja: Download R 3.3.3 for Windows uruchomienie R-3.3.3-win MAGDA MIELCZAREK 2
Uruchomienie programu MAGDA MIELCZAREK 3
Dostępne opcje MAGDA MIELCZAREK 4
Ładowanie pakietów MAGDA MIELCZAREK 5
System pomocy MAGDA MIELCZAREK 6
System pomocy help( nazwafunkcji )? nazwa funkcji args(nazwafunkcji) apropos( słowok ) example(nazwafunkcji) help.search( słowokluczowe ) MAGDA MIELCZAREK 7
Plik Nowy skrypt (.R) obszar roboczy vs. nowy plik MAGDA MIELCZAREK 8
Edycja kodu źródłowego: skrypt dostępny w pakiecie R alternatywne edytory tekstowe np. Notepad++, Tinn-R Notepad++ is a free (as in "free speech" and also as in "free beer") source code editor and Notepad replacement that supports several languages. Running in the MS Windows environment, its use is governed by GPL License. MAGDA MIELCZAREK 9
Pakiet R: uwagi wstępne R = środowisko obliczeń statystycznych R = język programowania Brak interfejsu graficznego (wada pozorna) Darmowy MAGDA MIELCZAREK 10
kalkurator operatory arytmetyczne x + y x y x * y x / y x ^ y suma różnica iloczyn iloraz x do potęgi y kropka jako oddzielnie części całkowitej od ułamkowej argumenty funkcji oddzielane przecinkami MAGDA MIELCZAREK 11
kalkurator wybrane funkcje arytmetyczne round(x,a) abs(x) log(x) log(x,a) sqrt(x) sin(x) cos(x) tan(x) factorial(x) zaokrąglenie liczby x do a miejsc po przecinku wartość bezwzględna z x logarytm naturalny z x logarytm z x o podstawie a pierwiastek kwadratowy z x wartości funkcji sinus w x wartości funkcji cosinus w x wartości funkcji tangens w x silnia liczby x MAGDA MIELCZAREK 12
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Po co przechowywać wartości w pamięci operacyjnej? Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja MAGDA MIELCZAREK 13
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Przechowywanie wartości liczbowych Dozwolona notacja naukowa (2e3) NaN (Not a Number) MAGDA MIELCZAREK 14
Typ zmiennych: liczbowy MAGDA MIELCZAREK 15
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Wartości występujące w kategoriach, np. płeć Definiowanie grup Poprawienie efektywności skryptów (zm. zajmują mniej miejsca w pamięci niż odpowiadające im łańcuchy znaków = szybsze wykonywanie obliczeń) MAGDA MIELCZAREK 16
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Przechowywanie łańcuchów znaków (napisów) Rozpoczynane i zakończone znakiem (lub ) Napisy można sklejać (paste) MAGDA MIELCZAREK 17
Typ zmiennych: znakowy MAGDA MIELCZAREK 18
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Logiczne prawda lub fałsz (TRUE, FALSE) Testowanie równości W wyrażeniu arytmetycznym konwertowane na 0 (F) i 1 (T) MAGDA MIELCZAREK 19
Typ zmiennych: logiczny MAGDA MIELCZAREK 20
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Uporządkowany zbiór elementów tego samego typu (indeksowanie) Funkcja c() MAGDA MIELCZAREK 21
Typ zmiennych: wektor MAGDA MIELCZAREK 22
Typ zmiennych: wektor MAGDA MIELCZAREK 23
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Uporządkowany zbiór elementów różnych typów Funkcja list() MAGDA MIELCZAREK 24
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Funkcja matrix() MAGDA MIELCZAREK 25
Typ zmiennych: macierz MAGDA MIELCZAREK 26
Macierze wybrane funkcje funkcja matrix(x,wiersze,kolumny) dim(m) nrow(m) ncol(m) t(m) M1 %*% M2 rbind(m1,m2) cbind(m1,m2) znaczenie macierz wypełniona liczbami x o zadanej liczbie wierszy i kolumn wymiar macierzy M liczba wierszy macierzy M liczba kolumn transpozycja macierzy M iloczyn macierzy M1 i M2 połączenie macierzy M1 i M2 wierszami połączenie macierzy M1 i M2 kolumnami MAGDA MIELCZAREK 27
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Przemysław Dane DANE) Biecek. Przewodnik po pakiecie R Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Lista wektorów tej samej długości Elementy w kolumnie są tego samego typu Różnica w typie pomiędzy kolumnami Funkcja data.frame() MAGDA MIELCZAREK 28
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Konstrukcja obiektów Słowo kluczowe function MAGDA MIELCZAREK 29
Praca z plikami wczytywanie pliku ze strony internetowej dane <- read.table( adres", nagłówek, separator kolumn) wczytywanie pliku z dysku komputera: dane <- read.table( ścieżka dostępu/nazwa pliku, nagłówek, separator kolumn) zapisywanie pliku na dysku: write.table(macierz, ścieżka dostępu/nazwa pliku, separator kolumn) MAGDA MIELCZAREK 30
Praca z plikami MAGDA MIELCZAREK 31
Statystyka opisowa funkcja max() min() range() mean() median() var() sd() cor() cov() length() znaczenie wartość maksymalna z próby wartość minimalna z próby przedział wartości próby średnia arytmetyczna z próby mediana z próby wariancja w próbie odchylenie standardowe w próbie współczynnik lub macierz korelacji kowariancja lub macierz kowariancji liczba elementów w próbie MAGDA MIELCZAREK 32
Statystyka opisowa w formie graficznej histogram MAGDA MIELCZAREK 33
Statystyka opisowa w formie graficznej wykres pudełkowy MAGDA MIELCZAREK 34
Zapisywanie rysunku MAGDA MIELCZAREK 35
Literatura: Przemysław Biecek Przewodnik po pakiecie R Marek Walesiak, Eugeniusz Gatnar Statystyczna analiza danych z wykorzystaniem programu R system pomocy pakietu R MAGDA MIELCZAREK 36