Wprowadzenie do Pakietu R dla kierunku Zootechnika Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu
Instalacja Pakietu R www.r-project.org wybór źródła wybór systemu operacyjnego: Download R for Windows opcja: install R for the first time opcja: Download R 3.3.3 for Windows uruchomienie R-3.3.3-win Statystyka matematyczna 2016/2017 2
Uruchomienie programu Statystyka matematyczna 2016/2017 3
Dostępne opcje Statystyka matematyczna 2016/2017 4
Ładowanie pakietów Statystyka matematyczna 2016/2017 5
System pomocy Statystyka matematyczna 2016/2017 6
System pomocy help( nazwafunkcji )? nazwa funkcji args(nazwafunkcji) apropos( słowok ) example(nazwafunkcji) help.search( słowokluczowe ) 7
Plik Nowy skrypt (.R) obszar roboczy vs. nowy plik Statystyka matematyczna 2016/2017 8
Edycja kodu źródłowego: skrypt dostępny w pakiecie R alternatywne edytory tekstowe np. Notepad++, Tinn-R Notepad++ is a free (as in "free speech" and also as in "free beer") source code editor and Notepad replacement that supports several languages. Running in the MS Windows environment, its use is governed by GPL License. Statystyka matematyczna 2016/2017 9
Pakiet R: uwagi wstępne R = środowisko obliczeń statystycznych R = język programowania Brak interfejsu graficznego (wada pozorna) Darmowy Statystyka matematyczna 2016/2017 10
kalkurator operatory arytmetyczne x + y x y x * y x / y x ^ y suma różnica iloczyn iloraz x do potęgi y kropka jako oddzielnie części całkowitej od ułamkowej argumenty funkcji oddzielane przecinkami Statystyka matematyczna 2016/2017 11
kalkurator wybrane funkcje arytmetyczne round(x,a) abs(x) log(x) log(x,a) sqrt(x) sin(x) cos(x) tan(x) factorial(x) zaokrąglenie liczby x do a miejsc po przecinku wartość bezwzględna z x logarytm naturalny z x logarytm z x o podstawie a pierwiastek kwadratowy z x wartości funkcji sinus w x wartości funkcji cosinus w x wartości funkcji tangens w x silnia liczby x Statystyka matematyczna 2016/2017 12
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Po co przechowywać wartości w pamięci operacyjnej? Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Statystyka matematyczna 2016/2017 13
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Przechowywanie wartości liczbowych Dozwolona notacja naukowa (2e3) NaN (Not a Number) Statystyka matematyczna 2016/2017 14
Typ zmiennych: liczbowy Statystyka matematyczna 2016/2017 15
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Wartości występujące w kategoriach, np. płeć Definiowanie grup Poprawienie efektywności skryptów (zm. zajmują mniej miejsca w pamięci niż odpowiadające im łańcuchy znaków = szybsze wykonywanie obliczeń) Statystyka matematyczna 2016/2017 16
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Przechowywanie łańcuchów znaków (napisów) Rozpoczynane i zakończone znakiem (lub ) Napisy można sklejać (paste) Statystyka matematyczna 2016/2017 17
Typ zmiennych: znakowy Statystyka matematyczna 2016/2017 18
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Logiczne prawda lub fałsz (TRUE, FALSE) Testowanie równości W wyrażeniu arytmetycznym konwertowane na 0 (F) i 1 (T) Statystyka matematyczna 2016/2017 19
Typ zmiennych: logiczny Statystyka matematyczna 2016/2017 20
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Uporządkowany zbiór elementów tego samego typu (indeksowanie) Funkcja c() Statystyka matematyczna 2016/2017 21
Typ zmiennych: wektor Statystyka matematyczna 2016/2017 22
Typ zmiennych: wektor Statystyka matematyczna 2016/2017 23
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Uporządkowany zbiór elementów różnych typów Funkcja list() Statystyka matematyczna 2016/2017 24
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Funkcja matrix() Statystyka matematyczna 2016/2017 25
Typ zmiennych: macierz Statystyka matematyczna 2016/2017 26
Macierze wybrane funkcje funkcja matrix(x,wiersze,kolumny) dim(m) nrow(m) ncol(m) t(m) M1 %*% M2 rbind(m1,m2) cbind(m1,m2) znaczenie macierz wypełniona liczbami x o zadanej liczbie wierszy i kolumn wymiar macierzy M liczba wierszy macierzy M liczba kolumn transpozycja macierzy M iloczyn macierzy M1 i M2 połączenie macierzy M1 i M2 wierszami połączenie macierzy M1 i M2 kolumnami Statystyka matematyczna 2016/2017 27
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Przemysław Dane DANE) Biecek. Przewodnik po pakiecie R Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Lista wektorów tej samej długości Elementy w kolumnie są tego samego typu Różnica w typie pomiędzy kolumnami Funkcja data.frame() Statystyka matematyczna 2016/2017 28
Podstawy języka R Zmienna służy do przechowywania wartości (np. x = 5, y = statystyka ) Nazwy zmiennych: Dowolny ciąg liter, cyfr, znaków podkreślenia lub kropek Wrażliwe na wielkość liter (dane Dane DANE) Typy zmiennych: liczbowy czynnikowy znakowy logiczny wektor lista macierz ramka danych funkcja Konstrukcja obiektów Słowo kluczowe function Statystyka matematyczna 2016/2017 29
Praca z plikami wczytywanie pliku ze strony internetowej dane <- read.table( adres", nagłówek, separator kolumn) wczytywanie pliku z dysku komputera: dane <- read.table( ścieżka dostępu/nazwa pliku, nagłówek, separator kolumn) zapisywanie pliku na dysku: write.table(macierz, ścieżka dostępu/nazwa pliku, separator kolumn) Statystyka matematyczna 2016/2017 30
Praca z plikami Statystyka matematyczna 2016/2017 31
Statystyka opisowa funkcja max() min() range() mean() median() var() sd() cor() cov() length() znaczenie wartość maksymalna z próby wartość minimalna z próby przedział wartości próby średnia arytmetyczna z próby mediana z próby wariancja w próbie odchylenie standardowe w próbie współczynnik lub macierz korelacji kowariancja lub macierz kowariancji liczba elementów w próbie Statystyka matematyczna 2016/2017 32
Statystyka opisowa w formie graficznej histogram 33
Statystyka opisowa w formie graficznej wykres pudełkowy 34
Zapisywanie rysunku Statystyka matematyczna 2016/2017 35
Literatura: Przemysław Biecek Przewodnik po pakiecie R Marek Walesiak, Eugeniusz Gatnar Statystyczna analiza danych z wykorzystaniem programu R system pomocy pakietu R Statystyka matematyczna 2016/2017 36