Pakiet R moŝna pobrać i zainstalować ze strony

Podobne dokumenty
UNIWERSYTET RZESZOWSKI KATEDRA INFORMATYKI

Wprowadzenie do języka R. Opracowanie: Ewelina Bednarz

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Symulacja w przedsiębiorstwie

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Matlab, zajęcia 3. Jeszcze jeden przykład metoda eliminacji Gaussa dla macierzy 3 na 3

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

author: Andrzej Dudek

Drugie kolokwium z Rachunku Prawdopodobieństwa, zestaw A

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Weryfikacja hipotez statystycznych

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Estymacja punktowa i przedziałowa

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

Zawartość. Zawartość

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Zadania ze statystyki, cz.6

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

2. Tablice. Tablice jednowymiarowe - wektory. Algorytmy i Struktury Danych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Matlab Składnia + podstawy programowania

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Zmienne losowe zadania na sprawdzian

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Statystyka w przykładach

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

Z poprzedniego wykładu

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Temat: Zmienna losowa. Rozkład skokowy. Rozkład ciągły. Kody kolorów: Ŝółty nowe pojęcie pomarańczowy uwaga. Anna Rajfura, Matematyka

Rozkłady i ich dystrybuanty 16 marca F X (t) = P (X < t) 0, gdy t 0, F X (t) = 1, gdy t > c, 0, gdy t x 1, 1, gdy t > x 2,

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

> x <-seq(-2*pi, 2*pi, by=0.5) > plot(x, sin(x), type="b",main="wykres funkcji sin(x) i cos(x)", col="blue") > lines(x, cos(x), type="l",col="red")

1 Podstawy rachunku prawdopodobieństwa

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

STATYSTYKA MATEMATYCZNA

ALGORYTMY Algorytm poprawny jednoznaczny szczegółowy uniwersalny skończoność efektywność (sprawność) zmiennych liniowy warunkowy iteracyjny

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

lekcja 8a Gry komputerowe MasterMind

Oszacowanie i rozkład t

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Metody Statystyczne. Metody Statystyczne.

Ćwiczenie 3. MatLab: Algebra liniowa. Rozwiązywanie układów liniowych

Analiza Statystyczna

Układy stochastyczne

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna. Wykład VI. Zesty zgodności

Testowanie hipotez statystycznych.

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Cwiczenie 3 - Rozkłady empiryczne i. teoretyczne

Elementy statystyki STA - Wykład 1

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

NAZWA ZMIENNEJ LOSOWEJ PODAJ WARTOŚĆ PARAMETRÓW ROZKŁADU PRAWDOPODOBIEŃSTWA DLA TEJ ZMIENNEJ

Zwiększenie wartości zmiennej losowej o wartość stałą: Y=X+a EY=EX+a D 2 Y=D 2 X

Statystyka matematyczna i ekonometria

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Analiza niepewności pomiarów

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Komputerowa Analiza Danych Doświadczalnych

Ćwiczenie 2. Statystyka opisowa i metody symulacyjne

Analiza wariancji. dr Janusz Górczyński

W4 Eksperyment niezawodnościowy

KURS PRAWDOPODOBIEŃSTWO

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Tablice mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Katowice, 2011

Rozkłady prawdopodobieństwa zmiennych losowych

Aby przygotować się do kolokwiów oraz do egzaminów należy ponownie przeanalizować zadania

Graficzna prezentacja wyników

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 3 ZADANIA - ZESTAW 3

Statystyka matematyczna

POLITECHNIKA WARSZAWSKA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka i eksploracja danych

Matlab Składnia + podstawy programowania

Transkrypt:

Wstęp do pakietu R Pakiet R moŝna pobrać i zainstalować ze strony http://www.r-project.org Pomoc: - Jeśli znamy nazwę funkcji, np.?solve lub help(solve) - Jeśli nie znamy nazwy funkcji: help.start() lub help.search("szukany tekst") Przypisywanie wartości zmiennym Zmiennym moŝna przypisywać wartości poprzez operatory przypisania ->, <-, = lub poprzez funkcje assign(). Na przykład: a<-5; 4->b; c=b; assign("x",10) a; b; c; x Podstawowe struktury danych - vector Do tworzenia wektora zawierającego konkretne elementy uŝywa się funkcji c() Na przykład: a<-c(10,-15,4,-2,8,7) a Operator : słuŝy do generowania ciągu kolejnych liczb całkowitych, a funkcja seq() do generowania liczb z zakresu z określonym krokiem. Przykłady: -10:5 seq(-5,5,by=.2) Ciąg o powtarzających się elementach tworzy się za pomocą funkcji rep(), np.: rep(c(1,2),4) Na wektorach moŝna wykonywać działania lub podstawowe funkcje, np.: x<-c(2,4,5); y<-c(1,3,2) x+y; x*y+2 log(x) Indeksowanie wektorów: a[2] # drugi element a[-2] # wszystkie oprócz drugiego a[c(1,5)] # pierwszy i piaty a>0 # wektor logiczny - które większe od zera a[a>0] # elementy większe od zera Często łatwiej zapamiętać nazwy niŝ wartości liczbowe. Tekstowe nazwy przypadków moŝna nadać w np. w następujący sposób: owoce<-c(1,5,8,10) names(owoce)<-c("jablko","gruszka","banan","sliwka") obiad<-owoce[c("jablko","banan")]

- factor Faktor jest strukturą przechowującą informacje o powtórzeniach takich samych wartości, np,: vect<-c(1,2,1,3,1,2,4,3,2); vect fact<-factor(vect); fact summary(fact) plot(fact) - array Tablice moŝna utworzyć z wektora poprzez określenie wymiarów funkcja dim(), np.: tbl=1:20 dim(tbl)=c(4,5) # wektor staje się tablica o wymiarach 4,5 tbl tbl[2,3] # element na pozycji 2,3 tbl[2,] # drugi wiersz tbl[,3] # trzecia kolumna MoŜna równieŝ dodawać kolumny: tbl<-cbind(tbl,3); tbl lub wiersze: tbl<-rbind(log(tbl[1,]),tbl); tbl - data frame Data frame jest typem tablicy, w której kolumny odpowiadają zmiennym, a wiersze obserwacjom. Data frame moŝna utworzyć na kilka sposobów: wczytując z pliku tekstowego read.table("nazwa pliku"), zamieniając tablicę poprzez funkcje as.data.frame(), poprzez funkcje data.frame(), np.: dat<-data.frame("x"=c(2,4,1,2),"y"=c(1,1,1,1)) interaktywnie zmieniając istniejącą data.frame za pomocą funkcji fix() lub edit(). Do poszczególnych zmiennych odwołujemy się przez nazwa.obiektu$nazwa.zmiennej. Aby do zmiennych moŝna było odwołać się bezpośrednio moŝna dany obiekt przypisać przez funkcje attach(). Wczytywanie danych z pakietu i z pliku, zapis danych do pliku tekstowego. Zainstaluj bibliotekę faraway, otwórz ja i otwórz dane pima z tej biblioteki: Z górnego paska wybierz Packages i Instal packages, następnie wybierz serwer i bibliotekę. Następnie wpisz: library(faraway); data(pima) Wszystkie dostępne bazy danych uzyskujemy przez komendę data(), a opis danych poprzez?pima. Dane te dotyczą badan nad cukrzyca u Indianek Pima. Zawierają one ilość ciąŝy (pregnant), koncentracja glukozy (glucose), ciśnienie rozkurczowe (diastolic), grubość fałdy skórnej (triceps), stęŝenie insuliny (insulin), indeks masy do wzrostu (bmi), funkcja cukrzycy (diabetes), wiek (ages), czy pacjent wykazuje symptomy cukrzycy (test).

Przeglądnij dane i wyświetl podstawowe statystyki dotyczące tych danych: summary(pima) Czy dostrzegasz cos niepokojącego? W R zmienne brakujace oznacza się przez NA. Nanieś niezbędne poprawki: pima$diastolic[pima$diastolic == 0] <- NA pima$glucose[pima$glucose == 0] <- NA pima$triceps[pima$triceps == 0] <- NA pima$insulin[pima$insulin == 0] <- NA pima$bmi[pima$bmi == 0] <- NA Czy zmienna test jest zmienna ilościową czy jakościową? Wskazówka: pima$test <- factor(pima$test) levels(pima$test) <- c("negative","positive") Przeglądnij ponownie podsumowanie danych. Stwórz obiekt westwood typu data frame i wypełnij go danymi: LotSize ManHours 30 73 20 50 60 128 80 170 40 87 50 108 60 135 30 69 70 148 60 132 Zapisz do pliku westwood.txt : westwood<-data.frame() fix(westwood) Ustaw katalog roboczy z górnego paska. write.table(westwood,"westwood.txt") Otwórz dane zawierające średnie roczne temperatury z pliku temperature.txt. Przeglądnij je i zastanów się czy wszystko jest w porządku. Spróbuj wczytać je poprawnie.

ROZKŁADY ZMIENNYCH Pakiet R posiada wbudowane algorytmy pozwalające na obliczanie gęstości, dystrybuanty i kwantyli najczęściej stosowanych rozkładów. MoŜe równieŝ pracować jako precyzyjny generator liczb losowych. Standardowo dostępne są następujące rozkłady: beta, binom, cauchy, chisq, exp, f, gamma, geom, hyper, lnorm, logis, nbinom, norm, pois, t, unif, weibull, wilcox. Poprzedzając nazwę rozkładu litera d uzyskujemy funkcje gęstości rozkładu. Analogicznie poprzedzając nazwę literą p uzyskujemy wartości dystrybuanty. Funkcja kwantylowa (poprzedzona q) podaje taki kwantyl, który po lewej stronie wykresu gęstości zawiera określone prawdopodobieństwo. Generator liczb losowych dostępny jest przy poprzedzeniu nazwy litera r. d p q r gęstość rozkładu, wartość dystrybuanty, kwantyl, generator liczb losowych. Funkcje te pozwalają na traktowanie pakietu R jako zestawu bardzo dokładnych tablic statystycznych. Popatrzmy na przykłady: dnorm(0) # gęstość rozkładu normalnego w zerze pnorm(1)-pnorm(-1) # ile wartości mieści się w N(0,1) w przedziale (-1,1)? qt(0.995,5) # wartość krytyczna t-studenta dla 99% i 5 stopni swobody qchisq(0.01,5) # wartość krytyczna chi-kwadrat dla 5 st. swobody i 99% dpois(0,0.1) # wartość prawdopodobieństwa. Poissona dla λ = 0. 1 i n=0 qf(0.99,5,6) # wartość krytyczna testu F dla n 1 =5, n 2 =6 Kilku słów wymaga wartość 0.995 (nie 0.99) w wywołaniu funkcji rozkładu t-studenta. Rozkład ten jest zwykle stosowany w kontekście dwustronnym, dlatego obszar krytyczny dzielimy równomiernie na obu końcach rozkładu. 99% ufności oznacza, ze krytyczny 1% jest podzielony na 2 końce i zawiera się w przedziałach (0, 0.05) oraz (0.995, 1). Wartość tablicowa jest kwantylem obliczonym dla takiego właśnie prawdopodobieństwa. Analogicznie np. dla 95% będzie to 0.975, a dla 99.9% 0.9995. Korzystając z funkcji generatora losowego moŝna generować dowolne ciągi danych do późniejszej analizy. Wygenerujmy przykładowy zestaw 30 liczb o średniej 50 i odchyleniu standardowym 5, posiadających rozkład normalny: rnorm(30,50,5) Oczywiście funkcja ta wygeneruje za kaŝdym razem całkowicie inne wartości, dlatego tez prowadząc analizy naleŝy je zapamiętać w zmiennej, a potem uŝywać tej zmiennej w dalszych operacjach. Warto przy okazji wspomnieć o funkcji sample, generującej wektor danych wylosowanych z innego wektora. Np. funkcja

sample(1:6,10,replace=t) symuluje 10 rzutów kostka (losowanie ze zbioru 1:6), a dane mogą się powtarzać. Jeśli nie jest podana liczba losowanych danych (np. sample(1:6) ), funkcja generuje losowa permutacje wektora podanego jako parametr. WYKRESY Wykresy słupkowe Wykresy słupkowe osiągalne są w R poleceniem barplot. Popatrzmy na przykładowe wykresy danych, dotyczących spędzanych godzin przed telewizorem i komputerem u 100 osób. Wygenerujemy te dane uŝywając funkcji rnorm, zaokrąglając do liczb całkowitych funkcja round. Funkcja abs zwraca wartości bezwzględne z danych, gdyŝ mogą wśród nich trafić się liczby ujemne. tv = abs(round(rnorm(100,4,1.5))) komp = abs(round(rnorm(100,6,2))) tv komp Następnie będziemy produkować róŝne przykładowe wykresy komendą barplot: 1. barplot(tv) najprostszy wykres, zawierający 100 słupków odpowiadających poszczególnym danym. 2. barplot(sort(tv)) wykres posortowanych danych, pozwalający na wizualna ocenę ilości poszczególnych odpowiedzi. 3. barplot(table(tv,tv)) ilość osób oglądających telewizje godzinę, dwie etc. 4. barplot(table(komp,tv),legend.text=t) wykres analogiczny, lecz słupki pokazują dodatkowo poszczególne odpowiedzi dotyczące komputera (są podzielone). Opcjonalny parametr legend.text pozwala na zamieszczenie legendy. 5. barplot(table(komp,komp)) taki sam wykres, lecz dla czasu spędzonego przed komputerem. 6. barplot(table(tv,komp),legend.text=t) analogiczny, z podzielonymi słupkami proporcjonalnie do czasu oglądania telewizji. 7. barplot(table(komp,tv),beside=t,legend.text=t) te same dane, jednak słupki połoŝone są obok siebie, a nie na sobie. 8. barplot(table(komp,tv),col=rainbow(10),legend.text=t) tutaj listę tęczowych kolorów generujemy funkcja rainbow. Istnieje kilka funkcji do generowania zestawów kolorów, analogicznie do rainbow, np. heat.colors, terrain.colors, topo.colors, cm.colors. Istnieje teŝ moŝliwość wyspecyfikowania konkretnej listy kolorów, np. col=c("red","orange","yellow","green","blue",violet") Wykresy kołowe Wykresy kołowe generujemy komenda pie, z analogiczna składnia. Przykładowo, poprzez wywołanie

pie(table(tv)) Histogramy W czasie analizy statystycznej niejednokrotnie zachodzi potrzeba przedstawienia graficznego rozkładu danych statystycznych. Pakiet R pozwala na zobrazowanie danych na wykresach w wieloraki sposób. W pierwszej kolejności załadujemy komendą data(rivers) dane dotyczące długości rzek w USA. Najprostszym sposobem zobrazowania rozkładu tych danych jest wykres tekstowy stem-and-leaf : stem(rivers) Wykres ten nie jest często stosowany, aczkolwiek warto go znać bardzo łatwo wkleić go wszędzie tam, gdzie operujemy tylko tekstem. Typowo graficzne wykresy to najczęściej histogramy i tzw. wykresy gęstości rozkładu. Oto kilka przykładów: 1. hist(rivers) zwykły histogram. 2. hist(rivers,40) tak samo, lecz narzucamy liczbę przedziałów histogramu. 3. hist(rivers,breaks=c(10,20,50,100,200,300,400,500,1000,4000)) tutaj narzucamy konkretne miejsca, w których kończą się przedziały. 4. plot(density(rivers)) wykres gęstości. Niekiedy rozkład danych doświadczalnych prezentuje się na tzw. wykresie kwantylowo-normalnym (quantile-normal plot). Jest to zaleŝność pomiędzy wartościami zmiennej, a kwantylami rozkładu normalnego. W idealnym przypadku, jeśli rozkład zmiennej jest czysto normalny, wykres ten przedstawia linie prosta. Popatrzmy na trzy przykłady: 1. qqnorm(rnorm(500)) wykres dla 500 liczb o rozkładzie normalnym. 2. qq=rt(500,1);qqnorm(qq);qqline(qq) wykres dla 500 liczb o rozkładzie t-studenta o 5 stopniach swobody. Funkcja qqline dodaje do wykresu linie prosta uśredniającą rozkład, 3. qqnorm(runif(500,0,1)) wykres dla 500 liczb, równomiernie rozmieszczonych w przedziale (0, 1). Wykresy dwuwymiarowe Funkcja plot jest uniwersalnym narzędziem pakietu R, a wykresy generowane przy jej uŝyciu mogą być skrajnie odmienne, w zaleŝności od argumentów tej funkcji. W najprostszym przypadku funkcja ta generuje dwuwymiarowy wykres punktowy, przedstawiający zaleŝność jednej zmiennej od drugiej. Załadujmy komenda data(trees); attach(trees) dane dotyczące wysokości, średnicy i objętości pnia 31 drzew, po czym wykonajmy wykresy: 1. plot(girth,volume,type="p") wykres punktowy. 2. plot(girth,volume,type="l") wykres liniowy. 3. plot(girth,volume,type="b") wykres punktowo-liniowy. 4. plot(girth,volume,type="h") wykres kreskowy. 5. plot(girth,volume,type="s") wykres schodkowy. 6. plot(girth,volume,type="s") wykres schodkowy (o odwrotnych schodkach).

Wykresy funkcji R umoŝliwia rysowanie wykresów dowolnych funkcji matematycznych, przy czym mogą one stanowić samodzielne wykresy, lub tez być dodawane do istniejących. SłuŜy do tego funkcja curve. Oto kilka przykładów: 1. curve(pnorm(x),xlim=c(-4,4));curve(pt(x,1),lty=2,add=t) rysuje wykres dystrybuanty rozkładu normalnego linia ciągła, a następnie dodaje dystrybuantę rozkładu t-studenta o 1 stopniu swobody. 2. hist(rnorm(500),prob=true);curve(dnorm(x),add=t) rysuje histogram 500 losowych liczb o rozkładzie normalnym wraz z idealna krzywa rozkładu. 3. curve(sin(x),xlim=c(-2*pi,2*pi)); curve(cos(x),col="red",add=t,xlim=c(- pi,pi)) rysuje wykres funkcji y = sin x w przedziale ( 2Π, 2Π), a następnie dodaje wykres y = cos x, czerwona linia, w przedziale ( Π, Π). ĆWICZENIA Zad1. Zgadnij, a następnie sprawdź jakie będą wyniki następujących poleceń: > y = c(2, 3, 5, 7, 11, 13) > length(y) > x = 2 * 1:5-1 > length(x) > x + y > sum(x > 5 x < 3) > y[-(3:5)] > y[x] Zad2. Twoje czasy dojazdu na uczelnię przez ostatnie dwa tygodnie (10 dni; w minutach) to: 17 16 20 24 22 15 21 15 17 22 Jakie były najdłuŝszy, średni i minimalny czasy dojazdu? Jakie było odchylenie standardowe czasu dojazdu? Ile razy dojazd zajął Ci mniej/więcej niŝ średnia -/+ odchylenie standardowe? Jakie były średnie czasy dojazdu dla wartości poniŝej/ponad pierwszym/trzecim kwartylem? Zad3. Wczytaj wbudowany zbiór danych mtcars. Zobacz czego dotyczy i sprawdź: 1. ile wynosi maksymalny przebieg (w milach/galon) i który samochód go osiągnął? 2. jaki wygląda pierwsza trójka samochodów o największej liczbie koni mechanicznych? 3. jakie są średnie przyspieszenia i odchylenie standardowe liczby koni dla: wszystkich samochodów, samochodów z / bez automatycznej skrzyni biegów, mercedesów,

Zad4. Spośród średniej i mediany - estymatorów środka populacji o zadanym rozkładzie, chcemy wybrać ten o mniejszej wariancji. W tym celu oblicz stosunek wariancji średniej do wariancji mediany na podstawie n = 1000 prób dla prób populacji liczności m = 100. Za rozkład populacji przyjmij: 1. Norm(0,1), 2. t(2) (rozkład t z dwoma stopniami swobody), Więcej na temat systemu R moŝesz znaleźć w An Introduction to R dostępnym na stronie projektu R.