Materiał dotyczy generowania różnego typu wykresów w środowisku R.

Podobne dokumenty
Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

> x <-seq(-2*pi, 2*pi, by=0.5) > plot(x, sin(x), type="b",main="wykres funkcji sin(x) i cos(x)", col="blue") > lines(x, cos(x), type="l",col="red")

Excel wykresy niestandardowe

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Podział strony graficznej

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Wizualizacja danych przestrzennych. dr Marta Kuc-Czarnecka

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Sposoby prezentacji problemów w statystyce

Wykład 4: Statystyki opisowe (część 1)

You created this PDF from an application that is not licensed to print to novapdf printer (

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

Qtiplot. dr Magdalena Posiadała-Zezula

Wykład 3: Prezentacja danych statystycznych

Niestandardowa tabela częstości

Wykresy. Informatyka Arkusz kalkulacyjny Excel dla WINDOWS. Excel. cz.4. Wykresy. Wykresy. Wykresy. Wykresy

Elementy statystyki STA - Wykład 1

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Sylabus Moduł 4: Grafika menedżerska i prezentacyjna

Nowoczesne techniki matematyczne, statystyczne i informatyczne

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Skumulowane wykresy słupkowe: pokazują zależności zachodzące między indywidualnymi elementami i całością.

Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych. 8a 3,54 8b 5,25 8c 4,21 8d 4,85

INFORMATYKA W SELEKCJI

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Badanie zależności skala nominalna

Uruchom polecenie z menu Wstaw Wykres lub ikonę Kreator wykresów na Standardowym pasku narzędzi.

WYKRESY ĆWICZENIE 5. Skorzystaj z wyznaczonej funkcji kalibracyjnej do określenia nadciśnienia przy podanych wskazaniach czujnika.

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:

Usługi Informatyczne "SZANSA" - Gabriela Ciszyńska-Matuszek ul. Świerkowa 25, Bielsko-Biała

Obliczenia inżynierskie arkusz kalkulacyjny. Technologie informacyjne

Podstawowe operacje graficzne.

Marta Stańczak Klasa I a Zespół Placówek Oświatowych im. Adama Mickiewicza Gimnazjum w Kuczborku-Osadzie

ARKUSZ KALKULACYJNY komórka

Laboratorium Algorytmy Obliczeniowe. Lab. 9 Prezentacja wyników w Matlabie

FUNKCJA LINIOWA - WYKRES

Temat: Graficzna ilustracja danych - wykresy

author: Andrzej Dudek

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Excel zadania sprawdzające 263

zajęcia 2 Definiowanie wektorów:

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

TRADYCYJNE NARZĘDZIA ZARZĄDZANIA JAKOŚCIĄ

Sylabus Moduł 3: Arkusze kalkulacyjne

Mathcad c.d. - Macierze, wykresy 3D, rozwiązywanie równań, pochodne i całki, animacje

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

FUNKCJA LINIOWA - WYKRES. y = ax + b. a i b to współczynniki funkcji, które mają wartości liczbowe

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

Tytuł: GRAPHER Podręcznik użytkownika ISBN: Autor: Zbigniew Galon Rok wydania: 2014 Stron: 500 Wydawca: Gambit COiS Sp. z o.o.

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Typy szeregów statystycznych

TABELE I WYKRESY W EXCELU I ACCESSIE

WYMAGANIA EDUKACYJNE Z ZAJĘĆ KOMPUTEROWYCH DLA KLASY V

Program szkoleniowy. 16 h dydaktycznych (12 h zegarowych) NAZWA SZCZEGÓŁY CZAS. Skróty dostępu do narzędzi

Wprowadzenie do Scilab: funkcje i wykresy

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Statystyka matematyczna i ekonometria

Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

a) Utworzyć wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównać różne formy opisu wykresu.

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Matlab Składnia + podstawy programowania

FORMUŁY AUTOSUMOWANIE SUMA

Analiza wyników egzaminacyjnych 2013

Statystyka Matematyczna Anna Janicka

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

OpenOffice.ux.pl Calc 2.0. Æwiczenia

Ćwiczenie 6 MS EXCEL

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

MATLAB ŚRODOWISKO MATLABA OPIS, PODSTAWY

Zajęcia nr VII poznajemy Rattle i pakiet R.

Laboratorium 7b w domu wykresy w Excelu

KATEGORIA OBSZAR WIEDZY

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

24 cel bdb db dst dop

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Próba własności i parametry

PRZYGOTOWANIE I REALIZACJA HOSPITACJI DIAGNOZUJĄCEJ

Wykład 6/7/8: Graficzna analiza danych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Program szkoleniowy. 16 h dydaktycznych (12 h zegarowych) NAZWA SZCZEGÓŁY CZAS. Skróty do przeglądania arkusza. Skróty dostępu do narzędzi

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

EXCEL. Diagramy i wykresy w arkuszu lekcja numer 6. Instrukcja. dla Gimnazjum 36 - Ryszard Rogacz Strona 20

Instrukcja użytkownika Platforma Walutowa

Katalog wymagań na poszczególne stopnie szkolne klasa 3

Wykorzystanie programów komputerowych do obliczeń matematycznych

WYMAGANIA Z MATEMATYKI NA POSZCZEGÓLNE OCENY KLASYFIKACYJNE DLA UCZNIÓW KLAS TRZECICH. Sposoby sprawdzania wiedzy i umiejętności uczniów

Funkcje systemu qs-stat Przegląd

Wykład 10: Elementy statystyki

Transkrypt:

Materiał dotyczy generowania różnego typu wykresów w środowisku R. Pamiętajmy, że niektóre typy wykresów są dedykowane do pewnych typów danych. Na potrzeby ćwiczeń początkowych załadujemy sobie zbiór danych gnp http://info.smu.edu.sg/rsite/datahandling/r/gnp.zip i po rozpakowaniu zapiszemy je w dowolnym miejscu na dysku. Następnie załadujemy zbiór do środowiska R. Wykres łodygowo-liściowy Diagram łodygowo-listkowy (ang. stemplot lub stem-and-leaf diagram) jest graficznym sposobem prezentacji danych ilościowych. Podobnie jak histogram, służy on do przedstawiania kształtu rozkładu, ma jednak nad nim tę przewagę, że przedstawia wszystkie dane, które tworzą rozkład. Diagram łodygowo-listkowy rysuje się w bardzo prosty sposób. Ustalamy najpierw, jakie liczby stanowić będą łodygę, zwykle opuszczając jedną lub dwie cyfry w zapisie dziesiętnym, a następnie sortujemy je rosnąco. Uzyskane liczby zapisujemy w jednej kolumnie, oddzielamy pionową kreską i dopisujemy obok obcięte końcówki liście.

Histogram - wykres częstości danych. Wykonamy go za pomocą polecenia: hist() Scatter plot wykres rozrzutu Wykres rozrzutu punktów na osiach X i Y. plot(x-variable, y-variable) Box-and-Whisker Plot wykres pudełkowy. boxplot(var1,var2) na wykresie zmienne będą zaprezentowane w takiej kolejności jak argument funkcji boxplot a więc najpierw var1 a potem var2.

> boxplot(gnp,invest) Wykres liniowy plot(gnp,invest,type="l") Argument type="l" tworzy linię, type="s" będzie tworzył wykres skokowy. Poszukaj jakie jeszcze są możliwości. plot(gnp, invest, type="l") Barplot The barplot()- wykres kolumnowy z zaznaczeniem częstości: barplot(gnp)

barplot(table(var)), table(var) - zwraca częstości zmiennych > barplot(table(gnp)) Wykres kołowy (Pie charts) świetnie przedstawiają procentowy rozkład danych. > pie(gnp)

Wykresy QQ plot oraz distribution curve omówimy przy okazji regresji. ćwiczenia Rozpatrzymy teraz osobno dane jakościowe i ilościowe. Najpierw zbiór w którym analizować będziemy dane jakościowe (School) Na pierwszy rzut załaduj zbiór dotyczący malarzy. Możemy zaczerpnąć więcej wiedzy dotyczącej zbioru. > help(painters)

Ostatnia kolumna odpowiada za kod szkoły do której malarz należał. Szkoły są zakodowane jako A, B,..., etc, - jest to cecha jakościowa. Możemy sprawdzić jaki jest rozkład szkół > painters$school Jeśli chcemy sprawdzić rozkład częstości malarzy w poszczególnych szkołach wystarczy następujący kod: Prezentacja w postaci kolumnowej za pomocą funkcji cbind ćwiczenia do wykonania: 1. Znajdź rozkład częstości dla composition scores w zbiorze painters.

Jeśli chcemy zbadać częstość względną danych jakościowych wystarczy zastosować wzór: Możemy drukować z mniejszą liczbą cyfr i uczynić go bardziej czytelnym przez ustawienie opcji cyfr. > options(old) # odtwarza poprzednią wersję zapisu danych ćwiczenie Znajdź częstość względną dla cechy composition stores w zbiorze painters. Bar plot

ćwiczenie Narysuj wykres słupkowy dla cechy composition scores w zbiorze painters.

Pie chart Ćwiczenie Narysuj wykres typu pie chart dla cechy composition scores w zbiorze painters

Zbiór z danymi ilościowymi > duration.freq = table(duration.cut) ćwiczenie Znajdź takie same wyliczenia dla cechy eruption waiting w zbiorze faithful. Histogramy

ma > colors = c("red", "yellow", "green", "violet", "orange", "blue", "pink", "cyan") > hist(duration, right=false, col = colors, main = "tytul wykresu", xlab = "etykieta osi X") Ćwiczenie Wygeneruj histogram dla cechy eruption waiting w zbiorze faithful. Gdy chcemy wyznaczyć względną częstość:

Rozkład częstości (skumulowany) ćwiczenie Wyznacz skumulowany rozkład częstości dla cechy eruption Whiting w zbiorze faithful.

ćwiczenie Wykreśl taki sam wykres tyle, że dla cechy eruption Waiting w zbiorze faithful. Względny rozkład częstości (skumulowany) Ćwiczenie Wykonaj te same działania dla cechy eruption waiting w zbiorze faithful. Wykres łodygowo-liściowy Diagram łodygowo-listkowy (ang. stemplot lub stem-and-leaf diagram) jest graficznym sposobem prezentacji danych ilościowych. Podobnie jak histogram, służy on do przedstawiania kształtu rozkładu, ma jednak nad nim tę przewagę, że przedstawia wszystkie dane, które tworzą rozkład. Diagram łodygowo-listkowy rysuje się w bardzo prosty sposób. Ustalamy najpierw, jakie liczby stanowić będą łodygę, zwykle opuszczając jedną lub dwie cyfry w zapisie dziesiętnym, a następnie sortujemy je rosnąco. Uzyskane liczby zapisujemy w jednej kolumnie, oddzielamy pionową kreską i dopisujemy obok obcięte końcówki liście.

Ćwiczenie Wykreśl taki sam wykres dla cechy eruption waiting w zbiorze faithful. Wykresy rozrzutu (ang. Scatter Plot) Dodanie linii regresji do wykresu

Wykresy typu paskowego Wykres paskowy (ang. strip chart) można otrzymać wydając polecenie stripchart Wydając to polecenie z opcjami pch=16 (obserwacje ze zbioru danych będą zaznaczone przy użyciu kropek), method="stack" (obserwacje powtarzające się będą ustawiane jedna nad drugą), cex=2 (kropki zostaną odpowiednio powiększone): stripchart(y,method="stack",pch=16,cex=2) > stripchart(duration) Efekt jest następujący: stripchart(duration,method="stack") Proszę sprawdzić opcję stripchart(duration,method="jitter") stripchart(duration,vertical=true) stripchart(w1$vals,vertical=true,method="jitter") stripchart(w1$vals,method="stack", main='leaf BioMass in High CO2 Environment', xlab='biomass of Leaves')

HISTOGRAMY hist(duration) Jak widać przedziały zostały automatycznie określone, ale zawsze można je regulować. Można także decydować o rozpiętości danych na osi x: hist(duration,breaks=12,xlim=c(0,10)) Proszę sprawdzić także następujące przykłady: > hist(duration,breaks=12,xlim=c(-1,2)) > hist(duration,breaks=12,xlim=c(0,2)) > hist(duration,breaks=12,xlim=c(1,1.3)) > hist(duration,breaks=12,xlim=c(0.9,1.3)) Wykresy typu Boxplots boxplot(w1)

> boxplot(duration,main='tytul wykresu',xlab='os X', ylab = 'os Y') > boxplot(w1,main='tytul wykresu',xlab='os X', ylab = 'os Y',horizontal=TRUE) A sprawdź co będzie efektem następującego wywołania obu linii (podstaw za w1$vals -> duration )