ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

Podobne dokumenty
Martin Pergel. 26. února Martin Pergel

Obsah Atributová tabulka Atributové dotazy. GIS1-2. cvičení. ČVUT v Praze, Fakulta stavební, katedra mapování a kartografie

PA152,Implementace databázových systémů 2 / 25

Inverzní Z-transformace

Scheelova kometa. Dušan Merta. Colours of Sepsis 2019, OSTRAVA!!!

Kristýna Kuncová. Matematika B2 18/19

MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Funkce zadané implicitně. 4. března 2019

Bazy danych i R/Bioconductor


Úvodní informace. 18. února 2019

Cauchyova úloha pro obyčejnou diferenciální rovnici


(13) Fourierovy řady

Obsah. Zobrazení na osmistěn. 1 Zobrazení sféry po částech - obecné vlastnosti 2 Zobrazení na pravidelný konvexní mnohostěn

1 Soustava lineárních rovnic

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti




Kristýna Kuncová. Matematika B3

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.







Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

1.1 Ovládací panel Zobrazení stavů Ovládací klávesnice Menu zobrazení Panel ovládání stroje...

Elementy statystyki STA - Wykład 1

5. a 12. prosince 2018

K SAMOSTATNÉ MODULOVÉ SCHODY MONTÁŽI. asta

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

R dla każdego : zaawansowane analizy i grafika statystyczna / Jared P. Lander. Warszawa, Spis treści

Platforma pro analýzu, agregaci a vizualizaci otevřených dat souv

Zásuvný modul QGISu. QGIS plugin pro práci s katastrálními daty

Wykłady specjalistyczne. (Matematyka w finansach i ekonomii; Matematyczne podstawy informatyki)

podle přednášky doc. Eduarda Fuchse 16. prosince 2010

ČVUT v Praze, katedra geomatiky. zimní semestr 2014/2015

XML data na disku jako databáze

domowyinformatyk24.pl firmowyinformatyk24.pl PREZENTACJA USŁUGI ISO/IEC 27001:2005 Certified ISO/IEC 20000:2011 Certified ISO/IEC 9001:2008 Certified

Matematika 2, vzorová písemka 1

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

Zadání: Vypočítejte hlavní momenty setrvačnosti a vykreslete elipsu setrvačnosti na zadaných

Biosignál II. Lékařská fakulta Masarykovy univerzity Brno

Edita Pelantová, katedra matematiky / 16

Martin Dlask (KSI FJFI) 3. března 2016

Kombinatorika a grafy I

IB047. Pavel Rychlý. 21. února

Geografická data a databázové systémy, OGC Simple Features pro SQL, PostgreSQL, MySQL, SQLite

Fakulta elektrotechnická

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

Architektura dużych projektów bioinformatycznych

Simple Features. Úvod do problematiky, geodatabáze, OGC Simple Features. Martin Landa

Co to znamená pro vztah mezi simultánní a marginální hustotou pravděpodobnosti f (x) (pravděpodobnostní funkci p(x))?

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

Obsah: CLP Constraint Logic Programming. Úvod do umělé inteligence 6/12 1 / 17

Język R : kompletny zestaw narzędzi dla analityków danych / Hadley Wickham, Garrett Grolemund. Gliwice, cop Spis treści

Euklidovský prostor. Funkce dvou proměnných: základní pojmy, limita a spojitost.

Ústav teorie informace a automatizace RESEARCH REPORT. Pavel Boček, Karel Vrbenský: Implementace algoritmu MIDIA v prostředí Google Spreadsheets

WPROWADZENIE DO PROGRAMOWANIA I ŚRODOWISKA R. Biomatematyka - wykład 2 Dr Wioleta Drobik-Czwarno

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Paralelní implementace a optimalizace metody BDDC

SZKOLENIE WPROWADZENIE DO R UNIWERSYTET SZCZECIŃSKI al. Papieża Jana Pawła II nr 22a Szczecin

Petr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/YDATA: Přednáška I. 5. říjen, / 37

Referenční plochy. Podpořeno z projektu FRVŠ 584/2011.

Matematika III Stechiometrie stručný

POLIURETANOWE SPRĘŻYNY NACISKOWE. POLYURETHANOVÉ TLAČNÉ PRUŽINY

Laboratorium 10 - Web Services

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

ARROW ECS SERVICES AUTORYZOWANE CENTRUM SZKOLENIOWE

SYSTEMY OPERACYJNE WYKŁAD 1 INTEGRACJA ZE SPRZĘTEM

Architektura dużych projektów bioinformatycznych

-Instalacja R: -Instalacja RStudio:

Pharo Whirlpool Serie 200

B0B99PRPA Procedurální programování

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Krzysztof Markowicz. NetCDF - format danych meteorologicznych

System 32-Bit 1: Microsoft Windows 7 Home Premium 2;, Professional, Ultimate, Enterprise Microsoft Windows 8/8.1, Pro, Enterprise 2;

Kategoria usługi (wybór z usługi. usługi. zgodnie z kartą usługi) ul. W. Syrokomli 11/8, Heuresis Certyfikowani Trenerzy

Krzysztof Trajkowski. Analiza i wizualizacja danych naukowych

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

Wprowadzenie do R. log(1) ## [1] 0. sqrt(3) ## [1] sin(x = 2*pi) ## [1] e-16

TGH01 - Algoritmizace

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Wirtualizacja. Metody, zastosowania, przykłady

Geometrická nelinearita: úvod

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Lana a šňůry pro elektrické ohradníky

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

ČVUT FEL, K Radek Mařík Strukturované testování 20. října / 52

Klasická metodologie testování

Kristýna Kuncová. Matematika B2

1. Cena brutto oferty 100 % (100 pkt)

DelighTech Fitness App

Wymagania techniczne dla programów antywirusowych. Oprogramowanie dla serwerów i stacji roboczych będących w sieci - ilość 450 sztuk:

Transkrypt:

ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

Jak vizualizovat? Požadované vlastnosti nástroje opakovatelnost, spolehlivost separace formy a obsahu flexibilita, jednoduchost

Jak vizualizovat? Požadované vlastnosti nástroje opakovatelnost, spolehlivost separace formy a obsahu flexibilita, jednoduchost Dostupné nástroje Matlab, IBM SPSS, Statgraphics

Jak vizualizovat? Požadované vlastnosti nástroje opakovatelnost, spolehlivost separace formy a obsahu flexibilita, jednoduchost Dostupné nástroje Matlab, IBM SPSS, Statgraphics MS Excel

Jak vizualizovat? Požadované vlastnosti nástroje opakovatelnost, spolehlivost separace formy a obsahu flexibilita, jednoduchost Dostupné nástroje Matlab, IBM SPSS, Statgraphics MS Excel GNUPlot, matplotlib, ggplot2

Předpoklady Základní znalost R (syntax, datové typy) Barevný monitor Obĺıbené IDE (RStudio, RkWard) nebo textový editor Materiály ke stažení http://golasowski.com/r workshop.zip

Vznik ggplot2 Hlavní autor: Hadley Wickham Rice University, Stanford, Auckland, RStudio specifikace jazyka pro vizualizaci separace jednotlivých elementů grafu jednoduchost, znovupoužitelnost Kniha: WICKHAM, Hadley. ggplot2: elegant graphics for data analysis. Springer Science & Business Media, 2009.

Jak získat ggplot2? Požadavky R (verze alespoň 3.1)

Jak získat ggplot2? Požadavky R (verze alespoň 3.1) Instalace Dostupný v CRAN pro Linux, OSX, Windows, (Solaris?) https://cran.r-project.org/web/packages/ggplot2/index.html Ručně - install.packages("ggplot2") Přes vaše obĺıbené IDE

Jak získat ggplot2? Požadavky R (verze alespoň 3.1) Instalace Dostupný v CRAN pro Linux, OSX, Windows, (Solaris?) https://cran.r-project.org/web/packages/ggplot2/index.html Ručně - install.packages("ggplot2") Přes vaše obĺıbené IDE Načtení baĺıčku library("ggplot2") Tot vše.

Elementy grafu v ggplot2 Data - std. datový formát (reshape2, stack,...) Mapování proměnných - aesthetics Vrstvy - geoms, stats Styly - vlastnosti textových a grafických elementů (theme) Vygenerování grafu ggplot (data, mapping = aes (x =...) + geom _ point () + labs (x = " Sample ", y = " Power ")

Rozhraní Zjednodušené Základní funkce, užitečné pro jednoduché one-shot grafy qplot (x, y = NULL, geom, xlab, ylab, main,...) Kompletní Všechny funkce, komplexní parametry ggplot ( data = NULL, mapping = aes (),...) + geom _* + scale _* +...

Data Původní data Data je nutné převést do standardního datového formátu. Ideální typ pro uložení dat je data.frame. Řádky obsahují jednotlivá pozorování. Jeden sloupec obsahuje hondoty všech závislých proměnných, ostatní sloupce obsahují jejich označení a další proměnné. Po převodu

Převod dat pomocí baĺıku reshape melt(dataset, id.vars = c("time.id"), variable name = "Station")

Elementy grafu - aesthetics Přiřazení k parametru mapping pomocí parametru funkce aes. Každý geom bere v potaz jiné elementy. x,y color - barva prvků (bodů, čar) shape - tvar bodů (puntíky, kolečka,...) linetype - čára (čárkovná, přerušovaná,...) size - velikost elementu alpha - průhlednost elementu fill - barva (typ?) výplně... a mnoho dalších aes(x = cut, y = depth, fill = clarity)

Geometrické objekty Tvoří jednotlivé vrstvy grafu, berou v potaz mapování na elementy a mohou je předefinovat. geom point - scatterplot, bodový graf geom line - liniový graf geom tile - rastry, dlaždice geom bar - sloupcový graf geom density - odhad hustoty pravděpodobnosti... geom point(mapping = aes(x = cut, y = depth, fill = clarity), size = 2.0)

Vzhled grafu Další funkce pro ruční specifikaci vlastností grafu, které se nevztahují k datům. scale * - vlastnosti os, rozsah, zobrazené hodnoty, atd. coord * - systém souřadnic, otáčení, měřítko, změna labs - popisky theme - přímý přístup k elementům šablony annotation * - dodatečné textové informace

Užitečné zdroje informací R - obecně Advanced R by H. Wickham - http://adv-r.had.co.nz ggplot2 Dokumentace ggplot2 - http://docs.ggplot2.org/current/index.html R Graphics Cookbook by W. Chang - http://www.cookbook-r.com/graphs/ https://www.r-bloggers.com/, Stack Overflow, http://stats.stackexchange.com/,...