1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

Podobne dokumenty
1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

Pakiety Matematyczne - R Zestaw 2.

1 Programowanie w matlabie - skrypty i funkcje

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table)

Import danych z plików CSV

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

SYSTEMY OPERACYJNE ĆWICZENIE POLECENIA SYSTEMU MSDOS

Pliki. Operacje na plikach w Pascalu

IBM SPSS Statistics Wersja 23. Konfigurowanie ułatwień dostępu

Elementy metod numerycznych - zajęcia 9

Maple i wykresy. 1.1 Najpierw należy się zalogować. Jak to zrobić zostało opisane w moim poprzednim tutorialu.

Włączanie/wyłączanie paska menu

Ćwiczenie: JavaScript Cookies (3x45 minut)

Usługi Informatyczne "SZANSA" - Gabriela Ciszyńska-Matuszek ul. Świerkowa 25, Bielsko-Biała

Dodawanie stron do zakładek

Podstawy MATLABA, cd.

Dodawanie stron do zakładek

MentorGraphics ModelSim

SZKOLENIE WPROWADZENIE DO R UNIWERSYTET SZCZECIŃSKI al. Papieża Jana Pawła II nr 22a Szczecin

Kier. MTR Programowanie w MATLABie Laboratorium

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

Wprowadzenie do Scilab: funkcje i wykresy

Współpraca FDS z arkuszem kalkulacyjnym

Programowanie proceduralne INP001210WL rok akademicki 2018/19 semestr letni. Wykład 6. Karol Tarnowski A-1 p.

Procedura aktualizacji systemu TelkomBud. dla serwera DBfC w wersji 4.x

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

Matlab, zajęcia 3. Jeszcze jeden przykład metoda eliminacji Gaussa dla macierzy 3 na 3

Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy. Wykład 12. Karol Tarnowski A-1 p.

Instalacja i konfiguracji czytników kart kryptograficznych, aplikacji procertum CardManager w systemach Mac OS X

System Inwentaryzacji Systemów Teleinformatycznych

SZYBKI START. Tworzenie nowego połączenia w celu zaszyfrowania/odszyfrowania danych lub tekstu 2. Szyfrowanie/odszyfrowanie danych 4

Lekcja 10. Uprawnienia. Dołączanie plików przy pomocy funkcji include() Sprawdzanie, czy plik istnieje przy pmocy funkcji file_exists()

bla bla Dokumenty podręcznik użytkownika

Instrukcja użytkownika ARSoft-WZ3

Szybka instrukcja tworzenia testów dla E-SPRAWDZIAN-2 programem e_kreator_2

Czytnik kart pamięci 8w1, Conrad USB 2.0 Instrukcja obsługi

Zadanie 8. Dołączanie obiektów

Projekt zaliczeniowy: Analiza wybranych warunków aerosanitarnych Poznania w latach

Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.

Mirror Tool.

Podstawy technologii WWW

Wiadomości i umiejętności

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

Ministerstwo Finansów

Programowanie obiektowe

Instalacja Pakietu R

WellCommerce Poradnik: Dodawanie języka i waluty. autor: Adrian Potępa (biuro@eclairsoaware.pl)

Podstawy i języki programowania

Ćwiczenie 1. Ćwiczenie 2. Ćwiczenie 3. Opisz działanie następujących komend systemowych : COPY EDIT FDISK FIND FORMAT XCOPY

Politechnika Łódzka. Instytut Systemów Inżynierii Elektrycznej. Laboratorium cyfrowej techniki pomiarowej. Ćwiczenie 4

Instrukcja importu deklaracji pacjentów. do dreryka

Rozdział 1. Oferta cenowa wersja 1...z... 9 Obsługa arkusza...k...k.9 Konstrukcja arkusza...k Rozdział 2. Oferta cenowa wersja 2...z...

plansoft.org Zmiany w Plansoft.org Błyskawiczny eksport danych PLANOWANIE ZAJĘĆ, REZERWOWANIE SAL I ZASOBÓW

Webowy interfejs - Shiny

Projektowanie przy uz yciu motywo w częś c 1: informacje podśtawowe

Python jest interpreterem poleceń. Mamy dwie możliwości wydawania owych poleceń:

Instrukcja. importu dokumentów. z programu Fakt do programu Płatnik. oraz. przesyłania danych do ZUS. przy pomocy programu Płatnik

Instrukcja użytkowania

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Jak utworzyć diagram

Wstęp do systemu Linux

1. Przypisy, indeks i spisy.

edycja szablonu za pomocą programu NVU

Laboratorium kryptograficzne dla licealistów 3

Przewodnik Szybki start

Tworzenie pliku źródłowego w aplikacji POLTAX2B.

Kurs obsługi systemu CMS. Prawie wszystkie treści wyświetlające się na stronie są zlokalizowane w dziale artykuły.

Wstęp 5 Rozdział 1. Instalacja systemu 13. Rozdział 2. Logowanie i wylogowywanie 21 Rozdział 3. Pulpit i foldery 25. Rozdział 4.

Podstawowe kontrolki graficzne. Obsługa plików poprzez kontrolki

GEO-SYSTEM Sp. z o.o Warszawa, ul. Kubickiego 9/5, tel./fax ,

LINUX. Instalacja oprogramowania

EDYCJA TEKSTU MS WORDPAD

Narzędzia informatyczne w językoznawstwie

1. Ćwiczenia z programem PowerPoint

Na komputerach z systemem Windows XP zdarzenia są rejestrowane w trzech następujących dziennikach: Dziennik aplikacji

INSTRUKCJA MASOWEGO WYSTAWIANIA OFERT ZA POMOCĄ PLIKU CSV

Modelowanie obiektowe - Ćw. 1.

Wartości x-ów : Wartości x ów można w Scilabie zdefiniować na kilka sposobów, wpisując odpowiednie polecenie na konsoli.

Diary przydatne polecenie. Korzystanie z funkcji wbudowanych i systemu pomocy on-line. Najczęstsze typy plików. diary nazwa_pliku

Modelowanie rynków finansowych z wykorzystaniem pakietu R

Instrukcja korzystania ze skryptu kroswalidacja.py

Ćwiczenia nr 2. Edycja tekstu (Microsoft Word)

VBA ZAJĘCIA NR 7! praca z plikami (kontynuacja zajęć 6)

Wprowadzenie do Python

Pracownia internetowa w każdej szkole (edycja Wiosna 2010) Opiekun pracowni internetowej cz. 1

1 Przygotował: mgr inż. Maciej Lasota

TABLET - UDOSTĘPNIANIE DOKUMENTÓW

> x <-seq(-2*pi, 2*pi, by=0.5) > plot(x, sin(x), type="b",main="wykres funkcji sin(x) i cos(x)", col="blue") > lines(x, cos(x), type="l",col="red")

BIBLIOTEKA NUMPY, CZĘŚĆ 1

pozwala na tworzenie i upowszechnianie pakietów implementujących nowe funkcjonalności. Obecnie dostępnych jest blisko 1000 pakietów do różnorodnych

Płace VULCAN. 2. W polu nad drzewem danych ustaw rok, za który chcesz utworzyć deklaracje.

bla bla Guard podręcznik użytkownika

Ćwiczenie 1. Wprowadzenie do programu Octave

Argumenty wywołania programu, operacje na plikach

Napisz program wypisujący na standardowym wyjściu następujący napis: Napis zawierający różne dziwne znaczki // \ \$ &%.

Instrukcja użytkownika programu QImport (wydanie I r.)

Integracja KS-ASW i KS-Medis z system CATO

Transkrypt:

Rachunek Prawdopodobieństwa i Statystyka lab 5 i lab 6. Kaja Chmielewska (Kaja.Chmielewska@cs.put.poznan.pl) Pliki do pobrania: -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/dane.csv -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/dane2.csv -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/dane3.csv -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/testr2.txt -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/testr3.txt -http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/example.r 1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać. Funkcje z którymi warto się zapoznać: - setwd() - pozwala ustawić katalog roboczy (argumentem jest ścieżka do pliku), - getwd() - funkcja, która pobiera informacje o aktualnym katalogu roboczym. > setwd("c:/users/kaja/desktop/prowadzone Zajęcia/RPiS") > getwd() Aby zobaczyć jakie pliki znajdują się w aktualnym katalogu, można użyć: > list.files() lub dobrze znanego: > dir() W przypadku, gdy nie chcemy podawać jawnie ścieżki do pliku, możemy użyć funkcji file.choose() aby otworzyć okno systemowe wyboru pliku. 2. Najpopularniejsze funkcje do zapisu i odczytu danych: Funkcje do zapisu i odczytu danych znajdują się pakiecie utils. Odczyt danych: - read.table(): wczytuje dane o strukturze ramki danych, gdzie kolumny odpowiadają kolejnym zmiennym, a wiersze kolejnym przypadkom. Wartości w kolumnach muszą mieć odpowiedni typ. Istnieją również inne ważne funkcje pozwalające na odczytanie danych: - read.csv / read.csv2 Wykorzystaj help (np.?read.table()), aby sprawdzić jak powinna wyglądać deklaracja wyżej przedstawionych funkcji. Zwróć uwagę, że funkcje te różnią się parametryzacją argumentów domyślnych. Przeczytaj opisy argumentów tych funkcji. Kilka drobnych uwag: - Dane zapisane w programie Excel mają format.csv. Dla tego formatu separatorem kolumn jest średnik, natomiast kropką dziesiętną jest przecinek (read.csv2()).

- Dane zapisane w angielskiej wersji Excel różnią się tym, że kropka dziesiętna jest kropką, a separatorem jest przecinek (read.csv()). Istniejące dane można odczytać za pomocą funkcji read.csv/read.csv2() #dane które są separowane za pomocą przecinka > macierz1 <- read.csv(file="c:/users/kaja/desktop/prowadzone Zajęcia/RPiS/dane2.csv", sep=",") #dane które są separowane za pomocą średnika > macierz2 <- read.csv2(file="c:/users/kaja/desktop/prowadzone Zajęcia/RPiS/dane.csv", sep=";") > tabela1 <- read.table(file="c:/users/kaja/desktop/prowadzone Zajęcia/RPiS/dane.csv", sep=";") Chcąc skorzystać z nazw kolumn należy je udostępnić używając funkcji attach(). Dane można zapisać > write.csv(macierz1, file="c:/users/kaja/desktop/prowadzone Zajęcia/RPiS/TestDane.csv") > write.csv2(macierz2, file="c:/users/kaja/desktop//prowadzone Zajęcia/RPiS/TestDane2.csv") Zapis danych: - write.table(): zapisuje wartość zmiennej do pliku tekstowego, zapisać można zmienną atomową, wektor, macierz, ramkę danych. - write.csv(): separatorem jest,, kropką dziesiętną jest.. - write.csv2(): separatorem jest ;, kropką dziesiętną jest,. help. Sprawdź argumenty oraz przeczytaj opisy argumentów funkcji do zapisu używając Przykłady: - wypisz wektor na ekranie: > write.table(1:5, "") Dostęp do schowka uzyskuje się poprzez podanie clipboard zamiast nazwy pliku. - zapisz wektor do schowka systemowego (skopiuj! poniższą instrukcję i wklej do R): > write.table(1:5,"clipboard",col.names=false, row.names=false) - przeczytaj ze schowka: > readclipboard() Schowek jest bardzo przydatny, można skopiować kilka interesujących nas danych z pliku i wyświetlić tylko te wybrane dane w formie tabeli. - skopiuj wybrane dane z pliku dane.csv i użyj instrukcji read.table:

> tab <- read.table(file="clipboard",sep=";", header=true) - zapisz tekst do plik.txt: > write.table("tekst w pliku","c:/users/kaja/desktop/testr.txt") Ciekawostka: Zapisywanie dużych obiektów typu data.frame do pliku tekstowego może być czasochłonne, zwłaszcza jeśli kolumny są różnego typu (ma to związek ze stylem formatowania). R sprawdza typ każdej kolumny i wiersza i formatuje go w zależności od ich typu. W przypadku, gdy mamy ramkę danych, w której wszystkie wartości są tego samego typu, najlepiej przekonwertować ja na macierz używając funkcji as.matrix(). 3. Inne funkcje do zapisu i odczytu danych: Odczyt danych: - funkcja scan(): jest bardziej elastyczną funkcją odczytywania danych, która zwraca wektor odczytanych wartości. Co więcej, dane nie muszą być w postaci tabelarycznej (w każdym wierszu może być różna liczba wartości). Ważnym parametrem funkcji skan() jest what, który określa typ odczytywanych wartości. Dodatkowo, funkcja scan(), pozwala na wprowadzenie wartości bezpośrednio z konsoli. Przykład: > wektor.wartosci <- scan("http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/testr2.txt") > wektor.wartosci > wektor.lancuchow <- scan("http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/testr3.txt", what="character", sep=",") > wektor.lancuchow #wprowadzenie danych z konsoli: > dane <- scan() #wprowadzamy dowolne dane (aby zakończyć wprowadzanie trzeba zrobić podać pustą linię), np. 1: 1 2 3 4: 1 2 3 7: 1 2 3 10: #funkcja scan() zwraca wektor: > dane

#zapisz dane do pliku.csv > write.csv(dane, file = "WriteTest.csv") #zapisz zwracany wektor jako macierz: > macierz <-matrix(dane, 3, 3) #3x3 to wymiary macierzy! 4. Import danych z bibliotek R: Pakiety R udostępniają również pewne zbiory danych. Aby dostać się do istniejących, przykładowych zbiorów wykorzystuje się funkcję data(). Wywołaj funkcję data() bez argumentów i zobacz jakie zbiory posiada R. Można także znaleźć dodatkowe informacje o zasobach w internecie, np: http://stat.ethz.ch/r-manual/r-devel/library/datasets/html/00index.html - wykorzystaj dowolny pakiet, np cars, stwórz jakiś wykres: > data(cars) > plot(cars) > lines(lowess(cars)) 5. Zapisywanie grafik (wykresów) do pliku: Najprostszym sposobem, ale czasochłonnym jest zapis grafiki manualnie: File\Save as (pod warunkiem że mamy wykres w oknie graficznym R). Innym sposobem jest wykorzystanie funkcji z pakietu grdevices: png(), jpeg(), bmp(), pdf(), pictex() i inne. Funkcje te przekierowują domyślne wyjście dla grafiki do określonego przez użytkownika pliku. Jednak samo użycie wymienionej powyżej funkcji to za mało by zapisać grafikę. Należy zamknąć przekierowanie i zapisać grafikę o określonej nazwie do określonego pliku. Przykład: > png("c:/users/kaja/desktop/obrazek2.png") > plot(cars) > lines(lowess(cars)) > dev.off() Oczywiście można zdefiniować wielkość wykresu, określając wartości dla wybranych parametrów: > png("c:/users/kaja/desktop/obrazek.png", width = 600, height = 400) Przydatną funkcją jest x11(), dzięki niej otwiera się kolejne okno graficzne i można stworzyć kolejny wykres. Tym sposobem można tworzyć różne wykresy w różnych oknach. > data(cars) > plot(cars) > x11() > data(co2) > plot(co2)

Kilka wybranych funkcji z pakietu grdevices, które służą do zarządzania urządzeniami graficznymi: > dev.cur() - aktualnie otwarte urządzenie graficzne > dev.list() - lista otwartych urządzeń graficznych > dev.set(which = dev.next()) - uaktywnia wskazane urządzenie graficzne > dev.off(which = dev.cur()) - zamyka wskazane urządzenie graficzne 6. Tryb wsadowy (BATCH MODE) Program R może być uruchomiony zarówno w trybie interaktywnym (z graficznym interfejsem) jak i wsadowym. W przypadku, gdy nie potrzebujemy interakcji z R, można uruchomić tryb wsadowy. Jako strumień wejściowy należy wskazać zawartość pliku z listą poleceń do wykonania (po prostu skrypt). Strumień wejściowy można przekierować do wskazanego pliku. Chcąc ustawić katalog roboczy, wykorzystaj setwd() lub zrób to manualnie przez menu: File/Change dir. Następnie wybierz File/Source R code lub wykorzystaj funkcję source(), która jako argument przyjmuje ścieżkę do pliku, w którym znajduje się skrypt (stwórz przykładowy skrypt wyświetlający Hello R ). > setwd(c:/users/kaja Chmielewska/Desktop/RR) > source("c:/users/kaja Chmielewska/Desktop/RR/example.r") Tryb wsadowy na linuxie, różne sposoby: $ Rscript example.r $ R CMD BATCH example.r output.txt $ R --vanilla <R.r> result.txt Parametr vanilla powoduje, że R po zakończeniu pracy nie pyta się, czy zapamiętać historię poleceń oraz przestrzeń roboczą. Na windowsie, konieczne jest podanie ścieżki do R: "C:\Program Files\R\R-3.2.2\bin\R.exe" CMD BATCH --vanilla "C:\Users\Kaja Chmielewska\Desktop\testR\example.r" out.txt

Zadanie: Skrypty pod koniec zajęć prześlij na maila (Kaja.Chmielewska@cs.put.poznan.pl). Proszę nadać tytuł maila zgodnie z opisem: RPiS_Imię_Nazwisko_lab5i6 1. Wykorzystaj zadanie z poprzednich zajęć, tak aby załadowanie przykładowych danych i wygenerowanie wykresów odbyło się w trybie wsadowym. Wygenerowane wykresy mają się zapisać w folderze roboczym o nazwie zgodnej ze schematem: numer_wykres-dd-mm-rrrr. 2. Stwórz plik o wybranym przez siebie rozszerzeniu (np. txt lub csv), który zawiera informacje o studentach i ich ocenach z konkretnych przedmiotów. Napisz funkcję, która dla każdego studenta wyliczy średnią arytmetyczną. Program powinien wyświetlić nazwisko najlepszego studenta. Stwórz stosowne wykresy (m.in. stwórz wykres, który będzie wizualizacją dla przedmiotów, jaka jest). 3. Wczytaj zbiór danych (http://www.cs.put.poznan.pl/kchmielewska/rpis/dane/dane3.csv) i wykonaj poniższe polecenia: - Napisz funkcję sprawdzającą typ i klasę każdej kolumny. - Wyświetl dane z wierszy o parzystych indeksach. - Wyświetl dane odpowiadajace pacjentom powyżej 50 roku życia, u których wystąpiły przerzuty (Wezly.chlonne=1).