Podobne dokumenty
> (gospodarstwadomoweszczecin1900 <- read.csv("gospdom_szczecin_1900.csv")) liczbaosob liczbagospodarstw

Instalacja Pakietu R

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Miary statystyczne w badaniach pedagogicznych


Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

UNIWERSYTET RZESZOWSKI KATEDRA INFORMATYKI

Język R : kompletny zestaw narzędzi dla analityków danych / Hadley Wickham, Garrett Grolemund. Gliwice, cop Spis treści

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

Wykład 3: Prezentacja danych statystycznych

5. Bazy danych Base Okno bazy danych

I. Podstawowe pojęcia i oznaczenia logiczne i mnogościowe. Elementy teorii liczb rzeczywistych.

Elementy statystyki STA - Wykład 1

Programowanie obiektowe. Literatura: Autor: dr inŝ. Zofia Kruczkiewicz

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Umowa użytkownika. 1. Uprawnienia. 2. Logowanie do platformy szkoleń elektronicznych

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Wstęp do programowania INP003203L rok akademicki 2018/19 semestr zimowy. Laboratorium 3. Karol Tarnowski A-1 p.

Temat 3 ćwiczenie 5. Bazy danych w R

Getin Noble Bank SA wersja 1.0 Infolinia

Wykład 2: Arkusz danych w programie STATISTICA

Sposoby prezentacji problemów w statystyce

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Instrukcja EQU Kantech

Język C : programowanie dla początkujących : przewodnik dla adeptów programowania / Greg Perry, Dean Miller. Gliwice, cop

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

Statystyka w pracy badawczej nauczyciela

Modelowanie rynków finansowych z wykorzystaniem pakietu R

> E0swiatKobiety <- subset(x0, Plec == "Female-Femmes") > E0swiatKobiety [1]

III TUTORIAL Z METOD OBLICZENIOWYCH

EGZAMIN MATURALNY 2011 INFORMATYKA

Podstawy programowania. Wykład: 9. Łańcuchy znaków. dr Artur Bartoszewski -Podstawy programowania, sem 1 - WYKŁAD

Środowisko R wprowadzenie. Wykład R1; Pakiety statystyczne

Wprowadzenie do programu ProjectLibre

Ciągłość funkcji i podstawowe własności funkcji ciągłych.

Historia aktualizacji

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

> # Bez użycia funkcji attach trzeba byłoby napisać: swiatobszary$obszar czy swiatobszary$rok2010 czy swiatobszary$rok2100, by wyświetlić powyższe dan

Rozdział 2 PROGRAMOWANIE LINIOWE CAŁKOWITOLICZBOWE

Bufor danych DL 111K Nr produktu

Wykład 4: Statystyki opisowe (część 1)

Część II Wyświetlanie obrazów

Język programowania DELPHI / Andrzej Marciniak. Poznań, Spis treści

TRADYCYJNE NARZĘDZIA ZARZĄDZANIA JAKOŚCIĄ

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

KALKULATOR ODSETEK BASIC - GRAY wersja V2

Analiza Statystyczna

Instrukcja instalacji programu ARPunktor wraz z serwerem SQL 2005 Express

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Baltie 3. Podręcznik do nauki programowania dla klas I III gimnazjum. Tadeusz Sołtys, Bohumír Soukup

Badania Statystyczne

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Języki i metody programowania Java. Wykład 2 (część 2)

REKLAMA INTERNETOWA WYMAGANIA TECHNICZNE

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Techniki programowania INP001002Wl rok akademicki 2017/18 semestr letni. Wykład 5. Karol Tarnowski A-1 p.

Statystyka matematyczna i ekonometria

Techniki programowania INP001002Wl rok akademicki 2018/19 semestr letni. Wykład 5. Karol Tarnowski A-1 p.

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

Rozdział 8. Regresja. Definiowanie modelu

Wykład ze statystyki. Maciej Wolny

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Tworzenie szablonów użytkownika

Instrukcja korzystania z portalu. Diagnoza z Nową Erą

Laboratorium WDEC. Opis posługiwania się pakietem AMPL

Writer wzory matematyczne

4 ŚRODKI DYDAKTYCZNE 5 UWARUNKOWANIA TECHNICZNE 6 PRZEBIEG LEKCJI. Scenariusz lekcji. komputery. lekcja multimedialna;

Nazwa wariantu modułu (opcjonalnie): Laboratorium programowania w języku C++

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Instrukcja korzystania z portalu Diagnoza Nowej Ery

Środki Trwałe v.2.2. Producent: GRAF Serwis Roman Sznajder Ustroń ul. Złocieni 4/1 tel ,

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Ocenianie ciągłe (praca przy Formująca tablicy oraz przy komputerze) pisemne, końcowe zaliczenie pisemne

1 Podstawy rachunku prawdopodobieństwa

SPIS TREŚCI: 1. INSTALACJA SYSTEMU SIMPLE.ERP LOGOWANIE DO SYSTEMU ZMIANA HASŁA PLANOWANIE INFORMACJE DODATKOWE...

Instrukcja dla programu Ocena.XP

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

Podstawy programowania. Wykład: 9. Łańcuchy znaków. dr Artur Bartoszewski -Podstawy programowania, sem 1 - WYKŁAD

System Comarch OPT!MA v. 17.1

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

Rozdział 6 PROGRAMOWANIE WYPUKŁE I KWADRATOWE

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

METODY KOMPUTEROWE W OBLICZENIACH INŻYNIERSKICH

Analiza struktury i przeciętnego poziomu cechy

Scenariusz lekcji. Scenariusz lekcji. opisać rodzaje zmian, jakie można wykonać na komórkach w Excelu; wskazać jak dane i komórki w Excelu

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

4.2. Statystyczne opracowanie zebranego materiału

Załącznik nr 6.2. Przykładowy projekt graficzny interfejsu użytkownika aplikacji mobilnej

Program APEK Użytkownik Instrukcja użytkownika

Fakt 3.(zastosowanie różniczki do obliczeń przybliżonych) Przy czym błąd, jaki popełniamy zastępując przyrost funkcji

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ

Transkrypt:

> # Zaglądamy na www.r-project.org i/lub pobieramy program, na przykład z http://r.meteo.uni.wroc.pl/ > # Literatura: > # - John M. Quick, Analiza statystyczna w środowisku R dla początkujących, Gliwice 2012, ss. 280. > # - ukasz omsta, prowadzenie do środowiska R, ss., 21 sierpnia 200 (www.cran.r-project.org/doc/contrib/ omsta- prowadzenie.pd ). > # - Przemysław iecek, Przewodnik po pakiecie R, wyd. 2, rocław 2011, ss. 0 (częś w sieci www.biecek.pl/r/rwydanie2.pd ). > # - (red.) Marek Walesiak, Eugeniusz Gatnar, Statystyczna analiza danych z wykorzystaniem programu R, Warszawa 2012, ss. 468. > # Sprawdzenie ścieżki do katalogu roboczego. > getwd() [1] "C:/Users/DC/Documents" > # Ustawienie ścieżki do własnego katalogu roboczego utworzonego na pulpicie o nazwie StatDem. > setwd("c:/users/dc/desktop/statdem/") > getwd() [1] "C:/Users/DC/Desktop/StatDem" > # Utworzenie wektora danych kategorycznych i przypisanie mu nazwy: pochodzenieszczecin. > pochodzenieszczecin <- c("t","n","t","n","n","n","t","n","t","t","n","t","t","n","n","n","t","t","n","t","t","n","n","t","n","n","n","t","n","n") > # yświetlenie wektora (nazywanego w programowaniu zmienną w tym wypadku w statystyce mowa o zbiorowości). > pochodzenieszczecin [1] "t" "n" "t" "n" "n" "n" "t" "n" "t" "t" "n" "t" "t" "n" "n" "n" "t" "t" "n" "t" "t" "n" "n" "t" "n" "n" "n" "t" "n" "n" > # Wyznaczenie liczebności (długoś łańcucha danych). > pochodzenieszczecinliczebnosc <- length(pochodzenieszczecin) > pochodzenieszczecinliczebnosc > # yświetlenie aktora, tu podanie poszczególnych wartości elementów zbioru i ich kategorii uporządkowanych al abetycznie (Levels). > pochodzenieszczecinfactor <- factor(pochodzenieszczecin) > pochodzenieszczecinfactor [1] t n t n n n t n t t n t t n n n t t n t t n n t n n n t n n Levels: n t > # yświetlenie wyników grupowania prostego (liczebności poszczególnych kategorii uporządkowanych al abetycznie) > pochodzenieszczecingrupowanie <- table(pochodzenieszczecin) > pochodzenieszczecingrupowanie pochodzenieszczecin n t 17 13 > # Utworzenie nowego wektora zmiennej i przypisanie mu nazwy: rodzenstwo. 1

> rodzenstwo <- c(3,1,0,1,2,0,0,3,0,2,1,0,1,2,0,1,1,0,0,4,1,2,2,2,1,1,3,0,3,4) > rodzenstwo [1] 3 1 0 1 2 0 0 3 0 2 1 0 1 2 0 1 1 0 0 4 1 2 2 2 1 1 3 0 3 4 > rodzenstwoliczebnosc <- length(rodzenstwo) > rodzenstwoliczebnosc > # yświetlenie aktora dla powyższej zmiennej, tu podanie poszczególnych wartości elementów zbioru i ich wariantów uporządkowanych od najmniejszego do największego (Levels). > rodzenstwofactor <- factor(rodzenstwo) > rodzenstwofactor [1] 3 1 0 1 2 0 0 3 0 2 1 0 1 2 0 1 1 0 0 4 1 2 2 2 1 1 3 0 3 4 Levels: 0 1 2 3 4 > rodzenstwogrupowanie <- table(rodzenstwo) > rodzenstwogrupowanie rodzenstwo 0 1 2 3 4 9 9 6 4 2 > # Grupowanie złożone (jednocześnie dwie zmienne rodzeństwo i pochodzenieszczecin) > rodzenstwopochodzenieszczecingrupowanie <- table(rodzenstwo,pochodzenieszczecin) > rodzenstwopochodzenieszczecingrupowanie pochodzenieszczecin rodzenstwo n t 0 3 6 1 6 3 2 4 2 3 3 1 4 1 1 > # Utworzenie ramki danych (kolumny danych indywidualnych). > rodzenstwopochodzenieszczecinramka <- data.frame(rodzenstwo,pochodzenieszczecin) > # yświetlenie ramki. > rodzenstwopochodzenieszczecinramka rodzenstwo pochodzenieszczecin 1 3 t 2 1 n 2

3 0 t 4 1 n 5 2 n 6 0 n 7 0 t 8 3 n 9 0 t 10 2 t 11 1 n 12 0 t 13 1 t 14 2 n 15 0 n 16 1 n 17 1 t 18 0 t 19 0 n 20 4 t 21 1 t 22 2 n 23 2 n 24 2 t 25 1 n 26 1 n 27 3 n 28 0 t 29 3 n 30 4 n > # yświetlenie wyników grupowania na podstawie odwołań do ramki z użyciem znaku specjalnego $ wskazującego drogę do kolumn ramki (wektorów). > rodzenstwopochodzenieszczecingrupowanieramka <- table(rodzenstwopochodzenieszczecinramka$rodzenstwo,rodzenstwopochodzenieszczecinramka$pochodzenieszczecin) > rodzenstwopochodzenieszczecingrupowanieramka n t 0 3 6 3

1 6 3 2 4 2 3 3 1 4 1 1 > Utworzenie nowej zmiennej: czasdojazduh (w godzinach). > czasdojazduh <- c(0.4,1,0.5,0.7,0.3,1.3,0.1,1.8,0.2,1.2,1.9,1,1.3,1.6,0.9,0.8,0.2,0.1,0.6,0.5,0.7,0.5,1.2,1.4,0.3,0.5,1,0.2,1.5,1.2) > czasdojazduh [1] 0.4 1.0 0.5 0.7 0.3 1.3 0.1 1.8 0.2 1.2 1.9 1.0 1.3 1.6 0.9 0.8 0.2 0.1 0.6 0.5 0.7 0.5 1.2 1.4 0.3 0.5 1.0 0.2 1.5 1.2 > czasdojazduhliczebnosc <- length(czasdojazduh) > czasdojazduhliczebnosc > czasdojazduhfactor <- factor(czasdojazduh) > czasdojazduhfactor [1] 0.4 1 0.5 0.7 0.3 1.3 0.1 1.8 0.2 1.2 1.9 1 1.3 1.6 0.9 0.8 0.2 0.1 0.6 0.5 0.7 0.5 1.2 1.4 0.3 0.5 1 0.2 1.5 1.2 Levels: 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.2 1.3 1.4 1.5 1.6 1.8 1.9 > # Użycie unkcji cut() do wydzielenia grup nazywanych dawniej przedziałami klasowymi i określenie ich granic dolnych i górnych wektorem c (standardowo przedziały domknięte z góry). > czasdojazduhprzedzialy <- cut(czasdojazduh,c(0,0.5,1,1.5,2)) > czasdojazduhprzedzialy [1] (0,0.5] (0.5,1] (0,0.5] (0.5,1] (0,0.5] (1,1.5] (0,0.5] (1.5,2] (0,0.5] (1,1.5] (1.5,2] (0.5,1] (1,1.5] (1.5,2] (0.5,1] (0.5,1] (0,0.5] (0,0.5] (0.5,1] (0,0.5] [21] (0.5,1] (0,0.5] (1,1.5] (1,1.5] (0,0.5] (0,0.5] (0.5,1] (0,0.5] (1,1.5] (1,1.5] Levels: (0,0.5] (0.5,1] (1,1.5] (1.5,2] > # Pierwszy zapis oznacza, że osoba miała czas dojazdu na uczelnię nie dłuższy jak pół godziny (dosłownie 0 i mniej minut), drugi zaś więcej od 0 minut a do godziny włącznie. > # ykonanie grupowania statystycznego na podstawie przynależności danych indywidualnych do poszczególnych, ogólniejszych grup. > czasdojazduhprzedzialygrupowanie <- table(czasdojazduhprzedzialy) > czasdojazduhprzedzialygrupowanie czasdojazduhprzedzialy (0,0.5] (0.5,1] (1,1.5] (1.5,2] 12 8 7 3 > # yświetlenie ramki dla trzech zmiennych rodzenstwo, pochodzenieszczecin, czasdojazduh. > rodzenstwopochodzenieszczecinczasdojazduhramka <- data.frame(rodzenstwo,pochodzenieszczecin,czasdojazduh) > rodzenstwopochodzenieszczecinczasdojazduhramka rodzenstwo pochodzenieszczecin czasdojazduh 4

1 3 t 0.4 2 1 n 1.0 3 0 t 0.5 4 1 n 0.7 5 2 n 0.3 6 0 n 1.3 7 0 t 0.1 8 3 n 1.8 9 0 t 0.2 10 2 t 1.2 11 1 n 1.9 12 0 t 1.0 13 1 t 1.3 14 2 n 1.6 15 0 n 0.9 16 1 n 0.8 17 1 t 0.2 18 0 t 0.1 19 0 n 0.6 20 4 t 0.5 21 1 t 0.7 22 2 n 0.5 23 2 n 1.2 24 2 t 1.4 25 1 n 0.3 26 1 n 0.5 27 3 n 1.0 28 0 t 0.2 29 3 n 1.5 30 4 n 1.2 < # Zapisanie wyników prac zmiennych w pliku o nazwie R_1_Grupowanie.RData (ścieżka do katalogu określona na samym początku prac). > save.image("r_1_grupowanie.rdata") < # yjście z programu. > q() 5