Elementy statystyki STA - Wykład 1

Podobne dokumenty
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Pozyskiwanie wiedzy z danych

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Środowisko R wprowadzenie. Wykład R1; Pakiety statystyczne

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Pakiety Matematyczne - R Zestaw 2.

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Modelowanie rynków finansowych z wykorzystaniem pakietu R

Instalacja Pakietu R

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Przedmiot statystyki. Graficzne przedstawienie danych.

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka matematyczna i ekonometria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Próba własności i parametry

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka Matematyczna Anna Janicka

Generowanie ciągów pseudolosowych o zadanych rozkładach przykładowy raport

Statystyczne systemy uczące

1 Podstawy rachunku prawdopodobieństwa

Materiał dotyczy generowania różnego typu wykresów w środowisku R.

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Wykład 4: Statystyki opisowe (część 1)

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

WPROWADZENIE DO PROGRAMOWANIA I ŚRODOWISKA R. Biomatematyka - wykład 2 Dr Wioleta Drobik-Czwarno

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyczne metody analizy danych

author: Andrzej Dudek

Wprowadzenie do programowania. Dr Wioleta Drobik

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

INFORMATYKA W SELEKCJI

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Laboratorium 3 - statystyka opisowa

Podstawy wykorzystania języka R

> x <-seq(-2*pi, 2*pi, by=0.5) > plot(x, sin(x), type="b",main="wykres funkcji sin(x) i cos(x)", col="blue") > lines(x, cos(x), type="l",col="red")

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Wykład ze statystyki. Maciej Wolny

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Sposoby prezentacji problemów w statystyce

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Nowoczesne techniki matematyczne, statystyczne i informatyczne

Statystyki opisowe i szeregi rozdzielcze

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

W1. Wprowadzenie. Statystyka opisowa

Wykład 5: Statystyki opisowe (część 2)

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

You created this PDF from an application that is not licensed to print to novapdf printer (

UNIWERSYTET RZESZOWSKI KATEDRA INFORMATYKI

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka matematyczna dla leśników

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej


Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Analiza Statystyczna

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Wprowadzenie do er(k)a

Statystyka I z R. Bartosz Maćkiewicz. 2 października 2017

Wprowadzenie do analizy dyskryminacyjnej

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Xi B ni B

Arkusz kalkulacyjny. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Wykład 10: Elementy statystyki

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

INFORMATYKA W SELEKCJI

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Wydział Nauki o Zdrowiu. Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Język R : kompletny zestaw narzędzi dla analityków danych / Hadley Wickham, Garrett Grolemund. Gliwice, cop Spis treści

Transkrypt:

STA - Wykład 1 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1

Programy do statystycznej analizy danych Komercyjne: Niekomercyjne: a) Statistica URL http://www.statsoft.com URL http://www.statsoft.pl b) SAS URL http://www.sas.com c) SPSS URL http://www.spss.com URL http://www.spss.pl a) R URL http://www.r-project.org 2

Literatura 1. T. Górecki, Podstawy statystyki z przykładami w R, BTC 2011. 2. Ł. Komsta, Wprowadzenie do środowiska R (http://www.r-project.org). 3. P. Biecek, Przewodnik po pakiecie R, GIS 2014. 4. M. Gagolewski, Programowanie w języku R, PWN 2014. 5. W.N. Venables, D. M. Smith and the R Development Core Team, An Introduction to R (http://www.r-project.org). 6. J. Verzani, simpler - Using R for Introductory Statistics (http://www.r-project.org). 3

Program R Program R jest zaawansowanym pakietem statystycznym i językiem programowania istniejacym na platformy Windows, Unix oraz MacOS. Objęty jest licencja GNU GPL. Pierwsza wersja R (poczatek lat 90) została napisana przez Roberta Gentlemana i Ross Ihake pracujacych na Wydziale Statystyki Uniwerstetu w Auckland. Obecnie rozwojem R kieruje fundacja "The R Foundation for Statistical Computing". Język R był wzorowany na języku S opracowanym w AT&T Bell Laboratories i stosowanym w programie S-PLUS. Język R jest językiem interpretowanym, a nie kompilowanym (kolejne komendy interpretowane sa linia po linii lub wykonywane jako skrypt). Największa siła R jest około 20 000 bibliotek funkcji napisanych przez setki osób z całego świata, przeznaczonych do najróżniejszych zastosowań. Każda biblioteka dostarczana jest z pełna dokumentacja. 4

Program RStudio Istnieje wiele programów (nakładek) ułatwiajacych prace z programem R np. Rcmdr, RKWard, RStudio. Strona domowa: www.rstudio.com 5

Programowanie w R Język programowania R opiera się na zmiennych i funkcjach. Zmienne nie musza być deklarowane. Uwagi: Klasycznym operatorem przypisania jest <, można również wykorzystywać znak =. Jeżeli chcemy, aby wynik przypisania został wyświetlony na ekranie, należy przypisanie zamknać w nawiasy (). Jeśli chcemy, aby kilka wyrażeń było zapisanych w jednej linii, to musimy oddzielić je średnikiem. Komentarz poprzedzamy znakiem hash #, wszystko do końca linii jest już komentarzem. R odróżnia wielkie i małe litery. W celu określenia kolejności działań używamy nawiasów okragłych. Do grupowania wyrażeń używamy nawiasów klamrowych. 6

Wektory vector(...) Podstawowe funkcje: mode - zwraca typ elementów wektora; length - zwraca długość wektora. Elementy dodatkowe: wek[3] - odwołanie do trzeciego elementu wektora wek ; c() - tworzenie wektora poprzez złaczanie, np. c(1,3,6); : - generuje liczby z podanego przedziału, np. 1:4; seq - generuje liczby z podanego przedziału, przy czym można podać krok (by) lub długość (length), np. seq(0,3,by=0.5); rep - generuje ciag składajacy się z powtórzeń innego ciagu, np. rep(1:3,2). 7

Ramki danych data.frame(...) Podstawowe funkcje: nrow - zwraca liczbę wierszy; ncol - zwraca liczbę kolumn; rownames - zmiana nazwy wiersza; colnames - zmiana nazwy kolumny. Elementy dodatkowe: ark[1,3] - odwołanie do elementu w pierwszym wierszu i trzeciej kolumnie; ark[,2] - odwołanie do elementów drugiej kolumny; ark$wiek - odwołanie do elementów kolumny o nazwie wiek (zmiennej: wiek ); ark[-3,] - usunięcie trzeciego wiersza; attach(ark) - doł aczenie do przestrzeni nazw wszystkich nazw kolumn ramki danych ark. 8

Listy list(...) Podstawowe funkcje: length - zwraca liczbę elementów listy. Elementy dodatkowe: lista[[3]] - odwołanie do trzeciego elementu listy; lista$dane - odwołanie do elementu listy o nazwie dane. Uwaga: Większość funkcji w R zwraca wynik w postaci listy. 9

Otwieranie/import danych load(...) - otwieranie danych zapisanych w formacie programu R (dla plików z rozszerzeniem RData ); read.table(...) - import danych z plików tekstowych; read.csv2(...) - import danych z plików csv (np. Excel). Uwaga: Do zapisu/exportu danych stosujemy odpowiednio funkcje: save, write.table oraz write.csv2. 10

Wykresy Podstawowe typy wykresów: plot - wykres punktowy; barplot - wykres słupkowy; hist - histogram; pie - wykres kołowy; boxplot - wykres "pudełko z wasami". Popularne parametry wykresów: main - tytuł wykresu; xlab, ylab - tytuły osi; lty - typ linii; lwd - grubość linii; col - kolory punktów, linii, itp. 11

Funkcje nazwa < function(argumenty) ciało Instrukcje warunkowe: if(warunek) wyrażenie1 else wyrażenie2 ifelse(warunek,a,b) switch(zmienna, wartość1=akcja1, wartość2=akcja2,...) Pętle: for(licznik in start:koniec) wyrażenie while(warunek) wyrażenie repeat wyrażenie 12

Rozkład empiryczny 13

Niech x = (x 1,..., x n ) będzie próbka, tzn. x 1,..., x n sa obserwacjami zmiennej (cechy) X. Zadaniem statystyki opisowej jest prezentacja rozkładu cechy X w próbce (rozkładu empirycznego), przy pomocy tabeli lub wykresu. Często wystarczajace jest jedynie podanie kilku liczb charakteryzujacych ten rozkład. Metody opisu rozkładu empirycznego: 2. Tabelaryczny R: table szereg rozdzielczy (liczebności), prop.table szereg rozdzielczy (proporcje, częstości), cut dla cechy ilościowej ciagłej podział na przedziały klasowe. 3. Graficzny R: barplot wykres słupkowy (cecha jakościowa lub ilościowa dyskretna), pie wykres kołowy (cecha jakościowa lub ilościowa dyskretna), hist histogram (cecha ilościowa ciagła). 14

3. Statystyki opisowe klasyczne bazujace na uśrednianiu obserwowanych wartości w próbce, np. moment zwykły rzędu r: µ r = 1 n n xk r k=1 pozycyjne bazujace na posortowanych rosnaco wartościach w próbce, np. dolny kwartyl: Q 1 = 1 2 (x (i) + x (j) ), gdzie lub górny kwartyl: i = n + 1 4, j = n 4 Q 3 = 1 2 (x (i) + x (j) ), gdzie i = 3(n + 1), j = 3n 4 4. 15

Statystyki opisowe Charakterystyki tendencji centralnej rozkładu empirycznego: średnia, R: mean mediana, R: median x = 1 n n k=1 x k Me = { x( n+1 2 ), n nieparzyste, 2 +1) ], n parzyste. 1 2 [x ( n 2 ) + x ( n 16

Statystyki opisowe Charakterystyki rozrzutu rozkładu empirycznego: odchylenie standardowe, R: sd s = 1 n (x k x) n 1 2 k=1 współczynnik zmienności v = 100 s x 17