> (gospodarstwadomoweszczecin1900 <- read.csv("gospdom_szczecin_1900.csv")) liczbaosob liczbagospodarstw

Podobne dokumenty
> E0swiatKobiety <- subset(x0, Plec == "Female-Femmes") > E0swiatKobiety [1]

Miary statystyczne w badaniach pedagogicznych


1. Indeksy/indeksowanie : Do elementów wektora, list, macierzy czy ramek, można się odwołać na kilka sposobów.

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Kolokwium ze statystyki matematycznej

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

1 Programowanie w matlabie - skrypty i funkcje

Analiza struktury i przeciętnego poziomu cechy

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Ćwiczenie 2 arkusze kalkulacyjne użycie funkcji logicznych

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

> # Bez użycia funkcji attach trzeba byłoby napisać: swiatobszary$obszar czy swiatobszary$rok2010 czy swiatobszary$rok2100, by wyświetlić powyższe dan

1 Podstawy rachunku prawdopodobieństwa

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka. Opisowa analiza zjawisk masowych

Przedmiot: Informatyka w inżynierii produkcji Forma: Laboratorium Temat: Zadanie 4. Instrukcja warunkowa.

Wprowadzenie komentarzy do programu

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Cw.12 JAVAScript w dokumentach HTML

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

MS Excel cz.1 funkcje zaawansowane

Warsztaty dla nauczycieli

Matlab Składnia + podstawy programowania

do MATLABa programowanie WYKŁAD Piotr Ciskowski

JAVAScript w dokumentach HTML (2)

Metody numeryczne Laboratorium 2

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

JAVAScript w dokumentach HTML (1) JavaScript jest to interpretowany, zorientowany obiektowo, skryptowy język programowania.

4. Funkcje. Przykłady

8. Wektory. Przykłady Napisz program, który pobierze od użytkownika 10 liczb, a następnie wypisze je w kolejności odwrotnej niż podana.

Podstawy programowania w R - część 1

Instalacja Pakietu R

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Diary przydatne polecenie. Korzystanie z funkcji wbudowanych i systemu pomocy on-line. Najczęstsze typy plików. diary nazwa_pliku

Matlab Składnia + podstawy programowania

Języki skryptowe w programie Plans

ANALIZA JEDNOZMIENNOWA. podstawowe pojęcia

Wydział Zarządzania AGH. Katedra Informatyki Stosowanej. Podstawy VBA cz. 1. Programowanie komputerowe

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

1. Operacje na plikach i katalogach Chcąc przeprowadzić analizę danych należy załadować/wczytać dane do R, a wyniki z pewnością chcemy zapisać.

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Pozyskiwanie wiedzy z danych

W przeciwnym wypadku wykonaj instrukcję z bloku drugiego. Ćwiczenie 1 utworzyć program dzielący przez siebie dwie liczby

PRZYKŁADOWE SKRYPTY (PROGRAMY W MATLABIE Z ROZSZERZENIEM.m): 1) OBLICZANIE WYRAŻEŃ 1:

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

WHILE (wyrażenie) instrukcja;

Zadanie 1. Analiza Analiza rozkładu

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Podstawy wykorzystania języka R

Język ludzki kod maszynowy

Ćwiczenie 1. Matlab podstawy (1) Matlab firmy MathWorks to uniwersalny pakiet do obliczeń naukowych i inżynierskich, analiz układów statycznych

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Pętla for. Matematyka dla ciekawych świata -19- Scilab. for i=1:10... end. for k=4:-1:1... end. k=3 k=4. k=1. k=2

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Rachunek prawdopodobieństwa i statystyka

Opisowa analiza struktury zjawisk statystycznych

REGUŁOWO-MODELOWE SKORUPOWE SYSTEMY EKSPERTOWE

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Testy nieparametryczne

Podstawy Programowania C++

Po uruchomieniu programu nasza litera zostanie wyświetlona na ekranie

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS

Zadanie 8 Zbadano wiek czytelników pewnej biblioteki. Na tej podstawie wyznaczyć i zinterpretować średnią arytmetyczną

Podstawy programowania w języku Visual Basic dla Aplikacji (VBA)

Rozdział 2 PROGRAMOWANIE LINIOWE CAŁKOWITOLICZBOWE

utworz tworzącą w pamięci dynamicznej tablicę dwuwymiarową liczb rzeczywistych, a następnie zerującą jej wszystkie elementy,

Przygotowanie danych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Zadania. Rozdział Wektory i macierze. 1.Podajpolecenie 1,któreutworzywektor: v = [100, 95, 90,..., 95, 100].

OWO-MODELOWE SKORUPOWE SYSTEMY EKSPERTOWE

Programowanie strukturalne i obiektowe. Funkcje

Lekcja 1. Składnia języka zmienne i podstawowe instrukcje PHP. Do wyświetlania tekstu służy instrukcja echo echo Hello world ;

Ćwiczenie 3. MatLab: Algebra liniowa. Rozwiązywanie układów liniowych

2 Ustalamy długość klasy, dzieląc rozstęp R przez liczbę klas, czyli przez 6. Klasy mają więc długość

Podstawy algorytmiki i programowania - wykład 2 Tablice dwuwymiarowe cd Funkcje rekurencyjne

PętlaforwOctave. Roman Putanowicz 13 kwietnia 2008

LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI. Wprowadzenie do środowiska Matlab

METODY KOMPUTEROWE W OBLICZENIACH INŻYNIERSKICH

1. Przycisk MS OFFICE 2. Belka szybkiej nawigacji 3. Wstęga 4. Zakładki arkuszy 5. Widok i jego tryby

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Komentarze w PHP (niewykonywane fragmenty tekstowe, będące informacją dla programisty)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Zmienne losowe zadania na sprawdzian

Blockly Kodowanie pomoc.

Programowanie strukturalne. Opis ogólny programu w Turbo Pascalu

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Wykład 5. Metoda eliminacji Gaussa

Operacje wykonywane są na operandach (argumentach operatorów). Przy operacji dodawania: argumentami operatora dodawania + są dwa operandy 2 i 5.

Transkrypt:

> getwd() [1] "C:/Users/DC/Desktop/StatDem" > # Wyświetlenie listy plików w katalogu roboczym. > list.files() [1] "data" "Dominanta_R.txt" [3] "Eo_World_Baza.csv" "Eo_World_bis.xlsx" [5] "Eo_World_Red.xlsx" "GospDom_Polska_2002.csv" [7] "GospDom_Polska_2002.xlsx" "GospDom_Szczecin_1900.csv" [9] "KobietyDzieci_1980_Polska.csv" "KobietyDzieci_2011_Polska.csv" [11] "LudnAfrykaSubsahar_2050_wiek.csv" "LudnEuropaZach_2050_wiek.csv" [13] "LudnSwiat_2010_2100_KBR_KMR.csv" "LudnSwiat_2010_2100_Obszary.csv" [15] "LudnSwKrzyz_1791_Wiek.csv" "Material_1.xlsx" [17] "nupturienci_jasienica_1861_1880.csv" "nupturienci_jasienica_1861_1880.xlsx" [19] "Nupturienci_kawalerowie_wiek_Jasienica_1861_1880.csv" "Nupturienci_panny_wiek_Jasienica_1861_1880.csv" [21] "Polska_emigranci_3miesiace_2002.csv" "Polska_emigranci_3miesiace_2011.csv" [23] "R_1_Grupowanie.docx" "R_1_Grupowanie.pdf" [25] "R_1_Grupowanie.RData" "R_2_LiczbyRelatywne.docx" [27] "R_2_LiczbyRelatywne.pdf" "R_2_LiczbyRelatywne.RData" [29] "R_3_TendencjaCentralna_indywidualneDane.docx" "R_3_TendencjaCentralna_indywidualneDane.pdf" [31] "rs_rocznik_demograficzny_2012.zip" > # Obliczanie średniej ważonej dla pogrupowanych danych - zmienna skokowa > (gospodarstwadomowepolska2002 <- read.csv("gospdom_polska_2002.csv")) liczbaosob liczbagospoddom2002 1 1 2486514 2 2 2215940 3 3 1890321 4 4 1568063 5 5 550173 6 6 170372 7 7 83080 > # Z uwagi na małą liczebność (mniej niż 5% ogólnej liczebności) ostatni wariant zmiennej "7 i więcej" zastąpiono wariantem "7". > attach(gospodarstwadomowepolska2002) > (gospodarstwadomowepolska2002srednia <- weighted.mean(liczbaosob,liczbagospoddom2002)) [1] 2.589811

> (gospodarstwadomoweszczecin1900 <- read.csv("gospdom_szczecin_1900.csv")) liczbaosob liczbagospodarstw 1 1 2984 2 2 7929 3 3 9763 4 4 9582 5 5 7444 6 6 5190 7 7 2996 8 8 1590 9 9 728 10 10 300 11 11 292 > # Z uwagi na małą liczebność (mniej niż 5% ogólnej liczebności) ostatni wariant zmiennej "11 i więcej" zastąpiono wariantem "11". > detach(gospodarstwadomowepolska2002) > attach(gospodarstwadomoweszczecin1900) > (gospodarstwadomoweszczecin1900srednia <- weighted.mean(liczbaosob,liczbagospodarstw)) [1] 4.124657 > detach(gospodarstwadomoweszczecin1900) > # Utworzenie własnej funkcji obliczającej średnią ważoną dla pogrupowanych danych - zmienna ciągła. > # Założenie dla dalszych obliczeń: tabela z danymi składa się z trzech kolumn, to jest "granicy dolnej", "granicy górnej", "liczebności". > sredniapogrupowane <- function(dane,poprzecinku) {round(sum((dane[,1]+dane[,2])/2*dane[,3])/sum(dane[,3]),poprzecinku)} > sredniapogrupowane function(dane,poprzecinku) {round(sum((dane[,1]+dane[,2])/2*dane[,3])/sum(dane[,3]),poprzecinku)} > (emigrancipolska2011 <- read.csv("polska_emigranci_3miesiace_2011.csv")) dolnagranicawieku gornagranicawieku emigranci2011 1 0 5 86800 2 5 10 74600 3 10 15 65000 4 15 20 64700 5 20 25 179200 6 25 30 382800 7 30 35 343200 8 35 40 221500

9 40 45 152300 10 45 50 134300 11 50 55 123000 12 55 60 87100 13 60 65 44900 14 65 70 18300 15 70 75 14400 16 75 80 10600 17 80 85 13700 > # Przetestowanie utworzonej funkcji na powyższych danych. Zaokrąglenie wyniku do dwóch miejsc po przecinku (po kropce). > emigrancipolska2011srednia <- sredniapogrupowane(emigrancipolska2011,2) > emigrancipolska2011srednia [1] 33.77 > (kawalerowiejasienica <- read.csv("nupturienci_kawalerowie_wiek_jasienica_1861_1880.csv")) dolnagranicawieku gornagranicawieku liczebnoscnupturientow 1 20 23 29 2 23 26 121 3 26 29 116 4 29 32 45 5 32 35 22 6 35 38 16 > (kawalerowiejasienicasrednia <- sredniapogrupowane(kawalerowiejasienica,2)) [1] 27.14 > # Utworzenie własnej funkcji obliczającej dominantę dla pogrupowanych danych. > # W obliczeniach przydatna jest funkcja which.max(), która zwraca indeks (pozycję) największej wartości w wektorze danych. > # Obliczenia dominanty dla pogrupowanych danych na podstawie wzoru: > # dolna granica przedziału z dominantą + (liczebność przedziału z dominantą liczebność przedziału poprzedzającego przedział z dominantą) / ((liczebność przedziału z dominantą liczebność przedziału poprzedzającego przedział z dominantą) + (liczebność przedziału z dominantą liczebność przedziału następnego po przedziale z dominantą)) * rozpiętość przedziału z dominantą. > dominantapogrupowane <- function(dane) { + # pozycja liczebności dominującej - pozndom + pozndom <- which.max(dane[,3]) + # wzór:

+ dane[pozndom,1]+(dane[pozndom,3]-dane[pozndom-1,3])/((dane[pozndom,3]-dane[pozndom-1,3])+(dane[pozndom,3]-dane[pozndom+1,3]))*(dane[pozndom,2]- dane[pozndom,1]) + } > dominantapogrupowane function(dane) { # pozycja liczebności dominującej - pozndom pozndom <- which.max(dane[,3]) # wzór: dane[pozndom,1]+(dane[pozndom,3]-dane[pozndom-1,3])/((dane[pozndom,3]-dane[pozndom-1,3])+(dane[pozndom,3]-dane[pozndom+1,3]))*(dane[pozndom,2]- dane[pozndom,1]) } > # Przetestowanie nowej funkcji - obliczenie dominanty wieku emigrantów w 2011 roku. > emigrancipolska2011dominanta <- dominantapogrupowane(emigrancipolska2011) > emigrancipolska2011dominanta [1] 29.18586 > # Obliczenie dominanty wieku kawalerów - nupturientów. > (kawalerowiejasienicadominanta <- dominantapogrupowane(kawalerowiejasienica)) [1] 25.84536 > pannywiek <- read.csv("nupturienci_panny_wiek_jasienica_1861_1880.csv") > pannywiek dolnagranicawieku gornagranicawieku liczebnoscnupturientek 1 17 20 29 2 20 23 100 3 23 26 114 4 26 29 63 5 29 32 36 6 32 35 11 7 35 38 5 > # Obliczenia mediany dla pogrupowanych danych na podstawie wzoru: > # dolna granica przedziału z medianą + (ogólna liczebność podzielona przez dwa suma liczebności poprzedzających przedział z medianą) / liczebność przedziału z medianą * rozpiętość przedziału z medianą > # Do utworzenia funkcji wykorzystana będzie: > # funkcja cumsum() tworząca wektor szeregu skumulowanego > # funkcja which() zwracająca indeks (pozycję) poszukiwanej lub poszukiwanych wartości z atrybutem TRUE (prawda).

> medianapogrupowane <- function(dane) { + # Wartość ogólnej liczebności podzielona przez dwa - Nprzez2 + Nprzez2 <- sum(dane[,3])/2 + # Pozycja (wiersz) przedziału z medianą - pozme + pozme <- which(cumsum(dane[,3])>nprzez2)[1] + # Wzór: + dane[pozme,1]+(nprzez2-cumsum(dane[,3])[pozme-1])/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) + } > medianapogrupowane function(dane) { # Wartość ogólnej liczebności podzielona przez dwa - Nprzez2 Nprzez2 <- sum(dane[,3])/2 # Pozycja (wiersz) przedziału z medianą - pozme pozme <- which(cumsum(dane[,3])>nprzez2)[1] # Wzór: dane[pozme,1]+(nprzez2-cumsum(dane[,3])[pozme-1])/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) } > # Przetestowanie > medianapogrupowane(pannywiek) [1] 24.31579 > # Utworzenie przykładowej ramki (a dolna granica, b górna granica, n liczebność). Mediana w pierwszym przedziale. > a <- c(1:3) > b <- c(2:4) > n <- c(100,2,2) > abn <- data.frame(a,b,n) > abn a b n 1 1 2 100 2 2 3 2 3 3 4 2 # Wprowadzenie do stosowania instrukcji warunkowej typu: if... else... # if(warunek) {prawda} else {fałsz} < if(2+2 == 4) {"To prawda"} else {"To nieprawda"} [1] "To prawda"

< if(2+2 == 5) {"To prawda"} else {"To nieprawda"} [1] "To nieprawda" # Ciąg dalszy wprowadzenia: utworzenie własnej funkcji sprawdzającej, czy dana wartość jest liczbą z użyciem funkcji class() # Funkcja class może zwrócić następujące wyniki: > class(15) [1] "numeric" > class("dom15") [1] "character" > class(true) [1] "logical" > czyliczba <- function(dana) {if (class(dana) == "numeric") {"To jest liczba"} else {"To nie jest liczba"}} > # Przetestowanie powyższej funkcji > czyliczba(10) [1] "To jest liczba" > czyliczba("dom15") [1] "To nie jest liczba" > czyliczba(true) [1] "To nie jest liczba" # Modyfikacja funkcji "medianapogrupowane" z uwzględnieniem występowania mediany w pierwszym przedziale > medianapogrupowane <- function(dane) { + # Wartość ogólnej liczebności podzielona przez dwa - Nprzez2 + Nprzez2 <- sum(dane[,3])/2 + # Pozycja (wiersz) przedziału z medianą - pozme + pozme <- which(cumsum(dane[,3])>nprzez2)[1] + # Sprawdzenie warunku i wykonanie obliczeń + if(nprzez2<dane[,3][1]) { + dane[pozme,1]+nprzez2/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) + } else { + dane[pozme,1]+(nprzez2-cumsum(dane[,3])[pozme-1])/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) + } + } >medianapogrupowane function(dane) { # Wartość ogólnej liczebności podzielona przez dwa - Nprzez2

Nprzez2 <- sum(dane[,3])/2 # Pozycja (wiersz) przedziału z medianą - pozme pozme <- which(cumsum(dane[,3])>nprzez2)[1] # Sprawdzenie warunku i wykonanie obliczeń if(nprzez2<dane[,3][1]) { dane[pozme,1]+nprzez2/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) } else { dane[pozme,1]+(nprzez2-cumsum(dane[,3])[pozme-1])/dane[pozme,3]*(dane[pozme,2]-dane[pozme,1]) } } > medianapogrupowane(abn) [1] 1.52 > medianapogrupowane(pannywiek) [1] 24.31579 (emigrancipolska2002 <- read.csv("polska_emigranci_3miesiace_2002.csv")) dolnagranicawieku gornagranicawieku emigranci2002 1 0 5 13100 2 5 10 19400 3 10 15 28100 4 15 20 47500 5 20 25 91300 6 25 30 116200 7 30 35 94700 8 35 40 89900 9 40 45 86200 10 45 50 71500 11 50 55 48400 12 55 60 24600 13 60 65 19500 14 65 70 14600 15 70 75 10100 16 75 80 5700 17 80 85 4500 > medianapogrupowane(emigrancipolska2002)

[1] 34.06811 > save.image("r_3_tendencjacentralna_pogrupowanedane.rdata") > q()