INFORMATYKA W SELEKCJI

Podobne dokumenty
PAKIETY STATYSTYCZNE

INFORMATYKA W SELEKCJI

Informatyka w selekcji - Wykªad 4

INFORMATYKA W SELEKCJI

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

BIOMETRIA 3. Wprowadzenie do pakietu SAS

PAKIETY STATYSTYCZNE

author: Andrzej Dudek

Ankieta. Informacje o uczestniku. Imię i nazwisko: Stanowisko : Warsztat Innowacyjne metody dydaktyczne (np. learning by doing, design thinking)

Sposoby prezentacji problemów w statystyce

ANALITYK DANYCH Kto to jest analityk danych? Na czym polega praca analityka danych?

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

PAKIETY STATYSTYCZNE

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

STATYSTYKA MATEMATYCZNA

Instrukcja korzystania ze skryptu kroswalidacja.py

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Analiza Statystyczna

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ

Z-LOGN1-006 Statystyka Statistics

Instalacja Pakietu R

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Podstawy statystyki matematycznej w programie R

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Uczelnia Łazarskiego Wydział Medyczny Kierunek Lekarski

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Wprowadzenie do analizy korelacji i regresji

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

KOMPLEKSOWA OFERTA SZKOLEŃ MS EXCEL W FINANSACH. z konsultacjami

Oprogramowanie dla GWAS

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Badanie normalności rozkładu

Dostawa oprogramowania. Nr sprawy: ZP /15

PRZYKŁAD AUTOMATYZACJI STATYSTYCZNEJ OBRÓBKI WYNIKÓW

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

Analiza regresji - weryfikacja założeń

JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

Wykład 1. Statystyka międzynarodowa - wprowadzenie Rynek pracy w Unii Europejskiej

SIGMA KWADRAT. Wykorzystanie programu MS Excel do opracowań statystycznych CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Informatyka w selekcji - Wykªad 1

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Wprowadzenie do SAS. Jak zacząć? Enhanced Editor (1) Uruchamianie programu. Ćwiczenie 3. Definiowanie bibliotek

Rachunek prawdopodobieństwa WZ-ST1-AG--16/17Z-RACH. Liczba godzin stacjonarne: Wykłady: 15 Ćwiczenia: 30. niestacjonarne: Wykłady: 9 Ćwiczenia: 18

PDF created with FinePrint pdffactory Pro trial version

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

PAKIETY STATYSTYCZNE

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

PROGRAM SZKOLENIA. Excel w Analizach danych.

Program szkolenia EXCEL OD PODSTAW POPOŁUDNIOWY (WIECZOROWY)

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

KARTA PRZEDMIOTU / SYLABUS

Instrukcja obsługi programu M116_Manager

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

MODELE LINIOWE. Dr Wioleta Drobik

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

POLITECHNIKA OPOLSKA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozdział 8. Regresja. Definiowanie modelu

Z poprzedniego wykładu

KNIME podstawy obsługi programu. Pracownia Chemometrii Środowiska Katedra Chemii i Radiochemii Środowiska Wydział Chemii UG

Tematyka seminariów z informatyki dla studentów I roku kierunku lekarsko-dentystycznego w roku akademickim 2017/2018.

Program szkolenia EXCEL ZAAWANSOWANY Z WPROWADZENIEM DO VBA.

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

SCENARIUSZ LEKCJI MATEMATYKI, FIZYKI LUB BIOLOGII Z WYKORZYSTANIEM FILMU ROZKŁAD NORMALNY.

TEMAT : TWORZENIE BAZY DANYCH PRZY POMOCY PROGRAMU EXCEL

Serie i autonumerowanie Listy niestandardowe Kopiowanie Kopiowanie formatów Daty

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Sieci Komputerowe 2 / Ćwiczenia 1

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Wykład 4: Statystyki opisowe (część 1)

ANALIZA JPK VAT. INSTRUKCJA OBSŁUGI Przy pierwszym uruchomieniu programu należy wpisać numer licencji.

Microsoft Office 2016 Krok po kroku

Z-LOG-033I Statystyka Statistics

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Wykorzystanie programu MS Excel do opracowań statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

KARTA PRZEDMIOTU / SYLABUS

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Transkrypt:

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne na przykładzie pakietu SAS i bezpłatnego pakietu R Z wykorzystaniem narzędzi programów Excel, SAS, R: 4. Wykorzystanie zależności cech w selekcji regresja 5. Analiza wariancji z modelem stałym i losowym (np. ocena h 2 ) 6. Ocena wartości hodowlanej z modelem mieszanym 7. Ocena efektów selekcji (m.in. trendu genetycznego)

INFORMATYKA W SELEKCJI WPROWADZENIE DO PAKIETU SAS Zasady pracy z programem Podstawy edycji danych

INFORMATYKA W SELEKCJI SAS to zintegrowany system oprogramowania, łączący: Pakiet statystyczny System zarządzania bazą danych Język programowania

SAS ANALIZA DANYCH różnorodne metody statystyczne wykonywanie wykresów bazy danych PROGRAM KOMERCYJNY roczna licencja POPRAWNOŚĆ poprawność obliczeń gwarantowana procedury stale uzupełniane

PRACA Z PROGRAMEM

PRACA Z PROGRAMEM PROGRAM EDITOR INSTRUKCJE WYKONANIE LOG BŁĘDY BRAK BŁĘDÓW OUTPUT INTERPRETACJA

PRACA Z PROGRAMEM OKNO PROGRAM EDITOR

OKNO PROGRAM EDITOR INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku

OKNO PROGRAM EDITOR INSTRUKCJE WPISANIE INSTRUKCJI

OKNO PROGRAM EDITOR INSTRUKCJE SKOPIOWANIE INSTRUKCJI

OKNO PROGRAM EDITOR INSTRUKCJE WYKONANIE INSTRUKCJI

PRACA Z PROGRAMEM OKNO LOG

OKNO LOG KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU PROGRAMU, M. IN.: nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed (!!! ) interpretacją wyników

OKNO LOG KOMUNIKATY BRAK BŁĘDU BŁĄD

PRACA Z PROGRAMEM OKNO OUTPUT

OKNO OUTPUT WYNIKI

PRZYDATNE KOMENDY ZAPISYWANIE ZAWARTOŚCI OKIEN DO PLIKU

PRZYDATNE KOMENDY PRZYWRACANIE ZAWARTOŚCI OKNA PROGRAM EDITOR USUWANIE ZAWARTOŚCI OKNA

PRZYDATNE KOMENDY PRZEŁĄCZANIE POMIĘDZY OKNAMI

PRACA Z PROGRAMEM STRUKTURA PROGRAMU

STRUKTURA PROGRAMU ZBIÓR DANYCH definicja zbioru danych wczytanie danych do programu Moduł DATA data nazwa; instrukcje opisujące dane; run; OBLICZENIA wybór procedur obliczeniowych wybór opcji dla procedur uruchomienie obliczeń Moduł PROC proc nazwa; instrukcje precyzujące procedurę; run;

STRUKTURA PROGRAMU /* wczytywanie danych */ data jagnieta ; infile I:/informatyka/dane.txt ; input nr masac wiek ; run ; /* analiza danych */ title analiza danych dla jagniat ; proc means data=jagnieta ; run; proc univariate data=jagnieta ; run ; proc sort data=jagnieta ; by WIEK ; run ;

STRUKTURA PROGRAMU /* wczytywanie danych */ data jagnieta ; infile I:/informatyka/dane.txt ; input nr masac wiek ; run ; /* analiza danych */ title analiza danych dla jagniat ; proc means data=jagnieta ; run; proc univariate data=jagnieta ; run ; proc sort data=jagnieta ; by WIEK ; run ; Nazwa zbioru danych Ścieżka do pliku Nazwy kolumn Tytuł Obliczanie średniej Obliczanie statystyk opisowych Sortowanie wg wieku

SAS PRACA Z PROGRAMEM SAS Okno PROGRAM EDITOR tworzenie programu Okno LOG komunikaty i błędy Okno OUTPUT - wyniki Przykładowy program SAS - prezentacja

INFORMATYKA W SELEKCJI Niektóre procedury SAS: proc means obliczanie średnich proc sort - sortowanie proc transpose - transpozycja układu danych proc univariate - analiza jednowymiarowych rozkładów prawdopodobieństwa (statystyka opisowa) proc corr, rank - korelacje proc reg - regresja liniowa proc anova - analiza wariancji przy równolicznych podgrupach proc glm - analiza wariancji przy nierównej liczebności grup proc mixed - szacowanie i predykcja efektów modelu mieszanego proc varcomp (method=type I, ML, REML) - szacowanie komponentów wariancji (metodą najm. kwadratów, metodami najw. wiarogodności)

INFORMATYKA W SELEKCJI Inny komercyjny system statystyczny StatSoft oferuje darmowy podręcznik internetowy: http://www.statsoft.pl/textbook/stathome.html Alternatywa? Statystyczny shareware (program darmowy), np. pakiet R

INFORMATYKA W SELEKCJI WPROWADZENIE DO PAKIETU R Zasady pracy z programem Podstawy edycji danych

R PAKIET R różnorodne metody statystyczne tworzenie własnych programów bazy danych program darmowy: http://www.r-project.org/ POPRAWNOŚĆ???

R KONSOLA PROGRAMU R

ODCZYTYWANIE DANYCH Z PLIKU komentarz # czytanie danych otwarcie pliku animals<-read.table("d:/dane.txt",dec=".") animals wypisanie zawartości pliku na ekran otwarcie pliku + nazwy kolumn animals<read.table("d:/dane.txt",dec=".",col.names=c('nr', 'masa','wzrost'))

OBLICZANIE STATYSTYK OPISOWYCH # obliczanie sumy sumamasa=sum(animals$masa) sumawzrost=sum(animals$wzrost) zastosowanie funkcji # obliczanie sredniej sredniamasa=mean(animals$masa) sredniwzrost=mean(animals$wzrost) # obliczanie odchylenia standardowego sdmasa1=sd(animals$masa) sdwzrost1=sd(animals$wzrost)

OBLICZANIE STATYSTYK OPISOWYCH zastosowanie pętli # obliczanie sumy N=50 sumamasa=0 sumawzrost=0 for (i in 1:N) { sumamasa=sumamasa+animals$masa[i] sumawzrost=sumawzrost+animals$wzrost[i] i=i+1 } wprowadzenie wzoru # obliczanie sredniej sredniamasa=sumamasa/n

OBLICZANIE STATYSTYK OPISOWYCH zastosowanie pętli # obliczanie odchylenia standardowego smasa=0 swzrost=0 for (i in 1:N) { smasa=smasa+(animals$masa[i]-sredniamasa)^2 swzrost=swzrost+(animals$wzrost[i]-sredniwzrost)^2 i=i+1 } sdmasa=sqrt(smasa/(n-1)) sdwzrost=sqrt(swzrost/(n-1))

TWORZENIE WYKRESÓW zastosowanie pętli #wykres zależnosci wzrostu od masy plot(animals$wzrost,animals$masa,xlab="wzrost",ylab= "masa",main="wykres rozrzutu") #histogram masy i wzrostu hist(animals$wzrost,prob=t,nclass=7,ylim=c(0,0.1), xlab="masa",ylab= czestotliwosc",main="histogram") lines(density(animals$wzrost,kernel=c("gaussian")), col="red") hist(animals$masa,prob=t,nclass=7,ylim=c(0,0.05), xlab="masa",ylab="czestotliwosc",main="histogram") lines(density(animals$masa),col="red")

LITERATURA http://www.r-project.org http://www.biecek.pl/r

https://cran.r-project.org/doc/contrib/biecek-r-basics.pdf

PAKIET R odczytywanie danych z pliku obliczanie prostych statystyk opisowych użycie funkcji tworzenie programu tworzenie wykresów

INFORMATYKA W SELEKCJI Od następnych ćwiczeń możliwość pracy nad indywidualnymi zbiorami danych Dane należy opracować statystycznie przy użyciu wybranego programu (SAS, R, Excel) Na ostatnich zajęciach prezentacja, omówienie i ocena projektów