Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW



Podobne dokumenty
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)

Wiedza niepewna i wnioskowanie (c.d.)

Specyfikacja techniczna banerów Flash

Podstawa prawna: Ustawa z dnia 15 lutego 1992 r. o podatku dochodowym od osób prawnych (t. j. Dz. U. z 2000r. Nr 54, poz. 654 ze zm.

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

STA T T A YSTYKA Korelacja

Obowiązek wystawienia faktury zaliczkowej wynika z przepisów o VAT i z faktu udokumentowania tego podatku.

Kurs wyrównawczy dla kandydatów i studentów UTP

E k o n o m e t r i a S t r o n a 1

Dr inż. Andrzej Tatarek. Siłownie cieplne

Zadanie 1. Liczba szkód w każdym z trzech kolejnych lat dla pewnego ubezpieczonego ma rozkład równomierny:

Ogólna charakterystyka kontraktów terminowych

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY


PRÓG RENTOWNOŚCI i PRÓG

Warszawska Giełda Towarowa S.A.

Diagnoza psychologiczna: podstawowe kompetencje (II część - decyzje diagnostyczne) Rola intuicji w diagnozie

Przygotowały: Magdalena Golińska Ewa Karaś

Twierdzenie Bayesa. Indukowane Reguły Decyzyjne Jakub Kuliński Nr albumu: 53623

Instrukcja sporządzania skonsolidowanego bilansu Miasta Konina

ZARZĄDZENIE nr 1/2016 REKTORA WYŻSZEJ SZKOŁY EKOLOGII I ZARZĄDZANIA W WARSZAWIE z dnia r.

Zagospodarowanie magazynu

7. REZONANS W OBWODACH ELEKTRYCZNYCH

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

SCENARIUSZ ZAJĘĆ SZKOLNEGO KOŁA NAUKOWEGO Z PRZEDMIOTU CHEMIA PROWADZONEGO W RAMACH PROJEKTU AKADEMIA UCZNIOWSKA

1. Rozwiązać układ równań { x 2 = 2y 1

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

IV Krakowska Konferencja Matematyki Finansowej

Komentarz technik dróg i mostów kolejowych 311[06]-01 Czerwiec 2009

Mapa umiejętności czytania, interpretacji i posługiwania się mapą Polski.

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

UCHWAŁA NR RADY MIEJSKIEJ W ŁODZI z dnia

Wniosek o ustalenie warunków zabudowy

7. OPRACOWYWANIE DANYCH I PROWADZENIE OBLICZEŃ powtórka

STRONA GŁÓWNA SPIS TREŚCI. Zarządzanie zawartością stron... 2 Tworzenie nowej strony... 4 Zakładka... 4 Prawa kolumna... 9

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Joanna Kisielińska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie

Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu

Test F- Snedecora. będzie zmienną losową chi-kwadrat o k 1 stopniach swobody a χ

2.Prawo zachowania masy

INSTRUMEWNTY FINANSOWE umożliwiające pomoc rolnikom w usuwaniu skutków niekorzystnych zjawisk atmosferycznych

K P K P R K P R D K P R D W

Regulamin. rozliczania kosztów centralnego ogrzewania i kosztów podgrzewania wody użytkowej w lokalach Spółdzielni Mieszkaniowej Domy Spółdzielcze

KLAUZULE ARBITRAŻOWE

'()(*+,-./01(23/*4*567/8/23/*98:)2(!."/+)012+3$%-4#"4"$5012#-4#"4-6017%*,4.!"#$!"#%&"!!!"#$%&"#'()%*+,-+

WZORU UŻYTKOWEGO EGZEMPLARZ ARCHIWALNY. d2)opis OCHRONNY. (19) PL (n) Centralny Instytut Ochrony Pracy, Warszawa, PL

Kalendarz biodynamiczny Barbara Chronowska.

II. WNIOSKI I UZASADNIENIA: 1. Proponujemy wprowadzić w Rekomendacji nr 6 także rozwiązania dotyczące sytuacji, w których:

SCENARIUSZ LEKCJI WYCHOWAWCZEJ: AGRESJA I STRES. JAK SOBIE RADZIĆ ZE STRESEM?

tel/fax lub NIP Regon

Właściwości materii - powtórzenie

Bazy danych. Andrzej Łachwa, UJ, /15

Prezentacja dotycząca sytuacji kobiet w regionie Kalabria (Włochy)

Czas pracy 170 minut

Polityka informacyjna Niezależnego Domu Maklerskiego S.A. w zakresie upowszechniania informacji związanych z adekwatnością kapitałową

Niegrzeczne dzieciaki na gorącym krześle

Rozdział 1 Postanowienia ogólne

System kształcenia dualnego w Niemczech

Postanowienia ogólne. Usługodawcy oraz prawa do Witryn internetowych lub Aplikacji internetowych

Zestawienie wartości dostępnej mocy przyłączeniowej źródeł w sieci RWE Stoen Operator o napięciu znamionowym powyżej 1 kv

Zadania. SiOD Cwiczenie 1 ;

LABORATORIUM PRZYRZĄDÓW PÓŁPRZEWODNIKOWYCH

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Wyznaczanie współczynnika sprężystości sprężyn i ich układów

Spis treści. 1. Znak Konstrukcja symbolu Budowa znaku Kolorystyka wersja podstawowa Kolorystyka wersja czarno-biała...

Ekonomia rozwoju. dr Piotr Białowolski Katedra Ekonomii I

Matematyka ubezpieczeń majątkowych r.

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Techniki korekcyjne wykorzystywane w metodzie kinesiotapingu

Zasady rachunkowości i planu kont dla prowadzenia ewidencji podatków i opłat.

Wybrane dane demograficzne województwa mazowieckiego w latach

Rozliczenia z NFZ. Ogólne założenia. Spis treści

Roczne zeznanie podatkowe 2015

Dokonamy analizy mającej na celu pokazanie czy płeć jest istotnym czynnikiem

STATUT KOŁA NAUKOWEGO KLUB INWESTORA

Edycja geometrii w Solid Edge ST

PRZEDMIOTOWY SYSTEM OCENIANIA z przedmiotu matematyka

TEST dla stanowisk robotniczych sprawdzający wiedzę z zakresu bhp

Stypendia USOS Stan na semestr zimowy 2013/14

PROGRAM ZAPEWNIENIA I POPRAWY JAKOŚCI AUDYTU WEWNĘTRZNEGO

Temat: Czy świetlówki energooszczędne są oszczędne i sprzyjają ochronie środowiska? Imię i nazwisko

KRYSTIAN ZAWADZKI. Praktyczna wycena przedsiębiorstw i ich składników majątkowych na podstawie podmiotów sektora bankowego

Matematyka dla liceum/funkcja liniowa

MATEMATYKA 9. INSTYTUT MEDICUS Kurs przygotowawczy do matury i rekrutacji na studia medyczne Rok 2017/2018 FUNKCJE WYKŁADNICZE, LOGARYTMY

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

Samochody osobowe i vany

KATEDRA INFORMATYKI STOSOWANEJ PŁ ANALIZA I PROJEKTOWANIE SYSTEMÓW INFORMATYCZNYCH

WSTĘP DO EKONOMETRII DANYCH PANELOWYCH. Spis treści

zarządzam, co następuje Ustala się zasady sporządzania bilansu skonsolidowanego wg załącznika Nr 1 do niniejszego zarządzenia.

Harmonogramowanie projektów Zarządzanie czasem

DE-WZP JJ.3 Warszawa,

UCHWAŁA NR XXX/263/2014 RADY GMINY PRZODKOWO. z dnia 31 marca 2014 r.

Ranking zawodów deficytowych i nadwyżkowych w powiecie strzelińskim w roku 2009

Transkrypt:

Statystyczna analiza danych w programie STATISTICA ( 4 (wykład Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Regresja prosta liniowa Regresja prosta jest metodą statystyczną, w której określamy zależność jednej zmiennej (Y) od drugiej (X), czyli zależność ta jest między tylko dwiema zmiennymi. Regresja prosta liniowa Regresja liniowa to metoda szacowania wartości oczekiwanej jednej zmiennej (Y) znając wartości innej zmiennej (X) na podstawie funkcji liniowej. Szukana zmienna, Y, jest nazywana zmienną zależną, zmienna X nazywa się zmienną niezależną.

Model regresji prostej liniowej Y=a+bX+e i gdzie: b współczynnik regresji a stała regresji e i błędy losowe o rozkładzie N(0;σ e2 ) Stała regresji (a) jest zatem szacowaną średnią wartością zmiennej Y w przypadku gdy X=0, natomiast wartość współczynnika regresji (b) oznacza średnią zmianę wartości Y w przypadku gdy X zwiększymy o jedną jednostkę. Ujemna wartość współczynnika regresji (b) świadczy o ujemnej zależności, a dodatnia wartość wskazuje na dodatnią zależność

Estymację (szacowanie wartości) współczynników równania regresji prowadzi się zwykle metodą najmniejszych kwadratów, która polega na minimalizacji następującej sumy kwadratów: n i= 1 (yi a bxi) 2 Estymatory wartości współczynników a i b oblicza się ze wzorów: b = s xy 2 x s a = y bx

R 2 współczynnik determinacji Określa stosunek zmienności wyjaśnianej przez model regresji do zmienności całkowitej. W przypadku regresji prostej liniowej R 2 =r 2 xy Czym wartość R 2 jest bliższa 100 % (czyli 1) to zależność Y od X jest silniejsza, i na odwrót gdy wartość R 2 jest bliższa 0 % (czyli 0) to zależność Y od X jest słabsza. Wartość współczynnika determinacji jest równa w przypadku regresji ( r ) prostej liniowej kwadratowi współczynnika korelacji prostej Pearsona Testowanie hipotezy H 0 : β=0 (współczynnik regresji dla całej populacji jest równy 0) pozwala na ocenę, czy występuje istotna zależność Y od X. Jeśli tę hipotezę odrzucimy to uznajemy, że Y istotnie zależy od X. ( p<α (powyższą hipotezę odrzucamy jeśli

Y -plon ziarna pszenicy (t/ha) 8 7 6 5 4 3 2 1 0 y = 0,0439x + 0,7413 R 2 = 0,8299 (82,99%) 0 20 40 60 80 100 120 140 X -nawożenie N (kg/ha)

Regresja prosta nieliniowa Nie wszystkie zależności między dwiema zmiennymi są liniowe, dlatego też czasami uzasadnione jest stosowanie innego niż liniowy modelu regresji. Stosowane są w tym celu różne inne modele regresji np. zamiast funkcji liniowej można użyć: -funkcji kwadratowej - pierwiastkowej -logarytmicznej lub innych. Dobór modelu regresji dokonuje się najczęś ęściej na podstawie wartości współczynnika determinacji (R 2 ), większa wartość R 2 oznacza lepiej dopasowany model regresji, a tym samym lepiej opisujący zmiany Y w zależności od X. Szczególnym przykładem regresji prostej jest regresja prosta wielomianowa, czyli wykorzystanie funkcji wielomianowej, w której zmienna niezależna (X) występuje w kolejnych potęgach. Najprostszym modelem regresji wielomianowej jest funkcja kwadratowa (X występuje w pierwszej i drugiej potędze)

9 8 Y -plon ziarna pszenicy(t/ha) 7 6 5 4 3 2 y = -0,0001x 2 + 0,0587x + 0,4438 R 2 = 0,8995 1 0 0 50 100 150 200 250 300 X -nawożenie N (kg/ha)

Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y). Najprostszym modelem regresji wielokrotnej, a jednocześnie najczęściej stosowanym w praktyce jest regresja wielokrotna liniowa.

Regresja wielokrotna liniowa Jeżeli zmienna zależna (Y) jest determinowana przez więcej niż jedną zmienną niezależną (X i ) to estymowany model regresji możemy zapisać równaniem: Y = a + b 1 X 1 + b 2 X 2 +... + b k X k Gdzie a- stała regresji, b 1, b 2,... cząstkowe współczynniki regresji Interpretacja wartości stałej regresji i cząstkowych współczynników regresji jest podobna jak w przypadku regresji prostej. Stała regresji jest to szacowana średnia wartość Y, gdy wszystkie zmienne niezależne (X i ) są równe 0. Wartość każdego cząstkowego współczynnika regresji oznacza szacowaną średnią zmianę wartości Y, gdy dana wartość zmiennej niezależnej (X i ) zwiększy się o jedną jednostkę. W przypadku regresji wielokrotnej zastosowanie metody najmniejszych kwadratów to minimalizowanie sumy: n i= 1 (yi a b1xi1 b2xi2... bkxik) 2

Graficzne przedstawienie regresji z 2 zmiennymi niezależnymi (X 1, X 2 )

Dobór modelu regresji Nie wszystkie zmienne niezależne (X i ) które bierzemy do analizy regresji wielokrotnej mają wpływ na zmienna zależną (Y), a więc uzasadnione jest usunięcie tych zmiennych i pozostawienie tylko tych zmiennych niezależnych, które mają istotny wpływ. W tym celu stosuje się różne metody pozwalające na usunięcie z modelu regresji nieistotnie wpływających zmiennych niezależnych i pozostawienie tylko tych, których wpływ udowodnimy. Jedną z metod, które są dość często stosowane jest regresja krokowa, która pozwala na dobór modelu z pominięciem zmiennych słabo lub nie wpływających na zmienną zależną.