Inżynieria Środowiska Ćwiczenia /2018 Regresja liniowa. Regresja wielomianowa

Podobne dokumenty
Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

STATYSTYKA I ANALIZA DANYCH

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Lista 6. Estymacja punktowa

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Estymacja przedziałowa

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

θx θ 1, dla 0 < x < 1, 0, poza tym,

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Prawdopodobieństwo i statystyka r.

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Prawdopodobieństwo i statystyka r.

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Ćwiczenie: Test chi 2 i miary na nim oparte.

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

STATYSTYKA MATEMATYCZNA

MATEMATYKA (poziom podstawowy) przykładowy arkusz maturalny wraz ze schematem oceniania dla klasy II Liceum

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

KADD Metoda najmniejszych kwadratów

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Statystyka. Katarzyna Chudy Laskowska

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Zeszyty naukowe nr 9

ANALIZA DANYCH DYSKRETNYCH

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

ZADANIA PRZYGOTOWUJĄCE DO SPRAWDZIANÓW W KLASIE DRUGIEJ.

Znajdowanie pozostałych pierwiastków liczby zespolonej, gdy znany jest jeden pierwiastek

ZADANIA NA ĆWICZENIA 3 I 4

Estymacja przedziałowa:

STATYSTYKA MATEMATYCZNA

Identyfikacja i modelowanie struktur i procesów biologicznych

COLLEGIUM MAZOVIA INNOWACYJNA SZKOŁA WYŻSZA WYDZIAŁ NAUK STOSOWANYCH. Kierunek: Finanse i rachunkowość. Robert Bąkowski Nr albumu: 9871

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Klucz odpowiedzi do zadań zamkniętych oraz schematy oceniania zadań otwartych. Matematyka. Poziom podstawowy

Matematyka ubezpieczeń majątkowych r.

2. Schemat ideowy układu pomiarowego

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

MINIMALIZACJA PUSTYCH PRZEBIEGÓW PRZEZ ŚRODKI TRANSPORTU

STATYSTYKA OPISOWA PODSTAWOWE WZORY

16 Przedziały ufności

STATYSTYKA OPISOWA WYKŁAD 1 i 2

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Elementy modelowania matematycznego

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych (w zakresie materiału przedstawionego na wykładzie organizacyjnym)

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Analiza wyników symulacji i rzeczywistego pomiaru zmian napięcia ładowanego kondensatora

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

Parametryczne Testy Istotności

(X i X) 2. n 1. X m S

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

POLITECHNIKA OPOLSKA

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

STATYSTKA I ANALIZA DANYCH LAB II

METODY NUMERYCZNE dr inż. Mirosław Dziewoński

Zadanie 3. Na jednym z poniższych rysunków przedstawiono fragment wykresu funkcji. Wskaż ten rysunek.

VII MIĘDZYNARODOWA OLIMPIADA FIZYCZNA (1974). Zad. teoretyczne T3.

Pierwiastki z liczby zespolonej. Autorzy: Agnieszka Kowalik

ANALIZA KORELACJI IREGRESJILINIOWEJ

Egzamin maturalny z matematyki CZERWIEC 2011

STATYSTYKA OPISOWA PODSTAWOWE WZORY

EKONOMETRIA. Liniowy model ekonometryczny (regresji) z jedną zmienną objaśniającą

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Poziom rozszerzony. 5. Ciągi. Uczeń:

Arkusz ćwiczeniowy z matematyki Poziom podstawowy ZADANIA ZAMKNIĘTE. W zadaniach od 1. do 21. wybierz i zaznacz poprawną odpowiedź. 1 C. 3 D.

0.1 ROZKŁADY WYBRANYCH STATYSTYK

Informatyka Stosowana-egzamin z Analizy Matematycznej Każde zadanie należy rozwiązać na oddzielnej, podpisanej kartce!

Numeryczny opis zjawiska zaniku

Zasada indukcji matematycznej. Dowody indukcyjne.

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Porównanie dwu populacji

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Zestaw II Odpowiedź: Przeciętna masa ciała w grupie przebadanych szczurów wynosi 186,2 g.

Metody numeryczne Laboratorium 5 Info

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Klucz odpowiedzi do zadań zamkniętych oraz schematy oceniania zadań otwartych. Matematyka. Poziom podstawowy

MACIERZE STOCHASTYCZNE

BADANIA DOCHODU I RYZYKA INWESTYCJI

Transkrypt:

Regresja liiowa W sytuacji, gdy obserwowaa jest zmiea dwuwymiarowa (X,Y) stawiamy pytaie, czy występuje związek prostoliiowy pomiędzy tymi zmieymi (związek liczbowy, czy też związek przyczyowoskutkowy), czy Y jest zmieą zależą, a X zmieą iezależą. Zatem a podstawie obserwacji (x1, y1), (x, y),, (x, y) wyzaczaa jest wartość współczyika korelacji Pearsoa rxy (wzory a końcu materiałów). Stawiamy hipotezę H0 : = 0, H1 : 0 i a przyjętym poziomie istotości sprawdzamy, czy badae zmiee są skorelowae. W przypadku związku przyczyowo-skutkowego odrzuceie hipotezy zerowej implikuje wyzaczeie prostej regresji, atomiast w przypadku związku liczbowego czasami iteresujące jest przedstawieie tego związku w postaci fukcyjej. Jeżeli dla każdej wartości x zmiea Y ma rozkład ormaly z jedakową (iezaą) wariacją to prostą regresji moża zapisać w postaci y ˆ ˆ 0 1x przedstawiającej związek między badaymi zmieymi. Możemy też zweryfikować hipotezę dla współczyika regresji, wyzaczyć krzywe ufości, obliczyć wartość miary dopasowaia prostej regresji do puktów eksperymetalych jaką jest współczyik determiacji R (wzory a końcu opracowaia). Przykład 1. Badając zaieczyszczeie tereów wokół pewego obiektu przemysłowego, odsłoięto siedem profili glebowych. W powierzchiowej warstwie badaych profili zawartości ołowiu i cyku (w mg/kg) przedstawiały się astępująco: ołów (X) 355 190 345 316 69 10 75 cyk (Y) 8 53 93 8 67 46 80 a) Oblicz i ziterpretuj współczyik korelacji między cechami X i Y. b) Sprawdź hipotezę o braku korelacji między zawartością ołowiu i cyku w powierzchiowej warstwie badaych profili. Przyjmij poziom istotości 0,05. c) Wyzacz rówaie regresji liiowej zawartości cyku względem zawartości ołowiu w powierzchiowej warstwie badaych profili. Ziterpretuj współczyik regresji. d) Oblicz i ziterpretuj współczyik determiacji. e) Na poziomie istotości liiowej zawartości cyku względem zawartości ołowiu. f) Wyzacz a podstawie rówaia regresji zawartość cyku w powierzchiowej warstwie, gdy zawartość ołowiu wyosi 70 (mg/kg). g) Zbuduj 95 % przedział ufości dla oczekiwaej zawartości cyku, jeśli zawartość ołowiu wyosi 70 mg/kg. 0,05 zweryfikuj, za pomocą aalizy wariacji, hipotezę o braku regresji Za pomocą programu STATISTICA Dae ależy wpisać w dwóch kolumach Rysuek 1. 1 3 4 5 6 7 1 x-ołów y-cyk 355 8 190 53 345 93 316 8 69 67 10 46 75 80 30

Zapozamy się ajpierw z wykresem zależości Y (zawartości cyku) od X (zawartości ołowiu). Z meu wybieramy Wykresy Wykresy rozrzutu w okie Zmiee wybieramy odpowiedie zmiee OK Więcej Dopasuj wybieramy Liiowa oraz statystyki as iteresujące tz. R kwadrat, wsp. korel. i p, rówaie regresji (rysuek 1.) OK. Otrzymamy wykres wraz z wyikami. Odpowiedzi: a) Współczyik korelacji r = 0,9189 jest dodati, czyli korelacja między cechami jest dodatia: im większa jest zawartość ołowiu w glebie, tym większa jest zawartość cyku. b) : 0 korelacja między cechami jest ieistota (ie ma korelacji) H 0 H 1 : 0 korelacja między cechami jest istota (jest korelacja) Odp. Poieważ p = 0,00344 < odrzucamy a poziomie istotości stwierdzamy, że korelacja między zawartościami ołowiu i cyku w glebie jest istota. 0,05, to hipotezę H 0 0,05 i c) Prosta regresji wyraża się wzorem y,468 0,478x. Jeżeli zawartość ołowiu wzrośie o jedostkę, czyli o 1 mg/kg, to przecięta zawartość cyku wzrośie o 0,5 mg/kg. d) Współczyik determiacji = r 100%, czyli u as R 0,8444 100% 84,44%. Ozacza to, że zmiea X w poad 84% ma wpływ a wartość zmieej Y. Efekt Regres. Reszta Razem R e) : 0 regresja liiowa jest ieistota H0 1 H 1 : 1 0 regresja liiowa jest istota Aby zweryfikować tę hipotezę ależy z meu Statystyka wybrać opcję Regresja wieloraka, wskazać zmieą zależą Y i zmieą iezależą X OK OK. W okie Wyiki regresji wielorakiej, ależy wybrać przycisk Więcej, a astępie opcję ANOVA (sum. dobroć dopasow.). Na ekraie pojawi się tabela aalizy wariacji i wyiki testu F (Rysuek.): Rysuek. Rysuek 3. Aaliza wariacji ; DV: y-cyk (Arkusz1) Suma df Średia F poziom p kwadrat. kwadrat. 1491,866 1 1491,866 7,1567 0,003443 74,99 5 54,998 1766,857 Zmiea x-ołów W. woly Przewidyw. -95,0%GU +95,0%GU Obliczaie wartości (Arkusz1) zmieej: y-cyk Waga B Wartość Waga B *Wartość 0,47818 70,0000 66,9109,46804 69,37896 6,07050 76,6874 31

Odp. Poieważ p = 0,003443 < i stwierdzamy, że regresja liiowa zawartości cyku względem zawartości ołowiu jest istota. H 0 0,05, to a poziomie istotości 0,05 odrzucamy hipotezę zerową f) Wracamy do oka Wyiki regresji wielorakiej, wybieramy przycisk Reszty, założeia, predykcja, a astępie Predykcja zmieej zależej (przy aktywym poleceiu Oblicz graice ufości). W okie Określ wartości zmieych iezależych wpisujemy liczbę 70 i aciskamy OK. Otrzymujemy oceę puktową progozy oraz poszukiwae graice ufości wartości progozowaej. Z tabeli (patrz rysuek 3.) wyika, że jeśli zawartość ołowiu wyosi 70 mg/kg, to przewidywaa zawartość cyku wyosi 69,38 mg/kg. g) Z tej samej tabeli (rysuek 3.) odczytujemy lewy i prawy kraiec przedziału ufości. Z prawdopodobieństwem 0,95 stwierdzamy, że przedział o końcach (6,07; 76,69) pokrywa oczekiwaą zawartość cyku (w mg/kg) przy zawartości ołowiu 70 mg/kg. Dodatkowo moża wyzaczyć obszar ufości dla oczekiwaej zawartości cyku przy różych zawartościach ołowiu i ew. zilustrować ( ręczie ) przedział ufości dla x = 70. Postępujemy podobie jak w pukcie a), dodatkowo zazaczając Pas regresji ufość. Zadaie 1. Dział marketigu pewej firmy aalizował związek między wielkością sprzedaży swych produktów (w tys. sztuk) a liczbą współpracujących z zakładem hurtowi. Otrzymao dae: liczba hurtowi (X) 1 3 4 5 6 7 8 9 10 wielkość sprzedaży (Y) 5,8 6,1 8,4 9, 9,3 10,4 1,9 14,6 19,1,8 a) Oblicz i ziterpretuj współczyik korelacji między wielkością sprzedaży produktów a liczbą współpracujących z zakładem hurtowi. Odp. r = 0,95 b) Sprawdź hipotezę o braku korelacji między wielkością sprzedaży produktów a liczbą współpracujących z zakładem hurtowi. Przyjmij poziom istotości 0,05. Odp. p=0,00003 c) Wyzacz rówaie regresji liiowej wielkości sprzedaży produktów względem liczby współpracujących z zakładem hurtowi. Ziterpretuj współczyik regresji. Odp. y,91,74x d) Oblicz i ziterpretuj współczyik determiacji. Odp. R = 89,81% e) Zweryfikuj hipotezę o istotości regresji liiowej wielkości sprzedaży względem liczby współpracujących z zakładem hurtowi. Przyjmij poziom istotości 0.05. Odp. p=0,000031 f) Określ przewidywaą wielkość sprzedaży, gdy liczba hurtowi wyiesie 6. Odp. 1,73 Zadaie. Na tereie byłego województwa koińskiego badao zmiejszeie się emisji pyłu (w t/rok) po zamotowaiu istalacji mokrego odpylaia a komiach ajwiększych zakładów. Otrzymao dae: 3

liczba zamotowaych istalacji odpylaia (X) 1 3 3 4 5 zmiejszeie emisji pyłu (Y) 5,8 6,1 8,4 9, 9,3 10,4 a) Wyzacz rówaie regresji liiowej zmiejszeia emisji pyłów względem liczby istalacji mokrego odpylaia. Ziterpretuj współczyik regresji. Odp. y 4,481,4x; b) Na poziomie istotości 0,05 zweryfikuj hipotezę o braku regresji liiowej zmiejszeia emisji pyłów względem liczby istalacji mokrego odpylaia. Odp. p=0,004641 c) Określ przewidywae zmiejszeie emisji pyłów, gdy liczba istalacji wyiesie 3. Odp. 8, Zadaie 3. Badao zawartość tleu rozpuszczoego w wodzie destylowaej (cecha Y w mgo/dm 3 ) w zależości od temperatury (cecha X w o C). Uzyskao dae: temperatura (X) 5 7 8 11 13 14 16 17 0 1 zawartość tleu (Y) 1,9 13,6 11,9 11 11, 11,9 10 11,7 8,8 8,9 a) Wyzacz rówaie regresji liiowej zawartości tleu rozpuszczoego w wodzie destylowaej względem temperatury. Odp. y 14,5 0,5x b) Jakiej zmiay zawartości tleu w wodzie możemy się spodziewać, gdy temperatura wody wzrośie o 1 o C? c) Na poziomie istotości 0,05 zweryfikuj hipotezę o braku regresji liiowej zawartości tleu rozpuszczoego w wodzie destylowaej względem temperatury. Odp. p=0,001145 d) Określ przewidywaą zawartość tleu, gdy temperatura wyosi 1 o C. Odp. 11,5 e) Oblicz i ziterpretuj współczyik determiacji. Odp. R = 75,6% f) Zbuduj 95 % przedział ufości dla progozowaej zawartości tleu przy temperaturze 10 0 C. Odp. (11,7955; 1,70714) Zadaie 4. Badao zależość między roczą wielkością wytworzoych odpadów w Polsce w ml to wg GUS a ilością odpadów wykorzystaych wtórie w ciągu roku w ml to. Uzyskao astępujące dae: Dla X (wytworzoe odpady): 10,8 1,7 14,6 14,4 133, Dla Y (wykorzystae odpady) : 65,6 66,9 69,5 80,1 91,7 a) Oblicz, zbadaj istotość (=0,05) i ziterpretuj współczyik korelacji między wielkością wykorzystaych odpadów a ilością wytworzoych odpadów. Odp. r = 0,9; b) Oszacuj prostą regresji wielkości wykorzystaych odpadów względem wytworzoych odpadów. y 193,7,15x c) Określ przewidywaą wielkość wykorzystaych odpadów, gdy ilość wytworzoych odpadów wyosi 130 ml to. Odp. 85,78 d) Zbuduj 95% przedział ufości dla oczekiwaej wielkości wykorzystaych odpadów, gdy wielkość wytworzoych odpadów wyosi 15 ml to. Zadaie 5. Producet apojów gazowaych dla sprawdzeia, czy istieje związek między wielkością zamówień hurtowi (Y) a temperaturą dobową (X) zgromadził dae dotyczące zamówień i temperatury dla wybraych 10 di czerwca: Temperatura dobowa w C 18 5 30 34 18 19 1 4 9 17 Zamówieia apojów gazowaych (w tys. sztuk) 7, 1 1 15 9,4 4,5 10 1 13 7 a) Wyzacz rówaie regresji liiowej zamówień hurtowi względem temperatury dobowej. Ziterpretować współczyik regresji. Odp. y 0,9 0, 47x b) Na poziomie istotości 0,05 zweryfikuj, za pomocą aalizy wariacji, hipotezę o braku regresji liiowej wielkości zamówień apojów względem temperatury. Odp. p= 0,001037 33

Regresja wielomiaowa (metoda krokowa wstecza) Na elemetach próbki losowej pobraej z populacji ormalej albo w przybliżeiu ormalej obserwowaa jest zmiea dwuwymiarowa (X, Y). Stawiamy pytaie, czy występuje związek wielomiaowy pomiędzy tymi zmieymi i którego stopia. Na podstawie obserwacji (x1, y1), (x, y),, (x, y) wyzaczay jest diagram korelacyjy, który ułatwi podjęcie decyzji dotyczącej stopia wielomiau k 0 1x x... kx y. Przy spełieiu założeń aalizy regresji wielomiaowej, wyzaczae jest rówaie regresji wielomiaowej obraego stopia. W przypadku istieia silego związku między zmieą zależą Y a zmieą iezależą X, waże jest by współczyik regresji przy ajwyższej potędze zmieej X w wyzaczoym rówaiu regresji wielomiaowej był istoty. Nie zawsze jedak tak jest. Dobór właściwego rówaia regresji wielomiaowej moża przeprowadzić stosując metodę krokową zstępującą (wsteczą). Metoda krokowa zstępująca (wstecza) 1. Wyzaczeie modelu wielomiaowego o potecjalie wysokim stopiu.. Wyzaczeie współczyika determiacji. 3. Weryfikacja hipotez dla cząstkowych współczyików regresji, przede wszystkim współczyika regresji przy ajwyższej potędze zmieej X ( H0 : k 0; H1 : k 0). 4. Po stwierdzeiu ieistotości współczyika regresji przy ajwyższej potędze zmieej X, wyzaczeie modelu wielomiaowego stopia miejszego o jede. 5. Powrót do puktu. Postępowaie tak długo jest kotyuowae do uzyskaia modelu wielomiaowego o istotym współczyiku regresji przy ajwyższej potędze zmieej X. Przykład. W literaturze przedstawioych jest wiele metod pozwalających a oszacowaie wartości przepływu wód w rzekach w przekrojach iekotrolowaych. Ze względu a silą zależość przepływów w rzekach polskich od sezou roku, przyjęto, że badae będą zależości regresyje dla każdego miesiąca oddzielie. W marcu uzyskao astępujące wyiki : Powierzchia zlewi w km Wartość przepływu w m 3 /s 50 10 00 50 30 340 360 410 470 560 590 610 670 700 5 10 13 16 17 16 0 4 7 6 30 31 34 Wyzacz model regresji krzywoliiowej stopia. Zastosuj metodę krokową wsteczą do wyzaczeia ostateczej postaci fukcji przedstawiającej związek wartości przepływu i powierzchi zlewi. Wyzacz krzywe ufości. Przyjmij = 0,05. Rozwiązaie: STATISTICA: Wpisujemy dae w dwóch kolumach. Następie postępujemy według schematu: Statystyka Zaawasowae modele liiowe i ieliiowe Ogóle modele regresji Kreator aalizy OK Następuje ustaleie zmieych: zmiea zależa (tutaj wartość przepływu) i predykatora ilościowego (tutaj powierzchia zlewi) OK. Przechodzimy do zakładki Dostosoway układ międzygrupowy klikamy a pozycję w okieku Ciągłe. Poiżej opcji Wielom. do st. 34

ustalamy stopień wielomiau: i klikamy przycisk Wielom. do st.. W okieku Efekty w układzie międzygrupowym pojawia się azwa zmieej iezależej (predykatora ilościowego) w pierwszej i kolejych potęgach do wybraego stopia OK Wszystkie efekty. KROK 1 Iteresuje as przede wszystkim wyik weryfikacji hipotezy: H0 : 0; przeciwko H1 : 0. W skoroszycie mamy trzy tabele z wyikami: Tabela 1: Jedowymiarowe testy istotości. Z tabeli tej odczytujemy, że współczyik dla drugiej potęgi jest ieistoty. Tabela : Ocey parametrów: W tej tabeli zawarta jest rówież iformacja, że współczyik dla drugiej potęgi jest ieistoty, a także podae są wartości oszacowaych cząstkowych współczyików regresji dla zmieej X występującej w kolejych potęgach oraz oszacowaie wyrazu wolego. Tabela 3: Test SS dla pełego modelu względem reszt. Z tej tabeli odczytujemy stopień dopasowaia modelu do daych i istotość związku regresyjego wyrażoego rówaiem regresji wielomiaowej tutaj stopia drugiego. p Wiosek: Poieważ 0,317667 > = 0,05, to ie mamy podstaw a poziomie istotości α = 0,05 do odrzuceia hipotezy H0, orzekającej, że współczyik dla drugiej potęgi jest ieistoty i obiżamy stopień rówaia KROK Poieważ współczyik przy drugiej potędze jest ieistoty (ie ma podstaw do odrzuceia : 0 ), H0 zmiejszamy stopień modelu. W tym celu otwieramy poowie okieko GRM-wyiki, klikamy Zmień Dostosoway układ międzygr. z Efekty w układzie międzygrupowym usuwamy zmieą w drugiej potędze Ok Wszystkie efekty. W skoroszycie tworzą się poowie trzy tabele z wyikami jak w kroku 1. Iteresuje as wyik weryfikacji hipotezy : 0; przeciwko H : 0 H0 1 1 1 35

p 1 Wiosek: Poieważ 0,000000 < zerową i stwierdzamy, że współczyik dla pierwszej potęgi jest istoty. = 0,05, to a poziomie istotości 0,05 odrzucamy hipotezę Odp. Otrzymujemy ostateczie rówaie regresji liiowej pozwalające a oszacowaie wartości zmieej y dla daego x, postaci: y 0,189 0,047x Krzywe ufości wyzaczamy wybierając z meu Wykresy Wykresy rozrzutu w okie Zmiee wybieramy odpowiedie zmiee OK Więcej Dopasuj wybieramy Liiowa oraz Pas regresji zazaczając ufość OK Zadaie 6. W pewym doświadczeiu chemiczym obserwowao szybkość rozpuszczaia się powłoki srebrej w różych temperaturach roztworu. Otrzymao wyiki (X temperatura w stopiach, Y szybkość rozpuszczaia się powłoki w μ/sek ): X 14 15 16 18 0 1 4 Y 0,31 0,35 0,36 0,39 0,41 0,4 0,43 0,44 a) Wyzacz model regresji wielomiaowej. Zastosuj metodę krokową do wyzaczeia ostateczej postaci fukcji przedstawiającej wpływ temperatury a szybkość rozpuszczaia się powłoki. Rozpoczij od stopia trzeciego. Przyjmij = 0,05. Ziterpretuj współczyik determiacji. b) Wykoaj wykres rozrzutu z dopasowaą krzywą. Wyzacz krzywe ufości. Odp. a) Krok 1: : 0; H : 0, p = 0,199761 > = 0,05, H0 3 1 3 H0 : 0; H1 : Krok : 0 p = 0,013049 < = 0,05, y 0,17137 0,048507x 0,000963x, R = 98,488% b) STATISTICA: aby uzyskać wielomia stopia postępujemy w astępujący sposób: Wykresy Wykresy rozrzutu w okie Zmiee wybieramy odpowiedie zmiee OK Więcej w Pasie regresji zazaczamy ufość w okie Dopasuj wybieramy Wielomia klikamy Opcje w okie Wielomia wybieramy Kwadratowy OK. 36

0,46 Wykres rozrzutu Y_szybkość względem X_temperatura Cw_10_dae 30v*5c Y_szybkość = -0,1713+0,0485*x-0,001*x^; 0,95 Prz.Uf. 0,44 0,4 Y_szybkość 0,40 0,38 0,36 0,34 0,3 0,30 1 14 16 18 0 4 6 X_temperatura Zadaie 7. W doświadczeiu badao dyamikę wzrostu traw ozdobych pewego wieloletiego gatuku. W szczególości mierzoo średicę kępy trzech wybraych rośli począwszy od połowy maja. Obserwacje prowadzoo co 14 di. Średie średice kęp S (w cm) w kolejych okresach dwutygodiowych przedstawiały się astępująco: t 1 3 4 5 6 7 S 10 19 9 34 36 37,5 37,5 Wyzacz rówaie regresji wielomiaowej. Zastosuj metodę krokową do wyzaczeia ostateczej dobrze dopasowaej do daych postaci modelu wielomiaowego. Rozpoczij od stopia 4. Wykoaj wykres rozrzutu z dopasowaą krzywą. Przyjmij = 0,05. Rozwiązaie: Krok 1: : 0; H : 0 H0 4 1 4 Poieważ p 4 0,84816 > odrzuceia hipotezy H0 orzekającej, że współczyik dla czwartej potęgi jest ieistoty i obiżamy stopień rówaia Krok : : 0; H : 0 H0 3 1 3 = 0,05, to ie mamy podstaw a poziomie istotości α = 0,05 do = 0,05, to ie mamy podstaw a poziomie istotości α = 0,05 do Poieważ p 3 0,490009 > odrzuceia hipotezy H0, orzekającej, że współczyik dla trzeciej potęgi jest ieistoty i obiżamy stopień rówaia Krok 3: : 0; H : 0 H0 1 p Poieważ 0,000499 < = 0,05, to a poziomie istotości 0,05 odrzucamy hipotezę zerową i stwierdzamy, że współczyik dla drugiej potęgi jest istoty. Odp. Zależość średicy (w cm) kępy traw ozdobych od czasu (w tygodiach) jest postaci S,4913,43t 1,113t. Współczyik determiacji R = 99,4% zatem otrzymay model jest w 99,4% dopasoway do daych. Zadaie 8. Testowao możliwość przewidywaia stężeń tleu rozpuszczoego a odciku Raby 445 a podstawie zaych wartości stężeń tleu w dopływach: Niżowskim Potoku i Krzyworzece. Zastosowao metodę sieci euroowych do wyzaczeia tego związku. Wyiki otrzymaych tą metodą przewidywaych wartości stężeń obok zaobserwowaych wartości stężeń tleu a odciku Raby 445 przedstawioo w tabeli : Stężeie tleu w Rabie 445 Wartość oszacowaia stężeia 1,1,3 3,5 4,1 5,3 6,8 7, 8,3 9,3 10,6 11,7 1,4 13, 14,4 1,, 3, 4,3 5,3 6,5 7,3 8,4 9, 10, 11,4 1,3 13,3 14,4 Sprawdź zgodość oszacowań z rzeczywistymi zaobserwowaymi wartościami stężeń tleu w Rabie poprzez wyzaczeie związku między oszacowaiem a daymi rzeczywistymi. Zaczij od stopia 3. 37

Jeżeli ostateczie po zastosowaiu metody krokowej wsteczej uzyskasz prostą regresji będącą dwusieczą I ćwiartki układu współrzędych to potwierdzisz zgodość oszacowań z wyikami rzeczywistymi. Wyzacz krzywe ufości. Przyjmij = 0,001. Odp. y=-0,0187+0,9933x y = x Zadaie 9. Dokoao pomiarów wielkości drgań pioowych grutu powstałych w wyiku trzęsieia ziemi w różej odległości od ogiska trzęsieia. Otrzymao wyiki (X odległość od ogiska trzęsieia ziemi w km, Y wielkość drgań pioowych grutu w cm): x 0 30 40 50 80 140 00 50 y 4,8 3,8,5,5 1,5 1,0 1, 0,8 Wyzacz model regresji krzywoliiowej. Zastosuj metodę krokową wsteczą do wyzaczeia ostateczej postaci fukcji przedstawiającej zależość wielkość drgań pioowych grutu od odległości od ogiska trzęsieia ziemi. Rozpoczij od stopia 3. Przyjmij = 0,05. Rysuek 3. Uwaga : Zauważ, że dla stopia 3 pojawia się komuikat. Ozacza to, że ustaloo zbyt wysoki stopień wielomiau. Zigoruj te komuikat przy stopiu 3 i wykoaj wykres rozrzutu y względem x. Uzyskasz wykres w astępujący sposób: Wykresy Wykresy rozrzutu w okie Zmiee wybieramy odpowiedie zmiee OK Więcej Dopasuj wybieramy Wielomia Opcje w okie Wielomia wybieramy Sześciey OK. Z wykresu (rysuek 3.) widać, że jede pukt jest przyczyą zmiay wypukłości fukcji a wklęsłość. W badaym zagadieiu szukaia związku wielkości drgań pioowych grutu powstałych w wyiku trzęsieia ziemi od odległości od ogiska trzęsieia, zgodie z pojawiającym się komuikatem stopień jest właściwy do rozpoczęcia aszej aalizy. Odp. y 4,934 0,0487x 0,0001x Zadaie 10. W badaiach ad stopiem skażeia gleby wokół pewej huty pobrao próbki gleby z warstwy wierzchiej i czterech poziomów geetyczych w dwóch odkrywkach Uzyskao astępujące ozaczeia cyku: Głębokość (w cm) 10 41 70 90 15 5 100 110 Z ( w mg/kg) 17 88 7 7 60 136 136 80 64 45 Wyzacz rówaie regresji wielomiaowej. Zastosuj metodę krokową do wyzaczeia ostateczej dobrze dopasowaej do daych postaci modelu wielomiaowego. Rozpoczij od stopia drugiego. Wykoaj wykres rozrzutu z dopasowaą krzywą. Przyjmij = 0,05. Odp.: y 133,6964 0,83735x 38

Zadaie 11. Suma opadów w okresie wegetatywym od marca do paździerika w iektórych miejscowościach (średie z dwudziestu lat) oraz szerokość geograficza, długość geograficza i wziesieie ad poziomem morza tych miejscowości są astępujące (plik cw4.sta). Wyzacz rówaia regresji wielomiaowej wyrażające sumę opadów oddzielie kolejo jako fukcję szerokości, jako fukcję długości oraz jako fukcję wysokości ad poziomem morza. Zastosuj metodę krokową wsteczą do wyzaczeia ostateczej dobrze dopasowaej do daych postaci rówaia regresji wielomiaowej. Rozpoczij od stopia drugiego. Wykoaj dla każdej pary zmieych wykres rozrzutu z dopasowaą krzywą. Przyjmij = 0,05. Uwaga : Należałoby dla rozpatrywaych daych wyzaczyć rówież rówaie regresji wyrażające jak suma opadów jest determiowaa jedocześie poprzez szerokość i długość geograficzą oraz wysokość ad poziomem morza (będzie to tematem kolejych zajęć). Odp. Szerokość geograficza: Krok 1: : 0; H : 0, p = 0,011049 < = 0,05, H0 1 y 79455,883001,6x 8,5x, R = 5,7% Długość geograficza: Zależość regresyja ieistota. Wysokość.p.m.: Krok 1: : 0; H : 0, p = 0,609179 > = 0,05, H0 1 H0 : 1 0; H1 : 1 Krok : 0, p = 0,000058 < = 0,05, y 415,48 0,51x, R = 58,% 1000 Wykres rozrzutu Opady (w mm) w zględem Wysokość.p.m. Cw _10_dae 30v*5c Opady (w mm) = 415,4845+0,5103*x; 0,95 Prz.Uf. 900 800 Opady (w mm) 700 600 500 400 300 Wysokość.p.m.:Opady (w mm): y = 415,4845 + 0,5103*x; r = 0,769; p = 0,00006; r = 0,580 00-100 0 100 00 300 400 500 600 700 800 900 Wysokość.p.m. 39

ANALIZA KORELACJI I REGRESJI LINIOWEJ Obserwacje (xi,yi) zmieej losowej dwuwymiarowej (X,Y) WSPÓŁCZYNNIK KORELACJI ŝ xy rxy ŝx ŝ y przy czym -1 rxy 1 xi y 1 i ŝ ( x y i 1 i 1 xy i i ) 1 i1 ( x ) 1 i ŝ ( x i 1 x ) 1 i, i1 ( y ) 1 i ŝ ( y i 1 y ) 1 i i1 Weryfikacja hipotezy, że zmiee X i Y ie są skorelowae Stawiamy hipotezę: Statystyka testowa rxy t H0 : = 0, H1 : 0 1 r xy ŝ x ŝ x ŝ y ŝ y Obszar krytyczy : t >t,- REGRESJA LINIOWA ( xi )( y ) i y ˆ ˆ 0 1x x y i 1 i 1 ŝ i i ˆ xy i 1 1, ˆ ˆ 0 y 1 x ŝ dla <xmi, xmax> x ( xi ) x i 1 i i1 Weryfikacja hipotezy, że dla zmieych X i Y związek wyrażoy za pomocą prostej regresji ie jest istoty Stawiamy hipotezę: Statystyka testowa Obszar krytyczy : H0: 1 0, ˆ t 1 ŝx H1: 1 0 t >t,- ŝ 1 r y xy Miara dopasowaia współczyik determiacji R rxy 100% Krzywe ufości ŝ y (1 rxy ) g1(xi ) y(xi ) t, [s x (xi x) ] ŝ x ( ) ŝ y (1 rxy ) g (xi ) y(xi ) t, [s x (xi x) ] ŝ x ( ) 40