POLITECHNIKA OPOLSKA

Podobne dokumenty
Wykład 3 Hipotezy statystyczne

Wprowadzenie do analizy korelacji i regresji

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

PDF created with FinePrint pdffactory Pro trial version

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

WYKŁAD 8 ANALIZA REGRESJI

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

KORELACJE I REGRESJA LINIOWA

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Analiza współzależności dwóch cech I

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

POLITECHNIKA WARSZAWSKA

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna dla leśników

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Rozdział 8. Regresja. Definiowanie modelu

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Analiza niepewności pomiarów

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

166 Wstęp do statystyki matematycznej

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Regresja i Korelacja

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

WYKŁAD 5 TEORIA ESTYMACJI II

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

STATYSTYKA MATEMATYCZNA

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Korelacja krzywoliniowa i współzależność cech niemierzalnych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

ESTYMACJA. Przedział ufności dla średniej

Spis treści 3 SPIS TREŚCI

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

STATYSTYKA MATEMATYCZNA, LISTA 3

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

WNIOSKOWANIE STATYSTYCZNE

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Zawartość. Zawartość

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Sposoby prezentacji problemów w statystyce

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Badanie normalności rozkładu

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka matematyczna i ekonometria

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Własności statystyczne regresji liniowej. Wykład 4

Testowanie hipotez statystycznych

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

LABORATORIUM Z FIZYKI

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Ekonometria. Zajęcia

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

Pobieranie prób i rozkład z próby

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

MODELE LINIOWE. Dr Wioleta Drobik

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Transkrypt:

POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych Zakres ćwiczenia Na linii produkcyjnej w warunkach produkcji wielkoseryjnej produkowane są przedmioty. Zachodzi podejrzenie, że występuje nadmierne zużywanie się ostrza narzędzia w funkcji czasu powodujące wyraźne zwiększanie się wymiaru w kolejnych przedmiotach schodzących z linii produkcyjnej. Należy sprawdzić prawdziwość tego przypuszczenia metodą analizy korelacji i regresji zmiennych. Należy w tym celu: 1. Wykonać pomiary wymiarów: a) 12,7k7 szerokość płytki skrawającej, b) 7js9 długość elementu ustawczego, c) 64h szerokość elementu ustawczego, d) 3ZA8 średnica wewnętrzna pierścienia, e) 44e1 średnica zewnętrzna pierścienia, szt. wyrobów i utrwalić wyniki pomiarów w arkuszu kalkulacyjnym. 2. Opracować procedurę obliczeniową oraz wyznaczyć współczynnik korelacji z próby między numerem kolejnego przedmiotu a jego wymiarem. 3. Określić zależność korelacyjną między badanymi zmiennymi. 4. Wykonać test istotności współczynnika korelacji (sprawdzić hipotezę, że zmienne i są skolerowane).. Wyznaczyć wartości współczynników i równania regresji liniowej. 6. Przy współczynniku ufności,9 oszacować metodą przedziałową liniową funkcję regresji. 7. Wykonać wykres badanej zależności (regresji) wraz z krzywymi ufności. 8. Wykonać analizę wyników obliczeń. 9. Sformułować wnioski.

I. PODSTAWY TEORETYCZNE Przy badaniu populacji generalnej równocześnie ze względu na dwie lub więcej cech mierzalnych posługujemy się pojęciami regresji i korelacji. Oba te pojęcia dotyczą zależności miedzy zmiennymi, przy czym korelacja zajmuje się siłą tej zależności, a regresja - jej kształtem, określa rodzaj zależności miedzy cechami (liniowa, krzywoliniowa). Generalnie, po ustaleniu, że między badanymi cechami istnieje niezbyt słaba (istotna) korelacja, przystępuje się do znalezienia funkcji regresji, która opisując matematycznie związek pomiędzy zmiennymi, pozwala na przewidywanie wartości jednej cechy przy założeniu, że druga cecha przyjęła określoną wartość. Analiza korelacji i analiza regresji są stosowane, gdy konieczne jest zbadanie zależności między dwiema zmiennymi, np. potwierdzenie (lub odrzucenie) zależności przyczynowo-skutkowych wykorzystywanych w sterowaniu jakością. Diagram korelacji w literaturze przedmiotu występuje także pod innymi nazwami: wykres rozrzutu, wykres zmiennych, wykres korelacji. Wykresy korelacji są uproszczoną formą graficznej ilustracji związku zachodzącego pomiędzy dwiema zmiennymi (rys. 1.). a) silna korelacja dodatnia b) silna korelacja ujemna c) korelacja liniowa 2 2,998 2 2,997 2 2 1 1 1 1 1 1 2 4 6 2 4 6 1 2 3 d) korelacja dodatnia e) korelacja ujemna f) brak korelacji 2 18 16 14 12 1 8 6 4 2,2 2 4 6 18 16 14 12 1 8 6 4 2,487 2 4 6 Rys. 1. Przykłady zmiennych mocno skorelowanych a) i b), słabo skorelowanych d) i e) oraz nieskorelowanych c) i f). 2 2 1 1 1 2 3 2

W celu sporządzenia diagramu korelacyjnego dane przedstawia się we współrzędnych prostokątnych reprezentujących obie zmienne poprzez nanoszenie na wykres punktów, których położenie na wykresie wynika z wartości poszczególnych par wyników (, ). Aby uzyskać wiarygodny obraz badanej zależności, wskazane jest przeanalizowanie stosunkowo dużej liczby par danych (więcej niż = 3). Sposób grupowania się punktów na wykresie uwidacznia zależności korelacyjne między badanymi zmiennymi: jeżeli punkty układają się w pobliżu pewnej krzywej, oznacza to, że pomiędzy badanymi zmiennymi zachodzi znacząca korelacja. Krzywą tę można aproksymować odpowiednią funkcją regresji ze wskazaniem siły związku między tymi wielkościami w postaci współczynnika korelacji. W najprostszym przypadku, punkty układają się w pobliżu prostej o dodatnim lub ujemnym współczynniku pochylenia (regresji). Mówi się wówczas o zachodzeniu pomiędzy nimi odpowiednio korelacji dodatniej lub ujemnej (rysunki 1a i 1b), zmienne są skorelowane. jeżeli punkty są na wykresie rozproszone lub ułożone wzdłuż prostej prostopadłej do jednej z osi układu współrzędnych, oznacza to, że badane wielkości nie są skorelowane, są od siebie niezależne (rysunki 1c i 1f). jeżeli punkty wykazują pewne skupienie i tworzą chmurę" rozciągającą się wzdłuż pewnej krzywej (rysunki 1d i 1e), można mówić o istnieniu lub nie istnieniu korelacji zmiennych dopiero po wykonaniu niezbędnych obliczeń, tj. wartości współczynnika korelacji z próby, oraz wartości statystyki testu istotności hipotezy, że zmienne i nie są skorelowane, wobec hipotezy alternatywnej. Należy podkreślić, iż współczynnik korelacji, = 1 lub, = 1 (ścisła zależność) nie oznacza, że pomiędzy zmiennymi musi zachodzić związek przyczynowo-skutkowy, np. wartość strzałki ugięcia f belki pod działaniem siły F. Najczęściej rzeczywiście tak jest, ale w każdym przypadku powinno to być wykazane dodatkową analizą fizyczną istoty zależności. Jeżeli, = ±1, a związek przyczynowo-skutkowy nie występuje, oznacza to, ze związek statystyczny staje się związkiem funkcyjnym. Współczynnik korelacji ma następującą interpretację: = nie ma korelacji, czyli nie ma liniowego związku między dwiema zmiennymi losowymi, = 1 zachodzi ścisły dodatni związek między dwiema zmiennymi. Gdy jedna z tych zmiennych przyjmuje większe wartości, druga także przyjmuje większe wartości (i na odwrót), = 1 zachodzi ścisły ujemny związek między dwiema zmiennymi. Gdy jedna z tych zmiennych przyjmuje większe wartości, to i druga przyjmuje mniejsze wartości (i na odwrót), znajduje się w przedziale ( 1,1) wartość współczynnika korelacji jest miarą siły liniowego związku między dwiema zmiennymi. 3

Klasyfikacja zależności korelacyjnej = - brak korelacji, <,1 - korelacja nikła,1 <,3 - korelacja słaba,3 <, - korelacja przeciętna, <,7 - korelacja wysoka,7 <,9 - korelacja bardzo wysoka,9 < < 1, - korelacja niemal pełna = 1 - korelacja pełna Korelację pełną można nazwać również zależnością funkcyjną, co oznacza, że pomiędzy x i y istnieje funkcja, która odwzorowuje x w y bez występowania jakiejkolwiek reszty, błędu. Można również spotkać się z następującą klasyfikacją zależności korelacyjnej:,,2 - brak korelacji (brak związku liniowego),2 <,4 - korelacja słaba,4 <,7 - korelacja (umiarkowana) średnia,7 <,9 - korelacja silna,9 < 1, - korelacja bardzo silna Należy pamiętać, że sama interpretacja siły związku jest mniej ważna niż informacja czy dana zależność jest istotna statystycznie. Jeżeli nie jest to oceniamy, że według statystyki (przyjętego poziomu istotności) uzyskana wartość jest dziełem błędu niż prawdziwej zależności. Jeżeli przyjmiemy jedną czy drugą klasyfikację nie popełnimy błędu - jeżeli posługujemy się daną skalą siły korelacji należy na wstępie zaznaczyć, z jakiej korzystamy w przedstawieniu wyników. Obliczenie współczynnika korelacji # $,% z próby Estymatorem nieobciążonym i zgodnym współczynnika korelacji miedzy dwiema badanymi cechami i w populacji jest współczynnik korelacji z próby (z eksperymentu), zwykle oznaczany symbolem, i obliczany z par (, ) wyników próby według wzoru: 1 [( ) ( *) ] = = * (1) / ( ) ( *) 1 1 współczynnik korelacji pomiędzy i, wartości rozpatrywane i średnia arytmetyczna zmiennej niezależnej,, * - wartości rozpatrywane i średnia arytmetyczna zmiennej zależnej, 1, 1 odchylenia standardowe zmiennych i ilość obserwacji 4

gdy = 1 lub = 1 istnieje ścisła zależność w postaci funkcji liniowej =, gdy = zmienne są nieskorelowane są niezależne, nie istnieje funkcja liniowa zależności im jest bliższa 1, tym korelacja jest mocniejsza. Na podstawie wyników tej próby należy sprawdzić hipotezę, że zmienne i nie są skorelowane, tzn. hipotezę 2 3 =, wobec hipotezy alternatywnej 2 -. Test istotności dla tej hipotezy jest następujący: obliczamy wartość współczynnika korelacji z próby oraz wartość statystyki = 1 2 (2) Statystyka ta ma przy założeniu prawdziwości hipotezy 2 3 rozkład t-studenta z 2 stopniami swobody. Z tablicy rozkładu t-studenta dla ustalonego z góry poziomu istotności 8 i dla 9 = 2 stopni swobody odczytujemy wartość krytyczną :,; tak by < :,; > = 8. Jeżeli z porównania obliczonej wartości z wartością krytyczną :,; otrzymamy nierówność :,; to hipotezę 2 3 o braku korelacji między zmiennymi trzeba odrzucić (czyli, istnieje korelacja/zależność między zmiennymi na przyjętym poziomie istotności 8). Gdy, natomiast < :,;, to nie ma podstaw do odrzucenia hipotezy 2 3, że zmienne i są nieskorelowane - niezależne (czyli, brak korelacji/zależności między zmiennymi, na przyjętym poziomie istotności 8). Wyznaczenie funkcji regresji liniowej Analiza regresji liniowej, zwana również regresją prostą określa sposób przyporządkowania jednej zmiennej losowej (zmiennej zależnej ) wartości innej zmiennej (zmiennej niezależnej ), za pomocą funkcji matematycznej i odpowiedniego wykresu (rys. 2). Może to mieć duże znaczenie w przewidywaniu wzajemnego zachowania się obu parametrów. O ile współczynnik korelacji liniowej mówi nam jak bardzo dane są od siebie zależne o tyle regresja liniowa mówi nam jak bardzo zmieni się gdy zmienimy.

14 12 1 8 * 6 4 2 b 2 4 6 8 1 12 14 16 Rys. 2. Wyznaczenie linie regresji Wyznaczenie funkcji regresji liniowej (rys. 2) polega na wyznaczeniu współczynników i linii prostej: = (3) gdzie: = ( ) ( *) ( ) =?@A(, ) 1 = 1 1 (4) = * () - estymator współczynnika regresji względem, współczynnik nachylenia prostej regresji, stała, wartości rozpatrywane i średnia arytmetyczna zmiennej niezależnej,, * wartości rozpatrywane i średnia arytmetyczna dla zmiennej zależnej.?@a(, ) kowariancja zmiennych i 1, 1 odchylenia standardowe zmiennych i współczynnik korelacji pomiędzy i Analiza regresji pozwala na: ustalenie istotności związku między wielkościami, ustalenie wpływu parametrów procesu na cechy wyrobu, ustalenie wpływu cech charakteryzujących jakość typu i jakość wykonania wyrobu na jego parametry użytkowe. Należy dodać, iż związki pomiędzy analizowanymi zmiennymi mogą mieć także charakter nieliniowy np. paraboliczny - krzywoliniowa funkcja regresji. 6

Wyznaczenie obszaru ufności Korzystając z założenia o normalności rozkładu, można zbudować tzw. obszar ufności pomiędzy krzywymi ufności dla prostej regresji = 8 B oraz przedział ufności dla współczynnika regresji korzystając z wzorów matematycznych poniższych modeli. MODEL 1 Oszacowanie parametrów liniowej regresji = 8 B wraz z jej obszarem ufności Dwuwymiarowy rozkład badanych dwóch cech mierzalnych i w populacji generalnej jest normalny lub zbliżony do normalnego. Z populacji tej wylosowano do próby elementów i otrzymano dla tych cech wyniki (, ) (C = 1,2,, ). Na podstawie wyników próby należy oszacować parametry liniowej regresji = 8 B wraz z jej obszarem ufności. Metoda najmniejszych kwadratów daje następujące oszacowanie prostej regresji E = (6) Estymatory i są nieobciążonymi i zgodnymi estymatorami parametrów 8 i B. Obszar ufności dla prostej regresji = 8 B ograniczony tzw. krzywymi ufności, wyznacza się według wzoru: <E F G H < J I < E F G H > = 1 K (7) E oznacza wartość funkcji = wyznaczonej według wzorów (4) i (), J I oznacza wartość szacowanej funkcji regresji = 8 B, F jest wartością zmiennej o rozkładzie t-studenta, wyznaczoną z tablicy tego rozkładu dla ustalonego z góry współczynnika ufności 1 K dla 9 = 2 stopni swobody (8) gdzie L M jest odchyleniem przeciętnym od prostej regresji, obliczanym ze wzoru: L M = Q 1 2 R( *) L EH = L M N 1 O P ( ) (9) Określony w ten sposób obszar ufności z prawdopodobieństwem 1 K (niepewnością K ) pokrywa prawdziwą funkcję regresji regresji = 8 B w populacji generalnej. 7

MODEL II Oszacowanie parametrów liniowej regresji = 8 B wraz z przedziałem ufności dla współczynnika regresji regresji 8 Dwuwymiarowy rozkład badanych dwóch cech mierzalnych i w populacji generalnej jest normalny lub zbliżony do normalnego. Z populacji tej wylosowano do próby elementów i otrzymano dla tych cech wyniki (, ) (C = 1,2,, ). Na podstawie wyników próby należy oszacować parametry liniowej regresji = 8 B wraz z przedziałem ufności dla współczynnika regresji 8. Przedział ufności dla współczynnika regresji 8 funkcji regresji = 8 B w populacji wyznacza się według wzoru: < 8 < 8 F L M V U L M 8 F T V S ( ) ( ) Y = 1 K (1) X W gdzie: 8 jest współczynnikiem regresji uzyskanym metodą najmniejszych kwadratów dla funkcji E = wyznaczonym z próby wg wzoru (4), L M jest odchyleniem przeciętnym od prostej regresji, obliczanym ze wzoru (9), F jest wartością zmiennej o rozkładzie t-studenta, wyznaczoną z tablicy tego rozkładu dla ustalonego z góry współczynnika ufności 1 K dla 9 = 2 stopni swobody. Dla wyznaczenia przedziału ufności dla współczynnika regresji 8 trzeba znaleźć E =, tj. oszacowanie całej liniowej funkcji regresji. PRZYKŁAD Badając zależność między wielkością pewnego wyrobu a zużyciem pewnego surowca zużywanego w produkcji tego wyrobu otrzymano dla losowej próby = 7 obserwacji następujące wyniki ( w tys. sztuk, w tonach). Tabela 1. Zależność wyrobu między zużycie surowca 1 2 3 4 6 7 8 13 14 17 18 2 22 Należy przy współczynniku ufności,9 (9%) oszacować metodą przedziałową zarówno całą liniową funkcję regresji, jak i sam współczynnik regresji zużycia surowca względem wielkości produkcji. 8

Nanosząc otrzymane punkty empiryczne (, ) na wykres (rys. 3) można stwierdzić, że badaną regresję można przyjąć za liniową. Rys. 3. Liniowa funkcja regresji wraz z krzywymi ufności Estymację liniowej funkcji regresji przeprowadzono według wzorów z MODELU I. Wartości estymatorów i wyznaczono metodą najmniejszych kwadratów stosując wzory (4) i (). Odpowiednie obliczenia przeprowadzono tabelarycznie w programie Microsoft Excel. Tabela 2. Obliczenia * ( )( *) ( ) ( *) E ( E ) ( ) ( ) 1 ( ) ( ) N 1 ( ) ( ) 1 8-3 -8 24 9 64 9, 2,2,321,464,681,694 1,8 7,8 11,3 2 13-2 -3 6 4 9 11,7 1,69,143,286,3,4 1,4 1,3 13,1 3 14-1 -2 2 1 4 13,8,4,36,179,423,431 1,1 12,7 14,9 4 17 1 1 16, 1,,,143,378,38 1, 1, 17, 18 1 2 2 1 4 18,1,1,36,179,423,431 1,1 17, 19,2 6 2 2 4 8 4 16 2,2,4,143,286,3,4 1,4 18,8 21,6 7 22 3 6 18 9 36 22,4,16,321,464,681,694 1,8 2,6 24,2 28 112 6 28 134,19,143 L EH F L EH E F G H E F G H = 28 7 = 4 * = 112 7 = 16 9

stąd = 6 28 = 2,14 = 16 (2,14 4) = 7,4 Otrzymano zatem oszacowanie prostej regresji: E = 2,14 7,4 Wartości E oraz kwadraty ich odchyleń empirycznych wartości obliczono w tabeli 2. L M = N 1,19 = /1,38 = 1,2 Dla 9 = 2 i dla przyjętego współczynnika ufności K =,9 otrzymano z tablic rozkładu t-studenta wartość F = 2,71. Ponadto - = - [ =,143. Wartości L EH oraz rzędne punktów leżących na krzywych ufności przedstawiono w tabeli 2. W ostatnich dwóch punktach tabeli otrzymano dla odpowiednich odciętych rzędne punktów leżących na dolnej i górnej krzywej ufności. Krzywe te naniesiono na rys. 3. Obszar między tymi krzywymi z prawdopodobieństwem 9% pokrywa nieznaną funkcję regresji = 8 B w populacji generalnej. Przedział ufności dla współczynnika regresji 8 otrzymano ze wzoru podanego w MODELU II. = 2,14 F = 2,71 QR( ) L M = 1,2 = 28 =,29 Przedział ufności dla współczynnika regresji 8 jest następujący: Korelacja < 8 < 8 F L M V U L M 8 F T V S ( ) ( ) 2,14 2,71 1,2 1,2 < 8 < 2,14 2,71,29,29 Czyli 2,14, < 8 < 2,14, 1,64 < 8 < 2,64 [( ) ( *) ] 6 = = / ( ) ( *) 28 134 =,979 Y = 1 K X W 1