Wykorzystanie statystyki w poszukiwaniach naftowych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wykorzystanie statystyki w poszukiwaniach naftowych"

Transkrypt

1 Wykorzystanie statystyki w poszukiwaniach naftowych 1) Pojęcia podstawowe i przykłady 2) Obliczanie statystyk opisowych i tworzenie wykresów statystycznych z zastosowaniem programu Grapher 7.0 mgr inż. Bartosz Papiernik Kraków 2007

2 Statystyki opisowe Podstawowy krok statystycznej analizy danych wejściowych stanowi opracowanie dla wyróżnionych populacji tzw. statystyk opisowych, które standardowo obejmują tzw. podstawowe miary położenia (średnia -mean [X śr ], mediana - median [Me]), miary zmienności (minimum - minimum value, maksimum maksimum value, wariancja - Variance [s 2 ], odchylenie standardowe standard deviation [s]), a także współczynnik skośności skewness [A] oraz spłaszczenia - kurtosis [Sp], i in. (Słomka, Krawczyk 1986; Mucha 1991). Postać rozkładu populacji (próbki) Zmienność parametru w obrębie badanej populacji punktów (tzw. postać rozkładu dwuwymiarowego) można przeanalizować z wykorzystaniem histogramów. W przypadku rozkładu porowatości, jeżeli analizowana próba obejmuje oznaczenia laboratoryjne pobrane ze skał o jednakowej genezie histogram będzie wykazywał rozkład dzwonowy czyli normalny (inaczej Gaussa). O populacji możemy powiedzieć, że wykazuje rozkład normalny, jeżeli 68% przypadków trafia do przedziału ±1 odchylenia standardowego od wartości średniej, a ±2 odchylenia standardowe obejmują 95% przypadków. Innymi słowy w rozkładzie normalnym wartości standaryzowane mniejsze niż -2 i większe niż +2 zdarzać się mogą z częstością równą lub mniejszą niż 5%. Konstruując histogramy dla kilku populacji danych w celu ułatwienia porównania form rozkładu danych należy zachować stałą szerokość klas dla każdej analizowanej subpopulacji. Niektóre programy jak np. RockWorks 2002 (i nowsze) umożliwiają uproszczoną graficzną formę oceny normalności rozkładu,z wykorzystaniem zmiennych barw słupków histogramu : tła (background); mieszczące się w przedziale zmienności (M. ± 1s) (gdzie: M.- średnia; s odchylenie standardowe); pomiarów nieznacznie anomalnych (slightly anomalous) mieszczące się w klasach (M-2s; M.-1s> oraz <M.+1s; M.+2s) Pomiarów anomalnych (anomalous) mieszczące się w klasach (M-3s; M-2s> oraz <M+2s; M+3s) Pomiarów mocno anomalnych (strongly anomalous) mieszczące się w klasach (ponad M- 3s > oraz <ponad M+3s)

3 STATYSTYKA - POROWATOŚĆ EFEKTYWNA [PRZYKŁAD STATYSTYKI OPISOWEJ I HISTOGRAMU] Utwory facji eolicznej (subpopulacja W) Univariate Statistics:(Statystyka jednej zmiennej) Population Minimum Value Maximum Value Range Mean Standard Deviation Standard Error Median Sum... 5, Sum of Squares... 75, Variance Skewness Kurtosis Rozkład porowatości efektywnej W utworach facji eolicznej (subpopulacja W) Anomalous M-2SD (0) Slightly Anomalous M-1SD (6) Mean (11) Standard Deviation M+1SD (16) Background Anomalous Slightly Anomalous M+2SD (22) M+3SD (27) Strongly Anomalous

4 STATYSTYKA -LOGARYTMOWANA PRZEPUSZCZALNOŚĆ [ Przykład 2 ] Utwory facji eolicznej (subpopulacja W) Univariate Statistics:(Statystyka jednej zmiennej) Population Minimum Value Maximum Value Range Mean Standard Deviation Standard Error Median Sum Sum of Squares Variance Skewness Kurtosis Rozkład logarytmowanej (log10) przepuszczalności W utworach facji eolicznej (subpopulacja W) Strongly Anomalous M-3SD (-2.4) Anomalous M-2SD (-1.3) Slightly Anomalous M-1SD (-0.3) Mean (0.7) Background Standard Deviation M+1SD (1.7) Slightly Anomalous M+2SD (2.8) Anomalous

5 W przypadku, gdy analizowany zbiór oznaczeń pochodzi ze skał o różnej genezie sedymentacyjnej albo odmiennym rozwoju procesów kompakcji i diagenezy histogram będzie wykazywał rozkład wyraźnie różny od unimodalnego 1 rozkładu Gaussa. Polimodalny rozkład porowatości utworów dolomitu głównego pokazuje na rysunku poniżej pokazuje, że analizowana populacja jest niejednorodna prawdopodobnie obejmując kilka odmiennych subpopulacji.. 80 Rozkład porowatości średnich w otworach przewiercających utwory Ca Mo 1 50 Liczba obs Mo 2 Mo Mo Porowatości średnie Górna granica (x<=granica) Ilustracja 1: Przykład polimodalnego histogramu. Porowatość utworów Ca2 Oczekiwane Normalny Analizy statystyczne dla przepuszczalności Przepuszczalność jest parametrem, który na ogół wykazuje bardzo wysoką zmienność, wyraźnie odbiegającą od rozkładu Gaussa. Na ogół w skałach w klastycznych, a zwłaszcza w węglanowych, dominują próbki o niskiej przepuszczalności. Zjawisko to jest szczególnie widoczne w węglanach, gdzie dominacja partii skał słabo przepuszczalnych jest tak wyraźna, że analizowane populacje surowych danych mają rozkład zbliżony do logarytmicznego 1 Histogram unimodalny ma jeden słupek zawierający najwyższą ilość pomiarów ( tzw. klasa modalna). H. bimodalny ma dwie oddalone od siebie klasy (słupki) obserwacji wyższe od otaczających

6 350 Rozklad przepuszczalność utworów Ca2 (populacja ogólna N) Liczba obs Oczekiwane Normalny Górna granica (x<=granica) Ilustracja 2: Przykład histogramu obrazującego zmienność nie przekształconej przepusczalności utworów dolomitu głównego. Populacja wykazuje rozkład logarymiczny Słuszność powyższej obserwacji potwierdza niżej załączony histogram, wykonany dla tej samej populacji po zlogarytmowaniu przepuszczalności. Iustracja ta pokazuje, że wykazuje ona postać rozkład zbliżoną do rozkładu Gaussa. 100 Rozkład Log10 Przepuszczalności (Populacja ogólna) Liczba obs Oczekiwane Normalny Górna granica (x<=granica)

7 Zmiana postaci rozkładu przekłada się bardzo wyraźnie na wartości obliczanych miar statystycznych Średnia Mediana N Xśr Me Minim um Maksim um Warianc. Odch.Std S Skośność A Przepuszczalność ,44 0, ,5 2977,98 11,46 152,18 1,45 Log(Przepuszcz.) ,91 1,33 1, ,1 Wartości przeliczone z logarytmow 0,516 0,450 0, ,961 21,478 14,256 0,689 1,265 Kurtoza Sp Badanie siły związku pomiędzy parametrami na podstawie analizy współczynnika korelacji porowatości i przepuszczalności Ocena postaci rozkładu umożliwia określenie wiarygodności odczytanych statystyk oraz stanowi niezbędny krok przygotowania danych, jeżeli chcemy zbadać związki pomiędzy parametrami fizycznymi złoża. np. porowatością a przepuszczalnością. W większości programów statystycznych analiza ta jest wykonywana z wykorzystaniem wykresów rozrzutu opartych na tzw. korelacji liniowej, a dokładniej korelacji Pearsona. Współczynnik korelacji Pearsona (dalej nazywany współczynnikiem korelacji), wymaga aby zmienne były mierzalne. Określa on stopień wzajemnej proporcjonalności wartości dwóch zmiennych. Wartość korelacji (współczynnik korelacji) nie zależy od jednostek miary w jakich wyrażamy badane zmienne. Proporcjonalność zmiennych oznacza, że korelacja jest silna jeśli może być wyrażona przy pomocy linii prostej (nachylonej dodatnio lub ujemnie), zwanej linią regresji (lub najmniejszych kwadratów). Jest ona wyznaczana w taki sposób by suma kwadratów odchyleń punktów pomiarowych od tej linii była minimalna. Współczynniki korelacji r mierzą liniową zależność między dwiema zmiennymi. Jeśli podnieść współczynnik korelacji do kwadratu wówczas otrzymana wartość (r 2 współczynnik determinacji) wyraża proporcję wspólnej zmienności dwóch zmiennych (tzn. siłę lub wielkość ich zależności). Innymi słowy współczynnik determinacji (r 2 ) określa dla jakiego procent analizowanych danych (Y) traktowanych jako tzw. zmienna zależna zmiana wartości będzie bezpośrednio warunkowana zmianami wartości zmiennej X (tzw. zmienna niezależna) w zależności funkcyjnej opisanej równaniem regresji. Współczynnik r 2 pozwala

8 nam również w łatwy sposób ocenić jaka część zmian wartości Y ma charakter przypadkowy. Mówi o tym współczynnik V p = 1-r 2 (Słomka, Krawczyk 1986, Mucha 1991, [1]) Wykres rozrzutu dla populacji ogólnej N Przepuszczalność( L)= *x Log10(Przepuszczalność) (R)= *x Przepuszczalność (L) Log10(Przepuszcz) (R) Przepuszczalność (md) Log10 (Przepuszczalność) Porowatość Aby ocenić korelację pomiędzy zmiennymi należy znać zarówno tę siłę, wielkość jak też istotność współczynnika korelacji. Wstępnym warunkiem, który muszą spełnić korelowane zmienne jest zachowanie normalności rozkładu, szczególnie dla prób mniejszych niż 100 przypadków. Dla nie zanieczyszczonych populacji współczynniki są na ogół znacznie wyższe. Przepuszczalność Wykres rozrzutu - "facje 1 i 2" nierozdzielone (N1) Przepuszczalność (L)= *x Log10(Przepuszczalność) (R)= *x Przepuszczalność(L) Log10(Przepuszcz.) (R) Log10 (Przepuszczalność) Porowatość

9 Wykresy statystyczne w programie Grapher 7.0 Statystyczna analiza danych wykonywana w programie Grapher 7.0 obejmuje możliwość: edycji i przeliczania danych w arkusz (tzw. Worksheet), policzenia statystyk opisowych definiujących zmienność badanego zbioru danych (populacji bądź próby statystycznej), graficznej analizy zmienności danych w postaci wykresów dwu wymiarowych (2D Graphs), trójwymiarowych (3D XYZ Graphs), a także opracowywania bardzo uproszczone form map konturowych (Contour map) oraz map z wypełnieniami barwnymi (Surface Maps) Aby rozpocząć pracę otwórz plik zawierający dane wejściowe (File --> Open).Podobnie jak Open Office Calc, program jest w stanie wykorzystać pliki zapisane w wielu formatach. Aby przygotować dane dla Grapher'a otwórz w Open Office Calc, plik zawierający dane petrofizyczne (POROWATOŚĆ, PRZEPUSZCZALNOŚĆ, np. dla grupy 7, plik g7- petro.ods) i zapisz go w formacie Excel.

10 Podobnie jak Open Office Calc, program Grapher 7.0 pozwala korzystać z plików zapisanych w formatach popularnych arkuszy kalkulacyjnych, baz danych i różnych odmian plików tekstowych MS Excel (xls), Dbase (dbf), Lotus (w??), pliki wymiany danych SYLK (slk), pliki tekstowe o kolumnach rozdzielonych przecinkami (CSV), bądź tabulatorami (txt, DAT). Dane do arkusza programu Grapher (Worksheet) można również pobierać z arkuszy bazy danych Ms Access. Statystyczna analiza danych Program G7 umożliwia wykonanie rozbudowanych statystyk opisowych analizowanych parametrów, obejmujących podstawowe miary położenia i zmienności, a także wykonanie przetestowanie normalności rozkładu analizowanej populacji lub wylosowanej z niej próbki z wykorzystaniem testu Kołmogorowa - Smirnowa

11 Porowatosc_Efe ktywna Number of values 106 Liczba wartości Sum Suma Minimum 0 Minimum Maximum Maximum Range Zakres zmienności Mean Średnia Median Mediana First quartile 0.36 Pierwszy kwartyl (25%) Third quartile 12.7 Kwartyl 75% 95% confidence interval 99% confidence interval Poziom istotności 95% Poziom istotności 95% Variance Wariancja Average deviation Średnie odchylenie Standard deviation Standardowe odchylenie Coefficient of variation Współczynnik zmienności Skewness Skośność Kurtosis Spłaszczenie Kolmogorov- Smirnov stat Critical K-S stat, alpha=.10 Cri`tical K-S stat, alpha=.05 Critical K-S stat, alpha= Statystyka Kołmogorowa -Smirnowa Statystyka K-S dla poziomu istotności p= Statystyka K-S dla poziomu istotności p= Statystyka K-S dla poziomu istotności p=0.1 Ćwiczenie Aby wykonać analizę zmienności parametru w arkuszu zaznacz odpowiednią kolumnę (np. Wsp_Poro) w menu głównym przejdź do opcji Data--> Statistics. Do obliczeń wybierz liczebność próby - number of values, średnią -mean, medianę - median, minimum - minimum value, maksimum maksimum value, wariancję - Variance, odchylenie standardowe standard deviation, a także współczynnik skośności skewness oraz spłaszczenia kurtosis. [Zaakceptuj wybory OK]

12 wyniki Policz wymienione statystyki dla zmiennych: współczynnik porowatości (WspPoro) oraz logarytmowanej przepuszczalności (LogPrzep). Ostateczne wyniki z okna Statistic Results skopiuj i wklej do pliku Open Office Writer, w którym będzie się znajdować sprawozdanie z wykonania ćwiczenia II. Wykresy statystyczne Jak już nadmieniono program Grapher. 7 stwarza możliwość graficznej analizy zmienności danych z wykorzystaniem wykresów dwu wymiarowych (2D Graphs), trójwymiarowych (3D XYZ Graphs). Wykresy są wykonywane dla aktywnego arkusza danych i zaznaczonej kolumny (jednej lub większej ich ilości)), po zaznaczeniu w menu (Opcja Graph) (Rys.3). W dalszej części tekstu omówiono przede wszystkim wykresy 2D, gdyż one mają największe znaczenie w procedurze statystycznej analizy danych dla oceny własności zbiornikowej strefy złożowe. W tekście zwrócono też uwagę wykresy 2D nie spotykane w praktyce powszechnie stosowanym oprogramowaniu statystycznym. W bardzo wąskim zakresie zostaną również omówione niektóre z wykresów 3D. Wykresy dwuwymiarowe Podstawowe znaczenie dla statystycznego rozpoznania analizowanego zbioru danych mają wykresy dwuwymiarowe, które z jednej strony pozwalają określić jak wygląda

13 Rys. 4: Histogram materiały demonstracyjne Grapher 7.0 zróżnicowanie poszczególnych zmiennych (np. porowatości, przepuszczalności, głębokości poboru prób, litologii itp) Nazwy wszystkich wykresów dwuwymiarowych (2D Graphs) przedstawia Ilustracja 3. Część z nich jak wykresy liniowe (Line) rozrzutu (Scatter), słupkowe (Bar chart), kołowe (Pie chart) są znane z arkuszy kalkulacyjnych. Ale wiele wykresów dostępnych w programie Grapher 7.0 można znaleźć wyłącznie w nielicznych specjalistycznych pakietów programów (RockWorks2002 i nowsze wersję) Rys. 3: Menu 2D Graphs -wykresów dwuwymiarowych Na podstawie rysunków demonstracyjnych dołączonych do programu Grapher7.0 zilustrowano niżej wygląd części z nich, biorąc pod uwagę wykresy ewentualnie przydatne w poszukiwaniach naftowych lub zagadnieniach związanych z energetyką wiatrową. Histogram 2D

14 Wykres ten opisuje tzw. gęstość prawdopodobieństwa występowania wartości parametru w analizowanym zbiorze danych, czy innymi słowy postać rozkładu tego zbioru (populacji). Zbiór danych w zakresie od wartości minimalnej do maksymalnej jest dzielony na przedziały (klasy) o stałe szerokości, a wykres pokazuje jak wiele przypadków wpada do każdej z klas. Częstotliwość ta może być wyrażona jako ilość przypadków lub jako procent przypadków w analizowanej populacji. Wykres kołowy Kiedy analizowaną populację (np. pomiary porowatości) reprezentują próbki należące do Rys. 5: Wykres kołowy ( mat. demonstarcyjne Grapher 7.0) różnych grup, czyli tzw. subpopulacji ( np. próbki pobrane dla różnych skał= litologii) często chcemy poznać liczebność tych subpopulacji.. Umożliwiają nam to nam m.in. wykresy słupkowy (Rys.5) i kołowy lub ich odmiany przestrzenne [3D] (Rys.6) Rys. 6: Wykresy kołowy i słupkowy kreślone z wykorzystaniem opcji 3D XYZ Graphs

15 Wykresy rozrzutu Rys. 7: Przykład wykresu rozrzutu z naniesionymi liniami najlepszego dopasowania Do podstawowych wykresów statystycznych wykorzystywanych w analizach naftowych należą wykresy rozrzutu badające siłę związku pomiędzy analizowanymi parametrami. W programie Grapher ich najprostszą dwuwymiarową formą są wykresy dostępne jako Line/Scatter (Rys.7) bądź, nieco bardziej złożone, Classed scatter. Wykresy liniowe (Line) w poszukiwaniach naftowych na ogół nie są stosowane. Na wykresie rozrzutu można przedstawić tylko punkty, ale także linie najlepszego dopasowania wyznaczane metodami najmniejszych kwadratów, wielomianów logarytmicznie itp. Inne specjalistyczne wykresy 2D stosowane w geologii Wykresy biegunowe Polar charts Wykresy biegunowe nie są powszechnie stosowane w arkuszach kalkulacyjnych. Umożliwiają je tylko specjalistyczne programy, jak Grapher. 7.0 i RockWorks (Rys.8). Wykresy biegunowe są stosowane w przypadku, gdy oprócz częstości występowania zjawiska chcemy określić jego kierunkową zmienność odniesioną względem północy geograficznej. W zakresie odnawialnych źródeł energii wykresy tego typu mogą być stosowane do kreślenia częstości wiania wiatru z określonych kierunków. Rys.8: Przykład wykresu biegunowego (mat. demonstarcyjne Grapher). Wykresy trójkątne (Ternary plots)

16 Wykresy trójkątne są stosowane do klasyfikowania różnych zjawisk na podstawie zawartości trzech składników, np. w różnych klasyfikacjach petrograficznych skał osadowych, klasyfikacjach gleb itp. Rys.9: Wykresy trójkątny - klasyfikacja gleb (mat. demonstarcyjne Grapher). Wykresy składu (Stiff plots) Grapher 7.0 umożliwia opracowanie wykresów składu jonowego wód. Podobne rozwiązania zapewniają stosunkowo nieliczne specjalistyczne programy.

17 Wykresy bąbelkowe (Buble Plots) Wykresy bąbelkowe są nieco zbliżone do wykresów liniowych / rozrzutu. Jednakże poprzez skalowanie wielkości symboli w zależności od wielkości zadanego parametru można uzyskać dodatkową informację o współzależności przedstawionych parametrów. W programie dostępne są wykresy bąbelkowe 2D i 3D Rys.11: Wykresy bąbelkowe w programie Grapher 7.0 można przedstawiać jako wykresy 2D lub 3D (mat. demonstracyjne Grapher) Ćwiczenie 1) Na podstawie danych petrofizycznych odpowiednich dla twojej grup (np. g6-petro dla grupy 6) skonstruuj histogramy dla zmiennych (WspPoro) oraz logarytmowanej przepuszczalności (LogPrzep). (W arkuszu kalkulacyjnym zaznacz odpowiednią kolumnę, wybierz opcję [New Graph -->2D Graphs- Histogram] 2) Wykonaj wykres rozrzutu dla wyżej wymienionych zmiennych 3) Wykonaj wykres bąbelkowy dla powyższych zmiennych

18 Literatura: DAVIS J.,C., Statistics and data analysis in geology. John Wiley & Sons, New York, Second Edition. Mucha J Wybrane metody matematyczne w geologii górniczej. Skrypty Uczelniane nr Wydawnictwo AGH, Kraków KRAWCZYK A., SŁOMKA T., Podstawowe metody matematyczne w geologii. Wydanie drugie poprawione. Skrypty Uczelniane nr Wydawnictwo AGH, Kraków 1986.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Analiza Statystyczna

Analiza Statystyczna Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Próba własności i parametry

Próba własności i parametry Próba własności i parametry Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik

Bardziej szczegółowo

POLITECHNIKA OPOLSKA

POLITECHNIKA OPOLSKA POLITECHNIKA OPOLSKA WYDZIAŁ MECHANICZNY Katedra Technologii Maszyn i Automatyzacji Produkcji Laboratorium Podstaw Inżynierii Jakości Ćwiczenie nr 4 Temat: Analiza korelacji i regresji dwóch zmiennych

Bardziej szczegółowo

1 Podstawy rachunku prawdopodobieństwa

1 Podstawy rachunku prawdopodobieństwa 1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne

Bardziej szczegółowo

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;

Bardziej szczegółowo

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Podstawowa charakterystyka statystyczna

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Podstawowa charakterystyka statystyczna Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Podstawowa charakterystyka statystyczna 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik babulice100.xls

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin. Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw

Bardziej szczegółowo

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions Zadanie 1. 1 Wygenerować 200 elementowa próbkę z rozkładu logarytmiczno-normalnego o parametrach LN(5,2). Utworzyć dla tej próbki: - szereg rozdzielczy - histogramy liczebności i częstości - histogramy

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1 Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-

Bardziej szczegółowo

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych. Laboratorium z ekonometrii (GRETL) 2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych. 2.1 Zaimportuj dane z pliku zatrudnienie.csv z przecinkiem jako separatorem danych i kropką jako

Bardziej szczegółowo

Podstawowe definicje statystyczne

Podstawowe definicje statystyczne Podstawowe definicje statystyczne 1. Definicje podstawowych wskaźników statystycznych Do opisu wyników surowych (w punktach, w skali procentowej) stosuje się następujące wskaźniki statystyczne: wynik minimalny

Bardziej szczegółowo

Badanie normalności rozkładu

Badanie normalności rozkładu Temat: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności. Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby liczebność

Bardziej szczegółowo

Zawartość. Zawartość

Zawartość. Zawartość Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które

Bardziej szczegółowo

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności Badanie normalności rozkładu Shapiro-Wilka: jest on najbardziej zalecanym testem normalności rozkładu. Jednak wskazane jest, aby

Bardziej szczegółowo

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Prezentacja materiału statystycznego Szeroko rozumiane modelowanie i prognozowanie jest zwykle kluczowym celem analizy danych. Aby zbudować model wyjaśniający relacje pomiędzy różnymi aspektami rozważanego

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych PROJEKT: Analiza kluczowych parametrów turbin wiatrowych Projekt jest wykonywany z wykorzystaniem pakietu statystycznego STATISTICA. Praca odbywa się w grupach 2-3 osobowych. Aby zaliczyć projekt, należy

Bardziej szczegółowo

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek ZADANIA statystyka opisowa i CTG 1. Dokonano pomiaru stężenia jonów azotanowych w wodzie μg/ml 1 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.59 0.50 0.52 0.49 0.49 0.50 0.49

Bardziej szczegółowo

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński Wstęp do teorii niepewności pomiaru Danuta J. Michczyńska Adam Michczyński Podstawowe informacje: Strona Politechniki Śląskiej: www.polsl.pl Instytut Fizyki / strona własna Instytutu / Dydaktyka / I Pracownia

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI Korelacja 1. Współczynnik korelacji 2. Współczynnik korelacji liniowej definicja 3. Estymacja współczynnika korelacji 4. Testy istotności współczynnika korelacji

Bardziej szczegółowo

Statystyka matematyczna i ekonometria

Statystyka matematyczna i ekonometria Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.

Bardziej szczegółowo

Regresja i Korelacja

Regresja i Korelacja Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Tytuł: GRAPHER Podręcznik użytkownika ISBN: 9788393908806 Autor: Zbigniew Galon Rok wydania: 2014 Stron: 500 Wydawca: Gambit COiS Sp. z o.o.

Tytuł: GRAPHER Podręcznik użytkownika ISBN: 9788393908806 Autor: Zbigniew Galon Rok wydania: 2014 Stron: 500 Wydawca: Gambit COiS Sp. z o.o. Tytuł: GRAPHER Podręcznik użytkownika ISBN: 9788393908806 Autor: Zbigniew Galon Rok wydania: 2014 Stron: 500 Wydawca: Gambit COiS Sp. z o.o. GRAPHER. Podręcznik użytkownika Spis treści: GRAPHER. Podręcznik

Bardziej szczegółowo

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa PRZEDMIOT: PODSTAWY STATYSTYKI PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA Statystyka opisowa = procedury statystyczne stosowane do opisu właściwości próby (rzadziej populacji) Pojęcia:

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

Pozyskiwanie wiedzy z danych

Pozyskiwanie wiedzy z danych Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy

Bardziej szczegółowo

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.

Bardziej szczegółowo

W1. Wprowadzenie. Statystyka opisowa

W1. Wprowadzenie. Statystyka opisowa W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące

Bardziej szczegółowo

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4 KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)

Bardziej szczegółowo

Z poprzedniego wykładu

Z poprzedniego wykładu PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne

Bardziej szczegółowo

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością

Bardziej szczegółowo

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki

Bardziej szczegółowo

INFORMATYKA W SELEKCJI

INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne

Bardziej szczegółowo

Analiza korelacyjna i regresyjna

Analiza korelacyjna i regresyjna Podstawy Metrologii i Technik Eksperymentu Laboratorium Analiza korelacyjna i regresyjna Instrukcja do ćwiczenia nr 5 Zakład Miernictwa i Ochrony Atmosfery Wrocław, kwiecień 2014 Podstawy Metrologii i

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Statystyki opisowe i szeregi rozdzielcze

Statystyki opisowe i szeregi rozdzielcze Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu

Bardziej szczegółowo

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna 1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy

Bardziej szczegółowo

Informatyka. Arkusze kalkulacyjne cz. II. 1 Analiza zmiennych na poziomie przedziałowym i proporcji miary położenia

Informatyka. Arkusze kalkulacyjne cz. II. 1 Analiza zmiennych na poziomie przedziałowym i proporcji miary położenia Informatyka Arkusze kalkulacyjne cz. II. 1 Analiza zmiennych na poziomie przedziałowym i proporcji miary położenia Analizując wartości zmiennych dla skal przedziałowych i proporcji można, podobnie jak

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Sposoby opisu i modelowania zakłóceń kanałowych

Sposoby opisu i modelowania zakłóceń kanałowych INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Temat: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Zadania: I. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego

Bardziej szczegółowo

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka zajmuje się prawidłowościami zaistniałych zdarzeń. Teoria prawdopodobieństwa dotyczy przewidywania, jak często mogą zajść

Bardziej szczegółowo

LABORATORIUM PODSTAW TELEKOMUNIKACJI

LABORATORIUM PODSTAW TELEKOMUNIKACJI WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:

Bardziej szczegółowo

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: - Nazwa modułu: Statystyka opisowa i ekonomiczna Rok akademicki: 2013/2014 Kod: ZIE-1-205-n Punkty ECTS: 6 Wydział: Zarządzania Kierunek: Informatyka i Ekonometria Specjalność: - Poziom studiów: Studia I

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1

Bardziej szczegółowo