Czym jest analiza skupień?

Wielkość: px
Rozpocząć pokaz od strony:

Download "Czym jest analiza skupień?"

Transkrypt

1 Statystyczna analiza danych z pakietem SAS Analiza skupień metody hierarchiczne Czym jest analiza skupień? wielowymiarowa technika pozwalająca wykrywać współzależności między obiektami; ściśle związana z zagadnieniami klasyfikowania i porządkowania otaczającej rzeczywistości; Definicja ANALIZA SKUPIEŃ to grupa metod służących do utworzenia (oby) sensownej i interpretowalnej klasyfikacji początkowo niesklasyfikowanego zbioru danych z wykorzystaniem wartości zmiennych obserwowanych na poziomie każdego indywidualnego obiektu. B. S. Everitt (1998), The Cambridge Dictionary of Statistics

2 Jak działa analiza skupień? nie zakładamy a priori żadnej informacji o właściwościach grup ani o ich liczbie; podział w oparciu o informację zawartą w samych obiektach; dzielimy obiekty tak, aby podobne do się siebie znalazły się w tej samej grupie, a znacznie różniące się znalazły się w innych grupach; Cele analizy skupień eksploracja danych grupowanie obiektów lub ustalenie określonej struktury hierarchicznej z zbiorze obiektów w postaci drzewa binarnego; porównanie istniejącej typologii obiektów (opartej na podstawach teoretycznych) z wynikami grupowania empirycznego; dokonanie agregacji danych w jednorodne grupy również do dalszej analizy (zastąpienie obiektów przez obiekty uśrednione dla poszczególnych grup); Podstawowy podział metody hierarchiczne; metody niehierarchiczne (dzielące);

3 Rodzaje metod hierarchicznych Iteracja Aglomeracyjne Podziałowe Grupowanie hierarchiczne w praktyce metody hierarchiczne są kręgosłupem analizy skupień najpowszechniej stosowane; niedoskonałości: trudno wskazać jednoznacznie najlepszą metodę hierarchiczną; przenoszenie / nawarstwianie błędów; Czaso- i zasobochłonne przy dużych zbiorach danych; Alternatywa = metody dzielące Metody dzielące (nazywane również grupowaniem optymalizacyjnym) dzielą zbiór obserwacji na określoną liczbę skupień minimalizując pewne kryterium (funkcję celu); Dwa popularne kryteria to: podobieństwo wewnątrz skupień; oddzielenie/separacja skupień;

4 Problemy z metodami dzielącymi narzucają pewne założenia dotyczące kształtu skupień; wymagają założenia liczby skupień przed rozpoczęciem analizy; wyniki mogą być uzależnione od: wyboru początkowych środków ciężkości, obecności obserwacji nietypowych; kolejności obserwacji w zbiorze; Wsadowe struktury danych - przykłady Macierz danych Macierz odległości (niepodobieństwa) lub macierz korelacji Własności dobrej miary podobieństwa 1. Symetria: d(x,y) = d(y,x). Nierówność trójkątna: d(x,y) d(x,z) + d(y,z) 3. Rozróżnialność innych: jeśli d(x,y) 0 to x y 4. Nierozróżnialność identycznych: jeśli x = y, to d(x,y) = 0. Czasem najprostsze stosowane miary podobieństwa, (np. współczynnik korelacji liniowej Pearsona) nie spełniają jednego lub więcej z powyższych kryteriów.

5 Odległość euklidesowa Przypomnijmy twierdzenie Pitagorasa: (x 1, x ) (0, 0) h = x 1 + x x 1 Odległość euklidesowa między punktami x i w w przestrzeni p-wymiarowej dana jest wzorem: x h= p E = k w k ) k= 1 d (x i= 1 ( x i = x 0) i= 1 i Miary oparte na odległości euklidesowej d kwadrat odległości euklidesowej; standaryzowana odległość euklidesowa; = x w ( ) x ( w ) p x w = ( 1 1 p p k k SE ) s1 sp k= 1 sk Odległość miejska (w 1,w ) (x 1,x ) = x Odległość miejska (Manhattan) między dwoma punktami jest mierzona wzdłuż prostopadłych osi. d M p k= 1 k w k

6 Miary podobieństwa dla zmiennych nominalnych Pary obserwacji mogą być porównywane przez występowanie lub brak pewnych charakterystyk. Wtedy podobne elementy będą miały więcej wspólnych charakterystyk niż elementy niepodobne. Przykłady miar dla zmiennych nominalnych: Odległość Hamminga; Odległość Levenshteina (tzw. odległość edycyjna); Efekt kolejności W niektórych przypadkach kolejność obserwacji może mieć wpływ na wyniki; Ta sama analiza zastosowana na tym samym zbiorze danych jedynie o zmienionej kolejności obserwacji może dać całkowicie różne skupienia!; Aglomeracyjna metoda hierarchiczna 1. Zacznij od liczby skupień równej liczbie obserwacji (N) oraz symetrycznej macierzy odległości (albo podobieństw) - N N.. Znajdź w macierzy odległości parę skupień będących najbliżej siebie. 3. Połącz skupienia z punktu (.) w jedno nowe skupienie. Uaktualnij macierz odległości dla liczby skupień zmniejszonej o Powtórz kroki (.) i (3.) N-1 razy.

7 Dendrogram grupowania hierarchicznego Cel praktyczny W praktyce większość badaczy stosujących analizę skupień jest zainteresowanych podziałem analizowanej grupy obserwacji na określoną jako optymalną liczbę grup. Sprowadza się to do obcięcia dendrogramu na jakimś określonym poziomie. Rodzaje analizy hierarchicznej Wielość technik hierarchicznej analizy skupień bierze się z wielu istniejących metod mierzenia odległości między skupieniem jednoelementowym (pojedynczą obserwacją) a skupieniem zawierającym kilka obserwacji, lub między dwoma grupami wieloelementowymi.

8 Metoda najbliższego sąsiedztwa (single linkage) Odległość między skupieniami to odległość między dwoma najbliższymi obiektami. Cluster K Cluster L D KL D KL = min i CK min j CL d( xi, x j ) (METHOD=SINGLE) Metoda najbliższego sąsiedztwa Ma wiele teoretycznie pożądanych własności, ale wypada słabo w symulacjach Monte Carlo; Nie narzucając żadnych ograniczeń na kształt skupień jest w stanie odkryć zwarte grupy o kształcie rozciągniętym i nieregularnym; Metoda najdalszego sąsiedztwa (complete linkage) Odległość między skupieniami to odległość między dwoma najdalszymi obiektami. Cluster K D KL (METHOD=COMPLETE) DKL = max i CKmax j CL d( xi, xj) Cluster L

9 Metoda najdalszego sąsiedztwa Mocno obciążona w stronę uzyskiwania zwartych grup o w przybliżeniu równych średnicach; Nawet nieskrajne obserwacje odstające mogą w dużym stopniu zaburzać wynik; Metoda średniej grupowej (average linkage) Odległość między skupieniami to średnia arytmetyczna odległości między wszystkimi parami obiektów należącymi do różnych skupień. Cluster K d(x i,x j ) (METHOD=AVERAGE) d( xi x j ) D 1 KL = n n, K L i C K j C L Cluster L Metoda średniej grupowej Ma tendencję do łączenia grup z małą wariancją i jest nieznacznie obciążona w kierunku uzyskiwania skupień o równej wariancji; Ponieważ bierze ona pod uwagę wszystkie elementy skupienia, a nie pojedyncze obserwacje, jest bardziej od innych metod odporna na występowanie obserwacji nietypowych;

10 Metoda środka ciężkości (centroid linkage) Odległość między skupieniami jest zdefiniowana jako kwadrat odległości euklidesowej między środkami ciężkości obu skupień ( x i x ). Cluster K X D KL K L (METHOD=CENTROID) D KL K L = x x Cluster L X Metoda środka ciężkości Ponieważ porównuje środki ciężkości jest również dość odporna na występowanie obserwacji nietypowych; W innych aspektach może nie dawać tak dobrych wyników jak metoda Warda lub średniej grupowej; Przy łączeniu dwóch grup nierównej wielkości mniejsza z nich staje się w znacznym stopniu zdominowana przez większą; Metoda mediany (median method) Odległość między skupieniami to odległość środkowa (w sensie mediany) między obiektami z różnych skupień. Cluster K D KL Cluster L Cluster M D JK Cluster J D JL D JM (METHOD=MEDIAN) D = JK + D JL D 4 KL

11 Metoda mediany Wypada słabo w symulacjach Monte Carlo; Ma mało (jeśli w ogóle) zalet w porównaniu z pozostałymi metodami; Grupa powstała z połączenia dwóch innych może być interpretowana jako pośrednia pozycja między połączonymi skupieniami; Metoda Warda (minimalnej wariancji) Znajdowane są środki ciężkości skupień i odległości od nich, które następnie są sumowane (jako miarę należy w tej metodzie wybrać kwadrat odległości euklidesowej wtedy interpretacją metody Warda jest minimalizacja wewnątrzgrupowej wariancji) ANOVA ANOVA D (METHOD=WARD) KL x K x L = n K n L Metoda Warda ma tendencję do łączenia grup o małej liczbie obserwacji i jest mocno obciążona w kierunku uzyskiwania skupień o zbliżonym kształcie i mniej więcej równej liczbie obserwacji; Jest również bardzo wrażliwa na obserwacje nietypowe;

12 Problemy z metodami hierarchicznymi Nie ma metody zawsze dającej lepsze rezultaty niż inne metody Symulacje: najlepsze Warda, średniej grupowej, najdalszego sąsiedztwa; Efektywność i czytelność metod hierarchicznych maleje wraz ze wzrostem liczby obserwacji; Nie umożliwiają korekty już utworzonych skupień, w związku z tym błędne przypisanie do skupienia nie może zostać skorygowane w kolejnym kroku; Określenie liczby skupień Odpowiedzi na pytanie Ile mamy segmentów? można szukać stosując różne kryteria: dendrogram; cubic clustering criterium Sarle a; statystyka pseudo-f; test pseudo-t ; Interpretowanie dendrogramu

13 Cubic Clustering Criterion Sarla Cubic clustering criterion Sarla (CCC) testuje następującą hipotezę: H 0 = dane pochodzą z rozkładu jednostajnego; H 1 = dane pochodzą z mieszanych wielowymiarowych rozkładów normalnych o równych wariancjach i prawdopodobieństwie wylosowania. Dodatnie wartości CCC oznaczają, że uzyskana wartość R jest większa niż oczekiwana w przypadku rozkładu jednostajnego (wtedy odrzucamy H 0 ). Graficzna interpretacja CCC Sarla Statystyka Pseudo-F Statystyka pseudo-f statistic (lub PSF) mierzy rozdzielenie między grupami na bieżącym poziomie hierarchii; Wysokie wartości wskazują, że średnie wartości rozpatrywanych zmiennych różnią istotnie się między grupami; Nie ma rozkładu F Snedecora;

14 Kryterium Pseudo-F Potencjalne rozwiązania Statystyka Pseudo-T Statystyka pseudo-t jest wariantem testu T Hotellinga. jeśli wartość statystyki pseudo-t jest duża, rozpatrywane w danym kroku dwa skupienia nie powinny być połączone, ponieważ średnie wartości rozpatrywanych zmiennych różnią się istotnie między nimi; jeśli wartość statystyki jest mała, rozpatrywane w danym kroku dwa skupienia mogą być bezpiecznie połączone; Kryterium Pseudo-T Potencjalne rozwiązania

15 Dziękuję za uwagę

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

CLUSTERING. Metody grupowania danych

CLUSTERING. Metody grupowania danych CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Zagadnienie klasyfikacji (dyskryminacji)

Zagadnienie klasyfikacji (dyskryminacji) Zagadnienie klasyfikacji (dyskryminacji) Przykład Bank chce klasyfikować klientów starających się o pożyczkę do jednej z dwóch grup: niskiego ryzyka (spłacających pożyczki terminowo) lub wysokiego ryzyka

Bardziej szczegółowo

Poznań, 14 grudnia 2002. Case Study 2 Analiza skupień

Poznań, 14 grudnia 2002. Case Study 2 Analiza skupień Poznań, 14 grudnia 2002 Case Study 2 Analiza skupień Celem ćwiczenia jest przeprowadzenie procesu grupowania / analizy skupień dla jednego z wybranych zbiorów danych (tj. dostarczonych przez prowadzącego).

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA (wykład ) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Weryfikacja (testowanie) hipotez statystycznych

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ

ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ ANALIZA CZYNNIKÓW ROKOWNICZYCH I METOD LECZENIA U CHORYCH NA ZIARNICĘ ZŁOŚLIWĄ prof. dr hab. Andrzej Sokołowski, dr Adam Sagan Jednym z ważniejszych obszarów zastosowań programu STATISTICA w badaniach

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

ANALIZA STRUKTURY WIEKOWEJ ORAZ PŁCIOWEJ CZŁONKÓW OFE Z WYKORZYSTANIEM METOD TAKSONOMICZNYCH

ANALIZA STRUKTURY WIEKOWEJ ORAZ PŁCIOWEJ CZŁONKÓW OFE Z WYKORZYSTANIEM METOD TAKSONOMICZNYCH Sugerowany przypis: Chybalski F., Analiza struktury wiekowej oraz płciowej członków OFE z wykorzystaniem metod taksonomicznych [w:] Chybalski F., Staniec I. (red.), 10 lat reformy emerytalnej w Polsce.

Bardziej szczegółowo

Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Eksploracja danych. Grupowanie wykład 1

Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Eksploracja danych. Grupowanie wykład 1 Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Tematem wykładu są zagadnienia związane z grupowaniem. Rozpoczniemy od krótkiego wprowadzenia

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela

Statystyka w pracy badawczej nauczyciela Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem

Bardziej szczegółowo

Parametry statystyczne

Parametry statystyczne I. MIARY POŁOŻENIA charakteryzują średni lub typowy poziom wartości cechy, wokół nich skupiają się wszystkie pozostałe wartości analizowanej cechy. I.1. Średnia arytmetyczna x = x 1 + x + + x n n = 1 n

Bardziej szczegółowo

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej 7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2 STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;

Bardziej szczegółowo

Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy

Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy Matematyka do liceów i techników Szczegółowy rozkład materiału Zakres podstawowy Wariant nr (klasa I 4 godz., klasa II godz., klasa III godz.) Klasa I 7 tygodni 4 godziny = 48 godzin Lp. Tematyka zajęć

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

S t a t y s t y k a, część 3. Michał Żmihorski

S t a t y s t y k a, część 3. Michał Żmihorski S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach

Bardziej szczegółowo

Analiza danych ilościowych i jakościowych

Analiza danych ilościowych i jakościowych Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 8 kwietnia 2010 Plan prezentacji 1 Zbiory danych do analiz 2 3 4 5 6 Implementacja w R Badanie depresji Depression trial data Porównanie

Bardziej szczegółowo

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona Badanie zależności między cechami Obserwujemy dwie cechy: X oraz Y Obiekt (X, Y ) H 0 : Cechy X oraz Y są niezależne Próba: (X 1, Y 1 ),..., (X n, Y n ) Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności

Bardziej szczegółowo

Wykrywanie nietypowości w danych rzeczywistych

Wykrywanie nietypowości w danych rzeczywistych Wykrywanie nietypowości w danych rzeczywistych dr Agnieszka NOWAK-BRZEZIŃSKA, mgr Artur TUROS 1 Agenda 1 2 3 4 5 6 Cel badań Eksploracja odchyleń Metody wykrywania odchyleń Eksperymenty Wnioski Nowe badania

Bardziej szczegółowo

Rozkład materiału z matematyki dla II klasy technikum zakres podstawowy I wariant (38 tyg. 2 godz. = 76 godz.)

Rozkład materiału z matematyki dla II klasy technikum zakres podstawowy I wariant (38 tyg. 2 godz. = 76 godz.) Rozkład materiału z matematyki dla II klasy technikum zakres podstawowy I wariant (38 tyg. godz. = 76 godz.) I. Funkcja i jej własności.4godz. II. Przekształcenia wykresów funkcji...9 godz. III. Funkcja

Bardziej szczegółowo

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski Zadanie 1 Eksploracja (EXAMINE) Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Przykład. Producent pewnych detali twierdzi, że wadliwość jego produkcji nie przekracza 2%. Odbiorca pewnej partii tego produktu chce sprawdzić, czy może wierzyć producentowi.

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych kod modułu: 2BL_02 1. Informacje ogólne koordynator

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);

Bardziej szczegółowo

Analiza wariancji. dr Janusz Górczyński

Analiza wariancji. dr Janusz Górczyński Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik

Bardziej szczegółowo

Przedmiot statystyki. Graficzne przedstawienie danych.

Przedmiot statystyki. Graficzne przedstawienie danych. Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin. Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Zadania analityczne (1) Analiza przewiduje badanie podobieństw

Bardziej szczegółowo

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW ODRZUCANIE WYNIKÓW OJEDYNCZYCH OMIARÓW W praktyce pomiarowej zdarzają się sytuacje gdy jeden z pomiarów odstaje od pozostałych. Jeżeli wykorzystamy fakt, że wyniki pomiarów są zmienną losową opisywaną

Bardziej szczegółowo

4.3 Grupowanie według podobieństwa

4.3 Grupowanie według podobieństwa 4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi

Bardziej szczegółowo

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki

Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy

Bardziej szczegółowo

Kurs Chemometrii Poznań 28 listopad 2006

Kurs Chemometrii Poznań 28 listopad 2006 Komisja Nauk Chemicznych Polskiej Akademii Nauk Oddział w Poznaniu Wydział Technologii Chemicznej Politechniki Poznańskiej w Poznaniu GlaxoSmithKline Pharmaceuticals S.A. w Poznaniu Stowarzyszenie ISPE

Bardziej szczegółowo

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych

Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych Typowe błędy w analizie rynku nieruchomości przy uŝyciu metod statystycznych Sebastian Kokot XXI Krajowa Konferencja Rzeczoznawców Majątkowych, Międzyzdroje 2012 Rzetelnie wykonana analiza rynku nieruchomości

Bardziej szczegółowo

STATYSTYKA REGIONALNA Marcin Salamaga Wydatki gospodarstw domowych według województw w 2006 r.

STATYSTYKA REGIONALNA Marcin Salamaga Wydatki gospodarstw domowych według województw w 2006 r. Spis treści nr 4/2009 Wiadomości Statystyczne STUDIA METODOLOGICZNE Jacek Białek, Henryk Gadecki Szacowanie współczynników w teście normalności Shapiro-Wilka Andrzej Młodak Hierarchiczność a porządkowanie

Bardziej szczegółowo

PORÓWNANIE TREŚCI ZAWARTYCH W OBOWIĄZUJĄCYCH STANDARDACH EGZAMINACYJNYCH Z TREŚCIAMI NOWEJ PODSTAWY PROGRAMOWEJ

PORÓWNANIE TREŚCI ZAWARTYCH W OBOWIĄZUJĄCYCH STANDARDACH EGZAMINACYJNYCH Z TREŚCIAMI NOWEJ PODSTAWY PROGRAMOWEJ PORÓWNANIE TREŚCI ZAWARTYCH W OBOWIĄZUJĄCYCH STANDARDACH EGZAMINACYJNYCH Z TREŚCIAMI NOWEJ PODSTAWY PROGRAMOWEJ L.p. 1. Liczby rzeczywiste 2. Wyrażenia algebraiczne bada, czy wynik obliczeń jest liczbą

Bardziej szczegółowo

Przykładowa analiza danych

Przykładowa analiza danych Przykładowa analiza danych W analizie wykorzystano dane pochodzące z publicznego repozytorium ArrayExpress udostępnionego na stronach Europejskiego Instytutu Bioinformatyki (http://www.ebi.ac.uk/). Zbiór

Bardziej szczegółowo

STATYSTYKA wykład 5-6

STATYSTYKA wykład 5-6 TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy

Bardziej szczegółowo

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

KADD Metoda najmniejszych kwadratów funkcje nieliniowe Metoda najmn. kwadr. - funkcje nieliniowe Metoda najmniejszych kwadratów Funkcje nieliniowe Procedura z redukcją kroku iteracji Przykłady zastosowań Dopasowanie funkcji wykładniczej Dopasowanie funkcji

Bardziej szczegółowo

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych.

Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych. Klasyfikacja województw według ich konkurencyjności przy pomocy metod taksonomicznych oraz sieci neuronowych. Krzysztof Karpio, Piotr Łukasiewicz, rkadiusz Orłowski, rkadiusz Gralak Katedra Ekonometrii

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl. wersja 20.01.2013/13:40 Statystyka dr Tomasz Giętkowski www.krajobraz.ukw.edu.pl wersja 20.01.2013/13:40 Tematyka wykładów 1. Definicja statystyki 2. Populacja, próba 3. Skale pomiarowe 4. Miary położenia (klasyczne i pozycyjne)

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY Liczebności i częstości Liczebność liczba osób/respondentów/badanych, którzy udzielili tej konkretnej odpowiedzi. Podawana w osobach. Częstość odsetek,

Bardziej szczegółowo

Statystyczne metody analizy danych

Statystyczne metody analizy danych Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem

Bardziej szczegółowo

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)?

Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Pytanie: Kiedy do testowania hipotezy stosujemy test F (Fishera-Snedecora)? Gdy: badana cecha jest mierzalna (ewentualnie policzalna); dysponujemy dwoma próbami; chcemy porównać, czy wariancje w tych próbach

Bardziej szczegółowo

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich Zmienne muszą być zmiennymi ilościowym (liczymy i porównujemy średnie!) Są to testy parametryczne Nazwa

Bardziej szczegółowo

Planimetria 1 12 godz.

Planimetria 1 12 godz. Planimetria 1 1 godz. Funkcje trygonometryczne kąta ostrego 1 definicje funkcji trygonometrycznych kąta ostrego wartości funkcji trygonometrycznych kątów 30º, 45º, 60º Trygonometria zastosowania Rozwiązywanie

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Rozwiązania zadań. Arkusz maturalny z matematyki nr 1 POZIOM PODSTAWOWY

Rozwiązania zadań. Arkusz maturalny z matematyki nr 1 POZIOM PODSTAWOWY Rozwiązania zadań Arkusz maturalny z matematyki nr POZIOM PODSTAWOWY Zadanie (pkt) Sposób I Skoro liczba jest środkiem przedziału, więc odległość punktu x od zapisujemy przy pomocy wartości bezwzględnej.

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych

Bardziej szczegółowo

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k: Statystyczne opracowanie danych pomiarowych W praktyce pomiarowej często spotykamy się z pomiarami wielokrotnymi, gdy podczas pomiaru błędy pomiarowe (szumy miernika, czynniki zewnętrzne) są na tyle duże,

Bardziej szczegółowo

W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora.

W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora. 1. Podstawy matematyki 1.1. Geometria analityczna W naukach technicznych większość rozpatrywanych wielkości możemy zapisać w jednej z trzech postaci: skalara, wektora oraz tensora. Skalarem w fizyce nazywamy

Bardziej szczegółowo

Statystyka opisowa SYLABUS A. Informacje ogólne

Statystyka opisowa SYLABUS A. Informacje ogólne Statystyka opisowa SYLABUS A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod Język Rodzaj Rok

Bardziej szczegółowo

Graficzna prezentacja danych statystycznych

Graficzna prezentacja danych statystycznych Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do

Bardziej szczegółowo

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74

4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74 3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15

Bardziej szczegółowo

Wykład 10 Zrandomizowany plan blokowy

Wykład 10 Zrandomizowany plan blokowy Wykład 10 Zrandomizowany plan blokowy Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności wewnątrz każdej grupy zabiegowej. Dzielimy

Bardziej szczegółowo

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Dwuczynnikowa analiza wariancji (2-way

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r

Statystyka matematyczna Test χ 2. Wrocław, 18.03.2016r Statystyka matematyczna Test χ 2 Wrocław, 18.03.2016r Zakres stosowalności Testowanie zgodności Testowanie niezależności Test McNemara Test ilorazu szans Copyright 2014, Joanna Szyda ZAKRES STOSOWALNOŚCI

Bardziej szczegółowo

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński

Własności estymatora parametru lambda transformacji potęgowej. Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński Własności estymatora parametru lambda transformacji potęgowej Janusz Górczyński, Andrzej Zieliński, Wojciech Zieliński 1. Wstęp Najczęstszym powodem transformowania zmiennej losowej jest jej normalizacja,

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć Katalog wymagań programowych na poszczególne stopnie szkolne Matematyka. Poznać, zrozumieć Kształcenie w zakresie podstawowym. Klasa 3 Poniżej podajemy umiejętności, jakie powinien zdobyć uczeń z każdego

Bardziej szczegółowo

Zadania o numerze 4 z zestawów licencjat 2014.

Zadania o numerze 4 z zestawów licencjat 2014. Zadania o numerze 4 z zestawów licencjat 2014. W nawiasie przy zadaniu jego występowanie w numerze zestawu Spis treści (Z1, Z22, Z43) Definicja granicy ciągu. Obliczyć granicę:... 3 Definicja granicy ciągu...

Bardziej szczegółowo

PF11- Dynamika bryły sztywnej.

PF11- Dynamika bryły sztywnej. Instytut Fizyki im. Mariana Smoluchowskiego Wydział Fizyki, Astronomii i Informatyki Stosowanej Uniwersytetu Jagiellońskiego Zajęcia laboratoryjne w I Pracowni Fizycznej dla uczniów szkół ponadgimnazjalych

Bardziej szczegółowo

Rodzaje badań statystycznych

Rodzaje badań statystycznych Rodzaje badań statystycznych Zbieranie danych, które zostaną poddane analizie statystycznej nazywamy obserwacją statystyczną. Dane uzyskuje się na podstawie badania jednostek statystycznych. Badania statystyczne

Bardziej szczegółowo

Model procesu dydaktycznego

Model procesu dydaktycznego Model procesu dydaktycznego w zakresie Business Intelligence Zenon Gniazdowski 1,2), Andrzej Ptasznik 1) 1) Warszawska Wyższa Szkoła Informatyki, ul. Lewartowskiego 17, Warszawa 2) Instytut Technologii

Bardziej szczegółowo

Plan wynikowy i przedmiotowy system oceniania

Plan wynikowy i przedmiotowy system oceniania Plan wynikowy i przedmiotowy system oceniania Przedmiot: Pracownia ekonomiczna Klasa II Technikum Ekonomiczne Nr programu nauczania: 341[02]/MEN/2008.05.20 (technik ekonomista) Podręcznik: R. Seidel, S.

Bardziej szczegółowo

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie

Bardziej szczegółowo

Inwestycje finansowe. Wycena obligacji. Stopa zwrotu z akcji. Ryzyko.

Inwestycje finansowe. Wycena obligacji. Stopa zwrotu z akcji. Ryzyko. Inwestycje finansowe Wycena obligacji. Stopa zwrotu z akcji. yzyko. Inwestycje finansowe Instrumenty rynku pieniężnego (np. bony skarbowe). Instrumenty rynku walutowego. Obligacje. Akcje. Instrumenty pochodne.

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Plan wykładu 1. Metody wnioskowania statystycznego vs. metody opisu 2. Testowanie hipotez statystycznych

Bardziej szczegółowo

Plan wynikowy klasa 3

Plan wynikowy klasa 3 Plan wynikowy klasa 3 Przedmiot: matematyka Klasa 3 liceum (technikum) Rok szkolny:........................ Nauczyciel:........................ zakres podstawowy: 28 tyg. 3 h = 84 h (78 h + 6 h do dyspozycji

Bardziej szczegółowo

Analiza Współzależności

Analiza Współzależności Statystyka Opisowa z Demografią oraz Biostatystyka Analiza Współzależności Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka

Bardziej szczegółowo

Analiza wielowymiarowa sytuacji ekonomicznej Polski oraz krajów Azji i Europy Wschodniej

Analiza wielowymiarowa sytuacji ekonomicznej Polski oraz krajów Azji i Europy Wschodniej Analiza wielowymiarowa sytuacji ekonomicznej Polski oraz krajów Azji i Europy Wschodniej Wstęp Anna Żemojtel Leszek Boguszewski Koło Naukowe Metod Ilościowych przy Katedrze Statystyki Wydziału Zarządzania

Bardziej szczegółowo

Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji

Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji Jacek Szcześniak Jerzy Błaszczyński Roman Słowiński Poznań, 5.XI.2013r. Konspekt Wstęp Wprowadzenie Metody typu wrapper Nowe metody

Bardziej szczegółowo

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we

Bardziej szczegółowo

I KONFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW

I KONFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach I KONFERENCJA KOŁA NAUKOWEGO STATYSTYKÓW ZASTOSOWANIE NARZĘDZI INFORMATYCZNYCH W PROCESIE NAUCZANIA STATYSTYKI 28 kwietnia 2005 ZASTOSOWANIE NARZĘDZI

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia

Bardziej szczegółowo

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak Tytuł: Autor: ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak Wstęp Zaawansowane metody analiz statystycznych przenoszą analizy statystyczne na kolejny wyższy poziom. Określenie tego wyższego

Bardziej szczegółowo

O ŚREDNIEJ STATYSTYCZNEJ

O ŚREDNIEJ STATYSTYCZNEJ O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla Młodych Matematyków Rachunek Prawdopodobieństwa i Statystyka Kraków, 20 26 IX 2009 r. WYNIKI OBSERWACJI X 1, X 2,..., X n WYNIKI

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test

Bardziej szczegółowo

Statystyczne sterowanie procesem

Statystyczne sterowanie procesem Statystyczne sterowanie procesem SPC (ang. Statistical Process Control) Trzy filary SPC: 1. sporządzenie dokładnego diagramu procesu produkcji; 2. pobieranie losowych próbek (w regularnych odstępach czasu

Bardziej szczegółowo

Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym

Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym Zeszyty Naukowe Wyższej Szkoły Bankowej w Poznaniu Nr 42/2012 Rafał Klóska Uniwersytet Szczeciński Statystyczna analiza poziomu rozwoju społeczno-gospodarczego w Polsce - w ujęciu regionalnym Streszczenie.

Bardziej szczegółowo

WPŁYW PROGRAMÓW ROLNOŚRODOWISKOWYCH JAKO INSTRUMENTÓW POLITYKI NA WARTOŚĆ DODANĄ W POLSKICH GOSPODARSTWACH ROLNYCH

WPŁYW PROGRAMÓW ROLNOŚRODOWISKOWYCH JAKO INSTRUMENTÓW POLITYKI NA WARTOŚĆ DODANĄ W POLSKICH GOSPODARSTWACH ROLNYCH WPŁYW PROGRAMÓW ROLNOŚRODOWISKOWYCH JAKO INSTRUMENTÓW POLITYKI NA WARTOŚĆ DODANĄ W POLSKICH GOSPODARSTWACH ROLNYCH dr Agata Sielska mgr Aleksandra Pawłowska Struktura Wpływ programów rolnośrodowiskowych

Bardziej szczegółowo

Plan wynikowy. Klasa III Technik pojazdów samochodowych/ Technik urządzeń i systemów energetyki odnawialnej. Kształcenie ogólne w zakresie podstawowym

Plan wynikowy. Klasa III Technik pojazdów samochodowych/ Technik urządzeń i systemów energetyki odnawialnej. Kształcenie ogólne w zakresie podstawowym Oznaczenia: wymagania konieczne, P wymagania podstawowe, R wymagania rozszerzające, D wymagania dopełniające, W wymagania wykraczające. Plan wynikowy lasa III Technik pojazdów samochodowych/ Technik urządzeń

Bardziej szczegółowo

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą

Bardziej szczegółowo

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja

Bardziej szczegółowo

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy

Przykłady bloków: Przykład. Przyporządkowanie. Wykład 9 Zrandomizowany plan blokowy Wykład 9 Zrandomizowany plan blokowy Staramy się kontrolować efekty zróżnicowania badanych jednostek eksperymentalnych poprzez zapewnienie ich ``jednorodności wewnątrz każdej grupy zabiegowej. Dzielimy

Bardziej szczegółowo

Komputerowa Analiza Danych Doświadczalnych

Komputerowa Analiza Danych Doświadczalnych Komputerowa Analiza Danych Doświadczalnych dr inż. Adam Kisiel kisiel@if.pw.edu.pl pokój 117b (12b) 1 Materiały do wykładu Transparencje do wykładów: http://www.if.pw.edu.pl/~kisiel/kadd/kadd.html Literatura

Bardziej szczegółowo