Nowoczesne techniki matematyczne, statystyczne i informatyczne

Podobne dokumenty
Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Statystyka Matematyczna Anna Janicka

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Schemat oceniania: Wstęp do statystyki praktycznej. Zalecane podręczniki: Dodatkowe uwagi: Przygotowanie studenta do zajęć:

Statystyka stosowana. Podreczniki. Oceny. Przygotowanie do zajęć

Wstęp do statystyki praktycznej. Semestr zimowy 2019/2020 Wykładowca: dr Damian Brzyski Strona internetowa:

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Przedmiot statystyki. Graficzne przedstawienie danych.

Oceny. Podreczniki. Dane. Statystyka matematyczna i stosowana

Oceny. Statystyka stosowana. Podreczniki. Przygotowanie do zajęć. Dane

Oceny: Wstęp do statystyki praktycznej. Zalecane podręczniki: Dodatkowe uwagi:

Oceny: Statystyka stosowana. Zalecane podręczniki: Dane. Dodatkowe uwagi: Przygotowanie studenta do zajęć:

Laboratorium 3 - statystyka opisowa

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

Wykład 3. Rozkład normalny

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Wykład 4: Statystyki opisowe (część 1)

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Pozyskiwanie wiedzy z danych

Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

W1. Wprowadzenie. Statystyka opisowa

Wykład 5: Statystyki opisowe (część 2)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 9 Wnioskowanie o średnich

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

You created this PDF from an application that is not licensed to print to novapdf printer (

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

1 Podstawy rachunku prawdopodobieństwa

Z-LOGN1-006 Statystyka Statistics

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Próba własności i parametry

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Z-0033z Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki. Stacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka opisowa- cd.

Wykład 4 Związki i zależności

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Estymacja parametrów w modelu normalnym

Przedmiot statystyki. Graficzne przedstawienie danych.

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

Statystyka matematyczna i ekonometria

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Sposoby prezentacji problemów w statystyce

Z poprzedniego wykładu

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

Z-LOG-033I Statystyka Statistics

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1

INFORMATYKA W SELEKCJI

Statystyki opisowe i szeregi rozdzielcze

CZEŚĆ PIERWSZA. Wymagania na poszczególne oceny,,matematyka wokół nas Klasa III I. POTĘGI

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

Wykład 10: Elementy statystyki

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Analiza statystyczna w naukach przyrodniczych

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Inżynierskie zastosowania statystyki Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Wydział Nauki o Zdrowiu. Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska

INFORMACJE O WYNIKACH EGZAMINU ZAWODOWEGO W KWALIFIKACJI M.11. EKSPLOATACJA ZŁÓŻ PODZIEMNYCH

Materiał dotyczy generowania różnego typu wykresów w środowisku R.

WYMAGANIA Z MATEMATYKI NA POSZCZEGÓLNE OCENY KLASYFIKACYJNE DLA UCZNIÓW KLAS TRZECICH. Sposoby sprawdzania wiedzy i umiejętności uczniów

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Skrypt 29. Statystyka. Opracowanie L2

Wykład 2. Transformacje (przekształcenia) danych

Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

Transkrypt:

Nowoczesne techniki matematyczne, statystyczne i informatyczne Wykładowca : Krzysztof Bogdan Biuro : C-11, p. 2.12 http://prac.im.pwr.wroc.pl/~bogdan/

Twój wynik z wykładów: zadania domowe (25%) kartkówki (25%) kolokwium 1 (25%) kolokwium 2 (25%) Ocena z kursu=50% wynik z wykładu+50% wynik z laboratoriów; 90%=bdb, 70%=db, 50%=dst. Obecność na zajęciach jest wymagana. Zadania domowe i kartkówki po terminie nie są dopuszczane. Należy informować o spodziewanej absencji na egzaminie.

Podręczniki (biblioteka C-11): J. Koronacki, J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, 2009 N. Fieller, Basics of Matrix Algebra for Statistics with R, CRC Press, 2016 D. Moore, G. McCabe, Introduction to the Practice of Statistics, ed. IV, Freeman, 2003

Do zrobienia.. Miej kalkulator na testy. Zainstaluj R na swoim komputerze. Regularnie odwiedzaj stronę internetową dla harmonogramu, notatek z wykładów, zadań, rozwiązań, tablic statystycznych i tp.

Dane: Używamy danych do odpowiedzi na pytania naukowe. Dane wykazują zmienność/szum. Aby wykorzystać informacje zawarte w danych należy odróżnić sygnał od szumu.

Przykład Zbadaj wpływ ćwiczeń na poziom cholesterolu. Jedna grupa ćwiczy, a druga nie. Czy w wyniku ćwiczeń zmniejsza się poziom cholesterolu? Rozważmy: ludzie się różnią poziomem odpowiedzi zewnętrzne czynniki mogą mieć duży wpływ ćwiczenia mogą wpływać na inne czynniki

Co to jest Statystyka? Nauka rozumienia danych i podejmowania decyzji w obliczu zmienności/losowości. Zestaw metod planowania eksperymentu i analizy danych w celu uzyskania informacji i określenia jej wiarygodności.

Rozdział 1.1 Jednostki i zmienne Jednostki - obiekty (ludzie, zwierzęta, rzeczy) opisane przez zbiór danych Zmienne charakterystyki/opisy jednostek

Rodzaje zmiennych Zmienne Jakościowe Ilościowe Porządkowe Nie porządkowe Ciągłe Dyskretne

Rodzaje zmiennych 1. Ilościowe (liczbowe) Ciągłe: np. wysokość, waga, stężenie Dyskretne: np. liczba klientów, kwiatów na łodydze 2. Jakościowe (nieliczbowe) Porządkowe: np. wybory w ankiecie: nigdy, rzadko, niekiedy, często, zawsze Nieporządkowe: np. kształt, płeć

Przykład: Informacje o pracownikach

Opisowa analiza danych: zmienne Rozkład = opis liczebności lub składu procentowego Zmienne jakościowe: rozkład ilustrujemy np. wykresem słupkowym lub kołowym. Zmienne ilościowe: rozkład ilustrujemy np. diagramem pnia i liścia lub histogramem.

Rozkład zmiennych jakościowych: np. Wykształcenie 25-34-latków w USA Wykształcenie Liczba (mln) Procent Poniżej szkoły średniej Ukończona szkoła średnia 4.7 12.3 11.8 30.7 Studium 10.9 28.3 Licencjat 8.5 22.1 Magisterium itd. 2.5 6.6

Wykres słupkowy Wykształcenia

Wykres kołowy Wykształcenia

Rozkład zmiennych ilościowych Indywidualne obserwacje zwykle się różnią - obserwujemy chmurę zamiast kilku wartości Rozkład zmiennych ilościowych jest ilustrowany histogramem

Rzut oka na rozkład: Diagram pnia i liścia Liść = ostatnia (najmniej znacząca) cyfra Łodyga = pozostałe cyfry Przykład: liczba home runs, które Babe Ruth zdobył w ciągu15 lat w New York Yankees: 54 59 35 41 46 25 47 60 54 46 49 46 41 34 22

Sporządź Diagram pnia i liścia: (BR z lewej)

Dwa diagramy pnia i liścia obok siebie Porównaj liczby home runs dla Babe Ruth i Marka McGwire: 9 9 22 29 32 32 33 39 39 42 49 52 58 65 70 Uwaga: Możemy zwiększyć liczbę łodyg poprzez podzielenie ich na dwie części, np. jeden z liśćmi od 0 do 4, a drugi z liśćmi od 5 do 9. Możemy również zaokrąglić liczby przed wykonaniem diagramu pnia i liścia.

Opisywanie rozkładów Opisz wzór: Kształt np. symetryczny lub skośny; liczbę mod Położenie np. punkt środkowy (mediana) Rozrzut np. odstęp pomiędzy maksimum i minimum wartości. Szukaj wartości odstających (outlier) wartości, które odbiegają od reszty.

Rozkład: ilustracja Histogramem

Tabela rozkładu dla Hispanic data Klasa Liczność Procent Klasa Liczność Procent 0.1-5 30 60 20.1-25 1 2 5.1-10 10 20 25.1-30 2 4 10.1-15 4 8 30.1-35 0 0 15.1-20 2 4 35.1-40 1 2

Histogram dla proporcji Hispanic adults

Histogram, uwagi: Klasy histogramu to przedziały. Klasy powinny być dogodne; zwykle mają równą długość; zawsze pokrywają pełny zakres danych. Wybór liczby klas nie jest prosty; wybierz kilka klas dla kilkudziesięciu obserwacji. Histogram liczności = ma liczności. Histogram częstości = ma częstości (procenty, %).

Etykietowanie wykresu jest ważne! Oś pozioma jest dla zmiennej. Oś pionowa jest dla liczności albo częstości/procentów. Pamiętaj, żeby opisać osie, jak w naszych przykładach.

... + 24,800 nanosekund

Wypełnij tabelę częstości dla danych Newcomba 20-24.9 25-29.9

Narysuj histogram liczności dla danych Newcomba. Następnie - histogram częstości.

Histogram dla danych Newcomba (zob. obs. odstające)

Inne wykresy: np. szeregi czasowe Mogą wskazywać na ukryte mechanizmy: Trend długotrwały wzrost lub spadek Zmienność sezonowa schemat powtarzający się okresowo w czasie takie wykresy będą mniej ważne w tym kursie.

Szereg czasowy dla danych Newcomba.

Rozdział 1.2 Opisywanie rozkładu liczbami: Średnia Mediana Kwartyle Wykres pudełkowy (Boxplot) Odchylenie standardowe Zmiana jednostki miary

Miary położenia Średnia Średnia arytmetyczna danych Oznaczana x xx 12. x x 1 n n n xi Średnia jest wrażliwa na obserwacje odstające, tzn. nie jest odporna.

Statystyki (do uzupełniania): Minicomp. City Minicomp. Highway Two-seater City Two-seater Highway Two-seater City w/t outlier Two-seater Highway w/t outlier Średnia Mediana Q1 Q3 Odchyl. stdand.

Mediana Mediana to środek rozkładu: Posortuj dane w porządku rosnącym. Mediana jest równa (n + 1)/2-szej obserwacji, jeśli n jest nieparzyste i jest to średnia z dwóch środkowych wartości, jeśli n jest parzyste. Mediana jest odporną miarą położenia, tzn. obserwacje odstające nie wpływają znacząco na medianę.

Średnia a Mediana W rozkładzie symetrycznym średnia = mediana. W rozkładzie skośnym średnia jest bardziej przesunięta w kierunku długiego ogona. Przykład: Średnia cena domów sprzedanych w 2000 r. wyniosła 176,200 $. Mediana cena sprzedaży wyniosła 139,000 $.

Miary rozrzutu Kwartyle: Q2 (drugi kwartyl) = mediana Q1 (pierwszy kwartyl) = mediana dolnej "połowy" posortowanych danych Q3 (trzeci kwartyl) = mediana górnej połowy danych p-ty kwantyl - liczba x taka, że około p procent obserwacji jest mniejszych niż x. Q1, Q2, Q3 to 0.25, 0.50, 0.75-ty kwantyl.

Definicja obserwacji odstającej Odstęp międzykwartylowy: IQR=Q3-Q1 Obserwacja jest odstająca, jeśli jest ponad 1.5 * IQR powyżej trzeciego kwartyla lub jest 1,5 * IQR poniżej pierwszego kwartyla. Często usuwamy wartości odstające z danych. U nas zrobimy to z Hondą Insight. Dlaczego?

Pięcioliczbowy opis rozkładu Minimum, Q1, Mediana, Q3, Maximum Boxplot wizualizacja pięciu liczb jw.

Histogram...

...i (zmodyfikowany) boxplot (pokazano obserwacje odstające).

Odchylenie standardowe Odchylenie i-tej obserwacji: Wariancja próbkowa: xi x ( xx ) ( xx ). ( xx ) 1 s ( ) n1 n1 standarddeviation: s 2 2 2 2 1 2 n 2 xi x 1 s = s ( xx ) n 1 2 2 i

1792 1666 1362 1614 1460 1867 1439 Średnia=1600 Odchylenie 1 =1792-1600=192 Odchylenie 7 =1439-1600=-161 s=189.24

Własności odchylenia standardowego s = 0, gdy nie ma rozrzutu s nie jest odporne Pięcioliczbowy opis rozkładu zazwyczaj lepiej opisuje rozkład skośny i/lub rozkład z wartościami odstającymi. Średnia i odchylenie standardowe są zwykle używane dla symetrycznych rozkładów bez wartości odstających.

Transformacje Liniowe: x nowe =a+bx stare Examples: x mile =0.62 x km x g =28.35 x oz 5 1605 x( x 32) x celsius fahr 9 99 fahr

Transformacje liniowe nie zmieniają kształtu rozkładu. Zmieniają one położenie i rozrzut, np.: Małe pytony 1 2 3 4 5 oz 1.13 1.02 1.23 1.06 1.16 g 32 29 35 30 33

Wpływ transformacji liniowej: x nowy =a+bx stary średnianowa=a+b*średniastara mediananowa=a+b*medianastara odch.stadnowe= b *odch.stdstare IRQnowe= b *IRQstare

Oblicz średnią, medianę i odchylenie standard. dla wagi pytonów w [g] w [oz] Średnia Mediana SD