TEORETYCZNE PODSTAWY INFORMATYKI
|
|
- Edyta Sikora
- 6 lat temu
- Przeglądów:
Transkrypt
1 1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana II stopień studiów
2 Wykład 13a 2 Eksploracja danych Co to są dane W jaki sposób zbieramy dane W jaki sposób reprezentujemy dane W jaki sposób analizujemy dane W jaki sposób wyciągamy wnioski
3 Macierz danych 3 obserwacja zmienna
4 Typy danych 4 Wszystkie dane numeryczne (ilościowe) maja wartości liczbowe; można dodawać, odejmować, wyliczać średnią, itd. opisowe (jakościowe) Skończona ilość kategorii; mogą być oznaczone wartościami liczbowymi ale nie podlegają operacjom arytmetycznym.
5 Typy danych 5 Wszystkie dane numeryczne opisowe ciągłe dyskretne dowolne uporządkowane Przyjmują dowolne wartości z jakiegoś przedziału Przyjmują jedną z określonego zbioru wartości Poziomy mają wewnetrzną kolejność
6 Macierz danych 6 country nazwa kraju opisowa
7 Macierz danych 7 cr_req ilość żądań usunięcia wpisu na www wysłany do Google dyskretna, numeryczna
8 Macierz danych 8 cr_comply procent żądań zaakceptowany przez Google ciągła, numeryczna
9 Macierz danych 9 opisowa hemisphere na jakiej półkuli jest dany kraj
10 Macierz danych 10 opisowa uporządkowana hdi poziom życia w danym kraju
11 Relacja pomiędzy danymi 11 Te dwie zmienne są ze sobą powiązane (skorelowane) Ta korelacja może być dalej sklasyfikowana jako pozytywna lub negatywna Jeżeli nie obserwujemy korelacji to mówimy że zmienne są niezależne.
12 W jaki sposób zbieramy dane? 12 badania obserwacja eksperyment Nie zaburza procesu w którym dane napływają Pozwala tylko na badanie związków pomiędzy danymi Retrospektywne: dot. przeszłości Prognozowane: dot. przyszłości Losowe przyporządkowuje podmiot do kategorii Pozwala na badanie związków przyczyna-skutek
13 13 Pytanie: czy zaliczenie kursu jest związane z poziomem aktywności obserwacja eksperyment
14 Czy teza Jedzenie corn-flakes na śniadania sprzyja prawidłowej wadze jest prawdziwa? 14 Korelacja nie oznacza wynikania! Ukryta zmienna
15 W jaki sposób zbierać dane? 15 Spis czyli przebadać cały zbiór? Niektórzy osobnicy mogą być trudni do zlokalizowania lub przebadania, ale też prawdopodobnie będą inni niż cała reszta osobników Zbiór osobników na ogół nie jest stabilny Wybrać tylko reprezentatywną próbkę? Tak ale uwaga na możliwość baiasowania: Np. tylko łatwo dostępni osobnicy Np. tylko volontariusze?
16 W jaki sposób wybierać próbkę? 16 Wybieramy losowo osobników (random sampling) Dzielimy na różne kategorie (divide & conquer), wybieramy losowo kilka kategorii i następnie losowo kilku osobników z każdej z wybranych kategorii. (stratifying) Dzielimy na identyczne podzbiory (warstwy) i wybieramy losowo osobników z kilku losowo wybranych podzbiorów (clustering)
17 W jaki sposób planować eksperyment? 17 Próbka kontrolna (control sample): porównuj wynik dla testowanej próbki i dla próbki kontrolnej Losowość (randomize): wybierz z próbki losowo osobników którzy są podlegają testowaniu Grupowanie (blocking): pogrupuj wpierw osobników względem zmiennej o której wiemy że może wpływać na wynik badania Powtarzanie (replicate): powtarzaj testowanie wielokrotnie na różnych próbkach
18 Przykład: grupowanie 18 Zaplanuj eksperyment badający czy napój energetyzujący pomaga biegać? Próbka testowana: podajemy napój Próbka kontrolna: nie podajemy napoju Ale profesjonaliści mogą różnie reagować na napój niż amatorzy Grupuj najpierw ze względu na status: Podziel osobników na pro, amator Podziel każdą grupę na testowaną i kontrolną Pro i amator są jednakowo reprezentowani w próbce testowanej i kontrolnej.
19 Wizualizacja danych 19
20 Wizualizacja danych 20
21 Wizualizacja danych 21
22 Związki pomiędzy zmiennymi 22
23 Histogram 23 Pozwala obejrzeć jaki jest rozkład funkcji gęstości Dogodny aby zilustrować kształt rozkładu
24 Przekrzywienia (skewed) 24 Rozkłady są przekrzywione w stronę długich ogonów rozkładu
25 Modalność rozkładu 25
26 Histogram i szerokość binu 26 Wybór szerokości binu może zakryć informację o strukturze
27 Punktowe ploty 27 Też wygodny, ale przy niedużej statystyce
28 Box-plot 28 Wygodny aby zaznaczyć medianę ( < 50% rozkładu), zakres międzykwartylowy (IQR), outliers IQR Q1-Q3 : zakres w którym mieści się 50% danych, dystans od pierwszej (Q1 = 25%) do trzeciej (Q3=75%) kwartyli
29 Wizualizacja danych 29
30 Mapa gęstości 30
31 Kształt rozkładu 31
32 Jeden parameter: środek rozkładu 32 Mean: średnia arytmetyczna średnia z próbki średnia całej populacji Mode: wartość o największym prawdopodobieństwie Mediana: środek rozkładu (poniżej znajduje się 50% przypadkow)
33 Przykład: wynik egzaminu 9-ciu studentów 33 A gdyby było 10-ciu
34 Wracamy do tabelki 34
35 Wizualizacja danych 35
36 Skrzywienie vs środek 36
37 Wariancja 37 w przybliżeniu średni kwadrat odchylenia od średniej Przykład: zakładając że średni czas życia jest 70.5 lat tabelce mamy 201 krajów i w
38 Wariancja 38 Dlaczego różnicę podnosimy do kwadratu? Aby dodatnie i ujemne różnice nawzajem się nie znosiły Aby zwiększyć wkład od dużych różnic bardziej niż od małych
39 Odchylenie standardowe 39 W przybliżeniu średnie odchylenie od wartości średniej i jest w tych samych jednostkach co dane
40 Zmienność vs różnorodność 40 Który z zestawów ma większą różnorodność kolorów
41 Zmienność vs różnorodność 41 Który z zestawów ma większą różnorodność kolorów
42 Zmienność vs różnorodność 42 Który z zestawów ma większą zmienność zużycia benzyny?
43 Zmienność vs różnorodność 43 Który z zestawów ma większą zmienność zużycia benzyny? (zmienność = rozrzut)
44 Zakres międzykwartylowy (interquartile range) 44 Zakres w którym mieści się 50% danych, dystans od pierwszej (25%) do trzeciej (75%) kwartyli
45 Odporna statystyka 45 Czyli taka aby ekstremalne wartości miały mały wpływ na parametry populacji Przykład:
46 Odporna statystyka 46 Czyli taka aby ekstremalne wartości miały mały wpływ na wartość badaną
47 Transformacja danych 47 To jest operacja na danych przy pomocy jakiejś funkcji, np. logarytm Jeżeli rozkład w danych jest bardzo przekrzywiony (ma długi ogon) używamy transformacji aby go było łatwiej modelować Inne przykłady: Zobaczyć dane w innej reprezentacji Zredukować skrzywienia rozkładu Wyprostować zależność na scatter plocie
48 Transformacja przy pomocy log e 48 Naturalny log czyli przy podstawie e. Wygodny jeżeli dane sklastrowane koło zera.
49 Przekształcenie przy pomocy logarytmu 49 Po przekształceniu zależność pomiędzy zmiennymi bardziej liniowa, łatwiejsza do modelowania.
50 Inne transformacje 50
51 Zmienne opisowe 51 Tabela Wykres słupkowy (bar plot)
52 Wykres słupkowy a histogram 52 Wykres słupkowy używamy do wizualizacji zmiennych opisowych Kolejność słupków może być zmieniana Histogram używamy do wizualizacji zmiennych numerycznych oś-x jest zmienna numeryczna, ustalona kolejność binów
53 Wykres kołowy (pie chart) 53 Raczej bezużyteczny do analizy ilościowej ale wygodny do ilustracji
54 Segmentowany wykres słupkowy 54 Wygodny aby wizualizować względne częstości i je ze sobą porównywać
55 Wykres słupkowy względnej częstości 55
56 Wykres mozaikowy 56
57 Kilka wykresów pudełkowych 57
58 Wnioskowanie statystyczne: przykład 58 Przykład: Badanie hipotezy o dyskryminacji kobiet 48 mężczyzn-kierowników analizowało te same akta personalne aby podjąć decyzję o promocji Akta były identyczne, różna była tylko zaznaczona płeć Losowo rozdzielono akta pomiędzy kierowników 35/48 akt uzyskało promocje Czy kobiety były dyskryminowane?
59 Dane 59 Różnica w proporcji: 88% - 58% = 30%
60 Dwa możliwe wnioski 60 Hipoteza O (null hypothesis). Dyskryminacja nie występuje, wynik jest losową fluktuacją Hipoteza A (alternative hypothesis) Tak kobiety były dyskryminowane, wynik jest statystycznie znaczący Test statystyczny: może stwierdzić że nie ma podstaw aby wyeliminować H 0 lub stwierdzić że są podstawy i przyjąć H A
61 Jak testujemy hipotezę 61 Startujemy z H 0 przyjmując że reprezentuje status quo Formułujemy hipotezę H A w postaci pytania na które chcemy odpowiedzieć Przeprowadzamy test, zakładając że H 0 jest prawdziwe, albo przy pomocy symulacji albo rozważań teoretycznych Jeżeli przeprowadzona symulacja nie daje przekonywującej ewidencji na H A, przyjmujemy że odpowiedź jest H 0 Jeżeli daje, odrzucamy H 0 i przyjmujemy że odpowiedź jest H A
62 Symulacja: weźmy talię kart 62 twarze reprezentują nie-promowanych, liczby reprezentują promowanych Odrzucamy jokery Odrzucamy 3 Asy zostaje 13 twarzy (A, K, D, W) Odrzucamy 1 kartę z liczbą zostaje 35 liczb
63 Przygotowujemy symulację 63
64 Kolejne kroki 64 1) Tasujemy karty 2) Dzielimy na dwie grupy (losowo) reprezentujące mężczyzn i kobiety 3) Liczymy ilość liczbowych kart w każdej grupie, reprezentuje to promocje 4) Liczmy proporcje promocji w każdej grupie, zapisujemy wynik różnicy w proporcji 5) Powtarzamy (1) (4) wielokrotnie
65 Tasujemy, dzielimy na grupy 65
66 Liczymy proporcje promocji w każdej grupie 66
67 Zaznaczamy wynik na wykresie 67
68 Powtarzamy symulacje wiele razy wynik promocji
69 Interpretacja wyników 69 Wyniki z symulacji nie wyglądają jak dane, przyjmujemy za prawdę hipotezę H A Różnica 0.30 to daleki ogon rozkładu, możemy policzyć jej p-value czyli prawdopodobieństwo że wynik symulacji byłby taki jak dane lub bardziej ekstremalny.
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Statystyczna analiza danych Co to są dane W jaki sposób zbieramy dane W jaki sposób reprezentujemy dane
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne Czyli jak bardzo jesteśmy pewni że parametr oceniony na podstawie próbki jest
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy
Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Prezentacja materiału statystycznego Szeroko rozumiane modelowanie i prognozowanie jest zwykle kluczowym celem analizy danych. Aby zbudować model wyjaśniający relacje pomiędzy różnymi aspektami rozważanego
Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe
Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Regresja liniowa Korelacja Modelowanie Analiza modelu Wnioskowanie Korelacja 3 Korelacja R: charakteryzuje
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych
STATYSTYKA MATEMATYCZNA WYKŁAD 3 Populacje i próby danych POPULACJA I PRÓBA DANYCH POPULACJA population Obserwacje dla wszystkich osobników danego gatunku / rasy PRÓBA DANYCH sample Obserwacje dotyczące
Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.
Wykład 10 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki? stopnie Celsiusza stopnie Fahrenheita dolary 1,000 dolarów wartość faktyczna odległość od minimum
Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła
12.03.2017 Wydział Inżynierii Produkcji I Logistyki Statystyka opisowa Wykład 3 Dr inż. Adam Deptuła METODY OPISU DANYCH ILOŚCIOWYCH SKALARNYCH Wykresy: diagramy, histogramy, łamane częstości, wykresy
KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno
STATYSTYKA POWTORZENIE Dr Wioleta Drobik-Czwarno Populacja Próba Parametry EX, µ Statystyki średnia D 2 X, δ 2 S 2 wnioskowanie DX, δ p ρ S w r...... JAK POWSTAJE MODEL MATEMATYCZNY Dane eksperymentalne
Próba własności i parametry
Próba własności i parametry Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony
Podstawowe pojęcia i testy statystyczne
Podstawowe pojęcia i testy statystyczne Piotr Knapik Śląskie Centrum Chorób Serca w Zabrzu Zebranie w Domu Lekarza niehomogenna, wysoce wyselekcjonowana grupa słuchaczy, rozkład wiedzy na temat statystyki
Nowoczesne techniki matematyczne, statystyczne i informatyczne
Nowoczesne techniki matematyczne, statystyczne i informatyczne Wykładowca : Krzysztof Bogdan Biuro : C-11, p. 2.12 http://prac.im.pwr.wroc.pl/~bogdan/ Twój wynik z wykładów: zadania domowe (25%) kartkówki
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Statystyczne metody analizy danych
Statystyczne metody analizy danych Statystyka opisowa Wykład I-III Agnieszka Nowak - Brzezińska Definicje Statystyka (ang.statistics) - to nauka zajmująca się zbieraniem, prezentowaniem i analizowaniem
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Z poprzedniego wykładu
PODSTAWY STATYSTYKI 1. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej
Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Wykład Ćwiczenia Laboratorium Projekt Seminarium 30
Zał. nr 4 do ZW WYDZIAŁ CHEMICZNY KARTA PRZEDMIOTU Nazwa w języku polskim Wstęp do statystyki praktycznej Nazwa w języku angielskim Intriduction to the Practice of Statistics Kierunek studiów (jeśli dotyczy):
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności
Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.
1 Agata Boratyńska WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne. Agata Boratyńska Wykłady ze statystyki 2 Literatura J. Koronacki i J. Mielniczuk Statystyka WNT 2004
Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE) Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 1 1 / 33 Warunki zaliczenia 1 Ćwiczenia OBOWIĄZKOWE (max. 3 nieobecności) 2 Zaliczenie
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski
Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW STATYSTYKA to nauka, której przedmiotem
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na
Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które
Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33
Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Laboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:
Laboratorium nr 1 CZĘŚĆ I : STATYSTYKA OPISOWA : 1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby: 6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2
STATYSTYKA I DOŚWIADCZALNICTWO
STATYSTYKA I DOŚWIADCZALNICTWO dla studiów magisterskich kierunku ogrodnictwo Wykład 1 Dariusz Gozdowski Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW Słowo statystyka pochodzi
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
laboratoria 24 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE
STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE CECHY mogą być: jakościowe nieuporządkowane - skala nominalna płeć, rasa, kolor oczu, narodowość, marka samochodu,
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.
Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych. Statystyka zajmuje się prawidłowościami zaistniałych zdarzeń. Teoria prawdopodobieństwa dotyczy przewidywania, jak często mogą zajść
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Rozkłady zmiennych losowych
Rozkłady zmiennych losowych Wprowadzenie Badamy pewną zbiorowość czyli populację pod względem występowania jakiejś cechy. Pobieramy próbę i na podstawie tej próby wyznaczamy pewne charakterystyki. Jeśli
Prawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Prawdopodobieństwo i rozkłady Zdarzenia losowe Prawdopodobieństwo warunkowe Prawdopodobieństwo bayesowskie
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4 Inne układy doświadczalne 1) Układ losowanych bloków Stosujemy, gdy podejrzewamy, że może występować systematyczna zmienność między powtórzeniami np. - zmienność
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Wydział Nauki o Zdrowiu. Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska
Podstawy Biostatystyki Wydział Nauki o Zdrowiu Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska Treść wykładu W1-W Statystyka opisowa. Podstawowe pojęcia statystyki. Prezentacja
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;
STATYSTYKA OPISOWA Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych; - badanie stanu zdrowia w pewnej miejscowości; - badanie stopnia zanieczyszczenia gleb metalami ciężkimi
1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.
Wykład Zmiana wartości wynikająca ze zmiany jednostek dana jest zwykle funkcją liniową: y = ay + c Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym, gdy zmienimy jednostki? Przykłady:
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);
Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Metody Statystyczne. Metody Statystyczne.
gkrol@wz.uw.edu.pl #4 1 Sprawdzian! 5 listopada (ok. 45-60 minut): - Skale pomiarowe - Zmienne ciągłe i dyskretne - Rozkład teoretyczny i empiryczny - Miary tendencji centralnej i rozproszenia - Standaryzacja
S t a t y s t y k a, część 3. Michał Żmihorski
S t a t y s t y k a, część 3 Michał Żmihorski Porównanie średnich -test T Założenia: Zmienne ciągłe (masa, temperatura) Dwie grupy (populacje) Rozkład normalny* Równe wariancje (homoscedasticity) w grupach
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną
Wydział: Zarządzanie i Finanse Nazwa kierunku kształcenia: Finanse i Rachunkowość Rodzaj przedmiotu: podstawowy Opiekun: prof. nadzw. dr hab. Tomasz Kuszewski Poziom studiów (I lub II stopnia): II stopnia
KURS STATYSTYKA. Lekcja 5 Analiza współzależności ZADANIE DOMOWE. Strona 1
KURS STATYSTYKA Lekcja 5 Analiza współzależności ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowiedź (tylko jedna jest prawdziwa). Pytanie 1 W analizie współzależności a) badamy
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Wykład 2: Tworzenie danych
Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk
Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska
Statystyczne metody analizy danych Agnieszka Nowak - Brzezińska SZEREGI STATYSTYCZNE SZEREGI STATYSTYCZNE odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny. Szeregi statystyczne
2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.
Laboratorium z ekonometrii (GRETL) 2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych. 2.1 Zaimportuj dane z pliku zatrudnienie.csv z przecinkiem jako separatorem danych i kropką jako
Wykład 2. Transformacje (przekształcenia) danych
Wykład 2 Transformacje (przekształcenia) danych Problem: Co się stanie ze średnią i odchyleniem standardowym, gdy zmienimy jednostki? Przykłady: stopnie Celsiusza stopnie Fahrenheita dolary 1,000 dolarów
Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.
Wykład 2 Transformacje (przekształcenia) danych Problem: Co się stanie ze średnią i odchyleniem standardowym, gdy zmienimy jednostki? Przykłady: stopnie Celsiusza stopnie Fahrenheita dolary 1,000 dolarów
Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia
Wykład 2 Statystyka opisowa - Miary rozkładu: Miary położenia Podział miar Miary położenia (measures of location): 1. Miary tendencji centralnej (measures of central tendency, averages): Średnia arytmetyczna
Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:
Statystyczne opracowanie danych pomiarowych W praktyce pomiarowej często spotykamy się z pomiarami wielokrotnymi, gdy podczas pomiaru błędy pomiarowe (szumy miernika, czynniki zewnętrzne) są na tyle duże,
Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii
Plan wykładu Statystyka opisowa Dane statystyczne miary położenia miary rozproszenia miary asymetrii Statystyka matematyczna Podstawy estymacji Testowanie hipotez statystycznych Żródła Korzystałam z ksiażek:
Matematyka 2. dr inż. Rajmund Stasiewicz
Matematyka 2 dr inż. Rajmund Stasiewicz Skala ocen Punkty Ocena 0 50 2,0 51 60 3,0 61 70 3,5 71 80 4,0 81 90 4,5 91-5,0 Zwolnienie z egzaminu Ocena z egzaminu liczba punktów z ćwiczeń - 5 Warunki zaliczenia
Wprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym
Wykład 3 Testowanie hipotez statystycznych o wartości średniej i wariancji z populacji o rozkładzie normalnym Wrocław, 08.03.2017r Model 1 Testowanie hipotez dla średniej w rozkładzie normalnym ze znaną
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Analiza statystyczna. Microsoft Excel 2010 PL.
Analiza statystyczna. Microsoft Excel 2010 PL. Autor: Conrad Carlberg Zaufaj posiadanym danym! Microsoft Excel 2010 to ukochane narzędzie studentów, analityków, księgowych, menedżerów i prezesów. Uniwersalność
Podstawy statystyki matematycznej w programie R
Podstawy statystyki matematycznej w programie R Piotr Ćwiakowski Wydział Fizyki Uniwersytetu Warszawskiego Zajęcia 1. Wprowadzenie 1 marca 2017 r. Program R Wprowadzenie do R i badań statystycznych podstawowe
1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.
[1] POJĘCIA WSTĘPNE STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych. BADANIE STATYSTYCZNE - ogół prac mających na celu poznanie struktury określonej
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Karta przedmiotu obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/201 WydziałPsychologii i Nauk Humanistycznych Kierunek studiów:
Graficzna prezentacja danych statystycznych
Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do
Przedmiot statystyki. Graficzne przedstawienie danych.
Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych
Rozkład materiału nauczania
Dział/l.p. Ilość godz. Typ szkoły: TECHNIKUM Zawód: TECHNIK USŁUG FRYZJERSKICH Rok szkolny 2015/2016 Przedmiot: MATEMATYKA Klasa: III 2 godz/tyg 30 = 60 godzin Rozkład materiału nauczania Temat I. LOGARYTMY
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Podstawy statystyki opisowej
Podstawy statystyki opisowej JERZY STEFANOWSKI Instytut Informatyki Politechnika Poznańska Aktualizacja 2017 Literatura Podstawowa: Statystyka dla studentów kierunków technicznych i przyrodniczych, Koronacki
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20 MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X