Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 2013/2014 Wykład 1
Statystyka Nazwa pochodząca o łac. słowa status stan, państwo i statisticus = polityczny Początki statystyka: spisy powszechne ludności Od XVIII-XIX wieku statystyka zajmowała się opisem stanu państwa (gospodarki) W syntetycznym uproszczeniu: statystyka to nauka (część matematyki), której przedmiotem zainteresowania są metody pozyskiwania, analizy i prezentacji danych opisujących różne zjawiska, przede wszystkim zjawiska masowe
Statystyka - definicje nauka zajmująca się badaniem zbiorowości niejednorodnych (czyli takich, w których występują różnice między poszczególnymi elementami tych zbiorowości) nauka o metodach badania zjawisk masowych (czyli takich, które ujawniają się podczas badania większej liczby jednostek). dyscyplina matematyki stosowanej, zajmująca się metodami badania wielkości, których cechą charakterystyczną jest zmienność
Statystyka w szkole podstawowej Klasa IV: odczytywanie danych o otaczającym świecie, prezentowanie danych w postaci tabelek lub prostej formie graficznej, wyszukiwania konkretnych informacji Klasa V: korzystanie z formularzy do zbierania danych, prezentowanie danych w zorganizowany sposób, np. za pomocą diagramów słupkowych, wyciąganie prostych wniosków z zebranych danych Klasa VI: przygotowanie formularza do zbierania danych, graficzna prezentacja danych, wyciąganie wniosków z zebranych danych, średnia arytmetyczna
Statystyka dla leśnika Po co leśnikowi statystyka? Umiejętność zbierania danych Umiejętność opracowywania danych Umiejętność stawiania i sprawdzania hipotez Umiejętność znajdowania zależności między cechami Umiejętność przeprowadzania prognoz Zdolność do podejmowanie decyzji na podstawie posiadanych (przetworzonych) informacji
Statystyka na kierunku leśnictwo Samodzielna Pracownia Dendrometrii i Nauki o Produkcyjności lasu Budynek 34, II piętro, pokój 2/78B
Statystyka na kierunku leśnictwo Samodzielna Pracownia Dendrometrii i Nauki o Produkcyjności lasu Budynek 34, II piętro, pokój 2/78B Przedmioty: Statystyka matematyczna Dendrometria Nauka o produkcyjności lasu Zajęcia specjalizacyjne i fakultety (m.in. metody pomiaru biomasy, zastosowanie modeli wzrostu, dendrochronologia, biometria, )
Statystyka na kierunku leśnictwo Wykłady (15h, środa 14:15-16:00, Aula 2) Dr hab. Michał Zasada, prof. SGGW Ćwiczenia (30h, sala 2/3 i 2/6) Pracownicy: dr inż. Rafał Wojtan, dr inż. Robert Tomusiak, dr Szymon Bijak Doktoranci: mgr inż. Maciej Czajkowski, mgr inż. Łukasz Ludwisiak, mgr inż. Michał Magnuszewski, mgr inż. Jacek Sagan
Statystyka na kierunku leśnictwo A w razie problemów: Osobiście: budynek 34, II piętro, pokój 2/78B (w gablocie obok sekretariatu - godziny konsultacji prowadzących) Telefonicznie: numer wewnętrzny 38081 (sekretariat) E-mailowo: Imie.Nazwisko@wl.sggw.pl
Statystyka na kierunku leśnictwo Ćwiczenia zaliczenie, w tym sprawozdania z poszczególnych zajęć oraz kolokwia w trakcie semestru szczegóły podadzą prowadzący na zajęciach Wykłady egzamin pisemny w sesji warunkiem przystąpienia do egzaminu jest zaliczenie ćwiczeń
Literatura Bruchwald Arkadiusz. Statystyka matematyczna dla leśników Łomnicki Adam. Wprowadzenie do statystyki dla przyrodników Luszniewicz Andrzej, Słaby Teresa. Statystyka stosowana Luszniewicz Andrzej. Statystyka nie jest trudna Kassyk-Rokicka Helena. Statystyka nie jest trudna inne źródła, również internetowe
Statystyka - podział statystyka opisowa (zbieranie danych, ich prezentacja i sumaryczny opis) rachunek prawdopodobieństwa (zdarzenia losowe) wnioskowanie statystyczne (wykorzystanie teorii statystycznych do uzyskiwania informacji o całości na podstawie badania części)
Statystyka - pojęcia Zjawiska masowe to takie zjawiska, które badane w dużej masie zdarzeń ujawniają pewne prawidłowości, jakich nie można zaobserwować w przypadku pojedynczych obserwacji
Statystyka - pojęcia Badanie statystyczne zespół czynności prowadzących do uzyskania za pomocą metod statystycznych informacji o objętej badaniami zbiorowości statystycznej Badanie pełne i częściowe
Statystyka - pojęcia Etapy badań statystycznych Obserwacja statystyczna zbieranie materiału empirycznego tak, aby możliwe było uchwycenie stanu populacji w określonym momencie lub zmian zachodzących w czasie Opis kontrola zebranego materiału, jego porządkowanie, klasyfikację, określenie wartości różnych mierników. Rezultatem są tablice, wykresy i charakterystyki liczbowe Analiza wykrywanie prawidłowości w badanych zjawiskach, ich interpretacja i formułowanie wniosków
Statystyka - pojęcia Zbiorowość statystyczna zbiór elementów (obserwacji, przedmiotów, obiektów, ) podobnych do siebie pod względem określonych cech zbiór jednostek nieidentycznych, powiązanych ze sobą logicznie
Statystyka - pojęcia Zbiorowość statystyczna zbiór elementów (obserwacji, przedmiotów, obiektów, ) podobnych do siebie pod względem określonych cech zbiór jednostek nieidentycznych, powiązanych ze sobą logicznie Populacja generalna (populacja) Zbiorowość statystyczna podlegająca badaniu statystycznemu Populacja skończona i nieskończona
Statystyka - pojęcia Jednostka statystyczna element zbiorowości statystycznej (populacji); źródło cech
Statystyka - pojęcia Cecha własność (charakterystyka) jednostek statystycznych będąca podstawą ich różnicowania przedmiot badań
Statystyka - pojęcia Cecha własność (charakterystyka) jednostek statystycznych będąca podstawą ich różnicowania przedmiot badań Rodzaje cech
Statystyka - pojęcia Cechy mierzalne (ilościowe): możliwe do opisania za pomocą liczb ciągłe: przyjmujące dowolne wartości w danym przedziale skokowe: przyjmująca określone wartości w danym przedziale, Cechy niemierzalne (jakościowe): można je jedynie opisać słownie lub za pomocą odpowiednich skal
Statystyka - pojęcia Skale pomiarowe sposób wyrażenia danej cechy uzależnione są od rodzaju opisywanych zmiennych determinują, co można zrobić z daną cechą / zmienną
Statystyka - pojęcia Skale pomiarowe Zmienne jakościowe Skala nominalna Skala porządkowa (rangowa) Zmienne ilościowe Skala przedziałowe (interwałowa) Skala ilorazowa (stosunkowa)
Skala nominalna Pozwala rozpoznawać obiekty jednakowe i różne, bez wypowiadania się o relacjach między nimi, np. gatunek drzewa, rodzaj drewna, rębnia, płeć, itp. Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych Bardzo słaba skala pomiarowa Graficzna prezentacja, dominanta
Skala porządkowa Dodatkowo wprowadza relację porządku w zbiorze zmiennych jakościowych, np. siedlisko suche, świeże, wilgotne, bagienne; drewno suche, wilgotne; uszkodzenie słabe, średnie, silne;... Jest skalą mocniejszą niż nominalna Powoduje najwięcej problemów i nieporozumień, przedmiot powszechnie popełnianych błędów
Skala porządkowa Przykład: skala ocen (ndst, dst, db, bdb) Wszelkiego rodzaju obliczenia są tutaj nadużyciem: nieznana jest odległość między poszczególnymi ocenami (różnica w między różnymi stopniami jest różna; często mieszane kategorie) Możliwe jest jedynie określenie, że np. silny stopień uszkodzenia jest mocniejszy, niż słaby
Skala przedziałowa Zachowuje własności skali porządkowej, ale dodatkowo wyposażona jest w stałą jednostkę miary i umowne zero Możliwy jest pomiar odległości między uporządkowanymi zmiennymi Jest skalą mocniejszą od porządkowej
Skala przedziałowa Przykład: skala Celsjusza dla temperatury Możliwe jest określenie o ile stopni dana temperatura różni się od innej Ale nie można opisać sensownie stosunku dwóch wartości zmiennych Np. średnia temperatura lipca w centralnej Polsce (17C) różni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to, że w lipcu jest prawie 2,5 raza cieplej, niż średnio w roku
Skala ilorazowa różni się od skali przedziałowej tym, że jest posiada zero absolutne, a nie umowne Możliwe jest określenie ile razy dana cecha jest większa od innej Jest to najsilniejsza skala pomiarowa
Skala ilorazowa Przykład: skala Kelwina Gleba o temperaturze 50C (323K) jest 1.1 raza (czyli o 10%) cieplejsza od gleby o temperaturze 20C (293K) Przykład: liczba kandydatów na studia Na WTD (100) było 3 razy mniej kandydatów na studia, niż na WL (300); zerem absolutnym jest tu brak kandydatów na dany kierunek studiów, na WL startowało 3x więcej kandydatów, niż na WTD
Statystyka opisowa
Statystyka opisowa Szeregi rozdzielcze Graficzna prezentacja danych Sumy i ich własności Miary statystyczne (miary położenia, zmienności i asymetrii) Jednostki standardowe
Szereg rozdzielczy
Szereg rozdzielczy Statystyczny sposób prezentacji rozkładu empirycznego. Uporządkowany materiał statystyczny w przedziałach klasowych utworzonych wg wartości badanej cechy
Szereg rozdzielczy Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność (częstość) zbiorów danych przypadających na każdą z tych kategorii Szereg może być: strukturalny (cecha jakościowa) punktowy (cecha ilościowa, skokowa) przedziałowy (cecha ilościowa, ciągła)
Szereg rozdzielczy x i n i Σn i p i Σp i 4 6 8 10 12 14 16 23 82 73 45 24 2 1 23 105 178 223 247 249 250 0,092 0,328 0,292 0,180 0,096 0,008 0,004 0,092 0,420 0,712 0,892 0,988 0,996 1,000 Σ 250 1,000
Graficzna prezentacja danych
Graficzna prezentacja danych Ważny element wstępnej analizy danych Nieodzowna ilustracja problemu i uzyskanych wyników Wielobok liczebności, histogram, szereg skumulowany, Dobór rodzaju wykresu, skali i szerokości klas
polygon 100 frequency 80 60 40 20 0 0 3 6 9 12 15 18 dk
Histogram for dk 100 frequency 80 60 40 20 0 0 3 6 9 12 15 18 dk
cumulative polygon 250 frequency 200 150 100 50 0 0 3 6 9 12 15 18 dk
cumulative histogram 250 frequency 200 150 100 50 0 0 3 6 9 12 15 18 dk
http://onlinestatbook.com/stat_si m/histogram/index.html
Dziękuję za uwagę!