Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Podobne dokumenty
Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Wprowadzenie do analizy dyskryminacyjnej

Spis treści. Laboratorium II: Analiza opisowa. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Wykład 4: Statystyki opisowe (część 1)

ZARZĄDZANIE DANYMI W STATISTICA

Wykład 5: Statystyki opisowe (część 2)

Instrukcja obsługi programu Do-Exp

Opracowywanie wyników doświadczeń

Analiza Statystyczna

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

ROZLICZENIE PRODUKCJI

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

PRZYGOTOWANIE ŚRODKA PDF

Niestandardowa tabela częstości

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1

Jak korzystać z Excela?

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

You created this PDF from an application that is not licensed to print to novapdf printer (

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Podstawy statystyki medycznej Laboratorium. Zajęcia 5 wprowadzenie do programu Statistica

Tworzenie tabeli przestawnej krok po kroku

Grupowanie materiału statystycznego

Analizy wariancji ANOVA (analysis of variance)

author: Andrzej Dudek

3.7. Wykresy czyli popatrzmy na statystyki

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Dokumentacja eksploatacyjna systemu SOVAT dla użytkownika zewnętrznego (pracownik jednostki)

Sposoby prezentacji problemów w statystyce

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych

Otwórz R. Zmień katalog roboczy za pomocą File/Change Dir. Wczytaj plik przypisując go obiektowi o nazwie students:

Statystyki opisowe i szeregi rozdzielcze

TABELE I WYKRESY W EXCELU I ACCESSIE

Instrukcja obsługi dla rachunków elektronicznych generowanych z programu RUMsoft

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

RF-graph 1.2 POMOC PROGRAMU

Przy wykonywaniu rozliczeń obowiązują pewne zasady, do których nie zastosowanie się będzie skutkowało odrzuceniem raportów ze strony NFZ:

Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych. Laboratorium VI: Testy nieparametryczne

1. Opis okna podstawowego programu TPrezenter.

POMIARY WIDEO W PROGRAMIE COACH 5

Podstawy tworzenia prezentacji w programie Microsoft PowerPoint 2007

Instrukcja uŝytkowania programu

Jak przekształcać zmienne jakościowe?

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Ćwiczenie 3. I. Wymiarowanie

Wirtualny Dziennik - INSTRUKCJA DLA RODZICÓW

Instrukcja użytkownika OPERATORA Akademickiego Systemu Archiwizacji Prac

UMOWY INSTRUKCJA STANOWISKOWA

Instrukcja użytkownika Platforma Walutowa

fa x. ( ) SPIS TREŚCI

Instrukcja użytkownika OPERATORA Akademickiego Systemu Archiwizacji Prac

Instrukcja użytkownika WYKŁADOWCY AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

INSTRUKCJA. SIMPLE.HCM Proces obsługi Kartoteki Pracownika, Kartoteki Przełożonego oraz Raportów kadrowo-płacowych

I Tworzenie prezentacji za pomocą szablonu w programie Power-Point. 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu

TABELE I WYKRESY W EXCELU I ACCESSIE

Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych. 8a 3,54 8b 5,25 8c 4,21 8d 4,85

Instrukcja. importu dokumentów. z programu Fakt do programu Płatnik. oraz. przesyłania danych do ZUS. przy pomocy programu Płatnik

I jest narzędziem służącym do porównywania rozproszenia dwóch zmiennych. Używamy go tylko, gdy pomiędzy zmiennymi istnieje logiczny związek

System Informatyczny Oddziału Wojewódzkiego NFZ

Abacus Tychy, ul. Pod Lasem 20 tel

Co to jest arkusz kalkulacyjny?

Temat: Graficzna ilustracja danych - wykresy

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Tworzenie szablonów użytkownika

1 Podstawy rachunku prawdopodobieństwa

Instrukcja użytkownika Platformy Walutowej

ERGODESIGN - Podręcznik użytkownika. Wersja 1.0 Warszawa 2010

Diagnoza Szkolna Pearsona. Instrukcja obsługi

DODAWANIE ARTYKUŁÓW DO STRONY INTERNETOWEJ

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Instrukcja użytkownika NAUCZYCIELA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Arkusz Optivum. Jak eksportować do SIO dane z Arkusza Optivum?

Przy wykonywaniu rozliczeń obowiązują pewne zasady, do których nie zastosowanie się będzie skutkowało odrzuceniem raportów ze strony NFZ:

unikupon.pl Unikupon PC Instrukcja obsługi

Instrukcja Użytkownika (Nauczyciel Akademicki) Akademickiego Systemu Archiwizacji Prac

Jak zrobić zakupy w sklepie ARTiSPA poradnik dla początkujących internautów

Regresja linearyzowalna

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Wyniki operacji w programie

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

UONET+ moduł Dziennik

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Szkoła z przyszłością. Zastosowanie pojęć analizy statystycznej do opracowania pomiarów promieniowania jonizującego

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Transkrypt:

PROJEKT: Analiza kluczowych parametrów turbin wiatrowych Projekt jest wykonywany z wykorzystaniem pakietu statystycznego STATISTICA. Praca odbywa się w grupach 2-3 osobowych. Aby zaliczyć projekt, należy dostarczyć wydrukowane sprawozdanie z wynikami przeprowadzonej analizy nie później niż do dnia 15 grudnia 2014 r. Niedostarczenie sprawozdania w terminie skutkuje uzyskaniem 0 punktów za projekt i taka też liczba jest brana pod uwagę przy wyliczaniu oceny końcowej. Sprawozdanie powinno być podpisane imionami i nazwiskami, numerami indeksów autorów oraz numerem grupy ćwiczeniowej. Dane do analizy znajdują się w pliku turbiny.xlsx i pochodzą ze strony: http://www.thewindpower.net. Zawierają informacje na temat kluczowych parametrów różnych modeli turbin wiatrowych wykorzystywanych w farmach wiatrowych. Dane zawierają 963 przypadki (różne modele) opisane przez 5 zmiennych (parametry): Celem jest: Manufacturer producent turbiny; Model model turbiny; Power (kw) moc nominalna turbiny; Diameter (m) średnica turbiny; Availability dostępność na rynku: 1. Analiza koncentracji, rozrzutu i struktury danych dla zmiennych Power i Diameter. 2. Analiza i porównanie koncentracji i rozproszenia tych samych zmiennych, ale w kategoriach określonych przez zmienną Availability. Analiza struktury danych w kategoriach poprzez wykonanie skategoryzowanych wykresów pudełkowych (na podstawie mediany i kwartyli) i skategoryzowanych histogramów. a. Kategoria I: turbiny wycofane z produkcji (Old), b. Kategoria II: turbiny aktualnie produkowane (Under production), c. Kategoria III: turbiny znajdujące się dopiero w budowie (Under dev.). 3. Wskazanie nazw 3 producentów, których turbiny są najliczniej reprezentowane w załączonych danych na podstawie histogramu przedstawiającego liczbę turbin wykonanych przez każdego producenta (nazwy producentów = kategorie określone w zmiennej Manufacturer) 4. Zilustrowanie zależności pomiędzy mocą turbiny a jej średnicą przy pomocy wykresu rozrzutu. Określenie równania dla prostej regresji. Wyniki otrzymane w każdym z punktów należy skomentować. Analizę koncentracji danych wykonuje się poprzez wyliczenie: Wartości średnich; Przedziałów ufności dla wartości oczekiwanej; Minimalnych i maksymalnych wartości zmiennych; Mediany i kwartyli (Q 1 i Q 3); Analizy rozrzutu/rozproszenia danych przez wyliczenie: a. Miar zmienności, czyli np. rozstępu, wariancji, odchylenia standardowego; Analizy struktury zbioru danych poprzez wykonanie: b. Histogramów (rozkłady empiryczne); c. Wykresów pudełkowych ilustrujących rozmieszczenie danych wokół mediany lub wokół średniej.

Zależności pomiędzy zmiennymi dobrze ilustrują wykresy rozproszenia. STAISTICA wylicza dla każdego wykresu rozproszenia równanie prostej regresji opisujące zależność liniową występującą pomiędzy zmiennymi. Aby wykonać powyższe zadania, należy się zapoznać z instrukcją opisaną w kolejnych punktach. 1. Importowanie danych z arkuszy xlsx do pakietu STATISTICA. W menu głównym STATISTIKI należy wejść w Plik/Otwórz: Wybrać odpowiedni plik i następnie zaznaczyć Import wybranego arkusza: Zaznaczyć arkusz, który zawiera dane (w przypadku pliku turbiny.xlsx arkusz ten nazywa się dane ) i potwierdzić wybór wciskając OK. Pojawia się okno, w którym należy zaznaczyć, żeby program wziął nazwy zmiennych z 1 wiersza i potwierdzić wybór przyciskiem OK: Może się pojawić okno, w którym należy wskazać, aby program wczytywał tekst jako etykiety tekstowe:

Prawidłowo wczytane dane powinny wyglądać następująco: Statystyki opisowe Do analizy koncentracji i rozrzutu wykorzystujemy parametry statystyki opisowej. Aby je wyliczyć dla wybranej zmiennej należy wybrać z menu głównego STATISTIKI Statystyka/Statystyki podstawowe i tabele: W wyniku tego działania pojawia się okno, w którym należy wybrać Statystyki opisowe, a wybór potwierdzić wciskając OK:

Wyświetla się nowe okno, w którym należy wskazać zmienną, dla której chcemy wyznaczyć parametry statystyki opisowej. Wyboru zmiennej dokonuje się poprzez wciśnięcie przycisku Zmienne, znajdującego się w lewym górnym rogu tego okna: Interesujące nas zmienne należy wybrać z listy zmiennych (można na raz wybrać kilka), a wybór potwierdzić wciskając OK:

W zakładce Więcej dokonujemy wyboru interesujących nas parametrów statystyki opisowej i aby uzyskać wynik wciskamy przycisk Statystyki: W wyniku tej operacji powinno się wyświetlić okno z wyznaczonymi wartościami wskazanych przez nas parametrów:

Aby wrócić do okna ze Statystykami opisowymi należy powiększyć zminimalizowane okno znajdujące się w lewym dolnym rogu ekranu: W oknie tym w zakładce Podstawowe znajdują się przyciski służące do generowania Histogramu i wykresu pudełkowego (nazwany jako Wykres ramka-wąsy):

Po wciśnięciu przycisku Histogram wyświetlą się histogramy dla wybranych zmiennych. Natomiast w związku z tym, że występuje kilka rodzajów wykresów pudełkowych, przed ich wyświetleniem należy wskazać typ wykresu pudełkowego, jaki ma zostać wygenerowany. Dokonuje się tego w zakładce Opcje:

Po wyborze opcji należy wrócić do zakładki Podstawowe i wcisnąć przycisk Wykres ramka-wąsy. Najlepiej zrobić to wybierając każdą zmienną osobno. Histogramy i wykresy pudełkowe skategoryzowane Aby móc porównać strukturę danych w różnych kategoriach pomocne są wykresy skategoryzowane. Wykonuje się je z poziomu okna Statystyki opisowe, wchodząc do zakładki W. skategoryzowane: W celu wykonania skategoryzowanych histogramów należy wcisnąć przycisk Histogramy skategoryzowane, a następnie wskazać przynajmniej jedną zmienną grupującą, czyli tą która zawiera informację o kategoriach (np. zmienną Availability):

Po wciśnięciu OK, pokazuje się okienko, w którym należy dokonać wyboru kodów zmiennej grupującej: Jeśli interesują nas wszystkie kategorie, wciskamy przycisk Wszystko, a następnie zatwierdzamy wybór OK: W wyniku tego działania pojawią się histogramy dla każdej kategorii określonej przez zmienną grupującą, w tym przypadku przez zmienną Availability. W taki sam sposób wykonujemy wykresy pudełkowe, pamiętając o odpowiednim ustaleniu opcji wykresu w zakładce Opcje. Wyznaczanie parametrów tylko dla wybranej kategorii Aby wyliczyć parametry statystyki opisowej dla wybranej kategorii (na przykład tylko dla kategorii Under production, określonej w zmiennej Availability), przy wyznaczaniu parametrów statystyki opisowej należy skorzystać z przycisku Select cases:

Po wciśnięciu tego przycisku należy zaznaczyć opcje Włącz warunki selekcji, oraz zdefiniować przypadki, które mają być poddane analizie poprzez wpisanie odpowiedniego warunku. Na rysunku przedstawionym poniżej warunek jest opisany jako: v5 = Under production, co oznacza, że interesują nas tylko te przypadki, dla których zmienna numer 5 (variable 5) przyjmuje wartość Under production :

Po wciśnięciu przycisku OK, następuje powrót do okna Statystyki podstawowe, w którym przycisk Select cases zostaje podświetlony na niebiesko, co oznacza, że zostały określone warunki selekcji przypadków. Po wyznaczeniu wszystkich interesujących nas parametrów statystyki opisowej dla kategorii Under production, wciskając ponownie przycisk Select cases możemy zmienić kategorię na inną, odpowiednio definiując interesujące nas przypadki. Ustalenie najliczniejszej kategorii Najbardziej liczną kategorię można wskazać na różne sposoby, jednym z nich jest wykonanie histogramu dla zmiennej, która zawiera informacje o kategoriach, czyli np. aby wskazać, który producent produkuje najwięcej turbin, należy wykonać histogram dla zmiennej Manufacturer. Aby to zrobić wybieramy z menu głównego Wykresy/Histogramy:

Pojawia się okno Histogramy 2W, w którym musimy dokonać wyboru zmiennej, a także określić kody, dla których powstanie histogram (kodami będą nazwy producentów). Należy również odznaczyć dopasowanie rozkładu normalnego, ponieważ histogram będzie wykonywany dla kategorii cechy jakościowej. 1 5 2 3 4 Po wciśnięciu OK pojawia się histogram przedstawiający liczebność turbin wykonywanych przez kolejnych producentów. Najechanie kursorem na wybrany słupek umożliwi nam odczytanie producenta, na którego dana liczebność przypada. Wykres rozrzutu W celu zilustrowania zależności pomiędzy zmiennymi, np. pomiędzy średnicą a mocą, wykonuje się wykres rozrzutu. Wykres ten wykonuje się wybierając w menu głównym Wykresy/Wykresy rozrzutu: Pojawia się okno Wykres rozrzutu 2W, w którym poprzez naciśnięcie przycisku Zmienne należy określić zmienne X i Y, czyli np. Diameter i Power:

1 5 2 3 4 Po zatwierdzeniu wyboru zmiennych poprzez OK, wciskamy jeszcze raz OK w oknie Wykresy rozrzutu 2W, uzyskując w ten sposób wykres rozrzutu ukazujący zależność pomiędzy wybranymi zmiennymi: Nad tym wykresem znajduje się równanie opisujące czerwoną prostą, dopasowaną do zmienności danych, nazywaną prostą regresji.